一般电商网站的搜索页面结构主要包含搜索栏、商品列表、面包屑、分类树、筛选项、商品推荐这几种元素,每一种元素,都为用户展现了不同纬度的检索结果;同时,部分元素也为用户提供了进一步的检索、过滤功能。
建立全文索引中有两项非常重要,一个是如何对文本进行分词,一是建立索引的数据结构。分词的好坏关系到查询的准确程度和生成的索引的大小。
在关键词检索上,用户通过输入一个检索词来描述自己的需求。关键词检索涉及到建立一个检索系统的一些基本步骤:
分词(将一段文本转化为一个一个单元,即term)
建立倒排索引(Inverted Index)
索引归并
排序
分词之前,首先需要确定的是:商品的哪些字段需要被分词并且建入索引。商品的标题是需要建索引的。另外,一般来说,商品的品牌名称、商家名称、分类名也是需要建索引。选择建索引字段的范围,是需要一些权衡的。
润壤提供的分词技术可以让用户在搜索商品名称中含有的任意连贯或不连贯字词组合时,都能从搜索结果页面获得对应的产品信息。