Skip to content

知识查询方式

知识库查询支持「语义查询」、「关键词查询」、「全文查询」三种方式,并且可以同时选择多种方式一起查询,三种查询方式说明如下:

语义查询

使用语义查询时,会先将查询的条件,通过语义模型向量化成一组代表语义的数组,再从向量库中存储的语义数组中进行匹配,将相似度接近的语义数组对应的段落内容查询出来。

例如,当用户输入“系统启动慢”进行查询时:

第一步:将“系统启动慢”通过语义模型抓换为一组代表语义的数组;

第二步:根据“系统启动慢”的语义数组,从知识库中存储的所有语义数组进行相似度计算

第三步:挑选语义数组相似度接近的知识,进行回复,比如:可以根据语义匹配到“启动速度优化”等内容。

优点:

1、可以理解用户查询的内容含义,从知识中进行语义相似性检索。

2、支持跨语言检索 。

缺点:

1、无法进行精确查询(例如:当用户需要查询包含“1234”、“航空航天大学”等词的段落时,无法精确查询到)

2、专业词汇在进行语义匹配时,可能匹配不到(原因主要是语义模型不清楚专业词汇含义)


关键词查询

使用语义查询时,会从知识库中每个段落维护的关键词中进行精确查找,并输出其对应的段落。

知识库中关键词维护位置如下: image 例如,用户输入“系统启动慢”,可以匹配到所有关键词是“系统启动慢”的段落

优点:

1、可以精确查询用户输入的内容。

2、查询速度快。

缺点:

1、关键词没有维护则无法查询到。

2、无法进行模糊匹配。


全文查询

全文查询先扫描出知识库中段落里的每个词语,再根据用户输入的内容,精确匹配这些词语,输出其对应的段落。

例如:在全文检索中,用户输入“人工智能”后:

第一步:系统会检索所有包含“人工智能”这个词语的知识段落;

第二步:根据段落中这个词的词频和权重,对每个段落进行排序;

第三步:输出词频和权重较高的段落内容。

优点:

1、基于段落分词和词频、权重进行查找,可以比较精确地查询用户需要的内容。

2、全文检索克服了语义搜索的局限性(即:语义搜索可能会忽略精确的术语)。

缺点:

1、比较依赖词语的拆分精确度,当词语拆分不精确时,会无法找出。

2、无法进行模糊匹配。