主题
知识查询方式
知识库查询支持「语义查询」、「关键词查询」、「全文查询」三种方式,并且可以同时选择多种方式一起查询,三种查询方式说明如下:
语义查询
使用语义查询时,会先将查询的条件,通过语义模型向量化成一组代表语义的数组,再从向量库中存储的语义数组中进行匹配,将相似度接近的语义数组对应的段落内容查询出来。
例如,当用户输入“系统启动慢”进行查询时:
第一步:将“系统启动慢”通过语义模型抓换为一组代表语义的数组;
第二步:根据“系统启动慢”的语义数组,从知识库中存储的所有语义数组进行相似度计算
第三步:挑选语义数组相似度接近的知识,进行回复,比如:可以根据语义匹配到“启动速度优化”等内容。
优点:
1、可以理解用户查询的内容含义,从知识中进行语义相似性检索。
2、支持跨语言检索 。
缺点:
1、无法进行精确查询(例如:当用户需要查询包含“1234”、“航空航天大学”等词的段落时,无法精确查询到)
2、专业词汇在进行语义匹配时,可能匹配不到(原因主要是语义模型不清楚专业词汇含义)
关键词查询
使用语义查询时,会从知识库中每个段落维护的关键词中进行精确查找,并输出其对应的段落。
知识库中关键词维护位置如下: 例如,用户输入“系统启动慢”,可以匹配到所有关键词是“系统启动慢”的段落
优点:
1、可以精确查询用户输入的内容。
2、查询速度快。
缺点:
1、关键词没有维护则无法查询到。
2、无法进行模糊匹配。
全文查询
全文查询先扫描出知识库中段落里的每个词语,再根据用户输入的内容,精确匹配这些词语,输出其对应的段落。
例如:在全文检索中,用户输入“人工智能”后:
第一步:系统会检索所有包含“人工智能”这个词语的知识段落;
第二步:根据段落中这个词的词频和权重,对每个段落进行排序;
第三步:输出词频和权重较高的段落内容。
优点:
1、基于段落分词和词频、权重进行查找,可以比较精确地查询用户需要的内容。
2、全文检索克服了语义搜索的局限性(即:语义搜索可能会忽略精确的术语)。
缺点:
1、比较依赖词语的拆分精确度,当词语拆分不精确时,会无法找出。
2、无法进行模糊匹配。