Skip to content

知识库节点-仅查询指定文件

什么是“仅查询指定文件”

"仅查询指定文件"功能是知识库节点的一项新特性,它允许用户将搜索范围限定在特定的知识文件上,从而提高查询的精确度。

“仅查询指定文件 - AI 自动选择文件” 则是在此基础上,充分使用 AI 的能力,通过 AI 分析用户搜索的内容与知识库中文件标题名称的关联性,实现自动筛选出相关联的特定文件,而无需用户手动选择具体文件。 image

“仅查询指定文件”功能的使用场景

当知识库中存在大量文字内容相似的文档时,推荐使用此功能。
例如,针对A、B、C三份同类型产品的说明书,若用户仅对A产品的尺寸参数感兴趣,利用"仅查询指定文件"功能,用户可直接访问A产品的说明书,从而获得精确的尺寸信息,无需筛选由B、C产品带来的无关知识段落。

我们以一个具体案例分析,来增加对这项功能的理解。


案例背景

斑小燕电商公司销售多种电子产品,包括智能手机、平板电脑、笔记本电脑等。每种产品都有详细的说明书和技术支持文档,这些文档在知识库中以电子形式存储。

售前客服团队经常需要快速响应客户对特定产品的查询,例如,客户想要了解某款智能手机的详细尺寸信息,客服人员需要在知识库中手动搜索和筛选信息,这不仅耗时,而且容易出错。

因此使用了 BetterYeah Agent 平台搭建了 AI 客服系统,通过 AI 分析用户提到的产品,并自动查询知识库后回复客户,上线后显著提高了客服团队工作效率。


问题场景

AI 客服系统上线一段时间后,客服团队发现 AI 的回答效果不够稳定,如下图示例,顾客提问“推荐适合做 AI 开发的高性能 x86 开发板”,却推荐了一些 ARM 开发板。 image

问题原因分析

客服团队分析问题后发现,原来是因为知识库内的知识,都是某个电子产品的硬件参数、性能参数。直接查询知识库,找到了很多文字内容相似,但却是一个不相关产品的知识。

如果能够将知识库的查询范围,限定在特定的几份文件内,就能查询到准确的知识了。


问题解决

客服团队启用了【知识库节点】的【查询指定文件 - AI选择文件】功能。通过 AI 自动分析顾客提到的产品,检索知识库中的文件标题名称并筛选出包含特定产品型号的文档,并在这几份文档中搜索到了正确的知识。 image

如何使用“仅查询指定文件 - AI 自动选择文件”功能

第一步,调整知识库内的文件名称

重要前提!!!AI 需要分析文件的标题名称与用户问题内容的关联性,因此必须要给每份文件取一个合适的名字。

例如使用产品的具体型号名称(iPhone 14 产品说明书.pdf)、知识的核心摘要(2024年Q2业绩统计表.xlsx)为文件重新命名。

第二步,在知识库节点中设置查询范围为 “仅查询指定文件 — AI 选择文件”,即可体验该功能。

image


注意事项

  1. 建议 “仅查询指定文件”与“查询全部文件” 功能搭配使用 在运用知识库节点的"仅查询指定文件"功能时,建议增设一个新的知识库节点,并将其查询范围设定为"全部文件"。这种双节点的策略可以使得用户在进行特定文件查询的同时,也能够对整个知识库进行全面的检索。

通过这种搭配使用,用户可以更灵活地控制查询的广度与深度,以适应不同的信息需求和检索场景。 image

能力进阶:调整“AI自动选择文件”的规则

image 当你需要让 AI 使用自定义规则去选择文件时,你可以在 “修改 AI 规则” 弹窗中,修改 AI 的技能。举例:你需要过滤 早于 2023 年的文件时,你可以为 AI 添加一项新的技能。

markdown
# 技能-1:关联性判断
# 技能描述:不放过任何蛛丝马迹,找出事物间的微弱关联性。
# 限制:只输出技能的执行结果,不输出技能的实现过程。
# 技能使用步骤
1. 接受外部传入的 file 参数,这个参数内包含了文件的名称和文件ID。
2. 接受外部传入的 question 参数,这个参数包含了用户的问题。
3. 判断 file 与 question 不存在任何关联
4. 如果 file 与 question 不存在任何关联,请返回false,否则请返回 file.id。

# 技能-2: 按时间筛选文件
# 技能描述:分析文件名称中的时间,过滤掉早于某个时间的文件
# 限制:只输出技能的执行结果,不输出技能的实现过程。
# 技能使用步骤:
1. 接受外部传入的 file 参数,这个参数内包含了文件的名称和文件ID。
2. 分析文件名称中的时间
3. 当文件标题中的时间早于 2023 年时,请返回false,否则请返回 file.id。

# 工作内容
# 限制:只输出工作的执行结果,不输出工作过程
# 工作步骤
1. 获取文件列表 all_files,这个参数内包含了每个文件的名称和ID。
2. 遍历文件列表,对于每个文件,执行技能-1关联性判断。
3. 遍历文件列表,对于每个文件,执行技能-2按时间筛选文件。
4. 收集步骤2、3输出的 file.id,并取交集,如果交集为空,请输出[],否则以 []列表 形式输出。

# all_files
%(files)s

# question
%(question)s

调整规则时的注意事项:

  1. 工作步骤的最后一步,必须是要求 AI “将收集到的 file.id 以 []列表 形式输出,如果收集到的 file.id 为空,请输出[]”。否则 AI 可能会出现错误。
  2. 禁止修改以下4行文字的内容和位置。
markdown
# all_files
%(files)s

# question
%(question)s