设置页面排名
使用页面排名创建逐步检索策略。
场景
在基于人工智能的聊天中,您可以配置聊天助手或代理从多个指定的知识库(数据集)中提取知识进行响应,前提条件是它们都采用相同的嵌入模型。当您希望特定的知识库中的信息优先显示或首先被检索时,可以使用RAGFlow的页面排名功能来提高这些知识库块的排名。例如,如果您配置了一个聊天助手从两个知识库中获取内容,其中一个用于2024年的新闻(知识库A),另一个用于2023年的新闻(知识库B),但希望优先显示2024年新闻,则此功能非常有用。
注意
需要注意的是,“页面排名”功能是在整个知识库级别操作的,而不是针对单个文件或文档。
配置
在您知识库的配置页面上,在页面排名部分拖动滑块以设置您的知识库的页面排名。也可以在滑块旁边的字段中输入所需的页面排名值。
注意
页面排名值必须是整数。范围:[0,100]
- 0:禁用(默认)
- 特定数值:启用
提示
如果您将页面排名设置为非整数值,例如1.7,则会向下取整到最接近的整数,在这种情况下是1。
计分机制
如果您配置聊天助手的相似度阈值为0.2,则只有混合得分大于0.2 x 100 = 20的块会 被检索并发送给聊天模型进行内容生成。这一步骤对于缩小相关信息范围至关重要。
如果将知识库A(2024年新闻)的页面排名设为1,而将知识库B(2023年新闻)的页面排名设为0,则最终混合得分会相应调整。从知识库A检索到的一个初始得分为50分的块将获得1 x 100 = 100分的加分,结果得分为50 + 1 x 100 = 150分。通过这种方式,来自知识库A的块总是会优先于从知识库B检索到的块。