跳到主要内容

设置页面排名

使用页面排名创建逐步检索策略。


场景

在基于人工智能的聊天中,您可以配置聊天助手或代理从多个指定的知识库(数据集)中提取知识进行响应,前提条件是它们都采用相同的嵌入模型。当您希望特定的知识库中的信息优先显示或首先被检索时,可以使用RAGFlow的页面排名功能来提高这些知识库块的排名。例如,如果您配置了一个聊天助手从两个知识库中获取内容,其中一个用于2024年的新闻(知识库A),另一个用于2023年的新闻(知识库B),但希望优先显示2024年新闻,则此功能非常有用。

注意

需要注意的是,“页面排名”功能是在整个知识库级别操作的,而不是针对单个文件或文档。

配置

在您知识库的配置页面上,在页面排名部分拖动滑块以设置您的知识库的页面排名。也可以在滑块旁边的字段中输入所需的页面排名值。

注意

页面排名值必须是整数。范围:[0,100]

  • 0:禁用(默认)
  • 特定数值:启用
提示

如果您将页面排名设置为非整数值,例如1.7,则会向下取整到最接近的整数,在这种情况下是1。

计分机制

如果您配置聊天助手的相似度阈值为0.2,则只有混合得分大于0.2 x 100 = 20的块会被检索并发送给聊天模型进行内容生成。这一步骤对于缩小相关信息范围至关重要。

如果将知识库A(2024年新闻)的页面排名设为1,而将知识库B(2023年新闻)的页面排名设为0,则最终混合得分会相应调整。从知识库A检索到的一个初始得分为50分的块将获得1 x 100 = 100分的加分,结果得分为50 + 1 x 100 = 150分。通过这种方式,来自知识库A的块总是会优先于从知识库B检索到的块。