跳到主要内容

构建知识图谱

为您的知识库生成一个知识图谱。


为了增强多跳问答功能,RAGFlow 在数据提取和索引之间增加了一个构建知识图谱的步骤,如下所示。此步骤会根据您指定的数据分块方法从现有分块中创建额外的部分。

Image

从 v0.16.0 版本开始,RAGFlow 支持在知识库上构建知识图谱,允许您跨越多个文件创建一个 统一 的图。当上传的新文件开始解析时,生成的图将自动更新。

警告

构建知识图谱需要大量的内存、计算资源和令牌。

场景

对于涉及 嵌套 逻辑的多跳问答问题而言,知识图谱特别有用。当您在处理包含复杂实体和关系的书籍或作品时,它们比传统的提取方法更有效。

提示

RAPTOR(递归抽象处理用于树形组织检索)也可以用于多跳问答任务。详见启用 RAPTOR以获取详细信息。您可以使用一种方法或者同时使用两种方法,但请确保了解涉及的内存、计算和令牌成本。

先决条件

系统默认使用的聊天模型用于生成知识图谱。在继续之前,请确保您已经正确配置了聊天模型:

Image

配置

实体类型(必填)

从您的知识库中提取的实体类型。默认类型包括:组织人物事件类别。您可以根据具体的知识库需求添加或删除类型。

方法

用于构建知识图谱的方法:

  • 通用: 使用由GraphRAG提供的提示来提取实体和关系。
  • 轻量级(默认): 使用由 LightRAG 提供的提示来提取实体和关系。此选项使用的令牌更少,占用内存也较小,并且计算资源需求较低。

实体解析

是否启用实体解析功能。您可以将其视为一个去重开关。当开启时,大模型会合并相似的实体 —— 例如,“2025” 和 “2025年”,或“IT”和“信息技术”。以构建更有效的图谱。

  • (默认)禁用实体解析。
  • 启用实体解析功能。此选项消耗更多令牌。

社区报告生成

在知识图谱中,一个社区是一组通过关系链接的实体簇。您可以让大模型为每个社区生成一份摘要,称为社区报告。有关更多信息,请参阅此处。这表示是否要生成社区报告:

  • 生成社区报告。此选项消耗更多令牌。
  • (默认)不生成社区报告。

操作步骤

  1. 在您的知识库的 配置 页面上,切换开启“提取知识图谱”或根据需要调整其设置,并点击 保存 确认更改。

    • 现在已为您的知识库设置了默认的知识图谱配置。从此时开始上传的所有文件在解析时将自动使用这些设置
    • 在此更新前解析的文件仍将保留它们原有的知识图谱设置
  2. 您的知识库中的知识图谱不会在新的上传文件被解析之前进行 自动更新

    一个 知识图谱 条目会在创建了知识图谱后出现在 配置 下面。

  3. 点击 知识图谱 查看生成的图谱详情。

  4. 要使用创建的知识图谱,请执行以下操作之一:

    • 在您的 聊天配置 对话框中,点击 助手设置 选项卡来添加相应的知识库,并点击 提示引擎 选项卡以切换开启“使用知识图谱”开关。
    • 如果您正在使用代理程序,请点击 检索 代理组件指定相应的知识库并切换开启“使用知识图谱”开关。

常见问题

我可以在我的知识库中的不同文件上设置不同的知识图谱配置吗?

可以。每个知识库只会生成一个图谱,但您的文件的小型图谱会在图表提取过程结束时 合并 成一个大的统一的图。

当我删除相关的文件时,知识图谱会自动更新吗?

不会。直到新的上传文档被解析之前,知识图谱都不会进行 自动更新

如何删除生成的知识图谱?

要删除生成的知识图谱,请删除知识库中的所有相关文件。尽管知识图谱条目仍然可见,但实际上图谱已被删除。

创建的知识图谱存储在哪里?

创建的所有知识图谱片段都存储在RAGFlow的文档引擎中:Elasticsearch或Infinity

如何导出创建的知识图谱?

不支持导出创建的知识图谱。如果您仍然认为此功能至关重要,请提出一个问题,解释您的使用场景及其重要性。