构建知识图谱
为您的知识库生成一个知识图谱。
为了增强多跳问答功能,RAGFlow 在数据提取和索引之间增加了一个构建知识图谱的步骤,如下所示。此步骤会根据您指定的数据分块方法从现有分块中创建额外的部分。
从 v0.16.0 版本开始,RAGFlow 支持在知识库上构建知识图谱,允许您跨越多个文件创建一个 统一 的图。当上传的新文件开始解析时,生成的图将自动更新。
构建知识图谱需要大量的内存、计算资源和令牌。
场景
对于涉及 嵌套 逻辑的多跳问答问题而言,知识图谱特别有用。当您在处理包含复杂实体和关系的书籍或作品时,它们比传统的提取方法更有效。
RAPTOR(递归抽象处理用于树形组织检索)也可以用于多跳问答任务。详见启用 RAPTOR以获取详细信息。您可以使用一种方法或者同时使用两种方法,但请确保了解涉及的内存、计算和令牌成本。
先决条件
系统默认使用的聊天模型用于生成知识图谱。在继续之前,请确保您已经正确配置了聊天模型:
配置
实体类型(必填)
从您的知识库中提取的实体类型。默认类型包括:组织、人物、事件和 类别。您可以根据具体的知识库需求添加或删除类型。
方法
用于构建知识图谱的方法:
实体解析
是否启用实体解析功能。您可以将其视为一个去重开关。当开启时,大模型会合并相似的实体 —— 例如,“2025” 和 “2025年”,或“IT”和“信息技术”。以构建更有效的图谱。
- (默认)禁用实体解析。
- 启用实体解析功能。此选项消耗更多令牌。
社区报告生成
在知识图谱中,一个社区是一组通过关系链接的实体簇。您可以让大模型为每个社区生成一份摘要,称为社区报告。有关更多信息,请参阅此处。这表示是否要生成社区报告:
- 生成社区报告。此选项消耗更多令牌。
- (默认)不生成社区报告。
操作步骤
-
在您的知识库的 配置 页面上,切换开启“提取知识图谱”或根据需要调整其设置,并点击 保存 确认更改。
- 现在已为您的知识库设置了默认的知识图谱配置。从此时开始上传的所有文件在解析时将自动使用这些设置。
- 在此更新前解析的文件仍将保留它们原有的知识图谱设置。
-
您的知识库中的知识图谱不会在新的上传文件被解析之前进行 自动更新 。
一个 知识图谱 条目会在创建了知识图谱后出现在 配置 下面。
-
点击 知识图谱 查看生成的图谱详情。
-
要使用创建的知识图谱,请执行以下操作之一:
- 在您的 聊天配置 对话框中,点击 助手设置 选项卡来添加相应的知识库,并点击 提示引擎 选项卡以切换开启“使用知识图谱”开关。
- 如果您正在使用代理程序,请点击 检索 代理组件指定相应的知识库并切换开启“使用知识图谱”开关。
常见问题
我可以在我的知识库中的不同文件上设置不同的知识图谱配置吗?
可以。每个知识库只会生成一个图谱,但您的文件的小型图谱会在图表提取过程结束时 合并 成一个大的统一的图。
当我删除相关的文件时,知识图谱会自动更新吗?
不会。直到新的上传文档被解析之前,知识图谱都不会进行 自动更新 。
如何删除生成的知识图谱?
要删除生成的知识图谱,请删除知识库中的所有相关文件。尽管知识图谱条目仍然可见,但实际上图谱已被删除。
创建的知识图谱存储在哪里?
创建的所有知识图谱片段都存储在RAGFlow的文档引擎中:Elasticsearch或Infinity。
如何导出创建的知识图谱?
不支持导出创建的知识图谱。如果您仍然认为此功能至关重要,请提出一个问题,解释您的使用场景及其重要性。