跳到主要内容

发布版本

最新发布版本中的关键功能、改进和错误修复。

信息

每个RAGFlow版本都有两个发行版:

  • 精简版:不包含内置嵌入模型,并且在版本名称后添加了**-slim**后缀。例如:infiniflow/ragflow:v0.20.1-slim
  • 完整版:包含内置嵌入模型,版本名称后没有额外的后缀。例如:infiniflow/ragflow:v0.20.1
重要

完整版中包括的嵌入模型是:

  • BAAI/bge-large-zh-v1.5
  • maidalun1020/bce-embedding-base_v1

这两个嵌入模型专门优化了英语和中文,如果用于其他语言文档的嵌入,则可能会影响性能。

v0.20.3

发布于2025年8月20日。

改进

  • 重新设计数据集、聊天和搜索页面的用户界面。
  • 搜索和聊天:引入了基于文档级别的元数据过滤,支持在聊天或搜索期间自动或手动进行过滤。
  • 搜索:支持创建适合各种业务场景的搜索应用
  • 聊天:允许在同一聊天页面上比较最多三个聊天模型设置的回答性能。
  • 代理:
    • 代理组件中实现了一个切换开关,用于启用或禁用引用。
    • 引入了通过拖放方法创建组件的功能。
  • 文档:修正了API参考中的不准确信息。

新的代理模板

  • 报告代理:一个生成内部问答场景总结报告的模板,支持显示表格和公式。#9427

修复的问题

  • v0.20.0版本中引入的时间超时机制导致GraphRAG等任务暂停。
  • 代理组件对话期间缺失了预定义的开场问候语。
  • 提示编辑器中的自动换行问题。
  • PyPDF引起的内存泄漏问题。#9469

API变更

已废弃

创建代理会话

v0.20.1

发布于2025年8月8日。

新功能

  • 检索组件现在支持使用变量动态指定知识库名称。
  • 用户界面新增了法语选项。

添加的模型

  • GPT-5
  • Claude 4.1

新的代理模板(工作流和代理)

  • SQL助理工作流:使非技术团队(如运营、产品等)能够独立查询业务数据。
  • 自选知识库工作流:允许用户在对话期间选择一个知识库进行查询。#9325
  • 自选知识库代理:提供更高质量的回答,适合复杂问题的长时间推理。#9325

修复的问题

  • 代理组件无法调用通过vLLM安装的模型。
  • 代理不能与团队共享。
  • 将代理嵌入网页的功能不起作用。

v0.20.0

发布于2025年8月4日。

兼容性变更

从v0.20.0版本开始,代理不再兼容早期版本,所有先前版本的现有代理都必须在升级后重建。

新功能

  • 代理和工作流的一体化调度。
  • 对代理进行了全面重构,大大增强了其能力和可用性,支持多代理配置、计划与反思以及可视化功能。
  • 完全实现了MCP功能,包括MCP服务器导入、代理作为MCP客户端运行以及RAGFlow本身作为一个MCP服务器运行。
  • 提供了代理的实时日志访问权限。
  • 管理面板中提供了与代理相关的聊天历史记录。
  • 集成了新版本的强大Infinity引擎,支持使用Infinity作为底层文档引擎实现自动标记功能。
  • 支持文件引用信息的新兼容OpenAI API。
  • 新模型的支持包括Kimi K2、Grok 4和Voyage嵌入。
  • RAGFlow的代码库现在在Gitee上进行了镜像。
  • 引入新的模型提供商,即Gitee AI。

新增的代理模板

  • 基于多代理的深度研究:由一个领导代理与多个子代理合作组成的团队工作模式,不同于传统的流程编排。
  • 利用内部知识库打造的智能问答聊天机器人,适用于客户服务和培训场景。
  • 用于筛选、分析和记录候选人信息的简历分析模板(RAGFlow 团队使用)。
  • 将原始想法转化为 SEO 友好型博客内容的工作流。
  • 智能客服工作流程。
  • 用户反馈分析模板:通过语义分析将用户反馈导向合适的团队。
  • 旅行规划助手:利用网页搜索和地图 MCP 服务器帮助进行旅游规划。
  • 图像翻译:从上传的照片中提取并翻译内容。
  • 信息检索助手,可以从内部知识库以及互联网上获取答案。

v0.19.1

发布于2025年6月23日。

解决的问题

  • 在高并发请求期间发生的内存泄漏问题。
  • 启用 GraphRAG 实体解析时,大文件解析冻结。#8223
  • 独立模式下使用沙箱(Sandbox)时出现的上下文错误。#8340
  • 由于 Ollama 导致的过度 CPU 使用问题。#8216
  • Code 组件中的一个错误。#7949
  • 在通过 API 创建知识库时,增加了对 Ollama 或 VLLM 安装的模型的支持。#8069
  • 启用了基于角色的身份验证以访问 S3 存储桶。#8149

新增的模型

  • Qwen 3 嵌入模型。#8184
  • Voyage 多模态 3. #7987

v0.19.0

发布于2025年5月26日。

新增特性

  • 知识和聊天模块中支持跨语言搜索(多语种环境中的知识库),增强了多语言环境下的搜索准确性和用户体验。
  • 代理组件:新的 Code 组件支持 Python 和 JavaScript 脚本,使开发人员能够处理更复杂的任务,例如动态数据处理。
  • 增强的图像显示:在聊天和搜索中,图像现在直接渲染到响应中,而不是作为外部引用。知识检索测试可以直接检索图像,而无需从图像中提取文本。
  • Claude 4 和 ChatGPT o3: 开发人员现在可以使用最新发布的、最先进的 Claude 模型以及 OpenAI 的最新 ChatGPT o3 推理模型。

下列特性由我们的社区贡献:

  • 代理组件:通过 Generate 组件启用工具调用。感谢 notsyncing
  • Markdown 渲染:分块后,Markdown 文件中的图像引用可以显示出来。感谢 Woody-Hu
  • 文档引擎支持:OpenSearch 现在可以用作 RAGFlow 的文档引擎。感谢 pyyuhao

技术文档

新增文档

v0.18.0

发布于2025年4月23日。

兼容性变化

从此次版本开始,内置的重新排名模型已被移除,因为它们对检索率的影响微乎其微,但显著增加了检索时间。

新增特性

  • MCP 服务器:通过 MCP 访问 RAGFlow 的知识库。
  • DeepDoc 支持在文档布局识别中采用 VLM 模型作为处理管道,在 PDF 和 DOCX 文件中的图像进行深度分析。
  • 兼容 OpenAI 的 API:代理可以通过兼容的 OpenAI API 调用。
  • 用户注册控制:管理员可以通过环境变量启用或禁用用户注册功能。
  • 团队协作:可以与团队成员共享代理。
  • 代理版本控制:所有更新都会被持续记录,并可通过导出回滚到先前版本。

export_agent

改进

  • 增强了引用答案的准确性:生成响应中的引文准确性得到了改进。
  • 提升问答体验:用户现在可以在对话中手动停止流式输出。

技术文档

新增文档

v0.17.2

发布于2025年3月13日。

兼容性更改

  • 移除“聊天配置”中的Max_tokens设置。
  • 移除“生成”、“重写”、“分类”、“关键字”代理组件中的Max_tokens设置。

从此次发布开始,如果您发现RAGFlow的响应被截断或缩短,请检查您的模型提供者所设定的Max_tokens值。

改进

  • 增加了与OpenAI兼容的API。
  • 引入德语用户界面。
  • 加快知识图谱提取速度。
  • 在“检索”代理组件中启用Tavily网络搜索功能。
  • 添加通义千问QwQ模型(与OpenAI兼容)。
  • 支持在“通用”分块方法中使用CSV文件。

修复的问题

  • 无法通过Ollama/Xinference添加模型,该问题在v0.17.1版本中引入。

API变更

HTTP API

Python API

v0.17.1

发布日期:2025年3月11日。

改进

  • 提高英语分词质量。
  • 优化Markdown文档解析中的表格提取逻辑。
  • 更新SiliconFlow的模型列表。
  • 支持解析XLS文件(Excel 97-2003)并改进相应的错误处理。
  • 支持Huggingface重排模型。
  • 在聊天助手和“重写”代理组件中支持相对时间表达式(如“现在”,“昨天”,“上周”,“明年”等)。

已修复的问题

  • 重复知识图谱提取问题。
  • API调用相关的问题。
  • “PDF解析器”,即“文档解析器”的下拉菜单缺少选项。
  • Tavily网络搜索中的问题。
  • 在AI聊天中无法预览图表或图片。

文档更新

新增文档

v0.17.0

发布日期:2025年3月3日。

新功能

  • AI聊天:实现深度研究以支持代理推理。要激活此功能,请在您的聊天助手对话的“Prompt engine”选项卡下启用Reasoning切换。
  • AI聊天:利用基于Tavily的网络搜索来增强代理推理中的上下文信息。要激活此项功能,您需要在聊天助手对话的“Assistant settings”选项卡中输入正确的Tavily API密钥。
  • AI聊天:支持不指定知识库的情况下开始聊天。
  • AI聊天:除了PDF文件外,现在也可以预览和引用HTML文件。
  • 数据集:在数据集配置中增加了一个名为PDF解析器(或称为“文档解析器”)的下拉菜单。这包括一个耗时较长的DeepDoc模型选项、一种更快速的naive选项(纯文本),该选项跳过DLA(文档布局分析)、OCR(光学字符识别)和TSR(表格结构识别)任务,以及几种目前处于实验阶段的大规模模型选项,请参阅此处
  • 代理组件:在“生成”或“模板”组件的系统提示字段中可以使用**(x)** 或正斜线 / 插入可用键(变量)。
  • 对象存储:支持将阿里云OSS(对象存储服务)作为文件存储选项。
  • 模型:更新通义千问(Qwen)支持的模型列表,增加了DeepSeek专用模型;并将ModelScope添加为模型提供商。
  • APIs: 文档元数据可以通过API进行更新。

以下图示展示了RAGFlow深度研究的工作流程:

图片

以下是集成深度研究的对话截图:

图片

API变更

HTTP APIs

更新文档方法中添加了body参数 "meta_fields"

Python APIs

更新文档方法中添加了一个键选项 "meta_fields"

文档更新

新增文档

v0.16.0

发布日期:2025年2月6日。

新功能

  • 支持DeepSeek R1和DeepSeek V3。
  • 图谱RAG重构:知识图是在整个知识库(数据集)上动态构建的,而不是在单个文件上,并且当新上传的文件开始解析时自动更新。请参见此处
  • 添加了一个迭代代理组件和一个研究报告生成器代理模板。请参见此处
  • 新的用户界面语言:葡萄牙语。
  • 允许为知识库中的特定文件设置元数据,以增强AI驱动的聊天功能。详情请参阅这里
  • 升级RAGFlow文档引擎 Infinity 至 v0.6.0.dev3 版本。
  • 支持为DeepDoc启用GPU加速(查看docker-compose-gpu.yml)。
  • 支持创建和引用一个标签知识库,这是弥合查询与响应语义差距的重要里程碑。
重要

在文档引擎 Infinity 中, 标签知识库 功能 不可用

文档

新增文档

v0.15.1

发布于2024年12月25日。

升级

  • 升级了RAGFlow的文档引擎Infinity到v0.5.2版本。
  • 改进了文档解析状态的日志显示功能。

修复的问题

此版本修复以下问题:

  • Infinity返回的SCORE not foundposition_int错误。
  • 在特定知识库中更改嵌入模型后,其他知识库中的嵌入模型无法再进行更改。
  • 由于重复加载嵌入模型导致问答和AI搜索响应慢。
  • 使用RAPTOR解析文档时失败。
  • 使用表格解析方法会导致信息丢失。
  • 其他API问题。

API变更

HTTP APIs

向以下API添加了一个可选参数"user_id"

v0.15.0

发布于2024年12月18日。

新功能

  • 引入了更多特定于Agent的API。
  • 支持使用页面排名分数在跨多个知识库搜索时提高检索性能。
  • 在聊天和代理中提供了一个iframe,方便将RAGFlow集成到网页上。
  • 添加了一个Helm图表以部署RAGFlow至Kubernetes平台。
  • 支持以JSON格式导入或导出Agent。
  • 支持Agent组件/工具的分步执行。
  • 新增用户界面语言:日语。
  • 支持从失败处恢复GraphRAG和RAPTOR,增强了任务管理的弹性。
  • 添加了更多Mistral模型。
  • 在UI中添加暗色模式,允许用户在浅色和深色主题之间切换。

优化

  • 升级了DeepDoc中的文档布局分析模型。
  • 使用Infinity作为文档引擎时的检索性能得到了显著提升。

HTTP APIs

Python APIs

v0.14.1

发布于2024年11月29日。

改进

添加了Infinity的配置文件,以便集成和自定义RAGFlow作为文档引擎。从此次发布开始,可以在RAGFlow中直接更新Infinity的配置,并通过使用docker compose重启RAGFlow后立即生效。#3715

修复的问题

此版本解决了以下问题:

  • 点击块后无法显示或编辑内容。
  • Elasticsearch中的“未找到”错误。
  • 在解析过程中中文文本出现乱码。
  • Polars的兼容性问题。
  • Infinity与GraphRAG之间的兼容性问题。

v0.14.0

发布于2024年11月26日。

新功能

  • 支持使用Infinity或Elasticsearch(默认)作为文档引擎进行向量存储和全文索引。#2894
  • 通过增加更多变量到代理中并实现自动保存来增强用户体验。
  • 添加了一个基于Andrew Ng的翻译代理启发的三步翻译代理模板。
  • 添加了SEO优化的博客写作代理模板。
  • 提供HTTP和Python API与代理进行对话。
  • 支持在检索过程中使用英语同义词。
  • 优化术语权重计算,将检索时间减少了50%。
  • 改进任务执行监控并添加额外的性能指标。
  • 将Redis替换为Valkey。
  • 添加了三种新的UI语言(由社区贡献):印尼语、西班牙语和越南语。

兼容性变更

从此次发布开始,service_config.yaml.template 文件取代了 service_config.yaml 用于配置后端服务。在Docker容器启动时,此模板文件中定义的环境变量会自动填充,并自动生成一个service_config.yaml#3341

这种做法消除了在更改 .env 后手动更新 service_config.yaml 的需要,从而促进了动态环境配置。

重要

确保在尝试此新方法之前同时升级您的代码和Docker镜像到此次发布

API变更

HTTP APIs

Python APIs

文档更新

新增文档

v0.13.0

发布于2024年10月31日。

新功能

  • 为所有用户提供团队管理功能。
  • 更新代理UI以提高易用性。
  • 在通用分块方法中添加Markdown片段支持。
  • 在代理UI内引入一个invoke工具。
  • 集成Dify知识库API的支持。
  • 添加GLM4-9B和Yi-Lightning模型的支持。
  • 引入用于数据集管理、数据集中文件管理和聊天助手管理的HTTP和Python API。
提示

要下载RAGFlow的Python SDK:

pip install ragflow-sdk==0.13.0

文档更新

新增文档

v0.12.0

发布于2024年9月30日。

新增功能

  • 提供了RAGFlow的Docker镜像精简版,这些版本不包含内置的BGE/BCE嵌入或重排模型。
  • 改进了多轮对话的结果。
  • 允许用户移除已添加的大规模语言模型(LLM)供应商。
  • 添加了对OpenTTSSparkTTS模型的支持。
  • 在通用分块方法中实现了一个“Excel到HTML”的切换功能,允许用户根据需要将电子表格解析为HTML表或按行的键值对。
  • 增加了代理工具YahooFinanceJin10
  • 添加了一个投资顾问代理模板。

兼容性变化

从这次发布开始,RAGFlow提供精简版Docker镜像以改善互联网访问受限用户的体验。RAGFlow的精简版Docker镜像不包含内置的BGE/BCE嵌入模型,大小约为1GB;完整版的RAGFlow大约为9GB,并包含了内置的嵌入模型和在RAGFlow UI中选择后将下载的嵌入模型。

默认的Docker镜像版本是nightly-slim。以下是不同版本之间差异的说明:

  • nightly-slim: 最近测试过的精简版Docker镜像。
  • v0.12.0-slim: 最新发布的官方精简版Docker镜像。
  • nightly: 最近测试过的完整版Docker镜像。
  • v0.12.0: 最新的官方发布完整版Docker镜像。

请参阅升级RAGFlow了解如何进行升级的说明。

文档

新增文档

v0.11.0

发布于2024年9月14日。

新增功能

  • 引入了RAGFlow UI中的AI搜索界面。
  • 支持通过FishAudioTongyi Qwen TTS输出音频。
  • 允许使用Postgres进行元数据存储,除了MySQL外的选项。
  • 支持对象存储选项,如S3或Azure Blob。
  • 支持的模型供应商包括:Anthropic, Voyage AI, 和Google Cloud
  • 支持使用Tencent Cloud ASR进行音频内容识别。
  • 添加了金融特定代理组件:WenCai, AkShare, YahooFinanceTuShare
  • 添加了一个医疗顾问代理模板。
  • 支持在以下数据集上运行检索基准测试:

v0.10.0

发布于2024年8月26日。

新增功能

  • 在代理UI中引入了文本到SQL的模板。
  • 实现了代理APIs。
  • 集成了任务执行器监控。
  • 引入了GitHub, DeepL, BaiduFanyi, QWeather, 和GoogleScholar等代理工具。
  • 支持EML文件的分块处理。
  • 支持更多LLM或模型服务:GPT-4o-mini, PerfXCloud, TogetherAI, Upstage, Novita AI, 01.AI, SiliconFlow, PPIO, XunFei Spark, Baidu Yiyan, 和Tencent Hunyuan

v0.9.0

发布于2024年8月6日。

新增功能

  • 支持GraphRAG作为分块方法。
  • 引入了代理组件“Keyword”和搜索工具,包括Baidu, DuckDuckGo, PubMed, Wikipedia, Bing, 和Google
  • 支持音频文件的语音识别功能。
  • 支持模型供应商GeminiGroq
  • 支持推理框架、引擎和服务,包括LM studio, OpenRouter, LocalAI, 以及Nvidia API
  • 支持在Xinference中使用重排模型。

v0.8.0

发布于2024年7月8日。

新增功能

  • 支持代理式RAG,可以构建基于图的工作流以实现RAG和代理的功能。
  • 支持的模型供应商包括Mistral, MiniMax, BedrockAzure OpenAI
  • 在手动分块方法中支持DOCX文件。
  • 在问答分块方法中支持DOCX、MD、PDF文件。

v0.7.0

发布于2024年5月31日。

新增功能

  • 支持使用重排模型。
  • 集成了重排和嵌入模型:BCE, BGEJina
  • 支持LLM Baichuan和VolcanoArk。
  • 实现了RAPTOR,以提高文本检索的性能。
  • 在通用分块方法中支持HTML文件。
  • 提供通过HTTP和Python API根据ID删除文档的功能。
  • 支持ARM64平台。
重要

虽然我们在ARM64平台上也测试了RAGFlow,但不维护适用于ARM的RAGFlow Docker镜像。

如果您在使用ARM平台,请参考此指南来构建RAGFlow Docker镜像。

API变更

HTTP API

Python API

v0.6.0

发布于2024年5月21日。

新增功能

  • 支持流式输出。
  • 提供HTTP和Python API用于检索文档块。
  • 支持系统组件的监控,包括Elasticsearch、MySQL、Redis和MinIO。
  • 在GENERAL分块方法中支持禁用Layout Recognition以减少文件分块时间。

API变更

HTTP API

Python API

v0.5.0

发布于2024年5月8日。

新增功能

  • 支持LLM DeepSeek。