发布版本
最新发布版本中的关键功能、改进和错误修复。
每个RAGFlow版本都有两个发行版:
- 精简版:不包含内置嵌入模型,并且在版本名称后添加了**-slim**后缀。例如:
infiniflow/ragflow:v0.20.1-slim
- 完整版:包含内置嵌入模型,版本名称后没有额外的后缀。例如:
infiniflow/ragflow:v0.20.1
完整版中包括的嵌入模型是:
- BAAI/bge-large-zh-v1.5
- maidalun1020/bce-embedding-base_v1
这两个嵌入模型专门优化了英语和中文,如果用于其他语言文档的嵌入,则可能会影响性能。
v0.20.3
发布于2025年8月20日。
改进
- 重新设计数据集、聊天和搜索页面的用户界面。
- 搜索和聊天:引入了基于文档级别的元数据过滤,支持在聊天或搜索期间自动或手动进行过滤。
- 搜索:支持创建适合各种业务场景的搜索应用
- 聊天:允许在同一聊天页面上比较最多三个聊天模型设置的回答性能。
- 代理:
- 在代理组件中实现了一个切换开关,用于启用或禁用引用。
- 引入了通 过拖放方法创建组件的功能。
- 文档:修正了API参考中的不准确信息。
新的代理模板
- 报告代理:一个生成内部问答场景总结报告的模板,支持显示表格和公式。#9427
修复的问题
- v0.20.0版本中引入的时间超时机制导致GraphRAG等任务暂停。
- 在代理组件对话期间缺失了预定义的开场问候语。
- 提示编辑器中的自动换行问题。
- PyPDF引起的内存泄漏问题。#9469
API变更
已废弃
v0.20.1
发布于2025年8月8日。
新功能
- 检索组件现在支持使用变量动态指定知识库名称。
- 用户界面新增了法语选项。
添加的模型
- GPT-5
- Claude 4.1
新的代理模板(工作流和代理)
- SQL助理工作流:使非技术团队(如运营、产品等)能够独立查询业务数据。
- 自选知识库工作流:允许用户在对话期间选择一个知识库进行查询。#9325
- 自选知识库代理:提供更高质量的回答,适合复杂问题的长时间推理。#9325
修复的问题
- 代理组件无法调用通过vLLM安装的模型。
- 代理不能与团队共享。
- 将代理嵌入网页的功能不起作用。
v0.20.0
发布于2025年8月4日。
兼容性变更
从v0.20.0版本开始,代理不再兼容早期版本,所有先前版本的现有代理都必须在升级后重建。
新功能
- 代理和工作流的一体化调度。
- 对代理进行了全面重构,大大增强了其能力和可用性,支持多代理配置、计划与反思以及可视化功能。
- 完全实现了MCP功能,包括MCP服务器导入、代理作为MCP客户端运行以及RAGFlow本身作为一个MCP服务器运行。
- 提供了代理的实时日志访问权限。
- 管理面板中提供了与代理相关的聊天历史记录。
- 集成了新版本的强大Infinity引擎,支持使用Infinity作为底层文档引擎实现自动标记功能。
- 支持文件引用信息的新兼容OpenAI API。
- 新模型的支持包括Kimi K2、Grok 4和Voyage嵌入。
- RAGFlow的代码库现在在Gitee上进行了镜像。
- 引入新的模型提供商,即Gitee AI。
新增的代理模板
- 基于多代理的深度研究:由一个领导代理与多个子代理合作组成的团队工作模式,不同于传统的流程编排。
- 利用内部知识库打造的智能问答聊天机器人,适用于客户服务和培训场景。
- 用于筛选、分析和记录候选人信息的简历分析模板(RAGFlow 团队使用)。
- 将原始想法转化为 SEO 友好型博客内容的工作流。
- 智能客 服工作流程。
- 用户反馈分析模板:通过语义分析将用户反馈导向合适的团队。
- 旅行规划助手:利用网页搜索和地图 MCP 服务器帮助进行旅游规划。
- 图像翻译:从上传的照片中提取并翻译内容。
- 信息检索助手,可以从内部知识库以及互联网上获取答案。
v0.19.1
发布于2025年6月23日。
解决的问题
- 在高并发请求期间发生的内存泄漏问题。
- 启用 GraphRAG 实体解析时,大文件解析冻结。#8223
- 独立模式下使用沙箱(Sandbox)时出现的上下文错误。#8340
- 由于 Ollama 导致的过度 CPU 使用问题。#8216
- Code 组件中的一个错误。#7949
- 在通过 API 创建知识库时,增加了对 Ollama 或 VLLM 安装的模型的支持。#8069
- 启用了基于角色的身份验证以访问 S3 存储桶。#8149
新增的模型
v0.19.0
发布于2025年5月26日。
新增特性
- 知识和聊天模块中支持跨语言搜索(多语种环境中的知识库),增强了多语言环境下的搜索准确性和用户体验。
- 代理组件:新的 Code 组件支持 Python 和 JavaScript 脚本,使开发人员能够处理更复杂的任务,例如动态数据处理。
- 增强的图像显示:在聊天和搜索中,图像现在直接渲染到响应中,而不是作为外部引用。知识检索测试可以直接检索图像,而无需从图像中提取文本。
- Claude 4 和 ChatGPT o3: 开发人员现在可以使用最新发布的、最先进的 Claude 模型以及 OpenAI 的最新 ChatGPT o3 推理模型。
下列特性由我们的社区贡献:
- 代理组件:通过 Generate 组件启用工具调用。感谢 notsyncing。
- Markdown 渲染:分块后,Markdown 文件中的图像引用可以显示出来。感谢 Woody-Hu。
- 文档引擎支持:OpenSearch 现在可以用作 RAGFlow 的文档引擎。感谢 pyyuhao。
技术文档
新增文档
v0.18.0
发布于2025年4月23日。
兼容性变化
从此次版本开始,内置的重新排名模型已被移除,因为它们对检索率的影响微乎其微,但显著增加了检索时间。
新增特性
- MCP 服务器:通过 MCP 访问 RAGFlow 的知识库。
- DeepDoc 支持在文档布局识别中采用 VLM 模型作为处理管道,在 PDF 和 DOCX 文件中的图像进行深度分析。
- 兼容 OpenAI 的 API:代理可以通过兼容的 OpenAI API 调用。
- 用户注册控制:管理员可以通过环境变量启用或禁用用户注册功能。
- 团队协作:可以与团队成员共享代理。
- 代理版本控制:所有更新都会被持续记录,并可通过导出回滚到先前版本。
改进
- 增强了引用答案的准确性:生成响应中的引文准确性得到了改进。
- 提升问答体验:用户现在可以在对话中手动停止流式输出。
技术文档
新增文档
v0.17.2
发布于2025年3月13日。
兼容性更改
- 移除“聊天配置”中的Max_tokens设置。
- 移除“生成”、“重写”、“分类”、“关键字”代理组件中的Max_tokens设置。
从此次发布开始,如果您发现RAGFlow的响应被截断或缩短,请检查您的模型提供者所设定的Max_tokens值。
改进
- 增加了与OpenAI兼容的API。
- 引入德语用户界面。
- 加快知识图谱提取速度。
- 在“检索”代理组件中启用Tavily网络搜索功能。
- 添加通义千问QwQ模型(与OpenAI兼容)。
- 支持在“通用”分块方法中使用CSV文件。
修复的问题
- 无法通过Ollama/Xinference添加模型,该问题在v0.17.1版本中引入。
API变更
HTTP API
Python API
v0.17.1
发布日期:2025年3月11日。
改进
- 提高英语分词质量。
- 优化Markdown文档解析中的表格提取逻辑。
- 更新SiliconFlow的模型列表。
- 支持解析XLS文件(Excel 97-2003)并改进相应的错误处理。
- 支持Huggingface重排模型。
- 在聊天助手和“重写”代理组件中支持相对时间表达式(如“现在”,“昨天”,“上周”,“明年”等)。
已修复的问题
- 重复知识图谱提取问题。
- API调用相关的问题。
- “PDF解析器”,即“文档解析器”的下拉菜单缺少选项。
- Tavily网络搜索中的问题。
- 在AI聊天中无法预览图表或图片。
文档更新
新增文档
v0.17.0
发布日期:2025年3月3日。
新功能
- AI聊天:实现深度研究以支持代理推理。要激活此功能, 请在您的聊天助手对话的“Prompt engine”选项卡下启用Reasoning切换。
- AI聊天:利用基于Tavily的网络搜索来增强代理推理中的上下文信息。要激活此项功能,您需要在聊天助手对话的“Assistant settings”选项卡中输入正确的Tavily API密钥。
- AI聊天:支持不指定知识库的情况下开始聊天。
- AI聊天:除了PDF文件外,现在也可以预览和引用HTML文件。
- 数据集:在数据集配置中增加了一个名为PDF解析器(或称为“文档解析器”)的下拉菜单。这包括一个耗时较长的DeepDoc模型选项、一种更快速的naive选项(纯文本),该选项跳过DLA(文档布局分析)、OCR(光学字符识别)和TSR(表格结构识别)任务,以及几种目前处于实验阶段的大规模模型选项,请参阅此处。
- 代理组件:在“生成”或“模板”组件的系统提示字段中可以使用**(x)** 或正斜线
/
插入可用键(变量)。 - 对象存储:支持将阿里云OSS(对象存储服务)作为文件存储选项。
- 模型:更新通义千问(Qwen)支持的模型列表,增加了DeepSeek专用模型;并将ModelScope添加为模型提供商。
- APIs: 文档元数据可以通过API进行更新。
以下图示展示了RAGFlow深度研究的工作流程:
以下是集成深度研究的对话截图:
API变更
HTTP APIs
在更新文档方法中添加了body参数 "meta_fields"
。
Python APIs
在更新文档方法中添加了一个键选项 "meta_fields"
。
文档更新
新增文档
v0.16.0
发布日期:2025年2月6日。
新功能
- 支持DeepSeek R1和DeepSeek V3。
- 图谱RAG重构:知识图是在整个知识库(数据集)上动态构建的,而不是在单个文件上,并且当新上传的文件开始解析时自动更新。请参见此处。
- 添加了一个迭代代理组件和一个研究报告生成器代理模板。请参见此处。
- 新的用户界面语言:葡萄牙语。
- 允许为知识库中的特定文件设置元数据,以增强AI驱动的聊天功能。详情请参阅这里。
- 升级RAGFlow文档引擎 Infinity 至 v0.6.0.dev3 版本。
- 支持为DeepDoc启用GPU加速(查看docker-compose-gpu.yml)。
- 支持创建和引用一个标签知识库,这是弥合查询与响应语义差距的重要里程碑。
在文档引擎 Infinity 中, 标签知识库 功能 不可用。
文档
新增文档
v0.15.1
发布于2024年12月25日。
升级
- 升级了RAGFlow的文档引擎Infinity到v0.5.2版本。
- 改进了文档解析状态的日志显示功能。
修复的问题
此版本修复以下问题:
- Infinity返回的
SCORE not found
和position_int
错误。 - 在特定知识库中更改嵌入模型后,其他知识库中的嵌入模型无法再进行更改。
- 由于重复加载嵌入模型导致问答和AI搜索响应慢。
- 使用RAPTOR解析文档时失败。
- 使用表格解析方法会导致信息丢失。
- 其他API问题。
API变更
HTTP APIs
向以下API添加了一个可选参数"user_id"
:
v0.15.0
发布于2024年12月18日。
新功能
- 引入了更多特定于Agent的API。
- 支持使用页面排名分数在跨多个知识库搜索时提高检索性能。
- 在聊天和代理中提供了一个iframe,方便将RAGFlow集成到网页上。
- 添加了一个Helm图表以部署RAGFlow至Kubernetes平台。
- 支持以JSON格式导入或导出Agent。
- 支持Agent组件/工具的分步执行。
- 新增用户界面语言:日语。
- 支持从失败处恢复GraphRAG和RAPTOR,增强了任务管理的弹性。
- 添加了更多Mistral模型。
- 在UI中添加暗色模式,允许用户在浅色和深色主题之间切换。
优化
- 升级了DeepDoc中的文档布局分析模型。
- 使用Infinity作为文档引擎时的检索性能得到了显著提升。
HTTP APIs
Python APIs
v0.14.1
发布于2024年11月29日。
改进
添加了Infinity的配置文件,以便集成和自定义RAGFlow作为文档引擎。从此次发布开始,可以在RAGFlow中直接更新Infinity的配置,并通过使用docker compose
重启RAGFlow后立即生效。#3715
修复的问题
此版本解决了以下问题:
- 点击块后无法显示或编辑内容。
- Elasticsearch中的“未找到”错误。
- 在解析过程中中文文本出现乱码。
- Polars的兼容性问题。
- Infinity与GraphRAG之间的兼容性问题。
v0.14.0
发布于2024年11月26日。
新功能
- 支持使用Infinity或Elasticsearch(默认)作为文档引擎进行向量存储和全文索引。#2894
- 通过增加更多变量到代理中并实现自动保存来增强用户体验。
- 添加了一个基于Andrew Ng的翻译代理启发的三步翻译代理模板。
- 添加了SEO优化的博客写作代理模板。
- 提供HTTP和Python API与代理进行对话。
- 支持在检索过程中使用英语同义词。
- 优化术语权重计算,将检索时间减少了50%。
- 改进任务执行监控并添加额外的性能指标。
- 将Redis替换为Valkey。
- 添加了三种新的UI语言(由社区贡献):印尼语、西班牙语和越南语。
兼容性变更
从此次发布开始,service_config.yaml.template 文件取代了 service_config.yaml 用于配置后端服务。在Docker容器启动时,此模板 文件中定义的环境变量会自动填充,并自动生成一个service_config.yaml。#3341
这种做法消除了在更改 .env 后手动更新 service_config.yaml 的需要,从而促进了动态环境配置。
确保在尝试此新方法之前同时升级您的代码和Docker镜像到此次发布。
API变更
HTTP APIs
Python APIs
文档更新
新增文档
v0.13.0
发布于2024年10月31日。
新功能
- 为所有用户提供团队管理功能。
- 更新代理UI以提高易用性。
- 在通用分块方法中添加Markdown片段支持。
- 在代理UI内引入一个invoke工具。
- 集成Dify知识库API的支持。
- 添加GLM4-9B和Yi-Lightning模型的支持。
- 引 入用于数据集管理、数据集中文件管理和聊天助手管理的HTTP和Python API。
要下载RAGFlow的Python SDK:
pip install ragflow-sdk==0.13.0
文档更新
新增文档
v0.12.0
发布于2024年9月30日。
新增功能
- 提供了RAGFlow的Docker镜像精简版,这些版本不包含内置的BGE/BCE嵌入或重排模型。
- 改进了多轮对话的结果。
- 允许用户移除已添加的大规模语言模型(LLM)供应商。
- 添加了对OpenTTS和SparkTTS模型的支持。
- 在通用分块方法中实现了一个“Excel到HTML”的切换功能,允许用户根据需要将电子表格解析为HTML表或按行的键值对。
- 增加了代理工具YahooFinance和Jin10。
- 添加了一个投资顾问代理模板。
兼容性变化
从这次发布开始,RAGFlow提供精简版Docker镜像以改善互联网访问受限用户的体验。RAGFlow的精简版Docker镜像不包含内置的BGE/BCE嵌入模型,大小约为1GB;完整版的RAGFlow大约 为9GB,并包含了内置的嵌入模型和在RAGFlow UI中选择后将下载的嵌入模型。
默认的Docker镜像版本是nightly-slim
。以下是不同版本之间差异的说明:
nightly-slim
: 最近测试过的精简版Docker镜像。v0.12.0-slim
: 最新发布的官方精简版Docker镜像。nightly
: 最近测试过的完整版Docker镜像。v0.12.0
: 最新的官方发布完整版Docker镜像。
请参阅升级RAGFlow了解如何进行升级的说明。
文档
新增文档
v0.11.0
发布于2024年9月14日。
新增功能
- 引入了RAGFlow UI中的AI搜索界面。
- 支持通过FishAudio或Tongyi Qwen TTS输出音频。
- 允许使用Postgres进行元数据存储,除了MySQL外的选项。
- 支持对象存储选项,如S3或Azure Blob。
- 支持的模型供应商包括:Anthropic, Voyage AI, 和Google Cloud。
- 支持使用Tencent Cloud ASR进行音频内容识别。
- 添加了金融特定代理组件:WenCai, AkShare, YahooFinance和TuShare。
- 添加了一个医疗顾问代理模板。
- 支持在以下数据集上运行检索基准测试:
v0.10.0
发布于2024年8月26日。
新增功能
- 在代理UI中引入了文本到SQL的模板。
- 实现了代理APIs。
- 集成了任务执行器监控。
- 引入了GitHub, DeepL, BaiduFanyi, QWeather, 和GoogleScholar等代理工具。
- 支持EML文件的分块处理。
- 支持更多LLM或模型服务:GPT-4o-mini, PerfXCloud, TogetherAI, Upstage, Novita AI, 01.AI, SiliconFlow, PPIO, XunFei Spark, Baidu Yiyan, 和Tencent Hunyuan。
v0.9.0
发布于2024年8月6日。
新增功能
- 支持GraphRAG作为分块方法。
- 引入了代理组件“Keyword”和搜索工具,包括Baidu, DuckDuckGo, PubMed, Wikipedia, Bing, 和Google。
- 支持音频文件的语音识别功能。
- 支持模型供应商Gemini和Groq。
- 支持推理框架、引擎和服务,包括LM studio, OpenRouter, LocalAI, 以及Nvidia API。
- 支持在Xinference中使用重排模型。
v0.8.0
发布于2024年7月8日。
新增功能
- 支持代理式RAG,可以构建基于图的工作流以实现RAG和代理的功能。
- 支持的模型供应商包括Mistral, MiniMax, Bedrock和Azure OpenAI。
- 在手动分块方法中支持DOCX文件。
- 在问答分块方法中支持DOCX、MD、PDF文件。
v0.7.0
发布于2024年5月31日。
新增功能
- 支持使用重排模型。
- 集成了重排和嵌入模型:BCE, BGE 和Jina。
- 支持LLM Baichuan和VolcanoArk。
- 实现了RAPTOR,以提高文本检索的性能。
- 在通用分块方法中支持HTML文件。
- 提供通过HTTP和Python API根据ID删除文档的功能。
- 支持ARM64平台。
虽然我们在ARM64平台上也测试了RAGFlow,但不维护适用于ARM的RAGFlow Docker镜像。
如果您在使用ARM平台,请参考此指南来构建RAGFlow Docker镜像。
API变更
HTTP API
Python API
v0.6.0
发布于2024年5月21日。
新增功能
- 支持流式输出。
- 提供HTTP和Python API用于检索文档块。
- 支持系统组件的监控,包括Elasticsearch、MySQL、Redis和MinIO。
- 在GENERAL分块方法中支持禁用Layout Recognition以减少文件分块时间。
API变更
HTTP API
Python API
v0.5.0
发布于2024年5月8日。
新增功能
- 支持LLM DeepSeek。