跳到主要内容

开始AI聊天

使用配置好的聊天助手启动一个基于人工智能的聊天。


知识库、无幻觉对话和文件管理是RAGFlow的三大支柱。在RAGFlow中的聊天基于特定的知识库或多个知识库进行。一旦您创建了知识库,完成了文件解析,并且运行了一次检索测试,就可以开始一个AI对话了。

开始AI聊天

您可以通过创建一个助手来启动AI对话。

  1. 在页面中间顶部点击Chat标签 > Create an assistant 来显示即将进行对话的Chat Configuration对话框。

    RAGFlow允许您为每个对话选择不同的聊天模型,同时可以在System Model Settings中设置默认模型。

  2. 更新助手设置

    • 助手名称 是您的聊天助手的名字。每个助手都对应一个具有独特知识库组合、提示语、混合搜索配置和大模型设置的对话。
    • 空响应
      • 如果您希望限制RAGFlow的回答仅基于知识库,可以在该字段中填写答案。这样,在没有找到答案时,它会统一使用这里设定的答案进行回应。
      • 如果您希望在未从知识库获取答案时让RAGFlow自由发挥,请保持为空,这可能会导致生成幻觉内容。
    • 显示引用:这是RAGFlow的一个重要功能,默认情况下启用。RAGFlow不像一个黑盒子,而是明确展示了其回答所依据的信息来源。
    • 选择相应的知识库。您可以选择一个或多个知识库,但请确保它们使用相同的嵌入模型,否则可能会引发错误。
  3. 更新提示引擎:在 系统 中,您需要填写LLM的提示信息,默认情况下可以保留默认提示。

    • 相似度阈值 设置每个文本块的相似性“门槛”。默认为0.2。相似分数低于此阈值的文本块将被过滤掉,不会出现在最终响应中。
    • 关键词相似权重 默认设置为0.7。RAGFlow 使用混合评分系统来评估不同文本块的相关性。这个值设置了关键词相似度在混合评分中的比重。
      • 如果 重排序模型 未填写,默认的混合评分系统将使用关键词相似度和向量相似度,其中默认分配给向量相似度部分的权重为1-0.7=0.3。
      • 如果 重排序模型 被选择,则混合评分系统会使用关键词相似度和重排序器评分,并且默认赋值于重排序器得分的部分是 1-0.7=0.3。
    • Top N 决定了要提供给LLM的文本块的最大数量。换句话说,即使检索到了更多的文本块,也只会提供前N个文本块作为输入。
    • 多轮优化 在多轮对话中使用现有上下文增强用户查询的能力,默认情况下启用。当开启时,它会消耗额外的LLM令牌,并显著增加生成答案的时间。
    • 使用知识图谱 表示在检索过程中是否使用指定的知识库中的知识图谱以支持跨跳问答。当打开时,这将涉及实体、关系和社区报告片段之间的迭代搜索,大大增加了检索时间。
    • 推理 表示是否通过深度寻求-R1/OpenAI o1等推理过程生成答案。一旦开启,在遇到未知话题时,聊天模型会自动在问答过程中整合深度研究,并动态地从外部知识中搜索并生成最终答案。
    • 重排序模型 设置要使用的重排序器模型,默认为空。
      • 如果 重排序模型 未填写,则混合评分系统将使用关键词相似度和向量相似度,其中默认分配给向量相似度部分的权重为1-0.7=0.3。
      • 如果 重排序模型 被选择,则混合评分系统会使用关键词相似度和重排序器得分,并且默认赋值于重排序器得分的部分是 1-0.7=0.3。
    • 跨语言搜索:可选 从下拉菜单中选择一个或多个目标语言。系统的默认聊天模型将把您的查询翻译成所选的目标语言,确保不同语言之间的语义匹配准确性,允许您检索到相关结果,而无需考虑语言差异。
      • 在选择目标语言时,请确保这些语言存在于知识库中以保证有效的搜索。
      • 如果没有选择任何目标语言,则系统只会按查询的语言进行搜索,可能会错过其他语言的相关信息。
    • 变量 指的是要在系统提示中使用的变量(键)。{knowledge} 是保留的变量。点击 添加 可为系统提示添加更多的变量。
      • 如果您不确定 变量 的逻辑,请保持原样不变。
      • 从 v0.20.3 开始,如果您在此处添加自定义变量,则传递它们值的方法只能是调用:
  4. 更新 模型设置:在 模型 设置中:选择聊天模型。虽然您已经在 系统模型设置 中选择了默认的聊天模型,但 RAGFlow 允许您为对话选择其他替代的聊天模型。

    • 自由度:通往 温度Top P存在惩罚频率惩罚 设置的快捷方式,表示了模型的自由程度。从 即兴创作精确平衡 ,每个预设配置都对应独特的 温度Top P存在惩罚频率惩罚 组合。

      • 此参数有三个选项:
        • 即兴创作:产生更具创意的回答。
        • 精确(默认):生成更为保守的回答。
        • 平衡:介于 即兴创作精确 之间的一个中间点。
    • 温度:模型输出的随机程度。
      默认值为 0.1。

      • 较低的数值会导致更确定性和可预测性的输出。
      • 较高的数值会带来更具创意和多样的输出。
      • 温度设为零时,相同的提示会产生同样的响应。
    • Top P:核心采样。

      • 通过设置阈值 P 并限制采样到累积概率超过 P 的令牌来减少生成重复或不自然文本的可能性。
      • 默认值为 0.3。
    • 存在惩罚:鼓励模型在响应中包含更多种类的令牌。

      • 较高的 存在惩罚 值会使得模型更有可能生成尚未出现在生成文本中的新令牌。
      • 默认值为 0.4。
    • 频率惩罚:阻止模型在同一段生成文本中过多重复相同的词语或短语。

      • 较高 频率惩罚 值会导致模型在使用重复的令牌时更加保守。
      • 默认值为 0.7。
  5. 现在,让我们开始演示:

    问题1

注意
  1. 单击答案上方的灯泡图标以查看扩展后的系统提示:

此灯泡图标仅在当前对话中可用。

  1. 滚动扩展提示以查看每个任务消耗的时间:

启示

更新现有聊天助手的设置

悬停在要编辑的聊天助手 > 编辑 以显示聊天配置对话框:

edit_chat

chat_config

将聊天功能集成到您的应用程序或网页中

RAGFlow 提供 HTTP 和 Python API,使您可以将 RAGFlow 的能力集成到应用程序中。请参阅以下文档以获取更多信息:

您可以使用 iframe 将创建的聊天助手嵌入到第三方网页中:

  1. 在继续之前,您必须获取一个API密钥;否则会出现错误消息。

  2. 悬停在要编辑的聊天助手 > 编辑 以显示 iframe 窗口:

    chat-embed

  3. 复制 iframe 并将其嵌入到您网页上的特定位置。