使用标签集
使用标签集对数据集中的一段进行自动标记。
检索准确性是生产就绪的RAG框架的重要标准。除了增强检索的方法(如自动生成关键词、自动生成问题和知识图谱)外,RAGFlow还引入了自动标记功能来解决语义差距的问题。该自动标记功能可以根据与每个片段的相关性将用户定义标签集中的标签映射到您的知识库中相关的片段上。这种自动化机制允许您为现有的数据集添加额外的“层级”的特定领域知识,特别是在处理大量片段时尤为有用。
要使用此功能,请确保至少有一个正确配置的标签集,并在知识库(数据集)的设置页面中指定标签集(或多个),然后重新解析文档以启动自动标记过程。在此过程中,您的数据集中每个片段都将与指定的标签集中每一条目进行比较,并基于相似性自动添加相应的标签。
场景
当片段之间极其相似以至于难以区分时,自动标记功能就会派上用场。例如,在有一小部分关于iPhone的内容和大部分内容是关于iPhone外壳或配件的情况下,如果没有额外的信息,则很难检索到这些有关iPhone的片段。