arrow_right
挑战1:语义相似实体间的远距离结构关系 - 现有方法过度依赖源文档,导致构建的知识图谱中许多实体在结构上不相近,尽管它们共享语义相似的属性。
arrow_right
挑战2:局部与全局知识之间的知识鸿沟 - 现有方法通常从全局或局部视角检索上下文,但未能解决这些知识层之间的内在差异,导致LLM难以协调不同范围的知识,产生不连贯的推理或不完整的答案。
Retrieval-Augmented Generation with Hierarchical Knowledge
HiRAG是一种创新的检索增强生成(RAG)方法,通过引入分层知识来增强RAG系统在索引和检索过程中的语义理解和结构捕获能力。该方法有效解决了现有RAG系统中存在的两个关键挑战:语义相似实体间的远距离结构关系以及局部与全局知识之间的知识鸿沟。
传统RAG系统架构示意图
HiRAG由两个核心模块组成:HiIndex(分层索引)和HiRetrieval(分层检索)。HiIndex构建分层知识图谱,增强语义相似实体间的连接;HiRetrieval则通过三层知识检索机制(全局层、桥接层和局部层)有效桥接局部实体描述与全局社区知识,弥合知识层之间的差距。
HiRAG框架由两个核心模块组成:
HiRAG框架的数学表示