抽象神经网络背景图

RAS 革命

从 RAG 到结构化知识增强

破解大型语言模型(LLM)短板的新范式:通过知识结构化实现从信息检索到知识创造的认知升维

核心突破

从信息搬运到知识创造的认知升维

技术架构

检索 → 结构化 → 生成三步法

应用前景

医疗、金融等高风险领域深度应用

革命性突破

LLM核心短板

  • 知识更新不及时,静态知识库限制
  • 模型幻觉问题,生成虚构内容
  • 缺乏深度推理能力,逻辑链条易断裂

RAS解决方案

  • 提升知识准确性与时效性
  • 增强逻辑推理严谨性与可解释性
  • 扩展特定领域的专业能力

"知识的形式决定了智能的深度。与其让LLM在杂乱无章的文本信息中'大海捞针',不如先对这些信息进行整理、提炼和结构化,构建一个清晰的知识网络。"

— RAS范式核心理念

当前大型语言模型的核心短板

当LLM被应用于真实世界的复杂场景时,其固有的局限性逐渐暴露,催生了从RAG到RAS的新范式

知识更新不及时与静态知识库

训练数据截止导致的知识陈旧

LLM的知识库是一个庞大但静止的图书馆,其馆藏在模型训练完成的那一刻就被封存了。这意味着模型无法回答任何关于训练截止日期之后发生的事件的问题。

表现特征
  • • 无法获取最新事件信息
  • • 基于过时知识进行猜测
  • • 可能产生误导性回答
影响领域
  • • 金融:市场动态分析
  • • 医疗:最新治疗方案
  • • 法律:法规政策更新

无法动态获取最新信息

LLM的推理过程完全依赖于其内部已固化的参数,缺乏与外部动态数据源进行交互的机制。这种能力的缺失,使得LLM在处理需要实时数据支持的任务时表现不佳。

缺乏深度与严谨的逻辑推理能力

多步推理链条的断裂与逻辑跳跃

当一个问题需要跨越多个信息点、进行多步推理才能得出答案时,LLM往往容易出现逻辑跳跃或推理链条断裂的情况。

多跳推理示例:

"A的妻子是谁?"

已知:"A是B的儿子"和"B的妻子是C"

推理路径:A → B的儿子 → B的妻子是C → A的母亲是C

复杂逻辑问题中的推理能力不足

对于需要精确计算、符号操作或严格逻辑规则的复杂任务,LLM的短板尤为明显。微软亚洲研究院与清华大学联合提出的"推理链"框架指出,现有模型普遍依赖于单一的推理范式。

数学证明

精确计算能力不足

财务分析

复杂比率计算困难

法律条文

细微差别分析不准

模型幻觉(Hallucination)问题

生成与事实不符或虚构的内容

模型幻觉是LLM最为人诟病的问题之一,指的是模型生成与事实不符、无中生有或虚构的内容。这种现象的根源在于LLM的本质是一个概率性的文本生成模型。

幻觉产生机制:
缺乏足够信息时进行"猜测"
倾向于依赖内部记忆而非实时输入
微调可能加剧幻觉问题

在非结构化信息中易受噪声干扰

传统的RAG方法虽然通过检索外部文档来提供上下文,但检索到的文本片段往往是未经处理的、包含噪声的原始信息。这些杂乱、非原子化的信息可能包含矛盾、误导性内容。

噪声干扰示例:

查询:阿司匹林的治疗效果

检索结果1:"阿司匹林可以治疗头痛"

检索结果2:"阿司匹林可能导致胃出血"

问题:缺乏上下文说明适用条件和剂量

处理复杂任务的局限性

难以整合多源异构信息

现实世界中的许多任务,如企业决策、科学研究或项目管理,都需要综合来自不同来源和不同格式的信息。LLM在有效整合这些信息并进行统一推理方面仍存在困难。

文本数据

年度报告、新闻

结构化数据

财务报表、数据库

动态数据

市场新闻、实时更新

长期依赖与动态规划能力不足

许多复杂任务需要模型具备长期依赖和动态规划的能力。然而,LLM的上下文窗口是有限的,这限制了它们处理长序列信息和维持长期记忆的能力。

能力缺失表现:
缺乏"计划-执行-反思"循环
一次性生成完整解决方案
难以应对动态任务
缺乏持续学习能力

从 RAG 到 RAS:范式演进的必然性

为了应对LLM的短板,研究者们提出了RAG技术,但其局限性催生了RAS范式的诞生

技术演进路径

graph LR A["传统LLM
静态知识库"] --> B["RAG
检索增强生成"] B --> C["RAS
检索与结构化"] A1["知识陈旧"] --> A A2["幻觉问题"] --> A A3["推理局限"] --> A B1["开卷考试"] --> B B2["外部检索"] --> B B3["非结构化文本"] --> B C1["知识结构化"] --> C C2["知识图谱"] --> C C3["可追溯推理"] --> C style A fill:#ffebee,stroke:#f44336,stroke-width:2px,color:#000 style B fill:#fff3e0,stroke:#ff9800,stroke-width:2px,color:#000 style C fill:#e8f5e8,stroke:#4caf50,stroke-width:2px,color:#000 style A1 fill:#ffcdd2,stroke:#f44336,stroke-width:1px,color:#000 style A2 fill:#ffcdd2,stroke:#f44336,stroke-width:1px,color:#000 style A3 fill:#ffcdd2,stroke:#f44336,stroke-width:1px,color:#000 style B1 fill:#ffe0b2,stroke:#ff9800,stroke-width:1px,color:#000 style B2 fill:#ffe0b2,stroke:#ff9800,stroke-width:1px,color:#000 style B3 fill:#ffe0b2,stroke:#ff9800,stroke-width:1px,color:#000 style C1 fill:#c8e6c8,stroke:#4caf50,stroke-width:1px,color:#000 style C2 fill:#c8e6c8,stroke:#4caf50,stroke-width:1px,color:#000 style C3 fill:#c8e6c8,stroke:#4caf50,stroke-width:1px,color:#000

RAS演进过程:从静态知识库到结构化知识增强

支持拖拽移动和缩放操作

RAG的贡献与局限

RAG的核心贡献

  • 开卷考试模式,动态访问外部知识
  • 无需昂贵微调,成本效益高
  • 显著降低幻觉概率,提升可信度
RAG工作流程

1. 接收用户查询

2. 从外部知识库检索相关信息

3. 将检索结果作为上下文提供给LLM

4. LLM基于上下文生成答案

RAG的局限性

  • 非结构化文本包含大量噪声和冗余
  • 缺乏明确的逻辑关系和层次结构
  • 难以进行有效的多步推理
检索粒度难题

文本块过大:引入过多噪声,干扰判断

文本块过小:丢失关键上下文,信息不完整

RAG的困境示例
检索到的文本片段

• "苹果公司2024年Q1营收达到1200亿美元"

• "苹果股价在过去一个月下跌5%"

• "苹果公司面临供应链挑战"

• "iPhone 15销量创新高"

问题:信息缺乏结构化

• 时间线不明确

• 因果关系不清晰

• 缺乏逻辑关联

• 难以进行综合分析

RAS范式的提出

从"信息搬运"到"知识创造"的认知升维

RAS核心思想

在RAG的"检索"和"生成"之间,增加一个至关重要的"结构化"步骤,将非结构化文本转化为有组织、有结构的知识表示形式。

知识图谱构建
实体关系提取
逻辑结构组织

本质转变

  • 不再将LLM视为"高级复读机"
  • 培养"理解"和"思考"的知识工作者
  • 消除噪声,提供可推理的知识体系

RAS工作流程:三步法

检索 (Retrieval)

从外部知识源检索相关信息,全面召回原始文本数据

结构化 (Structuring)

信息抽取,构建知识图谱,清洗重组核心事实

生成 (Generation)

基于结构化知识进行推理,生成准确可靠的答案

结构化知识增强:破解LLM短板的关键突破

通过将非结构化文本转化为结构化知识图谱,RAS范式实现了从"信息检索"到"知识构建"的革命性转变

提升知识获取的准确性与时效性

连接动态更新的结构化知识源

RAS可以直接对接结构化的知识源,如实时更新的知识图谱、关系型数据库或领域本体,彻底解决知识陈旧和专业知识不足的问题。

优势特点:
  • • 实时更新的财报数据、股权变动
  • • 领域本体定义的知识关联
  • • 无需费力提取和整合信息

确保知识的精确性与可验证性

"实体-关系-实体"三元组表示方式具有高度的精确性和原子性,消除了自然语言中的歧义和模糊性。

示例:

自然语言:"蒂姆·库克是苹果公司的CEO"

结构化表示:

实体1: 苹果公司

关系: hasCEO

实体2: 蒂姆·库克

知识准确性对比示例

传统RAG方法

检索文本:"苹果公司去年营收很好,股价表现不错,但最近有些波动"

问题:

  • • "去年"具体指哪一年?
  • • "很好"是多好的程度?
  • • "最近"是多久之前?
  • • "波动"的具体幅度?
RAS结构化方法

知识图谱:

• 苹果公司 → 2023年营收 → 1200亿美元

• 苹果公司 → 2024年Q1股价 → 下跌5%

• 苹果公司 → 供应链 → 面临挑战

• iPhone 15 → 销量 → 创新高

增强逻辑推理的严谨性与可解释性

知识图谱多步推理

知识图谱本身就是天然的推理引擎,LLM可以在图上进行"漫步",从一个实体出发,沿着关系边逐步探索,构建显式推理链。

推理示例:

问题:"谁是X公司CEO的配偶的兄弟?"

1. 找到"X公司"的"CEO"实体

2. 找到该CEO的"配偶"实体

3. 找到该配偶的"兄弟"实体

减少幻觉提升透明度

推理过程锚定在显式的、事实驱动的知识结构上,从根本上抑制模型"自由发挥"产生幻觉的倾向。

透明度优势:
  • • 每一步推理都有明确依据
  • • 可视化展示推理路径
  • • 便于调试和优化系统

推理过程可视化

示例问题:"苹果公司CEO的配偶的兄弟是谁?"
苹果公司
CEO
配偶
兄弟

推理路径:苹果公司 → hasCEO → 蒂姆·库克 → spouse → 劳伦·鲍威尔 → brother → 答案

扩展模型在特定领域的专业能力

结合领域知识图谱提升专业性

通过构建领域专属的知识图谱,可以将复杂的领域知识系统地组织起来,与LLM的能力相结合,打造真正具备专业水准的AI应用。

医疗领域
  • • 疾病、症状、药物
  • • 基因、临床试验
  • • 复杂医学关系
金融领域
  • • 财报数据、股权变动
  • • 监管规则、风控模型
  • • 欺诈检测系统
法律领域
  • • 法律条文、判例
  • • 司法解释、合规规则
  • • 合同条款分析
工业领域
  • • 生产参数、设备数据
  • • 时序预测、异常监测
  • • 优化控制策略

成功案例:清华大学"极数"大模型

技术特点
  • • 专门针对工业时序数据
  • • 处理生产参数和设备运行数据
  • • 结构化数据建模能力
  • • 支持长期预测和异常检测
性能表现
  • • 工业时序预测超越专用模型
  • • 异常监测准确率提升
  • • 优化控制策略效果显著
  • • 展示了结构化知识的巨大潜力

高风险领域的深度应用

可解释性

推理过程可追溯,每一步都有明确依据

可追责性

决策过程透明,错误可以追溯和修正

安全性

可靠落地关键领域,降低风险

RAS范式的技术实现与核心机制

RAS范式的成功不仅在于其前瞻性的理念,更在于其背后一系列精巧的技术实现和核心机制

知识结构化:从文本到知识图谱

信息提取(IE)

从非结构化文本中识别出结构化信息,包括命名实体识别(NER)和关系提取(RE)。

示例句子:

"苹果公司于2024年发布了新款iPhone"

NER结果:
  • • "苹果公司" → ORG
  • • "2024年" → DATE
  • • "iPhone" → PRODUCT
RE结果:
  • • "发布" → 苹果公司->iPhone
  • • "于" → 苹果公司->2024年

知识图谱构建(KG)

将离散的"实体-关系-实体"三元组构建成连贯的知识图谱,涉及实体消歧、关系融合和图谱优化。

构建挑战:
  • 实体消歧:"苹果" vs "苹果公司"
  • 关系融合:"是...的CEO" vs "担任...首席执行官"
  • 相似实体聚类,降低图谱稀疏性

现代信息提取工具

kg-gen工具包
  • • 利用LLM强大的自然语言理解能力
  • • 从纯文本构建高质量知识图谱
  • • 简化信息提取流程
  • • 自动实体聚类和关系标准化
技术优势
  • • 端到端自动化处理
  • • 高质量实体识别
  • • 关系抽取精度高
  • • 支持多种知识表示格式

知识图谱构建示例

输入文本

"蒂姆·库克是苹果公司的CEO。他于2011年接替史蒂夫·乔布斯。苹果公司总部位于加利福尼亚州库比蒂诺市。"

IE提取结果

实体:蒂姆·库克 (人名)

实体:苹果公司 (组织)

实体:史蒂夫·乔布斯 (人名)

实体:库比蒂诺市 (地名)

关系:isCEOOf(蒂姆·库克, 苹果公司)

关系:succeeded(蒂姆·库克, 史蒂夫·乔布斯)

关系:headquarteredIn(苹果公司, 库比蒂诺市)

构建的知识图谱

• 蒂姆·库克 —isCEOOf→ 苹果公司

• 蒂姆·库克 —succeeded→ 史蒂夫·乔布斯

• 苹果公司 —headquarteredIn→ 库比蒂诺市

• 库比蒂诺市 —locatedIn→ 加利福尼亚州

知识图谱可视化展示

结构增强的检索与生成

结构增强检索

利用知识图谱的语义结构进行智能导航,避免关键词匹配的局限性,实现精准信息定位。

检索策略:
直接查找实体关系连接
利用分类法引导检索
语义导航而非关键词匹配

结构增强生成

将知识图谱作为逻辑推理的"演算板",引导LLM在图上进行逐步推理。

先进技术:
ToG (Think-on-Graph)

在知识图谱上逐步探索,构建显式推理链

GoT (Graph-of-Thought)

将推理过程结构化为图,支持多路径探索

GraphRAG

结构化知识浓缩成简洁文本摘要

推理技术对比

技术 特点 优势 适用场景
ToG 线性推理链 推理过程清晰 单一路径查询
GoT 图结构推理 多路径探索 复杂问题求解
GraphRAG 子图摘要 全局理解 复杂查询回答

推理过程演示

查询示例

"在苹果公司工作超过10年的高级工程师有哪些?"

ToG推理步骤

1. 定位"苹果公司"实体

2. 查找"hasEmployee"关系

3. 筛选"高级工程师"

4. 验证"工作超过10年"

5. 收集结果实体

知识图谱支持

• 实体类型分类

• 时间属性标注

• 职位关系定义

• 精确数值比较

结果优势

• 答案准确可验证

• 推理过程透明

• 支持复杂条件查询

• 减少幻觉产生

迭代式RAS循环

动态知识结构化

系统首先通过分类法增强的检索器找到相关文档,立即结构化为初步子图,形成查询特定的知识图谱。

动态构建特点:
  • • 根据查询需求灵活组织知识
  • • 不依赖庞大不相关的静态知识库
  • • 支持实时构建和更新
  • • 发现信息不足时进入下一轮循环

行动规划模块

当LLM在初步推理中遇到困难时,行动规划模块会分析当前知识图谱和查询目标,生成新的、更具体的子查询。

迭代求精机制:

检索 → 结构化 → 推理 → 再检索

系统像人类专家一样,通过不断提问和探索来逐步解决复杂问题

迭代循环流程

graph TD A["初始查询"] --> B{"检索相关文档"} B --> C["结构化为知识图谱"] C --> D["LLM推理尝试"] D --> E{"答案是否满意?"} E -->|是| F["生成最终答案"] E -->|否| G["行动规划模块"] G --> H["分析知识缺口"] H --> I["生成子查询"] I --> J["新一轮检索"] J --> K["补充结构化知识"] K --> D F --> L["输出结果"] style A fill:#e3f2fd,stroke:#2196f3,stroke-width:2px,color:#000 style B fill:#fff3e0,stroke:#ff9800,stroke-width:2px,color:#000 style C fill:#f3e5f5,stroke:#9c27b0,stroke-width:2px,color:#000 style D fill:#e8f5e8,stroke:#4caf50,stroke-width:2px,color:#000 style E fill:#fff3e0,stroke:#ff9800,stroke-width:2px,color:#000 style F fill:#e8f5e8,stroke:#4caf50,stroke-width:2px,color:#000 style G fill:#fce4ec,stroke:#e91e63,stroke-width:2px,color:#000 style H fill:#fce4ec,stroke:#e91e63,stroke-width:2px,color:#000 style I fill:#fce4ec,stroke:#e91e63,stroke-width:2px,color:#000 style J fill:#fce4ec,stroke:#e91e63,stroke-width:2px,color:#000 style K fill:#fce4ec,stroke:#e91e63,stroke-width:2px,color:#000 style L fill:#e3f2fd,stroke:#2196f3,stroke-width:2px,color:#000

迭代式RAS循环:通过不断提问和探索解决复杂问题

支持拖拽移动和缩放操作

实际应用案例

复杂查询示例

"找出所有在2020年前加入苹果公司、目前担任高级工程师、且参与过iPhone 15项目研发的人员。"

第一轮:初步检索

• 检索苹果公司员工信息

• 发现信息不完整

• 缺少项目参与记录

子查询生成

• 生成"iPhone 15项目团队成员"子查询

• 生成"苹果公司高级工程师名单"子查询

• 生成"员工入职时间记录"子查询

迭代求精

• 补充检索项目信息

• 完善知识图谱结构

• 生成准确答案

• 提供完整推理路径

迭代循环的核心优势

类人思考

像专家一样通过提问探索解决问题

动态适应

根据推理进展调整检索策略

质量保证

持续完善知识结构确保答案质量

总结与展望

RAS范式代表了LLM在处理知识密集型任务方面的重大飞跃,开启了AI系统设计的新篇章

RAS革命的核心价值

从根本上改变LLM与外部知识的交互方式

可靠性的飞跃

将LLM的推理过程锚定在事实驱动的知识图谱上,极大抑制幻觉产生。

  • • 每个推理步骤都有明确依据
  • • 生成的答案可验证、可追溯
  • • 满足金融、医疗、法律等高风险领域需求

推理能力的深化

知识图谱为LLM提供多步、复杂逻辑推理的"演算板"。

  • • 解决传统方法难以处理的复杂查询
  • • 跨越多个信息点的推理能力
  • • 展现接近人类的深度思考能力

可解释性的增强

整个工作流程透明、可解释,从检索到结构化再到生成。

  • • 展示完整推理链条和知识来源
  • • 极大增强用户对AI系统的信任
  • • 为系统调试和优化提供清晰指引

RAS带来的变革性影响

技术层面
  • • 从信息检索到知识构建的转变
  • • 解决了LLM的幻觉和推理局限
  • • 实现了可验证、可追溯的推理过程
应用层面
  • • 拓展到高风险、高可靠性领域
  • • 支持复杂决策和分析任务
  • • 提供专业级的知识服务
人工智能技术应用场景展示

未来发展方向与挑战

技术挑战

检索效率

数据规模扩大时的快速准确检索,平衡性能与延迟。

  • • 规模化与延迟优化
  • • 自适应检索策略
  • • 智能判断查询复杂度
知识质量

自动化工具可能引入错误、噪声和矛盾。

  • • 噪声与不一致性控制
  • • 领域专家知识引入
  • • 跨领域一致性保证
集成复杂度

异构、动态知识与LLM推理过程的深度融合。

  • • 异源信息融合
  • • 冲突消解机制
  • • 实时适配与性能权衡

研究机会

多模态知识集成

无缝处理和融合图像、视频、音频等多模态信息。

  • • 构建统一跨模态知识索引
  • • 建立模态间语义连接
  • • 支持真正跨模态推理
跨语言系统

构建跨语言的统一知识图谱,打破语言壁垒。

  • • 多语言嵌入技术
  • • 平行语料库利用
  • • 低资源语言知识共享
交互式自我精炼

允许用户通过自然对话细化查询,系统自我检查优化。

  • • 强化学习优化机制
  • • 用户反馈整合
  • • 自我纠错能力提升
人机协作框架

智能地将需要专家验证的知识呈现给人类专家。

  • • 自动构建-人工验证闭环
  • • 高效整合专家反馈
  • • 持续学习改进
个性化知识投递

根据用户背景、兴趣和认知水平定制知识呈现。

  • • 背景感知定制
  • • 认知水平适配
  • • 提升用户体验
性能优化

优化大规模数据处理效率和系统响应速度。

  • • 分布式处理架构
  • • 缓存和索引优化
  • • 实时性能监控

未来愿景

未来人工智能技术概念图

"RAS范式不仅是一个技术框架,更是一种新的AI系统设计哲学,它将强大的生成能力与严谨的知识组织相结合,旨在构建更可靠、更智能、更具可解释性的AI应用。"

— RAS范式的发展愿景