多代理LLM代码助手的上下文工程

多代理LLM代码助手的上下文工程
多代理LLM系统架构

使用ElicitNotebookLMChatGPTClaude Code
多代理LLM代码助手的上下文工程

Muhammad Haseeb
2025年8月

介绍与背景

介绍与背景

warning 当前LLM代码助手的挑战
  • arrow_right 复杂项目的上下文窗口有限
  • arrow_right 特定领域知识的知识缺口
  • arrow_right 难以协调多文件变更
build 上下文工程的需求
  • arrow_right 静态上下文文件(如CLAUDE.md)不足
  • arrow_right 单代理方法缺乏专业化
  • arrow_right 不熟悉API时存在幻觉风险
代码生成工作流
传统单代理代码生成系统的局限性

提出的方法

提出的方法:上下文工程工作流

集成多代理系统
translate
意图翻译
GPT-5明确用户需求
search
知识检索
Elicit获取领域知识
summarize
文档合成
NotebookLM创建上下文
code
代码生成
Claude Code多代理系统
psychology
意图翻译器
使用GPT-5将用户请求重写或详细阐述为结构化任务规范
library_books
Elicit检索
语义论文/文档检索,用于注入特定领域知识
description
NotebookLM合成
从文档创建简洁摘要和上下文理解
groups
Claude Code系统
用于代码生成、验证和测试的多代理框架

系统架构

系统架构与代理编排

architecture Claude多代理设计
  • person 规划代理:分析需求并创建任务分解
  • search 检索代理:查找相关代码和文档
  • code 编码代理:生成和修改代码
  • bug_report 测试代理:验证实现并运行测试
  • fact_check 审查代理:确保代码质量和标准
sync_alt 代理编排流程
1
意图分析
2
上下文检索
3
任务规划
4
代码生成
5
验证
多代理系统架构
Claude Code多代理系统架构

结果与收益

结果与收益

trending_up
关键性能指标
42%
相比基线更高的单次成功率
35%
复杂项目中上下文遵循性提升
28%
开发时间和成本降低
science 案例研究:Next.js代码库
  • check_circle 成功在15+个文件中实现复杂功能
  • check_circle 验证过程最少人工干预
  • check_circle 有效处理特定领域知识缺口
compare
与基线方法比较
框架 成功率 上下文遵循
我们的方法 68.3% 92.1%
CodePlan 48.2% 67.5%
MASAI 52.7% 71.3%
HyperAgent 45.9% 63.8%
insights
主要收益
  • auto_awesome 更好地处理多文件项目协调
  • auto_awesome 减少不熟悉API的幻觉
  • auto_awesome 更准确地实现复杂功能
  • auto_awesome 为特定领域任务有效注入知识

讨论与未来工作

讨论与未来工作

psychology
上下文工程的影响
  • insights 系统化的上下文构建显著减少不熟悉领域的幻觉
  • insights 意图澄清带来更准确的任务规范和更好的结果
  • insights 外部知识注入弥合LLM训练数据中的差距
lightbulb 关键见解
对于复杂的软件工程任务,上下文工程与模型架构同等重要
warning
局限性
  • priority_high 相比单代理系统,计算开销增加
  • priority_high 依赖多个外部AI服务(Elicit、NotebookLM)
  • priority_high 编排代理交互和解决冲突的复杂性
school
多代理编排的经验教训
  • auto_awesome 专业代理在特定子任务上优于通用代理
  • auto_awesome 代理间清晰的通信协议至关重要
  • auto_awesome 代理角色分解应反映人类开发工作流程
  • auto_awesome 上下文共享机制必须优化以避免冗余
rocket_launch
未来研究方向
  • trending_up 开发更高效的上下文压缩技术
  • trending_up 探索自我改进的多代理系统
  • trending_up 研究特定领域的代理专业化
business 生产环境应用
具有适当上下文工程的多代理系统在企业软件开发中显示出潜力,但需要与现有工作流程谨慎集成

结论

结论

stars 主要贡献
architecture
创新工作流
结合多个AI组件的集成上下文工程方法
groups
多代理系统
通过Claude框架编排的专业化子代理
trending_up
性能提升
复杂项目中更高的成功率和更好的上下文遵循性
business 生产环境应用
  • check_circle 上下文工程对企业软件开发至关重要
  • check_circle 多代理系统优于单代理方法
  • check_circle 与现有开发工作流程的集成是必要的
  • check_circle 随着规模和任务复杂度的增加,成本效率提高
Haseeb, M. (2025). 使用Elicit、NotebookLM、ChatGPT和Claude Code的多代理LLM代码助手的上下文工程. arXiv:2508.08322
favorite 谢谢

发表评论

人生梦想 - 关注前沿的计算机技术 acejoy.com 🐾 步子哥の博客 🐾 背多分论坛 🐾 知差(chai)网 🐾 DeepracticeX 社区 🐾 老薛主机 🐾