
使用Elicit、NotebookLM、ChatGPT和Claude Code的
多代理LLM代码助手的上下文工程
Muhammad Haseeb
2025年8月
介绍与背景
warning
当前LLM代码助手的挑战
- arrow_right 复杂项目的上下文窗口有限
- arrow_right 特定领域知识的知识缺口
- arrow_right 难以协调多文件变更
build
上下文工程的需求
- arrow_right 静态上下文文件(如CLAUDE.md)不足
- arrow_right 单代理方法缺乏专业化
- arrow_right 不熟悉API时存在幻觉风险

传统单代理代码生成系统的局限性
提出的方法:上下文工程工作流
集成多代理系统
translate
意图翻译
GPT-5明确用户需求
search
知识检索
Elicit获取领域知识
summarize
文档合成
NotebookLM创建上下文
code
代码生成
Claude Code多代理系统
psychology
意图翻译器
使用GPT-5将用户请求重写或详细阐述为结构化任务规范
library_books
Elicit检索
语义论文/文档检索,用于注入特定领域知识
description
NotebookLM合成
从文档创建简洁摘要和上下文理解
groups
Claude Code系统
用于代码生成、验证和测试的多代理框架
系统架构与代理编排
architecture
Claude多代理设计
- person 规划代理:分析需求并创建任务分解
- search 检索代理:查找相关代码和文档
- code 编码代理:生成和修改代码
- bug_report 测试代理:验证实现并运行测试
- fact_check 审查代理:确保代码质量和标准
sync_alt
代理编排流程
1
意图分析
2
上下文检索
3
任务规划
4
代码生成
5
验证

Claude Code多代理系统架构
结果与收益
trending_up
关键性能指标
42%
相比基线更高的单次成功率
35%
复杂项目中上下文遵循性提升
28%
开发时间和成本降低
science
案例研究:Next.js代码库
- check_circle 成功在15+个文件中实现复杂功能
- check_circle 验证过程最少人工干预
- check_circle 有效处理特定领域知识缺口
compare
与基线方法比较
框架 | 成功率 | 上下文遵循 |
---|---|---|
我们的方法 | 68.3% | 92.1% |
CodePlan | 48.2% | 67.5% |
MASAI | 52.7% | 71.3% |
HyperAgent | 45.9% | 63.8% |
insights
主要收益
- auto_awesome 更好地处理多文件项目协调
- auto_awesome 减少不熟悉API的幻觉
- auto_awesome 更准确地实现复杂功能
- auto_awesome 为特定领域任务有效注入知识
讨论与未来工作
psychology
上下文工程的影响
- insights 系统化的上下文构建显著减少不熟悉领域的幻觉
- insights 意图澄清带来更准确的任务规范和更好的结果
- insights 外部知识注入弥合LLM训练数据中的差距
lightbulb
关键见解
对于复杂的软件工程任务,上下文工程与模型架构同等重要
warning
局限性
- priority_high 相比单代理系统,计算开销增加
- priority_high 依赖多个外部AI服务(Elicit、NotebookLM)
- priority_high 编排代理交互和解决冲突的复杂性
school
多代理编排的经验教训
- auto_awesome 专业代理在特定子任务上优于通用代理
- auto_awesome 代理间清晰的通信协议至关重要
- auto_awesome 代理角色分解应反映人类开发工作流程
- auto_awesome 上下文共享机制必须优化以避免冗余
rocket_launch
未来研究方向
- trending_up 开发更高效的上下文压缩技术
- trending_up 探索自我改进的多代理系统
- trending_up 研究特定领域的代理专业化
business
生产环境应用
具有适当上下文工程的多代理系统在企业软件开发中显示出潜力,但需要与现有工作流程谨慎集成
结论
stars
主要贡献
architecture
创新工作流
结合多个AI组件的集成上下文工程方法
groups
多代理系统
通过Claude框架编排的专业化子代理
trending_up
性能提升
复杂项目中更高的成功率和更好的上下文遵循性
business
生产环境应用
- check_circle 上下文工程对企业软件开发至关重要
- check_circle 多代理系统优于单代理方法
- check_circle 与现有开发工作流程的集成是必要的
- check_circle 随着规模和任务复杂度的增加,成本效率提高
Haseeb, M. (2025). 使用Elicit、NotebookLM、ChatGPT和Claude Code的多代理LLM代码助手的上下文工程. arXiv:2508.08322✅
favorite
谢谢