RAG 实现正变得更具代理特性

🌟 引言

随着生成性人工智能框架的不断进步，RAG（检索增强生成）实现正在朝着更具代理特性的方向演化。曾几何时，基本的 RAG 架构被视为足够，但如今，这一领域正通过融合更多智能和元素而发生显著变化。我们不禁要问，这种转变意味着什么？在探索这一问题的同时，我们将揭开 RAG 实现的潜在优势以及其面临的挑战。

首先，RAG 架构中的提示结构日益重要。过去，仅仅将上下文数据注入提示中并不足以满足需求。如今，开发者们开始精心设计提示的措辞，以最大限度地优化性能。例如，Chain-of-Thought 技术的引入使得提示可以引导模型进行更复杂的推理。这一变化标志着从简单的文本输入到更复杂的多层次输入的转变。

其次，RAG 的静态特性使其在两个关键方面显得乏力。RAG 通常未能充分考虑对话的上下文，且其检索决策过程往往受限于静态规则，缺乏灵活性。想象一下，假设你在和一个机器人聊天，但它却只记得你刚刚说过的内容，而无法理解你先前提到的背景信息，这就像在与一个只会重复的录音机对话。

此外，关于不必要的开销问题也逐渐引起关注，特别是在未优化的检索和额外的文本中，导致了不必要的成本和推理延迟。多步骤方法和分类器被用于确定最佳响应，而这些分类器常常依赖于标注数据来训练特定任务的模型。这一现象在一定程度上暴露了标准 RAG 实现的局限性。

随着对 RAG 方案不断深入的研究，出现了一种被称为「代理式 RAG」的新模式。在这种模式中，RAG 被实现为一种更具代理特性的方式。每个工具都与一个或一组文档相关联，代理能够根据文档的描述选择合适的工具。用户可以提交跨越多个文档的问题，代理则能综合不同工具的能力，给出更为精准的答案。

例如，设想一个 RAG 代理被要求计算一个公司在三个月内的利润（收入减去成本）。标准的 RAG 实现将无法处理这一复杂的用户请求，因为这需要跨越多个文档进行数据的综合与处理。而代理式 RAG 则能够将不同工具结合起来，以实现更复杂的计算和推理。

在 RAG 的代理式实现中，关键决策点在于三个方面：首先，了解何时以及从何处进行检索；其次，对检索到的数据进行评估、校正或至少进行某种质量检查；最后，生成后的检查也至关重要。在某些实现中，可能会运行多次生成，并选择最佳结果。此外，也有框架对生成结果进行真实性检查。

这种代理式架构的建立不仅提升了 RAG 的鲁棒性，还增强了其推理能力和智能性。通过将多个小型工人代理整合到一个更大的框架中，组织能够轻松扩展其代理系统，以适应不断变化的需求。

随着 RAG 实现的不断演进，代理式 RAG 的模式无疑是这一发展过程中的自然进步。它展示了多代理协调的良好范例，也为 RAG 实现增添了更多活力与灵活性。未来，我们可以预见，代理式 RAG 将在各种应用场景中发挥越来越重要的作用，从而实现更加智能化的交互与服务。

Greyling, C. (2024). RAG Implementations Are Becoming More Agent-Like. Cobus Greyling on LLMs, NLU, NLP, chatbots & voicebots.✅
LlamaIndex. Agentic RAG Overview.
Chain-of-Thought Prompting Techniques.
Multi-Agent Orchestration Frameworks.
The Evolution of Generative AI in Conversational Interfaces.