

Anthropic在2025年6月16日发布的技術博客中,详细披露了其Claude AI多智能体研究系统的构建历程。该系统采用“主导智能体(LeadResearcher)+子智能体(Subagents)”架构,在处理开放性研究任务时展现出显著优势。内部评测显示,以Claude Opus 4为主智能体、Claude Sonnet 4为子智能体的组合,性能较单智能体提升90.2%。
动态并行处理突破单智能体极限
传统检索增强生成(RAG)依赖静态检索,而Anthropic的解决方案通过多步骤动态搜索实现突破。主导智能体将用户查询拆解为子任务后,同时激活3-5个子智能体,每个子智能体可并行调用3个以上工具。这种设计使复杂查询的研究时间缩短90%,例如在检索“信息技术S&P 500企业董事会成员”时,多智能体系统成功完成任务,而单智能体因串行检索失败。
核心优势源于token的高效利用。在BrowseComp评估中,token消耗量单独解释80%的性能差异。升级至Claude Sonnet 4带来的效率提升,甚至超过将Claude Sonnet 3.7的token预算翻倍。但代价是显著增加的资源消耗——多智能体系统的token使用量达普通聊天的15倍,单智能体则为4倍。
提示词工程解决协同难题
早期版本曾出现“为简单查询生成50个子智能体”的失控情况。Anthropic通过精细化提示词设计建立控制机制:
- 分级投入规则:简单查询分配1个智能体(3-10次工具调用),复杂任务启用10+子智能体
- 工具选择启发式:强制智能体先扫描所有可用工具,专业任务优先选用专用工具
- 扩展思维模式:让Claude展示思考过程,主导智能体借此规划策略
“我们曾允许主导智能体发出‘研究芯片短缺’这类模糊指令,结果三个子智能体重复检索2025年供应链数据,报告重复率达60%。”团队通过引入明确的任务边界描述解决了这一问题。
生产环境挑战与解决方案
智能体系统的状态持续性带来独特工程难题:
- 错误累积:采用检查点恢复机制,结合Claude的自主调整能力处理工具故障
- 调试困难:部署全量生产追踪系统监控决策模式
- 版本管理:使用彩虹部署逐步迁移流量,避免中断运行中的智能体
当前同步执行架构存在瓶颈,主导智能体需等待子智能体全部完成。Anthropic透露正在开发异步方案,但需平衡并行性与错误传播风险。
该技术已应用于实际场景,用户反馈称其能“发现商业机会”“厘清医疗方案”。Anthropic强调,成功部署需研究、产品与工程团队的深度协作,以及对智能体能力阈值的准确认知。随着AI进入协同智能阶段,多智能体系统正成为解决开放性问题的关键基础设施。
