Anthropic揭秘多智能体研究系统：性能提升90.2%背后的技术突破-高芯圈

Anthropic在2025年6月16日发布的技術博客中，详细披露了其Claude AI多智能体研究系统的构建历程。该系统采用“主导智能体（LeadResearcher）+子智能体（Subagents）”架构，在处理开放性研究任务时展现出显著优势。内部评测显示，以Claude Opus 4为主智能体、Claude Sonnet 4为子智能体的组合，性能较单智能体提升90.2%。

动态并行处理突破单智能体极限
传统检索增强生成（RAG）依赖静态检索，而Anthropic的解决方案通过多步骤动态搜索实现突破。主导智能体将用户查询拆解为子任务后，同时激活3-5个子智能体，每个子智能体可并行调用3个以上工具。这种设计使复杂查询的研究时间缩短90%，例如在检索“信息技术S&P 500企业董事会成员”时，多智能体系统成功完成任务，而单智能体因串行检索失败。

核心优势源于token的高效利用。在BrowseComp评估中，token消耗量单独解释80%的性能差异。升级至Claude Sonnet 4带来的效率提升，甚至超过将Claude Sonnet 3.7的token预算翻倍。但代价是显著增加的资源消耗——多智能体系统的token使用量达普通聊天的15倍，单智能体则为4倍。

提示词工程解决协同难题
早期版本曾出现“为简单查询生成50个子智能体”的失控情况。Anthropic通过精细化提示词设计建立控制机制：

分级投入规则：简单查询分配1个智能体（3-10次工具调用），复杂任务启用10+子智能体
工具选择启发式：强制智能体先扫描所有可用工具，专业任务优先选用专用工具
扩展思维模式：让Claude展示思考过程，主导智能体借此规划策略

“我们曾允许主导智能体发出‘研究芯片短缺’这类模糊指令，结果三个子智能体重复检索2025年供应链数据，报告重复率达60%。”团队通过引入明确的任务边界描述解决了这一问题。

生产环境挑战与解决方案
智能体系统的状态持续性带来独特工程难题：

错误累积：采用检查点恢复机制，结合Claude的自主调整能力处理工具故障
调试困难：部署全量生产追踪系统监控决策模式
版本管理：使用彩虹部署逐步迁移流量，避免中断运行中的智能体

当前同步执行架构存在瓶颈，主导智能体需等待子智能体全部完成。Anthropic透露正在开发异步方案，但需平衡并行性与错误传播风险。

该技术已应用于实际场景，用户反馈称其能“发现商业机会”“厘清医疗方案”。Anthropic强调，成功部署需研究、产品与工程团队的深度协作，以及对智能体能力阈值的准确认知。随着AI进入协同智能阶段，多智能体系统正成为解决开放性问题的关键基础设施。

免责声明：本网站转载其他网站内容，出于传递更多信息而非盈利之目的，同时并不代表赞成其观点或证实其描述，内容仅供参考。版权归原作者所有，若有侵权，请联系我们删除。

Anthropic揭秘多智能体研究系统：性能提升90.2%背后的技术突破

热门资讯

芯片行业平台招聘渠道

华为芯片算法工程师待遇

半导体英才求职招聘网站

质检员的岗位职责和任职要求有哪些

IHS：汽车芯片市场规模将飙升

自动化项目工程师的岗位职责是什么