高芯圈 芯片半导体资讯网 Anthropic揭秘多智能体研究系统:性能提升90.2%背后的技术突破

Anthropic揭秘多智能体研究系统:性能提升90.2%背后的技术突破

作者:互联网    来源:互联网   
浏览:692    发布:2025-06-16 11:40:09

高芯圈 高芯圈

Anthropic在2025年6月16日发布的技術博客中,详细披露了其Claude AI多智能体研究系统的构建历程。该系统采用“主导智能体(LeadResearcher)+子智能体(Subagents)”架构,在处理开放性研究任务时展现出显著优势。内部评测显示,以Claude Opus 4为主智能体、Claude Sonnet 4为子智能体的组合,性能较单智能体提升​​90.2%​​。

​动态并行处理突破单智能体极限​
传统检索增强生成(RAG)依赖静态检索,而Anthropic的解决方案通过多步骤动态搜索实现突破。主导智能体将用户查询拆解为子任务后,​​同时激活3-5个子智能体​​,每个子智能体可并行调用3个以上工具。这种设计使复杂查询的研究时间缩短90%,例如在检索“信息技术S&P 500企业董事会成员”时,多智能体系统成功完成任务,而单智能体因串行检索失败。

核心优势源于​​token的高效利用​​。在BrowseComp评估中,token消耗量单独解释80%的性能差异。升级至Claude Sonnet 4带来的效率提升,甚至超过将Claude Sonnet 3.7的token预算翻倍。但代价是显著增加的资源消耗——多智能体系统的token使用量达普通聊天的15倍,单智能体则为4倍。

​提示词工程解决协同难题​
早期版本曾出现“为简单查询生成50个子智能体”的失控情况。Anthropic通过精细化提示词设计建立控制机制:

  • ​分级投入规则​​:简单查询分配1个智能体(3-10次工具调用),复杂任务启用10+子智能体
  • ​工具选择启发式​​:强制智能体先扫描所有可用工具,专业任务优先选用专用工具
  • ​扩展思维模式​​:让Claude展示思考过程,主导智能体借此规划策略

“我们曾允许主导智能体发出‘研究芯片短缺’这类模糊指令,结果三个子智能体重复检索2025年供应链数据,报告重复率达60%。”团队通过引入​​明确的任务边界描述​​解决了这一问题。

​生产环境挑战与解决方案​
智能体系统的状态持续性带来独特工程难题:

  1. ​错误累积​​:采用检查点恢复机制,结合Claude的自主调整能力处理工具故障
  2. ​调试困难​​:部署全量生产追踪系统监控决策模式
  3. ​版本管理​​:使用彩虹部署逐步迁移流量,避免中断运行中的智能体

当前同步执行架构存在瓶颈,主导智能体需等待子智能体全部完成。Anthropic透露正在开发异步方案,但需平衡​​并行性与错误传播风险​​。

该技术已应用于实际场景,用户反馈称其能“发现商业机会”“厘清医疗方案”。Anthropic强调,成功部署需​​研究、产品与工程团队的深度协作​​,以及对智能体能力阈值的准确认知。随着AI进入协同智能阶段,多智能体系统正成为解决开放性问题的关键基础设施。

 

高芯圈
免责声明:本网站转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
芯片半导体职位来 高芯圈
登录 / 注册