智猩猩AI整理
编辑:汐汐
Anthropic最近非常的风光火热,Claude Code已从单纯的coding工具逐步走向全能化,也开始成为了开发者构建智能体工作流的重要工具,而Claude系列模型也已经成为行业内普遍认为是最顶级的模型之一。无论是写代码、做复杂项目,还是多智能体协作,Claude Code都在快速更新进化,不断补充新功能和新的工具。
然而,它最大的问题就是贵!实在是太贵了!最高档Pro计划高达200美元/月(约合1400人民币),加上最近Claude Code“烧token”事件频上热搜,开发者们面对高昂的价格,实在是忍不住抱怨。
但是,就在今天,北京时间4月10日,Claude团队重磅推出一项名叫Advisor Strategy(顾问策略)的功能,让Claude Code在性能基本维持的情况下,大幅降低token消耗量。

01 Advisor strategy:给Sonnet/Haiku配备Opus导师
一、Claude Code狂烧token
Claude Code作为高度智能体化的工具,在实际使用场景中消耗的token往往远超预期,甚至还有说一句hello就烧了2%用量的情况。

其罪魁祸首主要有如下原因。
· 图像消耗巨大。每次UI设计或视觉验证时截图,图像token价格高昂,且每次消息都会重复发送。
· 智能体轮询浪费。智能体需不断读取外部事件或日志,产生大量无效上下文。
· 长上下文未优化。大型项目产生的大量文件和历史上下文直接导致上下文窗口膨胀,每次交互都需重新处理海量token。
· Opus模型本身其token消耗就高昂,尤其是其执行智能体功能时更是消耗token的无底洞。
并且,对不少开发者来说,选用Opus其实是无奈之举。在许多开发场景下,只有Opus模型的性能才能较好地完成任务,而目前尚未有其他模型能够完美替代Opus,选用Opus这一昂贵的模型也就导致了用户消耗token非常快。
二、Advisor Strategy:Opus当顾问,Sonnet/Haiku当执行体
4月10日,Claude官方宣布,将advisor strategy引入Claude平台。

该策略的核心就是,让相对较低消耗的模型(Sonnet/Haiku)担任智能体的主要执行者,而Opus则作为外部的“导师”来辅助,帮助性能较低的Sonnet/Haiku来解决问题。
Claude团队介绍道,将advisor工具添加到Messages API调用中,当Sonnet或Haiku智能体在运行中遇到问题的时候,就会咨询Opus,获取下一步的计划并继续运转,而这些全部在单个API请求中完成。

作为评估,Claude官方介绍称,配备Opus作为顾问的Sonnet在SWE-bench Multilingual上比单独的Sonnet高2.7%,而每个任务成本降低11.9%。

更详细信息如下。
Sonnet 4.6的对比:

Haiku 4.6的对比:

在Messages API中请求使用advisor的方式如下:
response = client.messages.create( model="claude-sonnet-4-6", # executor tools=[ { "type": "advisor_20260301", "name": "advisor", "model": "claude-opus-4-6", "max_uses": 3, }, # ... your other tools ], messages=[...])# Advisor tokens reported separately# in the usage block.值得注意的是,几乎同一时间,Claude Code PM也发布贴文,宣布在Claude Code中推出一个名为Monitor的工具,让Claude能够创建后台脚本,仅在需要时才唤醒,避免轮询来节省token。

02 Opus鞭打Sonnet:“我们早就提出这个了!”
Advisor Strategy和Monitor Tool上线后,迅速引发了许多开发者和用户的激烈讨论。
UC Berkeley教授、Bespoke Labs AI创始人Alex Dimakis表示了不满,Advisor模型他们早已提出,但是却未被引用。

nextron systems研究主管、YARA/Sigma工具作者Florian Roth讽刺地说,Anthropic发布这些使用更便宜的模型、减少token用量的方法,其实是变相告诉用户“请停止消耗我们受赞助的算力”。

也有开发者提出自己的见解,认为AI竞赛又开始转向零一条赛道,也就是从“最佳模型”开始转向“最低成本的高性价比编排”。

更有趣的是,有用户化用前些天被Anthropic警告的“用鞭子鞭打Claude”的开源项目做了个梗图,现在完全是“Opus鞭打Sonnet”。

不过也有用户觉得这是Anthropic对这几天疯狂讨论的“Claude变蠢了”的挽救措施。

03 太聪明而太浪费:高效利用大模型来提效
这一套Advisor Strategy与Monitor工具的组合拳,可以说是Anthropic送给开发者们的一份降本增效大礼包。
这意味着,以往动辄好几百美元的长期运行、或者是涉及又多又杂的复杂调用、思考等情况,如今可能一套流程下来能省个几百块人民币,这对于经济压力大的个人开发者或者小型企业来说是个大喜讯。而Monitor工具也能让常驻后台烧token的情况不再重演,等到重要节点才唤醒,提高效率还节约成本。
但是,再好的工具也无法彻底解决所有问题。今天Anthropic的两大更新虽然一定程度上缓解了token消耗的问题,但是个人配置等其他方面的问题依然存在,需要开发者自己解决。否则,再强大的工具也只会让烧钱从明面转移到暗面上。
不少开发者其实自己也能意识到,很多token是被白白浪费掉的。明明只是调用一下工具写一个简单的东西,也用Opus去解决,这真的有些伤不起。大量无效的输入输出和上下文膨胀,以及决策和执行层面全部搅和在一起,导致成本爆炸。构建复杂智能体的时候,恨的不是模型太聪明,而是太聪明的模型被太浪费。
包括昨天Anthropic发布的Managed Agents也是一样,让不同的模型各司其职,编排好各自要做的事情,编排好工具调用、处理好并发管理、完成错误恢复等工作,CEO模型负责安排、员工模型踏实做事,高效利用智能体背后的大模型,才能发挥最大的价值。






