说个hello烧2%token！Claude 推出顾问策略让Opus当Sonnet导师，成本直降超10%

2026-04-10 16:27:00

智猩猩AI整理

编辑：汐汐

Anthropic最近非常的风光火热，Claude Code已从单纯的coding工具逐步走向全能化，也开始成为了开发者构建智能体工作流的重要工具，而Claude系列模型也已经成为行业内普遍认为是最顶级的模型之一。无论是写代码、做复杂项目，还是多智能体协作，Claude Code都在快速更新进化，不断补充新功能和新的工具。

然而，它最大的问题就是贵！实在是太贵了！最高档Pro计划高达200美元/月（约合1400人民币），加上最近Claude Code“烧token”事件频上热搜，开发者们面对高昂的价格，实在是忍不住抱怨。

但是，就在今天，北京时间4月10日，Claude团队重磅推出一项名叫Advisor Strategy（顾问策略）的功能，让Claude Code在性能基本维持的情况下，大幅降低token消耗量。

01 Advisor strategy：给Sonnet/Haiku配备Opus导师

一、Claude Code狂烧token

Claude Code作为高度智能体化的工具，在实际使用场景中消耗的token往往远超预期，甚至还有说一句hello就烧了2%用量的情况。

其罪魁祸首主要有如下原因。

· 图像消耗巨大。每次UI设计或视觉验证时截图，图像token价格高昂，且每次消息都会重复发送。

· 智能体轮询浪费。智能体需不断读取外部事件或日志，产生大量无效上下文。

· 长上下文未优化。大型项目产生的大量文件和历史上下文直接导致上下文窗口膨胀，每次交互都需重新处理海量token。

· Opus模型本身其token消耗就高昂，尤其是其执行智能体功能时更是消耗token的无底洞。

并且，对不少开发者来说，选用Opus其实是无奈之举。在许多开发场景下，只有Opus模型的性能才能较好地完成任务，而目前尚未有其他模型能够完美替代Opus，选用Opus这一昂贵的模型也就导致了用户消耗token非常快。

二、Advisor Strategy：Opus当顾问，Sonnet/Haiku当执行体

4月10日，Claude官方宣布，将advisor strategy引入Claude平台。

该策略的核心就是，让相对较低消耗的模型（Sonnet/Haiku）担任智能体的主要执行者，而Opus则作为外部的“导师”来辅助，帮助性能较低的Sonnet/Haiku来解决问题。

Claude团队介绍道，将advisor工具添加到Messages API调用中，当Sonnet或Haiku智能体在运行中遇到问题的时候，就会咨询Opus，获取下一步的计划并继续运转，而这些全部在单个API请求中完成。

作为评估，Claude官方介绍称，配备Opus作为顾问的Sonnet在SWE-bench Multilingual上比单独的Sonnet高2.7%，而每个任务成本降低11.9%。

更详细信息如下。

Sonnet 4.6的对比：

Haiku 4.6的对比：

在Messages API中请求使用advisor的方式如下：

response = client.messages.create(

    model="claude-sonnet-4-6",  # executor

    tools=[

            "type": "advisor_20260301",

            "name": "advisor",

            "model": "claude-opus-4-6",

            "max_uses": 3,

},

        # ... your other tools

],

    messages=[...]

# Advisor tokens reported separately

# in the usage block.

值得注意的是，几乎同一时间，Claude Code PM也发布贴文，宣布在Claude Code中推出一个名为Monitor的工具，让Claude能够创建后台脚本，仅在需要时才唤醒，避免轮询来节省token。

02 Opus鞭打Sonnet：“我们早就提出这个了！”

Advisor Strategy和Monitor Tool上线后，迅速引发了许多开发者和用户的激烈讨论。

UC Berkeley教授、Bespoke Labs AI创始人Alex Dimakis表示了不满，Advisor模型他们早已提出，但是却未被引用。

nextron systems研究主管、YARA/Sigma工具作者Florian Roth讽刺地说，Anthropic发布这些使用更便宜的模型、减少token用量的方法，其实是变相告诉用户“请停止消耗我们受赞助的算力”。

也有开发者提出自己的见解，认为AI竞赛又开始转向零一条赛道，也就是从“最佳模型”开始转向“最低成本的高性价比编排”。

更有趣的是，有用户化用前些天被Anthropic警告的“用鞭子鞭打Claude”的开源项目做了个梗图，现在完全是“Opus鞭打Sonnet”。

不过也有用户觉得这是Anthropic对这几天疯狂讨论的“Claude变蠢了”的挽救措施。

03 太聪明而太浪费：高效利用大模型来提效

这一套Advisor Strategy与Monitor工具的组合拳，可以说是Anthropic送给开发者们的一份降本增效大礼包。

这意味着，以往动辄好几百美元的长期运行、或者是涉及又多又杂的复杂调用、思考等情况，如今可能一套流程下来能省个几百块人民币，这对于经济压力大的个人开发者或者小型企业来说是个大喜讯。而Monitor工具也能让常驻后台烧token的情况不再重演，等到重要节点才唤醒，提高效率还节约成本。

但是，再好的工具也无法彻底解决所有问题。今天Anthropic的两大更新虽然一定程度上缓解了token消耗的问题，但是个人配置等其他方面的问题依然存在，需要开发者自己解决。否则，再强大的工具也只会让烧钱从明面转移到暗面上。

不少开发者其实自己也能意识到，很多token是被白白浪费掉的。明明只是调用一下工具写一个简单的东西，也用Opus去解决，这真的有些伤不起。大量无效的输入输出和上下文膨胀，以及决策和执行层面全部搅和在一起，导致成本爆炸。构建复杂智能体的时候，恨的不是模型太聪明，而是太聪明的模型被太浪费。

包括昨天Anthropic发布的Managed Agents也是一样，让不同的模型各司其职，编排好各自要做的事情，编排好工具调用、处理好并发管理、完成错误恢复等工作，CEO模型负责安排、员工模型踏实做事，高效利用智能体背后的大模型，才能发挥最大的价值。

本文内容来源于智猩猩AI点击查看原文

智猩猩AI

223篇文章

关注公众号

先封禁再抄袭！Claude官方Harness上线 “梦境” 记忆，继续硬刚OpenClaw

智猩猩AI

AI智能体动态

30B媲美Qwen3-235B！阿里开源智能体小模型AgenticQwen，推理时延直降23%

智猩猩AI

AI智能体动态

DeepSeek-V4取代Claude！OpenClaw最新版首设官方默认模型，力挺开源模型

智猩猩AI

AI智能体动态

蒸馏博导科研经验！港科大骆昱宇老师开源Supervisor-Skills，NeurIPS投稿前一键评审

智猩猩AI

AI智能体动态

智猩猩AI

223篇文章

智猩猩AI的公众号