烧掉60万亿token,效率提升了多少?

2026-06-05 09:00:00
翰德恩咨询
原创
15
摘要:Meta烧掉60万亿token,亚马逊员工专门刷AI用量应付排行榜——硅谷AI转型正在变成KPI游戏。数据显示烧10倍token只换来2倍产出。本文拆解激励逻辑背后的陷阱,以及对企业AI落地的真实启示。

一个月,60万亿token。

这是Meta内部AI使用排行榜记录的数字。更有意思的是,扎克伯格本人没有进入前250名。

同期,亚马逊给员工配了内部AI工具,上线实时排行榜追踪每个人的token消耗量。员工很快摸清规则:榜单靠前的人更安全。于是,本来不需要AI的活儿,也要丢给AI跑一遍——专门为了拉高数字。

硅谷给这个行为起了个名字:tokenmaxxing(疯狂刷AI用量)。

数据很快来打脸了

工程智能公司Jellyfish对1.2万名开发者的数据做了分析,结论很扎心:最高使用层的开发者,每个项目消耗的token约为中位数的10倍,但实际产出只有约2倍。

烧了10倍的油,只跑了2倍的路。

另一家平台Faros.ai的数据补上了故事另一半:AI确实让任务完成量上升了34%,但同期每位开发者的bug数量增加了54%,代码审查时间升至约5倍,代码返工率在高AI采用环境下上升了惊人的861%。

指标在飞涨,效率并没有跟上。

统计数据

Goodhart定律,又一次应验

经济学里有一条著名定律:当一个衡量指标变成了目标,它就不再是可靠的衡量指标了。

token消耗量变成KPI的那一刻,它就失去了作为效率代理指标的意义。员工的精力从"怎么把工作做好"转移到了"怎么让数字好看"。这不是员工的问题,是激励设计的问题。

你设计什么激励,就会得到什么行为。

排行榜本身没有原罪

公平地说,token排行榜不是一无是处。对几十人的初创公司,CEO亲自盯榜表扬,是文化信号,效果直接。当团队还没养成AI使用习惯时,量化指标可以起到推动作用。

但对数十万人的大企业,规模完全不同,副作用也完全不同。排行榜很快会从"推动采用"的工具,变成"应付考核"的游戏。

这场闹剧背后,还有一层逻辑

四家超大规模云厂商2026年的合并资本开支已逼近7000亿美元。这笔钱需要证明花得值——而内部token使用量的增长,客观上成为了"AI基建投资物有所值"的佐证。

员工刷的每一个token,都在给资本开支的合理性背书。这不是阴谋论,而是资本叙事的内在逻辑。

对企业AI落地的真实启示

这场硅谷闹剧,对正在推进AI转型的中国企业有几点直接参考价值。

  • 用量不等于价值。AI使用率、token消耗量都是过程指标,不是结果指标。真正值得追踪的,是业务产出有没有改变:交付周期缩短了多少,客户满意度提升了多少。
  • 激励设计决定行为。考核AI使用量,员工就想办法提高使用量;考核业务结果,员工才会真正思考如何用AI改善结果。表面相似,方向截然不同。
  • 广泛适度,优于极端刷量。Jellyfish研究负责人给出的建议是:不要追求少数人的极限用量,而是把更多人推到曲线的中间地带——广泛、适度、持续的AI采用,比少数人的极端消耗更划算,也更可持续。
启示

翰德恩咨询在辅导企业AI落地时,始终强调一个原则:AI工具的价值要在业务端兑现,不是在排行榜上兑现。衡量AI转型是否成功,看的不是用了多少,而是改变了什么。

结语

AI确实在提升生产力,数据已经证明了这一点。但围绕AI使用率建立的激励体系,正在以难以察觉的方式扭曲这一切。

Goodhart定律不是新知识,但每一次技术变革,它都会找到新的表现形式。这一次的主角,是token。


相关课程:

联系我们
联系人: 田老师
电话: +86 135 5227 9573
Email: clientservice@hardenx.cn
地址: 北京市朝阳区福码大厦B座17层1705

加微领1G资料