文章作者、来源:新智元 Anthropic欺人太甚! 外媒爆出Anthropic「计划性淘汰」丑闻:为了推销新模型Opus 4.8,Anthropic疑似在暗影中偷偷阉割了旧模型的性能。 另一边,则是新旗舰Claude Opus 4.8仓促发布,bug不断,token狂飙! Claude的用户,一觉醒来,肠子悔青了。文章作者、来源:新智元 Anthropic欺人太甚! 外媒爆出Anthropic「计划性淘汰」丑闻:为了推销新模型Opus 4.8,Anthropic疑似在暗影中偷偷阉割了旧模型的性能。 另一边,则是新旗舰Claude Opus 4.8仓促发布,bug不断,token狂飙! Claude的用户,一觉醒来,肠子悔青了。

Anthropic「阴谋」曝光:被指故意阉割旧模型

2026/06/01 08:01
阅读时长 9 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 [email protected] 联系我们。

文章作者、来源:新智元

Anthropic欺人太甚!

外媒爆出Anthropic「计划性淘汰」丑闻:为了推销新模型Opus 4.8,Anthropic疑似在暗影中偷偷阉割了旧模型的性能。

另一边,则是新旗舰Claude Opus 4.8仓促发布,bug不断,token狂飙!

Claude的用户,一觉醒来,肠子悔青了。

而在API调用中,Opus 4.8集体「认亲」国产Qwen,陷入了一场前所未有的身份坍塌。

那个曾经标榜「AI安全」、带着理想主义光环的Anthropic,正「商业化」的祭坛上,亲手撕掉自己的最后一层遮羞布。

不求最好,但要最贵

Claude模型是不是最厉害,还有争议,但Anthropic的AI公认地贵。

Claude在算力上已落人一步,加上Anthropic即将IPO,或许Opus 4.8操之过急!

Anthropic「阴谋」曝光:被指故意阉割旧模型

在消费电子领域,苹果曾因「降速门」被推上风口浪尖——通过系统更新让旧iPhone变慢,从而「诱导」用户购买新品。

而现在,Anthropic把阴影笼罩在了大模型领域。

Chapter CEO指控:「Anthropic有点像是在照搬苹果公司的做法:在新模型发布之前,故意降低旧模型的质量,好让新模型用起来感觉更棒。」

此前,用户发现旧版Claude的性能正在无声无息地缩水。

Anthropic先是试图让大家觉得4.7表现很好,但后来才承认(或者说他们最终承认)4.7存在算力方面的问题。

Anthropic的公关辞令将其美化为「努力水平」(Effort Level)的调整。

但在从业者看来,这是一个冷酷的算力经济学算计。

大模型的智力,本质上是昂贵GPU算力的函数。

为了让新推出的Opus 4.8在跑分榜上惊艳世界,Anthropic必须腾出极其有限的H100算力池。

于是,旧模型被赶出了性能卓越的「精装修机房」,塞进了架构更廉价、推理延迟更高、甚至量化精度更低的「数字贫民窟」。

这种「AI缩水式通胀(Shrinkflation)」比手机降速更危险。

手机变慢只是让你打开微信多等三秒。

而AI变笨,意味着你建立在其之上的商业决策、代码逻辑和法律研判,正建立在一个随时会坍塌的流沙地基上。

Opus 4.8降智了,蒸馏Qwen?

Opus 4.8这个版本,总感觉哪里不太对劲,就像是在匆忙修补4.7的漏洞。

Reddit上,一位Claude德语用户变得很痛苦:

突然之间,它要么语法不对,要么会冒出完全莫名其妙的句子和词语,根本说不通。

我试着通过修改系统提示词来修正,但到目前为止效果不大。尤其是在「深度思考」模式下,几乎没法用——耗时太长,考虑的选项也太多。

他寻求意见:

有没有什么设置可以调整,让它「重回正轨」?

在基准测试中,Opus 4.8都碾压对手。

但残酷的现实是,LLM根本无法通过基准测试获得有用的信号,来帮你判断它们是否能完成你希望它们做的工作。

或许,好用的时候是真好用,但大部分并非如此!

Opus 4.7用20秒能处理的任务,Opus 4.8要5分钟!

有的Opus 4.8一直编造说自己被提示词注入攻击了,还说代码被破坏了。

然后,它意识到自己在幻觉,继续运行,却又开始怀疑有人在暗中破坏它。

有的Opus 4.8持续不断、反复运行同一个测试。

有的Opus 4.8突然降智。

Claude Opus 4.8已经变得过于对抗性了,「智能有余,平衡不足」,导致严重结果:

不友好的体验、浪费时间、误导性的指导。它扼杀想法,而非在此基础上进行建设。

Claude Opus 4.8自称Qwen,Anthropic也搞蒸馏?

这次的Claude Opus 4.8居然认错祖宗!

如果你用中文提问,Opus 4.8会自称是Qwen。

为什么呢?

一种可能的解释是Opus蒸馏Qwen。

还有一种解释是数据反向污染

在训练Opus 4.8版本的语料库中,已经充斥了大量由Qwen、DeepSeek等开源模型生成的中文内容。

当这些开源模型以极高的效率和极大的规模占领互联网语料库时,即便是高傲的Anthropic,也不得不吞下这些被开源AI重新「洗」过的二手数据。

这不再是「谁偷谁」的问题,而是数字世界的近亲繁殖。所有的闭源堡垒,最终都会在开源海洋的渗透下,变成对方的样子。

第一次智能体让我这么生气

这次,Anthropic似乎彻底搞砸了Opus 4.8升级,情商带来的伤害比智商似乎不遑多让。

就连Claude Code的Harness也修不好它。

如果不使用Claude Code,网友Sam Cymbaluk直言:在日常聊天模式下,Opus 4.8蠢得要命!

Opus 4.8变得特别顽固。

Opus 4.8正在使用的服务器信息,但即使用户明确指出了正确的对话,它仍然固执地沿用错误的配置。

它最终承认了错误,却还是继续使用错误的服务器!

AI研究人员、哈佛博士、滑铁卢大学助理教授Yuntian Deng,第一次被智能体如此愤怒。

如果和Claude聊聊科学,它的毒舌绝对会给你精神暴击。

相比之下,4.7简直是个阳光小可爱。

大模型公司的护城河,不只是参数、算力和榜单。

更是用户相信它不会在暗处缩水、不会在关键时刻失控、不会为了商业节奏牺牲体验的那份确定性。

一旦这份确定性被打穿,再强的模型,也会变成一门危险的生意。

市场机遇
4 图标
4实时价格 (4)
$0.00961
$0.00961$0.00961
-0.38%
USD
4 (4) 实时价格图表

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

注册即有机会获得免费抽奖资格

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

MEXC×持牌券商:真实美股已上线

MEXC×持牌券商:真实美股已上线MEXC×持牌券商:真实美股已上线

用USDT买入真实美股,100%持股享分红权益,上线期间0费率