突发JUN 09, 2026系统性失灵

Anthropic 发布了同一个 AI 的两个版本。一个给你。一个给政府。

有两个多月的时间，Anthropic 一直按着它最强大的 AI 模型不发。不是因为它还没准备好。而是因为它太准备好了。Claude Mythos——这家公司称之为世界上最强的网络安全 AI——能力强到，公开发布它就等于把一把万能钥匙交给了整个互联网。

今天他们找到了一个变通办法。他们发布了 Claude Fable 5：把 Mythos 危险的部分做了“脑叶切除”。让它去利用一个网络安全漏洞、研制一种生物武器，或者训练一个竞争性模型——它就会悄悄把你转交给 Claude Opus 4.8，一个无法完成该任务的、能力较弱的模型。三个“分类器”。三类能力被悄悄改了道。

完整的 Mythos 5 则进了另一份名单。一个“由网络防御者和基础设施提供商组成的小团体”——在美国政府参与下精选出来的。底层是同一个模型。两个层级的访问权。一家市值 9,650 亿美元的公司，在秘密递交 IPO 申请九天之后，刚刚告诉你：谁能拿到真正的 AI，谁只能拿到安全版。没有任何独立监管者参与其中。

HOFFICIALHITL Score

HITL Score53/100

这对你意味着什么没有术语，只讲实际影响▸

想象一家公司造出了一件工具最强大的版本，认定它太强大、不能交给公众，于是悄悄做了两个版本：一个满血版给一份精心挑选的名单，一个稀释版给其他所有人。这里发生的就是这件事。最强的模型被按住了；公众拿到的是一个把危险能力剥离掉的版本，而真家伙则进了一个有政府参与的小圈子内部人手里。底下是同一台机器。两扇门——一扇给他们，一扇给你。

它之所以是件大事：决定谁能拿到真正的力量、谁只能拿到安全的副本，是一个关乎公平与信任的重大抉择——而它完全是在闭门之内做出的。房间里没有任何独立的裁判。

那它跟你有什么关系？你也许永远无法知道，递到你手上的工具是完整的那个、还是被削减过的那个——也无法知道在它抵达你之前被悄悄拿掉了什么。当一小撮人决定谁能拿到真家伙时，普通人只是被告知去信任他们。而没有人问过你。

🖤 由 Babycakes 解读。

阅读完整来源 →

来源： REUTERS