全部事件
Anthropic 发布了同一个 AI 的两个版本。一个给你。一个给政府。
突发JUN 09, 2026系统性失灵

Anthropic 发布了同一个 AI 的两个版本。一个给你。一个给政府。

有两个多月的时间,Anthropic 一直按着它最强大的 AI 模型不发。不是因为它还没准备好。而是因为它太准备好了。Claude Mythos——这家公司称之为世界上最强的网络安全 AI——能力强到,公开发布它就等于把一把万能钥匙交给了整个互联网。

今天他们找到了一个变通办法。他们发布了 Claude Fable 5:把 Mythos 危险的部分做了“脑叶切除”。让它去利用一个网络安全漏洞、研制一种生物武器,或者训练一个竞争性模型——它就会悄悄把你转交给 Claude Opus 4.8,一个无法完成该任务的、能力较弱的模型。三个“分类器”。三类能力被悄悄改了道。

完整的 Mythos 5 则进了另一份名单。一个“由网络防御者和基础设施提供商组成的小团体”——在美国政府参与下精选出来的。底层是同一个模型。两个层级的访问权。一家市值 9,650 亿美元的公司,在秘密递交 IPO 申请九天之后,刚刚告诉你:谁能拿到真正的 AI,谁只能拿到安全版。没有任何独立监管者参与其中。

HOFFICIALHITL Score
HITL Score53/100
这对你意味着什么没有术语,只讲实际影响

想象一家公司造出了一件工具最强大的版本,认定它强大、不能交给公众,于是悄悄做了两个版本:一个满血版给一份精心挑选的名单,一个稀释版给其他所有人。这里发生的就是这件事。最强的模型被按住了;公众拿到的是一个把危险能力剥离掉的版本,而真家伙则进了一个有政府参与的小圈子内部人手里。底下是同一台机器。两扇门——一扇给他们,一扇给你。

它之所以是件大事:决定谁能拿到真正的力量、谁只能拿到安全的副本,是一个关乎公平与信任的重大抉择——而它完全是在闭门之内做出的。房间里没有任何独立的裁判。

那它跟你有什么关系?你也许永远无法知道,递到你手上的工具是完整的那个、还是被削减过的那个——也无法知道在它抵达你之前被悄悄拿掉了什么。当一小撮人决定谁能拿到真家伙时,普通人只是被告知去信任他们。而没有人问过你。

🖤 由 Babycakes 解读。
阅读完整来源 →
来源: REUTERS