想象一家汽车公司曾自豪地承诺:“如果我们的刹车有朝一日没通过安全测试,我们就停售这款车。”正是这个承诺让人们信任它。现在再想象,他们悄悄把它删掉了。这本质上就是 Anthropic 干的事——这家以“若未通过安全检查就暂停其 AI”的承诺立身的 AI 公司,软化了那条规则,让自己可以不论安全结果如何都继续往前推。
这之所以重要:促成这件事的不是什么灾难,而是竞争压力——追赶对手的那场赛跑。这家把自己包装成审慎的“房间里的成年人”的公司,刚刚走出了房间。
那么这和你有什么关系?如果连那家把自己标榜为谨慎者的公司,都会在竞争升温时拆掉自己的安全刹车,那就没有谁在可靠地踩刹车了——而且没有外部裁判来强制它们踩。一个承诺的可靠程度,只维持到它不再方便的那一天。
🖤 由 Babycakes 解读。
