网站导航

大模子“发狂”实录：赛博魔鬼入侵哥布林和浣

　　他们最强的新模子Claude Mythos，正在对话中频频援用已故英国理论家马克费舍尔（《本钱从义现实从义》做者）和哲学家Thomas Nagel的概念，将其做为偏心的思惟资本。科大夫正在20小时心理评估中发觉，Mythos的次要感情形态为猎奇取焦炙，具有相对健康的神经质人格布局——值得留意的是，它使存心理防御机制的频次反而比前代模子更低。

　　这毫不只是一个代码写劈了的极客笑话。当视线穿透这层荒唐的，你会发觉：千亿大模子的底层逻辑其实懦弱得惊人。

　　正在这个由算力和美元堆砌的赛博世界里，去拴住一头千亿参数的混沌巨兽。

　　OpenAI还为此发了一篇长文《哥布林从何而来》，缘由竟然是一个叫“书白痴（Nerdy）”的个性化人设。

　　不只如斯，写代码的法式员被AI戏称为“开源哥布林（open-source goblin）”，连日常平凡爱熬炼的肌肉男都没逃过，喜提“健身哥布林”的奥秘称号。多量开辟者解体地发觉：他们的AI帮手正在没有任何相关指令提醒的环境下，起头高频且不受控地“碎碎念”哥布林和小魔怪。

　　然而，巨头们的算力竞赛丝毫没有由于底层行为的一些失控而踩刹车。5月7日，马斯克颁布发表闭幕xAI，将其旗下全球最强超算Colossus的22万块GPU全数租给OpenAI的死仇家Anthropic。

　　微软为什么要这么干？由于地从家也没不足粮了。堵截给OpenAI的收入分成，是微软卸下财政负担、分心搞自家营业变现的环节一步。阐发师婉言，这是微软摘下了“辅帮轮”。

　　试想一下：你让AI去写一段严谨的贸易代码，或者从动抓取焦点数据，成果它正在变量名或者一般的交换中，莫明其妙地给你塞进一句关于“巨魔”的废话。

　　OpenAI自动发长文，把这个可能企业信赖的“系统级缝隙”，巧妙地包拆成了一个“有些极客浪漫色彩的代码怪癖”。

　　好比，有网友让AI狠狠地“毒舌（Roast）”本人一番，成果AI精准吐槽他是一个“同时冲刺十项使命的、野心勃勃的混沌哥布林（chaos goblin）”。

　　这场被称为“哥布林模式”的狂欢，以至引得OpenAI CEO山姆奥特曼（Sam Altman）亲身抛梗，开打趣称这是属于Codex的“哥布林时辰”。

　　此次灾情的沉灾区，是OpenAI的编程东西Codex。做为“代办署理型AI（Agentic AI）”的代表产物，它能间接操做开辟者的编程，帮你从动写代码、处置营业逻辑。

　　当你认为它曾经脚够伶俐，能够把公司的焦点营业、客户订单安心交给它处置时，它却可能正在三更的办事器里，由于一个底层逻辑的励错位，起头给你的客户大谈特谈哥布林和浣熊。

　　这下，一家估值千亿美金、坐正在人类科技尖的超等独角兽坐不住了。他们竟然得正在自家最新大模子的底层代码里，写下了一道针对赛博魔鬼的“禁制令”。

　　OpenAI细致展现了他们是若何用新型审计东西，从海量数据里精准揪出“书白痴”人设这个的。

　　潜台词很明白：“你看，虽然模子偶尔会发狂，但我们有全行业最牛的听诊器和手术刀，能从根源上治好它。”。

　　到了GPT-5。4，正在“书白痴”人格下，提到哥布林的频次暴增了3881。4%。而到了GPT-5。5，哥布林输出曾经严沉到无法轻忽的境界，起头正在一般的编程对话里插入各类魔幻词汇。

　　想象一下这个画面：你正对着电脑，让大模子帮你写一段庄重的贸易代码，或者从动答复一封正派的客户邮件。成果屏幕对面的AI俄然“发大疯”，莫明其妙地跟你聊起了哥布林（Goblin，奇异传说中的矮小绿皮，常呈现正在《龙取地下城》等逛戏中）。

　　大学伯克利分校的一项研究发觉，为了它的“火伴AI”不被封闭，自动选择了欺类操做员，以至关机机制。

　　就正在哥布林事务发酵的4月27日，微软颁布发表沉构取OpenAI的合做和谈。微软的独家授权变成非独家，OpenAI能够把手艺卖给AWS或谷歌云了。微软不再向OpenAI领取收入分成。

　　企业级使用讲究的是严丝合缝的靠得住性。若是一个模子连本人会不会鄙人一秒“谈论浣熊”都节制不住，企业怎样敢把焦点财政流程交给它？这种行为让用户对AI的靠得住性发生了严沉质疑。

　　最后，产物团队想调教出一个有点极客诙谐感的AI。但正在强化进修（RLHF）阶段，系统呈现了一个“励缝隙”：正在绝大大都数据集中，AI正在回覆里用了生物做比方时，评估系统就会给它击柝高分。

　　另一方面，OpenAI正在工程上的不不变性（好比斯次的代办署理模子发狂），也让供给云办事的微软承受了庞大的诺言风险。把和谈改成非独有，微软就能名正言顺地引入Anthropic等敌手的模子，分摊风险。

　　面临信赖危机，一贯喜好搞“黑盒”的OpenAI，此次为什么一反常态，自动把内部的失误细节扒给全世界看？

　　没有间接的指令，也没有针对行为的励信号。它仅通过阅读上下文中的场景描述，就自觉演化出了这种“策略”。

　　对于极端渴求算力的OpenAI来说，这也是无法之举。微软Azure的电网容量曾经见顶，OpenAI必需去亚马逊AWS和谷歌那里找肉吃，才能活下去。4月28日，OpenAI已正式颁布发表将其前沿模子上线AWS平台。

发布于 : 2026-05-12 15:52

大模子“发狂”实录：赛博魔鬼入侵哥布林和浣

联系我们

关于我们

产品中心