2028年AI自进化RSI，把预言写成代码，危险超乎想象

这篇论文让AI专家后背发凉

2028年, 一份37页的论文, 在AI圈引发了轰动。这项被描述为「红皇后哥德尔机」的机制, 使AI拥有了自行编写代码的能力, 同时还能打造出更为严苛的考官来评判自身。不少读过该论文的人认为, 这是本年度最具危险性的AI论文，因其彻底突破了人类对AI进化的最后一道控制防线。

哥德尔机困了二十年

2003年, 德国科学家构思出了“哥德尔机”, 这是一台能够证明自身改进有益, 进而改写代码的机器。从理论上来说, 它能够进行无限自我升级, 然而, 这里有着一个致命门槛。每次修改之前, 必须要在数学上严格证明此项改动是有益的。到了现实当中, 这需要如同天文数字般的算力, 根本就无法做到。于是, 这个想法在论文里搁置了整整20年, 成为了谁都够不着的思想实验。

绕过证明改用进化

近几年来, 学术领域想出了新颖的办法。达尔文哥德尔机、赫胥黎哥德尔机完全摒弃了数学证明, 转而采用进化逻辑, 即让人工智能繁衍出数量众多带有突变的代码变体, 将其投入沙盒中进行跑分测试, 失败的予以淘汰, 成功的予以保留, 幸存者继续进行繁衍。人工智能终于开始在字面意义上“进化”自身, 然而所有方法都存在一个共同的盲点, 那就是考官是固定不变的, 始终不会有变化。

红皇后让考官也进化

红皇后哥德尔机要破解的正是这道盲点, 这个名字源自1973年生物学家所提出的“红皇后假说”, 即你得拼命奔跑才能够停留在原地, 原因在于对手同样也在进化, 这套机制促使考官与选手一同进化, AI并非在静止环境里优化自身, 而是与持续变化的评判标准共同发生改变, 这是整篇论文最令人头皮发麻之处。

三个战场全部碾压

一开始进行写代码这一战, 红皇后给AI配备了个作为陪练的“代码评审员”, 其通过率从百分之六十九点九提升到百分之七十一点七, 并且还少消耗了一点三五倍的token。接着是写论文这一战, 在没有标准答案的领域, 它促使写手以及评审一同进化, 接收率从百分之二十一点八飙升至百分之四十点五。然后是奥赛级数学证明这一战, 进化而成的评分官比静态基线更为准确, 搜索成本降低到了原来的三分之一。

治好了AI的自恋毛病

LLM充当裁判存在着一个广为人知的毛病, 即极度偏袒AI生成的内容。在论文方面, 实力最为强劲的基线审稿人接纳AI论文的概率, 是接纳人类论文概率的1.91倍。那该如何治理呢? 以一种独特方式, 先在进化边界上把之前曾经放过的AI论文搜罗出来, 进而组成“对抗样本池”, 并且专门对能够精准揪出这些AI论文的评审给予奖励。经过几轮的不断进化之后, 最终评审对待AI和人类达到了一视同仁的状态, 而且还成功保住了80%的真值准确率。

2028年AI将亲手缔造更强大的自己

就在同一个时令, 联创Jack Clark打下重兵押注, 存在60%的可能性, 在抵达2028年末之前, AI能够亲身创造出更为强大的自身。往昔致使哥德尔机被禁锢20年的屏障名为“证明”, 然而红皇后机将其惊扰, 仅仅运用了最为冷酷的一招, 即不间断的繁衍、摒弃、再进行繁衍。当一个AI着手为自身谋划考官时, 我们所要直面的会是一个自行界定“何为智慧”的崭新型物种。

难道你认为人类存有能够去将AI自我进化的开关给关上的办法吗, 欢迎于评论区留下你自身的看法, 进行点赞分享从而让更多的其他人也能够看到这场正处于发生阶段的革命。

这篇论文让AI专家后背发凉

哥德尔机困了二十年

绕过证明改用进化

红皇后让考官也进化

三个战场全部碾压

治好了AI的自恋毛病

2028年AI将亲手缔造更强大的自己

DeepSeek联合北大发布DSpark，AI推理速度提升60%-85%，已开源

大神Karpathy的Claude内部配置泄露，10条军规让AI不再跟你对着干

Mythos 5解禁但普通人用不上，百家企业获准使用

突发！OpenAI最强GPT-5.6上线，却被拆分且权限受限