Sakana AI联手MIT:大语言模型在Core War中驱动AI对抗进化,揭示数字红皇后算法与趋同演化现象

AI快讯 2026-01-12

Sakana AI与MIT合作:大语言模型在Core War中驱动AI对抗进化,揭示数字红皇后算法与趋同演化现象

Sakana AI与MIT合作研究数字红皇后算法
想象一下,在一台虚拟计算机的核心地带,一群由人工智能驱动的程序正在展开一场无休止的生存之战。它们的目标纯粹而残酷:消灭对手,成为唯一的幸存者

这正是Sakana AI与麻省理工学院(MIT)联合进行的一项开创性研究——数字红皇后(Digital Red Queen, DRQ)项目的核心场景。

数字红皇后算法概念图

研究团队复活了1984年诞生的经典编程游戏《Core War》,并利用先进的大语言模型(LLM)作为引擎,驱动了一场跨越数字维度的“军备竞赛”。在这个世界里,没有永恒的胜利者,只有不断适应和进化的挑战者。

简单来说,他们开发了一种让汇编代码自我演化的方法。代码通过在《Core War》的虚拟战场中持续战斗来迭代进化。与传统的静态优化不同,这种方法通过训练新的“战士”程序去对抗一个不断壮大的、由历史对手组成的“幽灵军团”,从而催生出既坚韧又具备广泛适应性的智能体。

这种“自我博弈”的模式所产生的汇编代码,不仅结构复杂精妙,更在人工生命的研究中揭示了一个引人入胜的现象:趋同进化

趋同进化现象示意图

当大语言模型遇见经典编程战场

《Core War》是一款历史悠久的竞技编程游戏。玩家需要使用一种名为Redcode的专用汇编语言,编写被称为“战士”的程序。这些程序被置入一个共享的虚拟内存空间(即“核心”),目标是通过执行指令来破坏对手的进程,同时保护自己。

Sakana AI的研究提出了一个新颖的设想:如果让大语言模型来主导这场游戏,会催生出怎样的演化动态?

研究团队摒弃了静态的评估基准,转而构建了一个动态的对抗性演化环境。在这里,程序必须不断适应并进化,以击败一个持续累积的对手历史档案,而非固定的几个敌人。他们的发现令人振奋:

  • 动态对抗过程推动模型产生了越来越通用化的策略。
  • 从不同起点独立演化的程序,最终会趋向于表现出相似的高效行为模式,展现了类似自然界中的趋同进化现象。
  • 整个演化过程完美契合红皇后动态——智能体们必须不断奔跑(进化)才能停留在原地(维持竞争力)。

这项研究将《Core War》重新定位为一个研究人工系统中红皇后动力学的理想“实验沙盒”。它为安全、可控地分析AI智能体在现实世界对抗性环境(如网络安全攻防)中的可能演化路径,提供了宝贵的研究平台。

DRQ生成的战士程序示例
战士程序策略可视化

由DRQ算法生成的两个“战士”程序示例:Ring Warrior Enhanced v9 和 Spiral Bomber Optimized v22。它们展示了DRQ能够合成不同质量策略的能力,以及生成整体高性能程序的能力。程序注释由大语言模型自动生成。

数字红皇后算法:在奔跑中维持生存

“红皇后假说”源自进化生物学,其核心观点是:在充满竞争的环境中,物种必须持续进化,不是为了取得绝对优势,而仅仅是为了在同样在不断进化的对手面前维持相对的生存能力。这个概念生动地捕捉了军备竞赛的本质——适应永远是一个进行时,而非完成时

“在这个国度,你必须拼命奔跑,才能留在原地。” —— 《爱丽丝镜中奇遇记》红皇后

受此启发,Sakana AI团队设计了“数字红皇后”算法。该算法利用大语言模型,使“战士”程序在一个持续变化的环境中进化。

DRQ的工作流程简洁而有力:它从一个初始“战士”开始,然后指示LLM进化出第二个“战士”来击败第一个。接着,LLM会尝试创造出第三个“战士”,要求它在对抗前两个战士时都能表现出色。如此循环往复,产生出一个“战士”谱系,其中每一个后代都适应了由所有前辈共同定义的、日益复杂的挑战环境。

研究团队强调:“DRQ本身并非一个全新的算法发明,而是对现有自博弈与多智能体方法的最小化实现。我们将其适配到《Core War》领域,旨在隔离并深入研究持续协同进化的动态过程。”

研究发现:通用稳健性与趋同进化

实验结果显示,随着DRQ算法运行轮次的增加,演化产生的“战士”程序展现出越来越强的通用稳健性。这种稳健性是通过与一组未见过的、由人类专家设计的“战士”进行对战来评估的。这揭示了一条持续生产稳健程序的路径,而无需直接在庞大的测试集上进行“过拟合”式的训练。

更令人惊讶的发现是趋同进化。多个独立启动的DRQ实验(各自从不同的随机“战士”开始),随着时间的推移,竟慢慢演化出行为模式高度相似的“战士”。值得注意的是,这种趋同发生在“行为”(表型)层面,而非“源代码”(基因型)层面。这意味着,不同的代码实现了相似的战略功能,正如鸟类和蝙蝠分别独立进化出了形态迥异但功能相同的翅膀。

DRQ趋同进化数据图

图示表明,随着演化轮次增加,DRQ产生的战士通用性增强,且不同实验线之间的行为差异减小,显示出趋同趋势。

表型与基因型趋同对比

表型趋同示意图:演化趋同主要体现在程序的行为上,而非其底层代码结构,类似于生物的功能趋同。

意义与展望:从数字沙盒到现实世界

“红皇后”动态与趋同进化在自然界中无处不在。DRQ算法与《Core War》沙盒的结合,为深入研究对抗性军备竞赛的其他特性提供了一个潜力巨大的实验场。由此获得的宏观洞察,有助于我们预测未来大语言模型在现实世界竞争中将如何演化。类似DRQ的算法,甚至可以在AI系统实际部署前,用于进行自动化的“红队测试”,提前发现潜在弱点。

在《Core War》这样的封闭沙盒中进行研究具有独特优势:整个系统自成一体,所有程序都在一个使用自定义语言(Redcode)的虚拟机中运行,生成的任何代码都无法在沙盒外执行。这为探索那些在现实世界中可能具有风险的对抗性动态,提供了一个绝对安全的环境。

尽管基础版DRQ算法结构简单,但其在《Core War》中展现出的强大能力表明:即使是最简化的自博弈循环,也能催生出复杂而鲁棒的策略。这使得DRQ成为探索其他竞争性多智能体模拟场景(如人工生命、计算生物学、药物发现、网络安全或市场模拟)的有力工具。

展望未来,研究可以扩展到更丰富的设定,例如允许多个智能体同时并行协同进化,以更好地模拟现实世界——在那里,大规模种群是同时适应,而非沿单一谱系线性演化。最终,这些研究成果将帮助我们更好地预见未来,并深刻理解驱动这些进化军备竞赛背后的科学原理。


想获取更多AI最新资讯智能工具推荐, 欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台AI学习社区


本文来源:机器之心

原文链接:https://www.jiqizhixin.com/articles/42e2b2fb-cba1-4b73-8794-e4eee11970b4

本站部分内容来源于网络,均已注明来源和出处(如有遗漏非主观故意)。本站尊重原创版权,转载内容版权归原作者所有,仅用于信息整理与交流。如原作者不同意转载,请联系我们进行删除或调整。

相关文章