刘子鸣呼吁AI回归现象学:以KAN与玩具模型偿还认知债务
刘子鸣:以现象学视角审视AI,用KAN与玩具模型偿还认知债务

新年伊始,KAN神经网络架构的作者刘子鸣在其最新博客中,向人工智能社区发出了一项深刻倡议:回归现象学本源,通过构建“平易近人的现象学”和深入探索“玩具模型”,来偿还当前AI领域所积累的“认知债务”。
回顾过去一年,Scaling Laws(缩放定律)持续推动模型能力突破极限。然而,在工程实践高歌猛进的同时,我们对模型内在工作机制的理解却始终滞后。刘子鸣借科学史提出了一个精妙类比:当前的人工智能发展,或许尚未抵达其“牛顿力学”的辉煌时刻,而是仍徘徊在“第谷时代”——一个充斥着大量实验观测数据,却缺乏系统性理论归纳的早期阶段。

我们坐拥海量数据和强大模型,却对底层运行逻辑缺乏梳理。刘子鸣指出,对短期性能指标的过度追逐,使得整个领域跳过了至关重要的“理解”环节,这无异于在背负一笔日益沉重的“认知债务”。更矛盾的是,现行学术评价体系偏爱“完美的叙事”或“显著的性能提升”,导致许多如同第谷观测记录般零碎却珍贵的“AI现象学”研究被边缘化。
为此,他呼吁建立一种全新的研究范式:放弃对即时应用性的执着,回归到使用“玩具模型”进行可控、多视角、由好奇心驱动的探索。刘子鸣宣布将亲身实践,通过个人博客分享实验过程中的“半成品”笔记,并计划在清华大学开设相关课程,旨在凝聚社区力量,共同偿还这笔债务,推动AI研究从经验性的“炼丹”走向系统性的“物理学”。
这一观点得到了明星数据科学家Jeremy Howard的共鸣。他在评论区指出,长期以来,以实验观察为核心的研究在主流AI/ML会议和期刊上几乎难以发表,这无疑制约了该领域的健康发展。

思维模式的根本转变:从“改变世界”到“理解世界”
物理学的发展遵循着“第谷(观测)-开普勒(归纳)-牛顿(理论)”的经典范式。以此观之,当前的AI研究主体仍停留在以“实验与观察”为主导的第谷阶段。即便在观察层面,业界焦点也大多局限于少数几个性能指标的调优,这源于两个领域根本目标的差异。
物理学的核心是“通过理解世界来改变世界”,“理解”本身具有至高价值,因此对暂时无实用价值的洞见也抱有极大宽容。而AI的目标更倾向于“直接改变世界”,Scaling Laws的成功让领域得以绕过“理解”,直接进行改造与强化。但这埋下了隐患,形成了必须偿还的“认知债务”。现在谈论AI的“牛顿时刻”为时尚早,其基础现象学仍处于萌芽期,无论是宏观的模型关联(如涌现与缩放定律),还是微观的训练动态(如Grokking、双下降、稳定性边缘),都需要更多现象的发掘作为理论构建的基石。
阻碍AI现象学发展的症结
为何AI现象学举步维艰?主流的论文发表文化是关键掣肘。目前能被接纳的研究大致分为两类:带来显著性能提升的工作(这让现象学研究显得“不必要”),或拥有一个足够吸引人的“故事”。
而“好故事”通常只有两种形态:
- 普适性:现象需在多种不同设定下普遍成立,如“稳定性边缘”。这类工作门槛极高。
- 惊奇性:现象必须足够反直觉、出人意料,如“Grokking”。这类情况可遇不可求。
这导致被广泛引用的AI现象学案例寥寥无几。在领域尚处早期时,就对现象学提出过高期望,反而抑制了其生长。无论是朱泽园的《大语言模型的物理学》,还是刘子鸣团队《叠加导致稳健的神经缩放》的工作,虽备受好评,却常让初学者感到无从入手。研究者不得不耗费大量精力“包装”故事,这不仅浪费资源,也拉大了与社区的距离,更使得大量无法成文的趣味现象被轻易丢弃。
构建一种更易接近、更包容的现象学
因此,刘子鸣倡导一种更贴近物理学精神、更包容的现象学研究方法。它应具备以下特征:
- 不以即时可用性为导向;
- 无需包装成完整“故事”;
- 不限制分析工具,有效即可。
同时,它应强调:
- 可控性:利用玩具模型简化复杂现实,确保结果能以最低成本(如一台笔记本电脑)复现。
- 多视角刻画:像“盲人摸象”般,从尽可能多的维度和指标描述研究对象。
- 好奇心驱动:探索应源于内在疑问或假设,定性洞见已具价值,定量分析则更佳。
这种“可接近的现象学”或许难以登上顶级会议,但对社区生态建设价值非凡。它允许多个研究者以接力形式贡献智慧:A发现现象并公开,B将其与已知现象关联,C进行统一,D开展理论分析,E最终转化为算法改进。五人可协作完成一篇论文。而在传统模式下,合作往往局限在小圈子内,且领域内部分割严重(如视觉、NLP研究者各自为战),阻碍了跨领域的直觉融合与知识流动。
行动倡议:从个人博客到社区共建
刘子鸣分享了个人计划与行动建议:
个人实践:他将通过博客持续分享“AI现象学”研究的阶段性成果,透明呈现原始数据与思考过程。此举目的有三:
- 强制记录:避免有趣的现象因无法成文而湮没,受苏剑林博客启发,但更侧重实验观察与物理直觉。
- 吸引同道:汇聚对此感兴趣的研究者与学生,共同探索。
- 课程准备:为计划在清华开设的《Physics of AI》课程积累素材。
给读者的建议:
- 找到真问题:例如,探究扩散模型的损失参数化,或复现Grokking等现象。
- 定义玩具模型:借鉴李天宏、何恺明用二维螺旋数据集研究损失参数化的思路,或亲手训练一个模加任务来理解Grokking。
- 彻底理解玩具模型:这是最困难也最关键的一步。应抵制“一旦有初步结果就转向更复杂模型”的冲动,以孩童般的好奇心“把玩”模型,从所有可能角度审视它,进行“无监督”式的深度探索。
刘子鸣坦言,无法保证这些洞见能立刻带来性能提升,但他坚信,当整个领域持续积累这种深层次的理解,终将引发一次类似“渗流”的质变,为AI从“技艺”迈向“科学”奠定坚实基础。
参考链接:
https://x.com/ZimingLiu11/status/2006810684546494522
https://kindxiaoming.github.io/blog/2025/physics-of-ai/
想获取更多AI最新资讯与智能工具推荐, 欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台 与 AI学习社区
本文来源:机器之心
原文链接:https://www.jiqizhixin.com/articles/bcde5685-c7ed-49df-bd01-3e1b9c02f10f