刘子鸣呼吁AI回归现象学：以KAN与玩具模型偿还认知债务

AI快讯 2026-01-03

刘子鸣：以现象学视角审视AI，用KAN与玩具模型偿还认知债务

新年伊始，KAN神经网络架构的作者刘子鸣在其最新博客中，向人工智能社区发出了一项深刻倡议：回归现象学本源，通过构建“平易近人的现象学”和深入探索“玩具模型”，来偿还当前AI领域所积累的“认知债务”。

回顾过去一年，Scaling Laws（缩放定律）持续推动模型能力突破极限。然而，在工程实践高歌猛进的同时，我们对模型内在工作机制的理解却始终滞后。刘子鸣借科学史提出了一个精妙类比：当前的人工智能发展，或许尚未抵达其“牛顿力学”的辉煌时刻，而是仍徘徊在“第谷时代”——一个充斥着大量实验观测数据，却缺乏系统性理论归纳的早期阶段。

我们坐拥海量数据和强大模型，却对底层运行逻辑缺乏梳理。刘子鸣指出，对短期性能指标的过度追逐，使得整个领域跳过了至关重要的“理解”环节，这无异于在背负一笔日益沉重的“认知债务”。更矛盾的是，现行学术评价体系偏爱“完美的叙事”或“显著的性能提升”，导致许多如同第谷观测记录般零碎却珍贵的“AI现象学”研究被边缘化。

为此，他呼吁建立一种全新的研究范式：放弃对即时应用性的执着，回归到使用“玩具模型”进行可控、多视角、由好奇心驱动的探索。刘子鸣宣布将亲身实践，通过个人博客分享实验过程中的“半成品”笔记，并计划在清华大学开设相关课程，旨在凝聚社区力量，共同偿还这笔债务，推动AI研究从经验性的“炼丹”走向系统性的“物理学”。

这一观点得到了明星数据科学家Jeremy Howard的共鸣。他在评论区指出，长期以来，以实验观察为核心的研究在主流AI/ML会议和期刊上几乎难以发表，这无疑制约了该领域的健康发展。

思维模式的根本转变：从“改变世界”到“理解世界”

物理学的发展遵循着“第谷（观测）-开普勒（归纳）-牛顿（理论）”的经典范式。以此观之，当前的AI研究主体仍停留在以“实验与观察”为主导的第谷阶段。即便在观察层面，业界焦点也大多局限于少数几个性能指标的调优，这源于两个领域根本目标的差异。

物理学的核心是“通过理解世界来改变世界”，“理解”本身具有至高价值，因此对暂时无实用价值的洞见也抱有极大宽容。而AI的目标更倾向于“直接改变世界”，Scaling Laws的成功让领域得以绕过“理解”，直接进行改造与强化。但这埋下了隐患，形成了必须偿还的“认知债务”。现在谈论AI的“牛顿时刻”为时尚早，其基础现象学仍处于萌芽期，无论是宏观的模型关联（如涌现与缩放定律），还是微观的训练动态（如Grokking、双下降、稳定性边缘），都需要更多现象的发掘作为理论构建的基石。

阻碍AI现象学发展的症结

为何AI现象学举步维艰？主流的论文发表文化是关键掣肘。目前能被接纳的研究大致分为两类：带来显著性能提升的工作（这让现象学研究显得“不必要”），或拥有一个足够吸引人的“故事”。

而“好故事”通常只有两种形态：

普适性：现象需在多种不同设定下普遍成立，如“稳定性边缘”。这类工作门槛极高。
惊奇性：现象必须足够反直觉、出人意料，如“Grokking”。这类情况可遇不可求。

这导致被广泛引用的AI现象学案例寥寥无几。在领域尚处早期时，就对现象学提出过高期望，反而抑制了其生长。无论是朱泽园的《大语言模型的物理学》，还是刘子鸣团队《叠加导致稳健的神经缩放》的工作，虽备受好评，却常让初学者感到无从入手。研究者不得不耗费大量精力“包装”故事，这不仅浪费资源，也拉大了与社区的距离，更使得大量无法成文的趣味现象被轻易丢弃。

构建一种更易接近、更包容的现象学

因此，刘子鸣倡导一种更贴近物理学精神、更包容的现象学研究方法。它应具备以下特征：

不以即时可用性为导向；
无需包装成完整“故事”；
不限制分析工具，有效即可。

同时，它应强调：

可控性：利用玩具模型简化复杂现实，确保结果能以最低成本（如一台笔记本电脑）复现。
多视角刻画：像“盲人摸象”般，从尽可能多的维度和指标描述研究对象。
好奇心驱动：探索应源于内在疑问或假设，定性洞见已具价值，定量分析则更佳。

这种“可接近的现象学”或许难以登上顶级会议，但对社区生态建设价值非凡。它允许多个研究者以接力形式贡献智慧：A发现现象并公开，B将其与已知现象关联，C进行统一，D开展理论分析，E最终转化为算法改进。五人可协作完成一篇论文。而在传统模式下，合作往往局限在小圈子内，且领域内部分割严重（如视觉、NLP研究者各自为战），阻碍了跨领域的直觉融合与知识流动。

行动倡议：从个人博客到社区共建

刘子鸣分享了个人计划与行动建议：

个人实践：他将通过博客持续分享“AI现象学”研究的阶段性成果，透明呈现原始数据与思考过程。此举目的有三：

强制记录：避免有趣的现象因无法成文而湮没，受苏剑林博客启发，但更侧重实验观察与物理直觉。
吸引同道：汇聚对此感兴趣的研究者与学生，共同探索。
课程准备：为计划在清华开设的《Physics of AI》课程积累素材。

给读者的建议：

找到真问题：例如，探究扩散模型的损失参数化，或复现Grokking等现象。
定义玩具模型：借鉴李天宏、何恺明用二维螺旋数据集研究损失参数化的思路，或亲手训练一个模加任务来理解Grokking。
彻底理解玩具模型：这是最困难也最关键的一步。应抵制“一旦有初步结果就转向更复杂模型”的冲动，以孩童般的好奇心“把玩”模型，从所有可能角度审视它，进行“无监督”式的深度探索。

刘子鸣坦言，无法保证这些洞见能立刻带来性能提升，但他坚信，当整个领域持续积累这种深层次的理解，终将引发一次类似“渗流”的质变，为AI从“技艺”迈向“科学”奠定坚实基础。

参考链接：
https://x.com/ZimingLiu11/status/2006810684546494522
https://kindxiaoming.github.io/blog/2025/physics-of-ai/

想获取更多AI最新资讯与智能工具推荐，欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台 与 AI学习社区

本文来源：机器之心

原文链接：https://www.jiqizhixin.com/articles/bcde5685-c7ed-49df-bd01-3e1b9c02f10f

本站部分内容来源于网络，均已注明来源和出处（如有遗漏非主观故意）。本站尊重原创版权，转载内容版权归原作者所有，仅用于信息整理与交流。如原作者不同意转载，请联系我们进行删除或调整。