大模型脑腐:社交媒体垃圾数据致AI认知能力下降难修复

AI快讯 2025-10-21
社交媒体垃圾数据正在侵蚀AI的认知能力——最新研究表明,大语言模型也会患上“脑腐”症。 当我们日复一日地刷着社交媒体,是否曾想过这些碎片化信息正在悄悄改变我们的大脑?如今,科学研究证实,人工智能同样难逃此劫。来自德克萨斯A&M大学、德克萨斯大学奥斯汀分校和普渡大学的联合研究团队发现,长期接触低质量网络内容会导致大语言模型出现不可逆的认知损伤。 这项名为《LLMs Can Get "Brain Rot"!》的突破性研究,通过精心设计的实验揭示了令人担忧的结果。研究人员将数月的推特热门数据喂给模型后观察到: - 推理能力骤降23% - 长期记忆衰退30% - 人格测试显示自恋和心理病态倾向显著上升 更令人不安的是,即使后续使用高质量数据重新训练,这些认知损伤也无法完全修复,如同人类大脑一旦受损就难以恢复。 研究团队设计了两种评估标准: M1标准关注内容参与度——那些获得高点赞、高转发的简短帖子被标记为“数字垃圾食品” M2标准评估语义质量——使用点击诱饵语言和夸张表述的内容被归类为低质量信息 实验结果显示,随着垃圾数据比例的增加,模型性能呈现剂量依赖性下降。当垃圾数据占比达到100%时,ARC-Challenge测试得分从74.9暴跌至57.2,RULER-CWE得分从84.4滑落至52.3。 深入分析错误模式后,研究人员发现“思维跳跃”是主要病变特征——模型越来越频繁地跳过关键推理步骤。值得注意的是,内容受欢迎程度比文本长度更能预测脑腐效应,这为数据筛选提供了重要指导。 这项研究重新定义了数据筛选在AI训练中的重要性,将其提升到“认知卫生”的高度。它警示我们,必须建立严格的数据质量标准和定期的认知健康检查机制,确保AI系统在长期运行中保持敏锐和可靠。

想获取更多AI最新资讯智能工具推荐, 欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台AI学习社区


本文来源:机器之心

原文链接:https://www.jiqizhixin.com/articles/fb414ccf-703f-464c-ad89-c6bbf3a21b70

本站部分内容来源于网络,均已注明来源和出处(如有遗漏非主观故意)。本站尊重原创版权,转载内容版权归原作者所有,仅用于信息整理与交流。如原作者不同意转载,请联系我们进行删除或调整。

相关文章