马斯克开源X平台推荐算法,Transformer架构提升透明度与内容质量
马斯克兑现承诺:X平台开源基于Grok的Transformer推荐算法,重塑社交媒体透明度
在科技界的一片瞩目与些许质疑中,埃隆·马斯克掌舵的X平台(前身为Twitter)正式迈出了历史性的一步——将其核心的“For You”信息流推荐算法完全开源。这一举措不仅兑现了他一周前在平台上的公开承诺,更标志着社交媒体巨头首次将决定用户所见所闻的“黑箱”引擎公之于众。
此次开源的算法核心,采用了与马斯克旗下xAI公司开发的Grok模型同源的Transformer架构。这套系统不再依赖传统的人工规则,而是通过一个庞大的神经网络,深度分析每位用户的历史行为——包括点赞、回复、转发、点击、停留时长等十几种互动信号——来预测其兴趣,并据此对海量推文进行精准排序。

推荐算法被誉为社交媒体平台的“心脏”,它直接决定了用户留存、内容生态乃至平台的商业命脉。马斯克此前宣布将开源这一核心资产时,曾引发广泛讨论。如今,代码仓库已如期在GitHub上线(https://github.com/xai-org/x-algorithm),尽管比原定的7天略有延迟,但这一开创性的透明度实践已然实现。
“我们知道这套算法远非完美,它笨拙且需要大量改进,”马斯克在开源后坦言,“但至少,你们可以亲眼看到我们正在如何实时、透明地努力让它变得更好。目前,没有其他任何社交媒体公司敢这样做。”

开源背后的多重考量:透明度承诺与监管压力
选择开源,或许并非纯粹的技术理想主义。有分析指出,这一决策背后交织着对平台透明度的追求与来自监管层面的压力。
据路透社报道,早在2025年7月,巴黎检察官办公室就对X平台展开了调查,焦点集中于潜在的算法偏见与欺诈性数据提取问题。马斯克当时将此次调查定性为“具有政治动机的刑事调查”,并认为其威胁了用户的言论自由。随后在12月,欧盟依据《数字服务法案》(DSA),以X平台在“蓝V”认证服务、广告库透明度以及向研究人员提供数据等方面未能履行义务为由,对其处以高达1.2亿欧元的罚款。
在此背景下,开源核心算法成为X平台展示其运作机制、回应监管关切、并重建信任的一种强势姿态。
技术深潜:Thunder与Phoenix如何驱动你的信息流?
那么,这份开源代码究竟揭示了怎样的技术图景?整个推荐系统的核心,围绕着两个名为“Thunder”(雷霆)和“Phoenix”(凤凰)的组件构建。

1. Thunder组件:实时关系网络引擎
Thunder是一个高性能、基于内存的实时数据系统,专门负责处理“站内关系内容”。它的任务简单而关键:以亚毫秒级的速度,追踪并为你提供所有已关注账号的最新动态。它持续从消息队列中获取新帖,为每位用户维护专属的帖子缓存,并自动清理旧数据,确保你能瞬间看到关注者的新鲜事。
2. Phoenix组件:AI驱动的发现与排序核心
Phoenix则是系统的智能大脑,完全基于机器学习,包含两大功能:
- 召回(双塔模型):从平台全局内容海洋中,为你打捞可能感兴趣的“站外发现内容”。一个“用户塔”将你的特征和行为编码成向量,另一个“内容塔”将海量帖子也编码成向量,通过计算向量相似度,找到与你最匹配的Top-K候选帖。
- 排序(隔离Transformer):这是基于Grok的Transformer模型发挥威力的地方。它将你的历史上下文和候选帖子一同输入,通过一种特殊的注意力机制(确保候选帖之间互不可见),预测你对每条帖子产生各种互动行为的概率。
模型预测的互动类型极为细致,远超简单的点赞转发:
预测类型包括:
├── 收藏概率 P(favorite)
├── 回复概率 P(reply)
├── 转发概率 P(repost)
├── 引用概率 P(quote)
├── 点击概率 P(click)
├── 主页点击 P(profile_click)
├── 视频观看 P(video_view)
├── 图片展开 P(photo_expand)
├── 分享概率 P(share)
├── 停留时长 P(dwell)
├── 关注作者 P(follow_author)
├── 不感兴趣 P(not_interested)
├── 拉黑作者 P(block_author)
├── 静音作者 P(mute_author)
└── 举报概率 P(report)
最终,一个加权评分器会综合所有这些概率,计算出每条帖子的唯一分数:最终分数 = Σ (权重_i × 互动概率_i)。这个分数直接决定了它在你的“For You”信息流中的位置。
新时代的“流量密码”:质量重于热度,关系重于病毒
通过解读开源算法,我们可以清晰地看到X平台内容推荐逻辑的深刻转变:
- 摒弃虚荣指标:排序不再单纯依赖点赞数等表面数据,而是更看重引用、深度回复、个人主页点击、关注以及内容停留时长等“深度互动”信号。
- 负面反馈权重显著:“不感兴趣”、静音、拉黑、举报等行为被赋予负权重,会直接且显著地降低内容的推荐范围,有效压制低质或不受欢迎的内容。
- 惩罚短期刺激:仅靠情绪化标题或争议性内容获取的短期互动峰值,可能会被算法后续捕捉到的负反馈所抵消,可持续的内容质量变得更为关键。
- 抑制刷屏行为:系统会对同一作者短时间内发布的多个内容进行递减加权,“以量取胜”的刷屏策略效果会大打折扣,鼓励创作者提升单条内容的价值。
- 强化关注网络:来自你已关注账号的内容享有最高权重,纯粹的“病毒式传播”内容在推送给非关注用户时会被系统性打折,这强调了构建稳定粉丝关系的重要性。
总而言之,X平台的推荐系统正明确地从优化“短期热度”转向优化“长期关系”与“内容质量”。对于内容创作者而言,建立真诚的互动、产出具有长期价值的内容,比追逐一时的流量爆点更为重要。
规则的帷幕已经拉开,算法的“流量密码”清晰可见。这不仅是一次技术公开,更可能引发社交媒体行业对透明度、责任与算法伦理的重新思考。下一步,全球的开发者、研究者和用户将如何审视、验证并参与塑造这套开放的算法,值得所有人期待。
想获取更多AI最新资讯与智能工具推荐, 欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台 与 AI学习社区
本文来源:机器之心
原文链接:https://www.jiqizhixin.com/articles/05581ac1-fddb-45e2-a986-676ebe7168a3