小红书EGMN模型获RecSys 2025最佳论文提名,视频观看时长预测受国际认可

AI快讯 2025-10-20

小红书EGMN模型荣获RecSys 2025最佳论文提名,视频观看时长预测技术获国际认可

近日,一则有趣的社交媒体轶事引发广泛关注:当诺贝尔奖委员会还在寻找新晋生理学或医学奖得主时,一位小红书用户似乎早已在美国落基山脉与获奖者相遇并进行了交流。这个"让世界先找到你"的故事再次凸显了小红书平台独特的内容连接能力。

小红书社交媒体内容
图片来源:微博

这种精准的内容连接并非偶然。作为科技媒体从业者,我们深切体会到小红书推荐系统的强大之处——许多AI领域的重要人物动态和顶级会议信息,我们都能在第一时间通过小红书获取。

这个支撑着平台内容分发的核心推荐引擎,最近在国际舞台上大放异彩。在布拉格举行的推荐系统顶级会议RecSys 2025上,小红书推荐算法团队发表的论文《Multi-Granularity Distribution Modeling for Video Watch Time Prediction via Exponential-Gaussian Mixture Network》从全球数百篇顶尖研究中脱颖而出,荣获仅五篇的"最佳论文提名"。

RecSys 2025会议现场

ACM推荐系统会议(RecSys)自2007年创办以来,一直被公认为推荐系统领域最重要、最具影响力的学术盛会。该会议不仅引领学术研究方向,更深刻影响着工业界推荐技术的发展演进。每年,RecSys都吸引着全球顶尖学者和行业专家参与,谷歌、Netflix、Meta等科技巨头也深度参与其中。

业内领先的推荐系统

会议期间,小红书展台人气爆棚,许多来自北美的专家和技术人员本身就是小红书的资深用户。他们对小红书推荐能力的一致评价是:"业内领先"。

一位参会者分享了令人惊叹的体验:从美国飞抵布拉格后,打开小红书APP,系统不仅快速推送了精准的本地内容,更神奇的是还推荐了其他RecSys参会者发布的帖子,促成了线下新朋友的结识。这种精准捕捉用户即时场景和身份的能力,让推荐系统专家们深感赞叹。

小红书精准推荐示例
小红书精准的内容推荐能力展示

这种来自用户的高度认可,激发了研究者们对背后技术的好奇心。当小红书推荐算法团队首次参会并分享视频观看时长预测研究成果时,现场座无虚席。

论文演讲现场
论文第一作者赵旭演讲时的现场盛况

演讲结束后,现场掌声热烈,演讲者被热情的同行们追问技术细节,展台甚至出现了排队交流的场面。许多参会者认为,这篇论文是今年最佳论文的最有力竞争者。

  • 论文标题:Multi-Granularity Distribution Modeling for Video Watch Time Prediction via Exponential-Gaussian Mixture Network
  • 论文地址:https://arxiv.org/abs/2508.12665

会议结束后,讨论热潮从线下蔓延至线上。知乎等社区平台上,众多技术博主和从业者从不同角度对EGMN模型进行深度解读,普遍认为这项研究首次系统性地剖析了视频时长预测这一核心行业难题。

回归本质的机器学习之美

要理解这项研究的重要性,首先需要认识小红书的业务规模。作为中国领先的生活兴趣社区,小红书月活跃用户从2015年的5000万增长至2024年的3.5亿以上。在这种庞大体量下,推荐模型的微小改进都会显著影响用户体验和业务成果。

该论文瞄准的是所有反馈信号中的关键基础指标:观看时长。选择建模这一指标的重要原因是日活跃用户数是推荐团队的T0优化目标,而观看时长是与DAU最相关的反馈信号。

观看时长重要性
观看时长是衡量平台内容质量与用户满意度的关键指标

用户观看时长建模这个牵一发而动全身的核心问题,成为了团队攻关的焦点。团队发现,用户观看行为分布极为复杂,呈现出"粗粒度的偏态性"(大量快速划走)和"细粒度的多样性"(不同用户和视频的多峰观看模式)两大挑战。

用户观看行为分布

为此,团队回归问题本质,提出了极具巧思的方案:指数-高斯混合网络(EGMN)

EGMN模型架构

该方案核心结合了两种经典概率分布:

  • 指数分布:专门捕捉"快速划走"行为,其概率密度在零点附近最高然后迅速下降的特性,完美模拟"没兴趣立即划走"的场景
  • 高斯混合分布:刻画其他多样化观看模式,如"观看至结尾"、"重复观看片段"等,通过多个高斯分布混合灵活拟合任意形状的多峰分布

模型核心思想不再是直接预测单一观看时长数值,而是预测在给定用户和视频条件下,观看时长完整概率分布的各项参数。

为了让模型训练更稳定、效果更好,团队设计了包含极大似然估计、熵正则化和回归损失在内的三目标联合优化策略,确保模型在拟合复杂分布的同时保证预测精度。

这种简洁、清晰且直击问题核心的思路,被现场专家盛赞"有一种传统机器学习的美"。论文审稿人在评审意见中写道:"The paper is already in excellent shape"(这篇论文已经非常出色了)。

论文评审结果
审稿人给出的Strong Accept评价

线上线下全面验证

EGMN模型在离线和在线环境中都取得了全面领先的效果。在四个离线数据集上的实验表明,模型表现全面超越现有最优方法:平均绝对误差相对降低14.11%,排序一致性指标相对提升7.76%。

离线实验效果

在覆盖1500万用户、为期7天的线上A/B测试中,EGMN模型取得了显著业务效果,主要指标明显改善。更重要的是,衡量预测分布与真实分布差异的KL散度指标大幅下降19.94%,证明了EGMN在真实工业环境中的强大分布拟合能力。

线上测试效果

消融实验验证了EGMN各组件的有效性,团队还从粗到细的三个粒度层面分析了EGMN的分布拟合能力,证明其能有效捕获观看时长分布中的复杂模式。

分布拟合结果
EGMN在不同粒度层面的分布拟合效果

EGMN在时长建模上的有效性表明:引入合理的先验分布信息可以帮助现有目标提升拟合精度。这本质上是一种解决多模态复杂分布回归问题的通用思路,可拓展到电商成交价格预估、广告GMV预估等多种业务场景。

始于热爱,归于务实

回顾小红书在RecSys 2025的收获经历,清晰可见一条发展路径:始于用户对产品的真实热爱,归于推荐算法团队对技术难题"回归本质"的务实探索。

正如小红书技术专家强调的:"不盲从,踏踏实实分析用户和场景面临的真实问题,以此为锚点设计技术演进路径,是更有价值的事。"

此次在顶级会议上的成果,正是这种务实研究文化的充分体现,对小红书而言,这仅仅是一个新的开始。推荐算法团队继续广纳贤才,共同探索推荐算法领域的前沿技术。

小红书招聘信息

想获取更多AI最新资讯智能工具推荐, 欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台AI学习社区


本文来源:机器之心

原文链接:https://www.jiqizhixin.com/articles/323f812c-a43c-4baf-9663-1f7eebe399c1

本站部分内容来源于网络,均已注明来源和出处(如有遗漏非主观故意)。本站尊重原创版权,转载内容版权归原作者所有,仅用于信息整理与交流。如原作者不同意转载,请联系我们进行删除或调整。

相关文章