机器学习

ByteRobust发布:高效故障诊断与容错机制提升大规模语言模型训练稳定性与效率

字节跳动发布的ByteRobust系统通过创新的双平面架构设计,实现了大规模语言模型训练的高效故障诊断与容错处理。该系统采用优先快速隔离而非精确定位的策略,结合自动化容错框架和可控恢复机制,在实际部署中达到97%的有效训练时间比率,显著提升训练稳定性和效率,为超大规模AI模型训练提供了可靠的技术解决方案。

RewardMap:多阶段强化学习优化多模态大模型视觉推理,提升地铁路径规划精度

西湖大学ENCODE实验室联合多所高校提出RewardMap框架,通过多阶段强化学习和难度感知的细粒度奖励机制,有效解决多模态大模型在地铁图等密集视觉信息处理中的奖励稀疏问题。该技术在地铁路径规划任务中实现显著性能提升,在空间推理评估中取得13.51%的改进,为高分辨率视觉推理任务提供了可复用的强化学习范式。

小红书EGMN模型获RecSys 2025最佳论文提名,视频观看时长预测受国际认可

小红书推荐算法团队在RecSys 2025顶级会议上凭借EGMN(指数-高斯混合网络)模型荣获最佳论文提名,该模型创新性地结合指数分布和高斯混合分布,精准预测视频观看时长,解决了推荐系统领域的核心难题。研究成果在国际学术界和工业界获得高度认可,体现了小红书在推荐算法技术上的领先地位和务实创新的技术文化。