HumanLift单图高保真三维数字人重建,高斯网实现多视角生成
HumanLift是由中科院计算所、香港科技大学和卡迪夫大学联合研发的单图三维数字人重建技术,通过融合三维视频扩散模型和面部增强模块,仅需单张人物照片即可生成高保真、多视角一致的三维模型。该技术有效解决了传统方法在服饰细节、面部真实感和多视角一致性方面的技术瓶颈,已入选SIGGRAPH ASIA 2025,为影视、游戏和VR/AR领域提供了创新的三维建模解决方案。
坦克400预售开启:激光雷达+Hi4-Z动力,智能越野新标杆
长城坦克400正式开启预售,推出Hi4-Z和Hi4-T两个版本。新车在外观、内饰全面升级,新增激光雷达和敦煌紫配色,搭载第三代Coffee Pilot Ultra智能驾驶系统。Hi4-Z新能源动力系统综合功率达635kW,纯电续航200公里,重新定义智能越野新标准。
坦克400预售开启,激光雷达+Hi4-Z动力+智能驾驶系统
长城坦克400正式开启预售,推出Hi4-Z和Hi4-T两个版本,预售价格30.98-32.98万元。新车在外观、内饰全面升级,新增激光雷达和Hi4-Z新能源动力系统,搭载第三代Coffee Pilot Ultra智能驾驶系统,综合功率635kW,纯电续航200公里,产品竞争力显著提升。
坦克400预售开启,激光雷达+Hi4-Z动力重塑硬派越野智能驾驶
长城坦克400正式开启预售,推出Hi4-Z和Hi4-T两个版本。新车在外观、内饰全面升级,新增激光雷达和第三代Coffee Pilot Ultra智能驾驶系统,配备Hi4-Z新能源动力,综合功率达635kW,纯电续航200公里,实现了硬派越野与智能科技的完美融合。
ByteRobust发布:高效故障诊断与容错机制提升大规模语言模型训练稳定性与效率
字节跳动发布的ByteRobust系统通过创新的双平面架构设计,实现了大规模语言模型训练的高效故障诊断与容错处理。该系统采用优先快速隔离而非精确定位的策略,结合自动化容错框架和可控恢复机制,在实际部署中达到97%的有效训练时间比率,显著提升训练稳定性和效率,为超大规模AI模型训练提供了可靠的技术解决方案。
美团IROS 2025展示具身智能:无人机配送与DINO-X算法引领零售服务创新
2025年IROS会议上,美团机器人研究院展示了具身智能与零售服务融合的创新成果,包括规模化无人机配送服务和突破性的DINO-X算法。学术大咖围绕物理与数据协同、基础模型构建等核心议题展开深入讨论,一致认为具身智能正从传统范式向基于物理世界的通才模型演进,为智能机器人技术的未来发展指明方向。
AttnRL:基于注意力机制的过程监督强化学习框架,清华快手联合研发
清华大学与快手联合研发的AttnRL框架创新性地将注意力机制引入过程监督强化学习,通过基于注意力的树分支策略和自适应采样机制,显著提升了推理模型的训练效率和性能表现,在多个数学推理基准测试中实现突破性成果,为大模型可解释性与强化学习研究开辟了新方向。
豹5长续航版本,豹8大五座版,方程豹秋季新品正式上市
宣告着电驱越野时代的全面到来
Claude生命科学版发布:AI驱动科研全流程,加速成果转化
Anthropic正式推出专为生命科学领域打造的Claude生命科学版,基于Claude Sonnet 4.5强大模型,通过集成Benchling、PubMed等专业科研平台连接器,开发单细胞RNA分析等专项技能,为研究人员提供从文献综述、实验设计到数据分析和监管合规的全流程AI支持。该版本在Protocol QA和BixBench等专业评估中表现卓越,超越前代模型和人类基准,并与多家行业领先机构建立合作,加速生命科学领域的创新成果转化。
DeepSeek-OCR视觉压缩技术颠覆文本处理,效率提升十倍引AI界关注
DeepSeek-OCR通过创新的视觉压缩技术实现文本处理效率十倍提升,将1000字文章压缩为100个视觉token并保持97%精度,这一突破可能改变大语言模型的输入范式,引发AI社区对像素输入替代文本输入的深入讨论。
大模型脑腐:社交媒体垃圾数据致AI认知能力下降难修复
最新研究表明,大语言模型长期接触社交媒体垃圾数据会导致推理能力下降23%、长期记忆衰退30%,且这种认知损伤难以通过再训练完全修复。研究提出数据质量是影响AI认知能力的关键因素,强调建立严格的数据筛选标准和定期认知健康检查的必要性。
RewardMap:多阶段强化学习优化多模态大模型视觉推理,提升地铁路径规划精度
西湖大学ENCODE实验室联合多所高校提出RewardMap框架,通过多阶段强化学习和难度感知的细粒度奖励机制,有效解决多模态大模型在地铁图等密集视觉信息处理中的奖励稀疏问题。该技术在地铁路径规划任务中实现显著性能提升,在空间推理评估中取得13.51%的改进,为高分辨率视觉推理任务提供了可复用的强化学习范式。
大模型微调范式认知再被颠覆?UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解
在大模型微调实践中,SFT(监督微调)几乎成为主流流程的一部分,被广泛应用于各类下游任务和专用场景。
Anthropic发布网页版Claude Code:云端编程与并行任务,安全沙盒助力开发效率
Anthropic正式推出网页版Claude Code,支持开发者在浏览器中直接委派编程任务,具备并行任务处理、灵活工作流程和安全沙盒环境三大核心优势,目前作为Beta版向Pro和Max用户开放,显著提升软件开发效率。
Claude Code网页版发布:云端编程任务并行开发,安全沙盒提效
Anthropic正式发布网页版Claude Code,支持用户在浏览器中直接委派编程任务到云端执行。该版本具备三大核心优势:支持跨仓库并行任务处理、灵活适配现有工作流程、以及安全隔离的沙盒执行环境。目前作为研究预览版向Pro和Max用户开放,标志着云端编程进入全新阶段。
Anthropic发布网页版Claude Code,支持云端编程与安全沙盒并行任务
Anthropic推出网页版Claude Code Beta版本,支持开发者在浏览器中直接委派编程任务,具备并行任务处理、灵活工作流适配和安全沙盒环境三大核心优势,为云端编程带来革命性体验。
Claude Code网页版发布:云端编程任务与并行开发,支持移动端安全沙盒
Anthropic正式发布网页版Claude Code,支持云端编程任务委派和并行开发,具备三大核心优势:并行任务处理、灵活工作流适配和安全沙盒环境,现面向Pro和Max用户开放Beta测试,同时支持移动端使用。
UniVid开源统一视频模型:高效融合视频理解与生成能力
UniVid是一个革命性的开源统一视频模型,创新性地将视频理解与生成能力融合到单一系统中。通过适配器架构、温控模态对齐和金字塔反射机制三大核心技术,该模型在VBench评测中创下多项纪录,在时序一致性、语义对齐等关键指标上表现卓越。UniVid的开源特性为视频智能技术的发展提供了强大基础,在影视创作、视频分析、机器人智能等领域具有广泛应用前景。
UniVid开源项目:统一模型实现视频理解与生成一体化
UniVid开源项目创新性地将视频理解与生成能力融合于统一模型,通过适配器架构、温度模态对齐和金字塔反射三大核心技术,在VBench评测中刷新多项记录,实现99.88的时序一致性和80.58的语义对齐度。该项目为视频内容创作、智能分析和机器人导航等场景提供强大支持,完全开源的特性助力AI研究社区发展。
UniVid开源项目:统一模型实现视频理解与生成一体化,提升语义一致性与画面连贯性
UniVid开源项目创新性地将视频理解与生成能力融合于单一模型,通过适配器架构、温控模态对齐和金字塔反射三大核心技术,在VBench评测中刷新多项记录,实现了语义一致性和画面连贯性的显著提升。这一突破为视频创作、智能分析和机器人技术等领域提供了强大的技术支撑,同时开源特性促进了AI研究的民主化进程。