AI快讯
ViMoGen创新模型:提升3D人体动作生成泛化能力,赋能具身智能发展
本文介绍了由多所顶尖机构联合提出的ViMoGen创新框架,该框架通过构建大规模多样化数据集ViMoGen-228K、设计融合视频先验与动作捕捉先验的双分支模型,以及建立首个面向泛化能力的综合评测基准MBench,系统性地解决了3D人体动作生成领域泛化能力不足的核心瓶颈。这项工作不仅显著提升了AI根据复杂文本指令生成自然、合理3D动作的能力,更为具身智能的发展提供了高质量的动作数据生成与评估工具,有望加速人形机器人等领域的仿真训练与技能学习。
雷蛇CES 2026发布Project Ava全息AI伴侣:Grok驱动二次元助手引隐私争议
雷蛇在CES 2026上发布了Project Ava全息AI桌面伴侣,这是一个5.5英寸的圆柱形设备,通过3D全息投影呈现可互动的二次元虚拟形象。其核心亮点在于能同时观察用户和电脑屏幕的多模态情境感知能力,提供游戏辅助、工作效率提升及情感陪伴等功能。然而,该产品由马斯克xAI的Grok模型驱动,其对话风格被指存在“调情”倾向,引发争议。更大的质疑在于其持续监控用户表情与屏幕的交互模式,引发了关于个人隐私边界与数据安全的广泛讨论。产品定位科技爱好者,预计2026年下半年上市,目标销量高达十亿台。
密瓜智能获数千万天使轮融资,开源HAMi提升异构算力效率
上海密瓜智能科技有限公司近期完成数千万元天使轮融资,由复星创富领投。公司核心为CNCF开源项目HAMi,专注于异构GPU资源的虚拟化与高效调度,已支持国内外主流芯片并拥有活跃的全球开发者社区。此次融资将用于深化开源生态、加速团队与全球化布局以及研发企业级产品,旨在解决AI时代算力效率瓶颈,推动产业高效发展。
英伟达CES发布桌面AI超算DGX,本地运行千亿参数大模型
在CES 2024上,英伟达发布了革命性的桌面AI超级计算机DGX Spark和DGX Station。这两款基于Grace Blackwell架构的设备,将数据中心级的算力浓缩至桌面,分别支持本地运行千亿级和万亿级参数的大语言模型。通过先进的硬件设计、NVFP4数据压缩格式以及与开源社区的深度合作,它们为开发者、研究机构和企业提供了强大的本地AI开发、微调与部署平台,同时英伟达还宣布了配套的企业AI套件订阅服务及面向游戏、机器人等领域的扩展支持计划。
AI工具重塑工作与教育:Claude Code如何缩短博士毕业时间
本文探讨了AI编程工具如Claude Code如何显著压缩工作时间和学习周期。通过硅谷工程师的真实案例,展示了AI工具将一年工作量压缩至一小时的惊人效率,并引发了关于传统教育模式是否过时的深度讨论。文章呈现了正反双方观点:支持者认为AI能大幅加速博士毕业和工程师成长;反对者则强调传统学习过程中培养的批判性思维和深层理解的价值。最终指向AI时代人类独特价值的重新定义——主动性、好奇心和与AI协作的能力可能成为最稀缺的特质。
AI Shortlist平台上线:助您精准追踪人工智能创新企业
AI Shortlist平台正式上线,通过专业的数据分析与可视化工具,帮助投资者、研究者和行业观察者精准追踪人工智能领域的创新企业动态,提供深度的行业洞察与决策支持。
田渊栋:从Meta被裁到AI创业,探索大模型可解释性与个人价值
本文讲述了知名AI科学家田渊栋从Meta被裁后投身AI创业的经历。他详细回顾了参与Llama 4项目、遭遇裁员的心路历程,并系统阐述了其2025年在提升大模型推理效率与探索模型可解释性方面的核心研究工作。文章重点分享了他对AI时代社会变革的深刻洞察,提出了“人类社会的费米能级”概念,指出个人价值将取决于人机协作效能是否超越AI本身。他警示了AI同化风险,并倡导以坚定的“目标感”和主动思考,在“遍地神灯”的时代中保持独特价值与创造力。
AI编程新范式:非专业开发者如何利用无代码工具高效创造
本文通过Factory开发者关系主管Ben Tossell的实践案例,深入探讨了AI时代编程范式的根本转变。Tossell作为非专业背景的开发者,在四个月内通过调度AI智能体消耗30亿Token,完成了包括个人网站重构、加密追踪系统、AI视频制作等数十个项目。文章揭示了从“语法记忆”到“系统驾驭”的能力评价标准变化,强调命令行界面(CLI)在AI协作中的核心地位,并提出了“为探索而探索”的新开发哲学。文章指出,当前正处于软件大爆炸前夜,技术民主化让每个人都能通过AI工具快速实现创意,关键在于掌握与智能体协
张吕敏团队突破AI长视频生成:ControlNet记忆压缩技术解决画面一致性难题
张吕敏团队提出了一项突破性的AI长视频生成技术,通过创新的记忆压缩系统解决了画面一致性与算力成本的矛盾。该技术采用两阶段策略,预训练一个能保留任意时间点高频细节的压缩模型,再将其作为记忆编码器集成到视频生成系统中。实验表明,该方法可将20秒视频压缩至约5k token,用消费级显卡实现长时、连贯、高保真的视频生成,在多项评估指标上表现优异。