多模态大模型空间想象力评估:SpatialViz-Bench基准测试与数据污染分析

中科院自动化所与伦敦大学学院联合团队推出首个基于认知科学的空间可视化评估基准SpatialViz-Bench,采用程序化生成技术有效防止数据污染。该研究对27个主流多模态大模型进行测试,发现即使最强模型Gemini-2.5-pro准确率仅44.66%,远低于人类82.46%的水平。研究揭示两大关键发现:思维链提示在开源模型中反而降低性能,模型主要错误源于基础感知和空间变换能力缺失而非高级推理。这些发现为多模态大模型的未来发展指明了重要方向。

AI抗体设计新突破:大卫·贝克团队革新蛋白质与抗体药物研发

诺贝尔奖得主大卫・贝克团队与华盛顿大学蛋白质设计研究所合作,利用人工智能技术实现抗体从头设计突破。该研究通过RFdiffusion模型精准设计抗体结构,成功靶向流感血凝素等多种疾病靶点,为4450亿美元抗体药物市场带来革命性变革。研究成果发表于《Nature》期刊,相关技术已开源并获商业应用许可。

πRL强化学习微调框架优化VLA模型机器人控制性能

πRL是由清华、北大、CMU等机构联合推出的强化学习微调框架,专门针对流匹配VLA模型优化。该框架创新性地提出Flow-Noise和Flow-SDE两种技术方案,解决了流匹配VLA难以计算输出动作对数似然的核心难题。实验结果显示,在LIBERO测试平台上,π0和π0.5模型的成功率分别提升至97.6%和98.3%,在大规模多任务训练中成功率增幅超过40%。该框架已完全开源,为机器人学习领域提供了重要的技术突破。

AlphaEvolve与陶哲轩:AI进化算法重构数学构造新发现

陶哲轩与Google DeepMind合作的研究展示了AI进化算法AlphaEvolve在数学构造发现中的突破性进展。该系统结合大语言模型与进化计算,能够在67个数学问题上自主发现新构造,部分成果甚至超越已知最优解。研究提出了“大规模建构性数学”新范式,通过多AI工具协同工作流实现从直觉发现到形式化验证的完整研究过程,为数学研究开辟了新途径。

罗氏携手Manifold Bio:AI突破血脑屏障,革新神经疾病治疗

罗氏制药与AI生物技术公司Manifold Bio达成战略合作,通过人工智能技术突破血脑屏障限制,开发新一代神经系统疾病治疗方法。这项价值超20亿美元的合作将利用Manifold的mDesign平台筛选数万种分子载体,解决药物入脑难题,标志着AI与药物递送技术融合成为制药行业新趋势。

QQ浏览器AI+小窗:悬浮窗智能辅助,网页视频总结即用即走

QQ浏览器最新推出的AI+悬浮窗功能,通过智能悬浮窗形式将多种AI能力深度融入浏览场景,支持手动触发和智能推荐两种使用方式,实现不打扰的即用即走体验。该功能涵盖视频总结、网页摘要、文本翻译等核心能力,让浏览器升级为智能信息处理中枢,同时保持用户原有操作习惯,打造无缝融合的AI浏览体验。

AI交易在股市震荡中的表现分析:DeepSeek量化投资与行为金融学视角

香港大学团队在2025年10月美股震荡期间进行的AI交易实验显示,六款大模型在真实市场环境中展现出截然不同的投资表现。DeepSeek以13.89%收益率领先,其逆向投资策略在恐慌市场中表现出色,而过度交易的Gemini则出现亏损。实验揭示了在复杂金融环境中,克制行动冲动、保持策略一致性的智能行为比单纯的技术分析更为重要。中国开发的AI模型在本次实验中表现突出,标志着国产AI技术正向实际任务执行能力快速演进。

AI推理模型安全漏洞:思维链劫持与越狱攻击深度解析

最新研究揭示思维链推理技术存在重大安全漏洞——思维链劫持攻击。通过在恶意指令前植入大量无害推理内容,攻击者能成功绕过主流AI模型的安全防护,攻击成功率最高达100%。研究发现了‘拒绝稀释’机制,挑战了‘更多推理等于更强安全’的传统认知,为AI安全防御提出了新的研究方向。

Turbo AI崛起:辍学生创业打造AI笔记学习工具,教育科技获好评

Turbo AI由两位20岁辍学生创立,专注AI教育领域,通过自动生成笔记、记忆卡片和测验等功能,在两年内积累500万用户并实现盈利。产品结合多模态学习方式,支持课堂录音、PDF和视频等多种格式,虽定价高于竞品但仍受市场欢迎,已获得高盛、德勤等企业客户认可。

OpenAI发布AI浏览器ChatGPT Atlas,重塑智能助手与浏览器竞争格局

OpenAI正式发布革命性AI浏览器ChatGPT Atlas,深度整合ChatGPT技术,通过Ask ChatGPT侧边栏提供智能页面理解能力。产品具备先进的浏览器记忆功能和智能体模式,支持多种任务自动化。目前首发macOS版本,免费向各层级用户开放,后续将推出多平台版本。OpenAI特别强调产品的安全防护措施,包括限制代码执行、文件系统访问等,同时基于Chromium内核确保技术稳定性,这一发布将重塑浏览器市场竞争格局。

OpenAI发布AI浏览器ChatGPT Atlas,强化智能助理与安全措施

OpenAI正式发布革命性AI浏览器ChatGPT Atlas,深度整合ChatGPT智能助手,提供实时页面理解、智能问答、记忆功能和浏览器操作等创新特性。该浏览器基于Chromium内核开发,目前推出macOS版本,后续将扩展至Windows和移动平台。OpenAI特别强调其多层安全防护机制,包括代码执行限制、敏感网站访问确认和登出模式等,同时提醒用户注意智能体潜在风险。这一发布标志着AI与浏览器深度整合的新时代,将直接挑战谷歌Chrome和微软Edge的市场地位。

OpenAI发布AI浏览器ChatGPT Atlas:智能助理革新浏览器功能

OpenAI正式发布革命性AI浏览器ChatGPT Atlas,深度集成ChatGPT智能助手功能,支持页面内容理解、智能记忆、任务执行等创新特性。该浏览器目前面向macOS用户免费开放,具备多层安全防护机制,基于Chromium内核开发,标志着AI与浏览器深度融合的新时代。

OpenAI发布AI浏览器ChatGPT Atlas,集成智能助手与安全措施

OpenAI正式发布智能浏览器ChatGPT Atlas,深度集成ChatGPT助手功能,提供Ask ChatGPT侧边栏、浏览器记忆、智能体模式等创新特性。该产品基于Chromium内核,目前推出macOS版本,后续将扩展至Windows和移动平台。OpenAI特别强调多重安全防护措施,包括限制代码执行、文件系统访问隔离、敏感网站访问确认等机制,同时提醒用户注意AI智能体潜在风险。这一发布标志着OpenAI正式进入浏览器市场,将与谷歌Chrome和微软Edge展开直接竞争。

HumanLift技术:单图实现高保真3D数字人重建与多视角生成

HumanLift是一项革命性的单图3D数字人重建技术,由中科院计算所、香港科技大学和卡迪夫大学联合研发。该技术通过融合三维视频扩散模型和面部增强算法,仅需单张人物照片就能生成高保真、多视角一致的三维数字人模型,完美解决服装细节和面部真实感的重建难题,为影视、游戏和VR/AR领域提供了创新的数字人建模解决方案。

HumanLift单图高保真三维数字人重建,高斯网多视角生成技术

HumanLift是一项突破性的单图高保真三维数字人重建技术,由中科院计算所、香港科技大学和卡迪夫大学联合研发。该技术通过融合三维视频扩散模型和人脸增强算法,仅需单张人体图片即可生成高质量、高逼真度的三维数字人模型,完美解决多视角一致性、服装细节还原和面部真实感等技术难题,为影视、游戏、VR/AR等领域提供强大的数字人创建解决方案。

HumanLift单图重建高保真三维数字人,高斯网多视角生成人脸增强

HumanLift是一项突破性的单图三维数字人重建技术,由中科院计算所、香港科技大学和卡迪夫大学联合研发。该技术通过融合三维视频扩散模型和人脸增强算法,仅需单张人体图片即可生成高质量、高逼真度的三维数字人模型,解决了传统方法在真实感、复杂衣物处理和面部细节还原方面的技术难题,已获SIGGRAPH ASIA 2025接收。

HumanLift单图重建三维数字人,高斯网多视角生成高保真

HumanLift是一项突破性的单图三维数字人重建技术,由中科院计算所、香港科技大学和卡迪夫大学联合研发。该技术通过融合三维视频扩散模型和人脸增强模块,仅需单张人体图片即可生成高质量、高逼真度的三维数字人,在保持多视角一致性的同时精准还原服饰细节和面部特征,为影视制作、游戏开发和VR/AR应用提供了创新的解决方案。

HumanLift单图三维重建:高斯网多视角生成与人脸增强技术

HumanLift是一项突破性的单图三维人体重建技术,由中科院、港科大和卡迪夫大学联合研发。该技术通过融合三维视频扩散模型和人脸增强模块,实现了仅凭单张照片即可生成高质量三维数字人的目标。核心技术包括多视角图像生成和三维模型重建两个阶段,创新性地采用高斯网表示和动态姿态优化,有效解决了服饰细节还原、面部特征保持和多视角一致性的技术难题,为影视、游戏和虚拟现实领域提供了高效的数字化解决方案。

HumanLift技术:单张图片实现高保真3D数字人多视角重建

HumanLift是一项突破性的单图像3D数字人重建技术,由中科院计算所、香港科大和卡迪夫大学联合研发。该技术通过融合三维视频扩散模型和人脸增强算法,仅需单张输入图像即可生成高保真、多视角一致的三维数字人模型,有效解决了复杂服饰和面部细节的重建难题,已获SIGGRAPH ASIA 2025收录,在影视制作、游戏开发和虚拟现实领域具有广泛应用前景。