AI快讯

Video-RAG:轻量高效的长视频理解与多模态对齐框架

Video-RAG是由厦门大学、罗切斯特大学和南京大学联合研发的轻量级长视频理解框架,采用多模态辅助文本检索增强生成技术,无需模型微调即可实现高效的视觉-语义对齐。该框架在多个基准测试中超越商业模型,为教育、安防、医疗等领域的视频分析应用提供了低成本、高可扩展的解决方案。

OmniPart框架:部件级3D生成技术,革新游戏与虚拟现实开发

OmniPart是由香港大学、VAST、哈尔滨工业大学和浙江大学联合研发的革命性部件级3D生成框架,采用创新的两阶段'规划-生成'策略,能够在不到1分钟内从单张图像生成高质量、可独立编辑的3D部件,显著提升了游戏开发、虚拟现实和数字孪生领域的3D内容创作效率和质量。