视频分析

Video-RAG:轻量高效的长视频理解与多模态对齐框架

Video-RAG是由厦门大学、罗切斯特大学和南京大学联合研发的轻量级长视频理解框架,采用多模态辅助文本检索增强生成技术,无需模型微调即可实现高效的视觉-语义对齐。该框架在多个基准测试中超越商业模型,为教育、安防、医疗等领域的视频分析应用提供了低成本、高可扩展的解决方案。