检索增强生成
RAG技术演进:从基础检索到智能体驱动知识系统
本文深入探讨了RAG技术的演进历程,从基础检索到智能体驱动知识系统的转变。分析了业界对RAG技术未来的三种不同观点:演进为智能体检索、成为严肃工程学科、被智能体和长上下文窗口替代。文章指出初级RAG已过时,但RAG核心思想永恒,未来RAG将作为智能体工具箱组件,根据不同场景需求灵活应用。
Video-RAG:轻量高效的长视频理解与多模态对齐框架
Video-RAG是由厦门大学、罗切斯特大学和南京大学联合研发的轻量级长视频理解框架,采用多模态辅助文本检索增强生成技术,无需模型微调即可实现高效的视觉-语义对齐。该框架在多个基准测试中超越商业模型,为教育、安防、医疗等领域的视频分析应用提供了低成本、高可扩展的解决方案。