标签名称：长视频生成

张吕敏团队突破AI长视频生成：ControlNet记忆压缩技术解决画面一致性难题

张吕敏团队提出了一项突破性的AI长视频生成技术，通过创新的记忆压缩系统解决了画面一致性与算力成本的矛盾。该技术采用两阶段策略，预训练一个能保留任意时间点高频细节的压缩模型，再将其作为记忆编码器集成到视频生成系统中。实验表明，该方法可将20秒视频压缩至约5k token，用消费级显卡实现长时、连贯、高保真的视频生成，在多项评估指标上表现优异。

AI快讯

2026-01-04

香港大学开源ViMax框架：多智能体协同实现AI全流程自动化视频制作

香港大学黄超教授团队开源的ViMax框架，通过多智能体协同实现了AI全流程自动化视频制作。该框架将影视制作分解为剧本创作、分镜规划、视觉生成、质量把控和统筹协调五个阶段，由专门的AI智能体负责。ViMax创新性地采用三层递归规划体系应对长视频叙事复杂度，并利用图网络和RAG技术解决跨镜头视觉一致性与上下文碎片化难题。这一体系标志着AI视频生成从‘片段生成’到‘系统化创作’的重要转变，为未来自动化创作工具的发展提供了新思路。

AI快讯

2025-12-13

Self-Forcing++突破4分钟长视频生成，自回归扩散模型实现高质量输出

Self-Forcing++是由加州大学洛杉矶分校与字节跳动Seed团队联合开发的突破性视频生成技术，首次实现4分钟高质量长视频生成，无需长视频训练数据。该技术通过创新的教师-学生模型交互机制、反向噪声初始化、扩展分布匹配蒸馏和滚动KV缓存三大核心技术，解决了传统视频生成模型在时长限制、误差累积和画面稳定性方面的根本问题。在50-100秒视频生成测试中全面超越现有基线模型，为AI视频生成领域开辟了新的技术路径。

AI快讯

2025-10-21

AI导航

长视频生成

张吕敏团队突破AI长视频生成：ControlNet记忆压缩技术解决画面一致性难题

香港大学开源ViMax框架：多智能体协同实现AI全流程自动化视频制作

Self-Forcing++突破4分钟长视频生成，自回归扩散模型实现高质量输出