字节跳动正式发布全新视觉生成框架 infinitystar,该框架在视频生成效率方面实现重大突破,仅需58秒即可生成一段5秒长的720p高清视频。这一技术不仅大幅提升了生成速度,还凭借统一架构支持多种视觉创作任务,涵盖图像生成、文本到视频转换、视频续写等多种功能。

InfinityStar 的核心设计源于对视频数据本质的深度洞察。不同于传统方法将视频看作一个整体的3D数据块,该框架创新性地采用了时空金字塔结构,将空间尺度与时间维度进行显式分离。这种架构使模型能够更精准地区分静态外观特征和动态运动信息,从而显著提升生成内容的质量与连贯性。

为进一步优化训练效率,InfinityStar 引入了知识继承机制,依托一个已预训练完成的变分自编码器(VAE)作为基础模块。借助该策略,新模型可快速迁移已有特征表示能力,有效减少训练周期并降低计算资源需求。
实测结果显示,InfinityStar 在保证出色视觉表现力的同时,实现了前所未有的生成速度。此次发布的框架标志着视觉生成领域的重要进展,为未来长时视频生成及多模态任务的拓展提供了坚实的技术支撑。
源码地址:点击下载
以上就是字节推出 InfinityStar 框架,视频生成速度提升至 58 秒的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号