字节跳动团队近期发布并开源了uso(unified style-subject optimized)模型,这一创新框架首次将“风格驱动”与“主体驱动”两类传统上相互独立的图像生成任务整合到一个统一模型中,成功实现了在两个方向上均达到开源领域最先进水平(sota)的突破。

USO通过解耦内容与风格特征,并引入奖励学习机制,构建了首个能够同时处理风格迁移与主体定制的统一生成架构。
以往的方法往往将风格保真度与主体一致性视为矛盾目标,而USO则提出了一种跨任务协同解耦的新范式。该方法基于一个包含20万组三元组的大规模训练集(包括风格参考图、去风格化的主体图以及对应的风格化结果图),利用主体生成模型合成高质量的风格化图像数据,并通过风格奖励信号指导解耦训练过程,从而优化主体保持能力。

从技术实现上看,USO采用SigLIP的多尺度特征投影进行风格对齐训练,结合内容-风格解耦编码器来分离条件输入中的不同语义信息,并进一步引入风格奖励学习(SRL)策略,显著增强了特征解耦的精度与生成效果。
目前,USO的完整代码、预训练权重已发布在Hugging Face和GitHub平台,同时提供在线体验Demo及一键部署脚本,便于研究者与开发者快速上手。
https://www.php.cn/link/d351f787f92fd392b0c30979e85630ef
https://www.php.cn/link/788fa30233fcab2260b28ae40dde74a7
https://www.php.cn/link/902560b1f108bc2a170725b884863354
https://www.php.cn/link/b12564853249eafedf53525ef9b6b0f6
以上就是字节跳动开源 USO,支持统一风格与主体定制的图像生成模型的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号