宇树科技近日发布了面向多种机器人本体的开源世界模型-动作(wma)架构——unifolm-wma-0。该架构致力于为通用机器人学习构建统一的技术底座,其核心是一个能够理解机器人与环境之间物理交互规律的世界模型。

这一世界模型具备两大关键能力:
模型可接收视觉图像和自然语言指令,并据此生成符合语义描述的未来动作视频序列。
据官方说明,UnifoLM-WMA-0 支持两种工作模式:
在训练过程中,研发团队利用宇树科技公开发布的5个开源数据集对模型进行训练。测试表明,该模型能够基于“当前画面”以及预设的“未来机器人动作”,实现可控的交互内容生成,并展现出在长周期任务中持续生成合理交互行为的能力。
项目主页:https://www.php.cn/link/a7a1b53e91a3344e9eb9db2a6fa4eae2
开源代码地址:https://www.php.cn/link/5cd338743288fdb62b74ee279d51bf93
以上就是宇树科技发布开源世界模型-动作架构:UnifoLM-WMA-0的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号