小米正式发布并开源行业首个实现自动驾驶与具身智能深度融合的跨域基础模型 mimo-embodied。
技术亮点
1. 跨域统一建模:单一模型架构支持具身智能三大核心任务(可供性推理、任务规划、空间理解)以及自动驾驶三大关键任务(环境感知、状态预测、驾驶规划),首次实现从家庭场景交互到道路驾驶决策的全场景智能融合。
2. 双向能力增强:实验表明,室内交互任务所学知识可有效迁移至道路驾驶任务,反之亦然,验证了跨场景、跨任务之间的协同进化潜力,为通用智能体发展提供新路径。
3. 端到端训练优化:采用“具身与自驾联合预训练→思维链推理强化→强化学习微调”的三阶段训练框架,大幅提升模型在复杂真实环境中的鲁棒性与决策准确性。
性能表现
在包含感知、决策与路径规划在内的29项核心评测任务中,MiMo-Embodied全面超越当前主流开源、闭源及专用模型:在具身智能领域的17项Benchmark中达到SOTA水平,在自动驾驶相关12项测试中刷新历史最佳成绩,同时在通用视觉语言任务中展现出强大的泛化能力。

应用与生态布局
小米将率先在自研产品线部署MiMo-Embodied,包括新一代扫地机器人、工业AGV及SU7高阶智能驾驶系统,并计划于2026年Q1起通过OTA逐步推送升级。同时,小米将开放模型API接口,面向智能家居、智慧出行与智能制造领域的开发者提供统一的跨域智能底层支持。
源码地址:点击下载
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号