微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 科技周边 > 人工智能 > 正文

无直接数据可用，AI怎么学会「干活」？微软团队揭秘AI从语言到行动的进化之路

DDD

发布： 2025-01-21 23:02:33

原创

668人浏览过

微软团队突破性研究：从零构建大行动模型lam，实现ai从被动语言生成到主动行动生成的飞跃！

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

微软Data, Knowledge, and Intelligence (DKI) 团队（TaskWeaver, WizardLLM, Windows GUI Agent UFO核心开发者）发布技术报告，详细阐述了如何在缺乏直接可用数据的情况下，从头训练一个能够在真实环境中执行任务的大行动模型（Large Action Model, LAM）。该研究为AI从被动语言生成向主动行动生成的转变提供了全新思路。

LLM的局限与LAM的优势

当前的大语言模型（LLM），如GPT系列和Mistral-7B，擅长文本生成，但在与物理或数字环境交互方面存在局限，无法执行超越文本层面的操作。这种“语言-行动断层”限制了AI的实际应用。

LAM则具备三大关键特性：精准的用户意图理解（涵盖语言、语音、图像等多种输入）、强大的行动生成能力（GUI操作、API调用、物理动作等）、以及动态规划与环境适应能力。

技术报告：Large Action Models: From Inception to Implementation
数据处理代码：https://www.php.cn/link/21b9a07cb47f707a02489fd5e3b882bd
完整技术文档：https://www.php.cn/link/dc4781e4d7949791a2c973340de4a010

从LLM到LAM的挑战与解决方案

将LLM转变为LAM面临诸多挑战：数据获取困难、模型训练方法的革新、离线评估的局限性以及线上环境适配和评估的复杂性。

微软团队提出的完整解决方案，涵盖了数据积累、模型训练和部署的各个阶段。

图1：从LLM到LAM的演变

数据积累：从无到有的数据构建流程

该团队设计了一个两阶段的数据收集和处理流程：

阶段一：任务-计划数据收集 从开源资源（应用帮助文档、WikiHow教程、搜索查询记录）收集76,672对任务-计划数据，并通过数据增强技术将数据量扩展至原来的150%。

MagicStudio

MagicStudio

图片处理必备效率神器！为你的图片提供神奇魔法

MagicStudio

102

MagicStudio

阶段二：任务-行动数据收集 将抽象的计划步骤转化为具体的行动序列，并在真实环境中执行验证，最终生成结构化的任务-行动对。

图2：任务-计划数据的收集过程

图3：任务-行动数据的收集过程

LAM训练流程：四阶段逐步迭代

LAM的训练过程分为四个阶段：

任务计划预训练: 利用任务-计划数据预训练模型，使其掌握任务分解能力。
专家知识学习: 利用任务-行动数据进行模仿学习，让模型能够执行具体的行动。
自我探索提升: 将LAM部署在UFO框架中，通过与真实环境交互，自动生成新的训练数据，并迭代模型。
奖励模型优化: 引入奖励模型，利用强化学习进一步优化LAM的决策能力。

图4：LAM的训练过程

实验结果：离线和线上测试验证LAM的有效性

离线实验结果显示，LAM在各个训练阶段都取得了显著的性能提升。线上实验结果表明，LAM在真实环境中的任务成功率达到了71.0%，并且在任务完成时间和平均步时延方面也展现了显著的优势。

表1：不同LAM训练阶段的离线实验结果

图5：LAM智能体架构

表2：LAM的线上实验结果

这项研究为构建能够在真实世界中执行复杂任务的AI智能体提供了宝贵的经验和方法论，标志着AI技术发展的重要里程碑。

以上就是无直接数据可用，AI怎么学会「干活」？微软团队揭秘AI从语言到行动的进化之路的详细内容，更多请关注php中文网其它相关文章！

相关标签：

微软 git windows ai api调用架构 github windows https microsoft gpt

大家都在看：

GPT-5.1-Codex-Max— OpenAI推出的智能编程模型 Shutterstock如何联系客服_Shutterstock官方客服联系方式与常见问题零跑A10广州车展首发定位全球车型明年上半年上市 deepseek网页版体验入口_deepseek使用教程详解 deepseek官网入口教程_deepseek网页版使用详解

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：碳化硅集成光量子纠缠器件领域研究获突破下一篇：能源电子将迎来新一轮技术创新大周期

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

永远的蔚蓝星球青羽聆风皮肤箱兑换推荐

2025-11-19 16:15:02
Go语言中同时运行多个Web服务器的实践指南

2025-11-19 16:17:00
至少5400mAh！折叠屏iPhone电池容量刷新纪录了……

2025-11-19 16:18:01
Linus 表示可以接受“Vibe Coding”，但不适合在生产环境使用

2025-11-19 16:19:01
《海绵宝宝：潮汐巨神》多平台发售 3D动作冒险

2025-11-19 16:19:14
深入理解Firebase异步操作：解决方法返回null/0的问题

2025-11-19 16:19:25
《回音：飞艇传说》开发者回顾新品节：感谢中国玩家的帮助

2025-11-19 16:20:12
《我们之中》联动《星露谷物语》开启大量特色奖励

2025-11-19 16:21:01
Go语言泛型概念解析：理解其在静态类型编程中的作用与意义

2025-11-19 16:21:19
Steam客户端更新:解决PS5手柄蓝牙连接陀螺仪故障等

2025-11-19 16:21:45

最新问题

怎样用DEEPSEEK做网页_DEEPSEEK网页版网页生成教程首先访问DEEPSEEK官网并登录账户，选择DeepSeek-V3及以上文本生成模型，输入如“生成企业官网首页HTML代码”等具体指令，添加移动端适配等要求后发送，获取返回的HTML代码并复制到本地文件保存为index.html，最后用浏览器打开预览效果。

2025-11-21 17:09:23

385

松鼠AI怎么参与寒假集训营_松鼠AI假期集训营报名与课程查看步骤答案：报名松鼠AI寒假集训营需通过官网、微信公众号或线下校区查询信息并联系课程顾问完成报名。

2025-11-21 17:08:32

385

ai智能写作官方网站链接_ ai智能写作在线创作官网直达 ai智能写作官方网站链接是https://www.68aixie.com/AI_A44F3A8，该平台基于先进自然语言处理技术，支持多场景内容一键生成，具备实时修改建议、行业模板库、资料整合及云端同步等功能，显著提升创作效率。

2025-11-21 17:08:02

950

哩布哩布ai官方网址主页地址_哩布哩布ai官网入口直达链接哩布哩布AI官网主页地址是https://www.liblib.art/，该平台提供一站式AI视觉生成服务，支持文生图、多种风格化模型、自定义LoRA训练及云端渲染，并设有创作社区供用户分享作品与模型，同时具备API接口、免费试用额度和永久云存储等特色功能。

2025-11-21 17:04:02

658

ai免费生成视频入口 ai生成视频免费入口答案：免费AI生成视频入口为https://www.pika.art。该平台支持文字生成短视频，提供多种风格模板和基础参数调节，配备在线编辑工具；注册即享免费额度，操作便捷，生成速度快，并设有作品展示区、提示词复用及创作挑战活动，支持用户反馈与模型优化。

2025-11-21 16:59:55

372

DEEPSEEK网页版导出对话_DEEPSEEK网页版记录导出教程 DEEPSEEK网页版导出对话需先登录，进入个人中心选择会话，点击“更多操作”中的“导出对话”，设置格式（TXT/JSON）与时间范围后开始导出，文件生成后24小时内可下载。

2025-11-21 16:53:02

811

百度ai官方访问地址链接_百度ai平台官网主页在线入口百度AI官方访问地址是https://ai.baidu.com/，该平台集成自然语言处理、图像识别、语音合成等技术，提供预训练模型部署、可视化操作界面和多终端数据同步功能，支持开源模型共享、技术文档查阅及社区交流，并为企业提供定制化解决方案与私有化部署服务。

2025-11-21 16:32:03

416

星火大模型登录页_科大讯飞AI开放平台官网科大讯飞星火大模型官网为https://www.xfyun.cn/，提供AI开放平台登录入口，集成多模态交互、智能文档处理与个性化智能体构建功能，支持图像理解、虚拟人视频生成、PPT自动生成及36000+公开智能体应用。

2025-11-21 16:28:59

770

仰望汽车登陆广州车展：U9 X、U8L鼎世版、U7齐亮相 11月21日，2025广州车展盛大启幕，仰望汽车携旗下三款重磅车型亮相——全球限量超跑U9Xtreme、全尺寸豪华行政SUV仰望U8L鼎世版以及旗舰级超级四电轿车仰望U7，引发广泛关注。仰望U7本次车展上，仰望U7首次发布全新外观配色——星河蓝，同时新增旭光橙内饰选项，并配备20英寸饼状锻造铝合金轮毂。据品牌方介绍，星河蓝的灵感源自夜空中最清澈的星光，将浩瀚宇宙的深邃之美凝练于车身漆面，光影交错间营造出沉浸式的驾控氛围。在配色选择方面，仰望U7提供星河蓝、月曜银、阿盖尔紫、曜石黑和萤石白五种车身

2025-11-21 16:25:00

776

豆包AI写作官网入口2026 豆包AI内容助手直达链接豆包AI写作官网入口为https://www.doubao.com/，该平台提供“帮我写作”板块、AI文档问答、多语言翻译等功能，支持网页版、App及电脑客户端使用，用户可通过抖音账号登录并创建个性化AI智能体，享受跨端同步的智能写作体验。

2025-11-21 16:19:02

443

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Node.js 教程

49429次学习
收藏
CSS3 教程

30120次学习
收藏
Rust 教程

28066次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部