微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 科技周边 > 人工智能 > 正文

817样本激发7倍推理性能：上交大「少即是多」定律挑战RL Scaling范式

花韻仙語

发布： 2025-02-07 12:40:21

原创

513人浏览过

上海交大最新研究颠覆传统认知：只需817个样本，ai数学推理能力即可超越众多顶尖模型！这项名为limo（less is more for reasoning）的研究成果，挑战了“更大即更强”的行业共识，证明了高质量小样本数据在激发大模型推理能力方面的巨大潜力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

论文标题：LIMO: Less is More for Reasoning
论文地址：https://www.php.cn/link/9d223e2d11d76ac6197ba7f4018bf006
代码地址：https://www.php.cn/link/5eabe0860bc644bc655dcb4c69f5a3c2
数据集地址：https://www.php.cn/link/2e6167426b4b6a4c272e01676d5df893
模型地址：https://www.php.cn/link/b20ab15a36e8643d52041a1cbce997e5

一、挑战规模竞赛：激活模型潜能

在AI数学推理领域，普遍认为需要海量数据和复杂的强化学习才能取得突破。然而，LIMO研究指出，大模型的数学能力可能早已存在，关键在于如何有效“唤醒”它。这项研究仅用817个精心设计的样本，通过简单的监督微调，就使模型在数学竞赛级别的题目上超越了众多使用十万级数据训练的先进模型，例如o1-preview和QwQ。

二、少即是多：从对齐到推理的范式转变

LIMO延续了此前LIMA（Less Is More for Alignment）的研究理念，即在特定任务中，少量高质量数据即可取得显著效果。但将此应用于数学推理领域面临更大挑战。LIMO的成功，归功于两个关键因素：

知识基础革命: 现代LLM在预训练阶段已掌握海量数学知识。
推理计算革命: 长推理链与模型推理能力密切相关。

LIMO假设：在知识基础足够完善的前提下，少量高质量样本，通过推理链即可激活模型的潜在推理能力。

三、LIMO与强化学习扩展的对比

传统强化学习扩展方法（如OpenAI的o1系列和DeepSeek-R1）依赖海量数据和复杂算法，将推理能力提升视为一个“搜索”过程。而LIMO则专注于“激活”模型已具备的能力，强调方向的重要性，将强化学习视为寻找最优推理轨迹的一种手段。

四、实验结果：显著超越传统方法

豆绘AI

豆绘AI

豆绘AI是国内领先的AI绘图与设计平台，支持照片、设计、绘画的一键生成。

豆绘AI

485

豆绘AI

LIMO在多个基准测试中均取得了显著优于其他模型的结果，例如在AIME24测试中准确率高达57.1%，远超其他模型。这证明了高质量小样本数据的巨大潜力。

五、数据的三重密码：推理链质量、问题难度、预训练知识

LIMO数据集的成功，在于这三个关键因素：高质量推理链、更具挑战性的问题和高质量预训练知识。

六、案例与定量分析：LIMO的卓越表现

具体的案例分析和定量数据进一步证明了LIMO的卓越推理能力和自我反思能力。

七、未来展望：少即是多的无限可能

LIMO的研究为未来研究指明了方向，包括领域泛化、理论基础研究、自动化评估、多模态集成、实际应用和认知科学的结合等。 LIMO的成功，标志着人工智能推理能力觉醒的新篇章。

以上就是817样本激发7倍推理性能：上交大「少即是多」定律挑战RL Scaling范式的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git ai deepseek less for github 算法人工智能 nlp https 自动化

大家都在看：

即梦4.0如何使用AI头像生成_即梦4.0生成个性化头像的步骤与技巧抖音AI最新官方网址入口_抖音AI在线使用官网主页直达哩布哩布AI怎么保存生成图片_哩布哩布AI作品导出高清图完整教程 AI志愿助手怎么使用NFC线下签到_AI志愿助手NFC刷卡签到完整教程 DEEPSEEK官网下载网页版_DEEPSEEK网页版官方版本入口

数码产品性能查询

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

来源：php中文网

上一篇：【收购】燕麦科技收购AxisTec公司67%股权；菱电电控拟发行股份收购奥易克斯98.426%股份；FormFactor第四季度营收1.895亿美元下一篇：德方纳米：动力型高压密新产品已批量出货，超高压密新产品验证进展顺利

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

Mac截图全攻略：快捷键一览

2025-11-19 12:30:02
Tkinter Menubutton与Menu正确关联指南

2025-11-19 12:34:26
解决IIS URL重写规则导致静态资源加载失败的问题

2025-11-19 12:42:36
《CEDEC 2026》7月22日举行日本最大游戏开发者大会

2025-11-19 12:45:02
NumPy reshape 深度解析：方法与函数的差异与应用

2025-11-19 12:47:00
在Gravis可视化NetworkX图时为节点添加交互式工具提示

2025-11-19 12:50:02
解决Symfony本地应用连接Docker容器数据库的指南

2025-11-19 12:50:21
利用Flask和Jinja2在表单提交后显示成功或错误消息

2025-11-19 12:51:34
PHP API开发中JSON响应前的HTML输出问题解析与解决方案

2025-11-19 12:56:02
使用Python高效识别和处理CSV文件中的列数不一致及编码问题

2025-11-19 12:56:57

最新问题

华为乾崑发布“境”系列新品牌以生态推动智能出行新境界 11月20日，主题为“乾崑生态共赴热爱”的2025华为乾崑生态大会在广州盛大召开。值得关注的是，本次大会首次揭晓了两个全新智能汽车品牌：由广汽与华为乾崑联手打造的高端新能源品牌“启境”，以及东风与华为合作推出的“奕境”。这两个品牌共同组成了全新的“境”系列，标志着华为乾崑在汽车智能化领域的合作布局迈上新台阶。对于此次品牌发布，华为智能汽车解决方案BUCEO靳玉志强调：“我们将从产品定义、研发到上市后的服务全流程深度参与，全面赋能合作伙伴。”广汽集团董事长冯兴亚也透露，启境品牌的首款车型预计于20

2025-11-21 12:10:02

867

早报：华为乾崑推出两大全新汽车品牌魅族回应出售总部【小编科技早报】近日，华为乾崑携手广汽集团推出全新高端智能新能源汽车品牌“启境”；小鹏汽车发布X9超级增程MPV，刷新全球大七座车型续航纪录；有消息称珠海唐家湾一处办公园区挂牌出售，疑似魅族总部，官方已回应；网易公布2024年第三季度财报，净收入达284亿元，同比增长8.2%。华为靳玉志：乾崑有境界，“境”系列双品牌开启智能化新篇章11月20日，以“乾崑生态共赴热爱”为主题的“2025华为乾崑生态大会”在广州正式举行。会上，华为乾崑全面展示了其在技术、商业与产业生态领域的最新成果。备受关注的是，

2025-11-21 12:03:02

872

松鼠ai官网教育平台入口_松鼠ai官方网站网址在线访问松鼠AI官网教育平台入口地址是http://www.squirrel.com/，该平台提供个性化学习路径规划、智能化内容推荐及实时学习反馈，助力学生高效学习。

2025-11-21 11:56:02

455

SAM 3— Meta开源的视觉分割模型 SAM3是什么SAM3（SegmentAnythingModel3）是MetaAI推出的最新一代计算机视觉模型，具备通过文本指令、示例输入以及视觉提示对图像和视频中的对象进行精准检测、分割与持续跟踪的能力。该模型支持开放词汇的自然语言输入，融合多模态信息实现智能交互，并可在运行过程中实时调整和优化分割结果。在性能方面，SAM3在图像与视频分割任务中表现远超前代系统，效率提升达两倍以上，同时支持零样本迁移学习。此外，其能力已拓展至3D重建领域，广泛服务于虚拟家居预览、创意视频编辑及科

2025-11-21 11:29:49

809

贾跃亭宣布FF控股公司更名AIxCrypto 启动双轮驱动战略 11月21日，FaradayFuture（FF）创始人贾跃亭在社交平台发布消息，宣布其控股公司已正式更名为AIxCrypto，并成功登陆纳斯达克。这一动作意味着FFAI与AIXC“双飞轮、双桥梁、双上市”战略架构全面实现，企业正式进入EAI与Crypto双向驱动的新纪元。贾跃亭表示，该体系致力于将Web3的颠覆性价值引入Web2生态，同时为Web3注入来自Web2的场外增量资源。据官方信息显示，AIxCrypto将启动“三驾马车”全新发展战略。其中，第二板块将聚焦现实世界资产代币化（RWA），首

2025-11-21 11:25:42

427

DEEPSEEK网页版怎么下载_DEEPSEEK网页版安装步骤说明 DEEPSEEK网页版无需安装，通过浏览器访问即可使用。首先在Safari或Chrome中打开https://www.deepseek.com并注册登录；随后可点击分享按钮将页面添加到主屏幕以快速启动；最后在设置中开启“允许离线访问”并确保浏览器授权存储权限，实现高效便捷的使用体验。

2025-11-21 10:53:02

396

即梦怎么复制别人的优秀提示词_即梦优秀提示词复制方法可直接复制他人优秀提示词用于即梦AI创作。通过灵感社区搜索高赞作品，长按提示词文本复制；或导入他人分享的生成记录文件，提取“prompt”字段内容；若提示词为图片形式，可用OCR技术识别截图中的文字，整理后粘贴使用，注意替换变量占位符并检查语法完整性。

2025-11-21 10:36:06

300

磷酸铁锂行业设成本红线协会推成本指数遏制低价内卷 11月20日，行业消息显示，面对磷酸铁锂产业长期处于全面亏损、价格战愈演愈烈的困境，中国化学与物理电源行业协会即将出台《关于参考磷酸铁锂成本指数及规范行业发展的通知》，正式提出设立“成本红线”机制，旨在引导企业合理报价，遏制恶性竞争和行业内部无序内卷。根据该《通知》建议，各企业应以协会于11月18日首次公布的特定型号磷酸铁锂材料行业平均成本区间——剔除碳酸锂原材料成本及税费因素后为15714.8元/吨——作为定价的重要参考依据，严禁以低于该成本底线的价格进行倾销。此举意在应对近年来因产能严重过剩

2025-11-21 08:56:02

342

秘塔AI写作入口app 秘塔AI免费写作入口app登录链接秘塔AI写作入口app可通过官网https://writer.metaso.cn/访问，支持实时校对、句子改写、中英文翻译、术语库管理等功能，提供多场景写作模板与智能续写，实现跨设备同步及文档批量处理，提升写作效率。

2025-11-21 07:21:11

513

kimi ai官方网址链接入口_kimi ai在线体验官网主页直达 KimiAI官方网址为https://kimi.moonshot.cn，由Moonshot自研大模型驱动，支持超长文本处理、联网搜索、文件解析及多端使用。

2025-11-21 05:05:16

992

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Node.js 教程

49294次学习
收藏
CSS3 教程

30064次学习
收藏
Rust 教程

27994次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部