微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 硬件教程 > 硬件测评 > 正文

ChatGPT 架构师，刚发布了最新研究成果

聖光之護

发布： 2025-10-02 10:44:01

原创

435人浏览过

chatgpt 架构师，刚发布了最新研究成果

距第二篇研究仅过去三天，Thinking Machines 再度发布第三篇技术博客。

本研究由 OpenAI 联合创始人之一 John Schulman 担纲核心作者，公司创始人、前 OpenAI CTO Mira Murati 也第一时间转发支持。

ChatGPT 架构师，刚发布了最新研究成果

新研究聚焦 LoRA 参数高效微调方法，题为《LoRA Without Regret》，深入探讨了 LoRA 在何种条件下可匹敌全量微调（FullFT）的性能，并提出了一套显著降低调参复杂度的简化方案。

当前主流大模型参数规模动辄上万亿，预训练数据高达数十万亿 token，但实际应用中，下游任务通常数据量小、领域特定。

若采用 FullFT 更新全部参数，计算资源消耗巨大，极不经济。

作为参数高效微调（PEFT）的核心技术，LoRA 通过引入低秩矩阵 A 和 B（参数量远少于原始权重）来捕捉微调增量，但长期存在争议：其性能是否真能追平 FullFT？

John Schulman 与 Thinking Machines 团队给出了明确答案：只要把握关键细节，LoRA 不仅能达到与 FullFT 相同的样本效率，最终性能也完全一致。

以下是三大核心发现：

LoRA 最优学习率约为 FullFT 的 10 倍

研究团队通过系统性实验总结出三点结论：

在中小规模数据集上，LoRA 性能与 FullFT 相当；

LoRA 应用于所有层效果最佳，而非仅注意力层；

LoRA 的最优学习率稳定在 FullFT 的 10 倍左右。

首先，在中小数据集场景下，LoRA 完全可与 FullFT 正面抗衡。

团队使用 Llama 3、Qwen3 等模型，在指令跟随导向的 Tulu3 数据集和推理密集型的 OpenThoughts3 数据集上进行测试。

结果显示，高秩 LoRA（如秩 512）的学习曲线与 FullFT 几乎完全重合，损失值随训练步数呈对数线性下降；

仅当数据集规模远超 LoRA 容量时，其效率才略有下降，而此类情况在常规后训练中极为罕见。

ChatGPT 架构师，刚发布了最新研究成果

更值得注意的是，在 MATH、GSM 等数学推理类强化学习任务中，即便将 LoRA 秩降至 1，其表现仍与 FullFT 持平。

ChatGPT 架构师，刚发布了最新研究成果

其背后原因在于强化学习的信息特性：每轮训练仅需通过 scalar 优势函数获取 O(1) 比特信息，而秩 1 LoRA 的参数容量已绰绰有余，甚至存在冗余。

ChatGPT 架构师，刚发布了最新研究成果

其次，在 LoRA 层的选择上，全层覆盖优于局部应用，打破“仅注意力层有效”的传统认知。

以往许多实践倾向于只在注意力模块部署 LoRA，但本次实验结果颠覆了这一做法。

仅作用于注意力层的 LoRA 表现明显落后，即便提升其秩（如秩 256）以匹配 MLP 层 LoRA（秩 128）的参数量，性能差距依然显著；

ChatGPT 架构师，刚发布了最新研究成果

而当 LoRA 覆盖所有层，尤其是参数占比最高的 MLP 层与 MoE 层时，性能大幅提升。甚至单独在 MLP 层应用 LoRA，效果已接近“MLP + 注意力”双层配置。

ChatGPT 架构师，刚发布了最新研究成果

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

ChatGPT

211

ChatGPT

根本逻辑在于：模型梯度主要由参数量大的层主导，只有实现全层覆盖，LoRA 的优化动态才能逼近 FullFT，从而释放全部潜力。

最后，针对 LoRA 超参数调试困难的问题，研究团队提出了大幅简化的调参策略。

许多用户因调参复杂而却步，但研究发现，LoRA 的最优学习率存在清晰规律——约为 FullFT 的 10 倍。（目前为实验观察，理论解释仍在完善中）

该比例在 14 个不同模型于 Tulu3 数据集上的测试中高度稳定。

ChatGPT 架构师，刚发布了最新研究成果

同时，得益于 1/r 缩放因子的作用，不同秩下的最优学习率差异极小。在秩 4 至 512 范围内，变化不足 2 倍；在短期任务中，秩的影响几乎可忽略。

ChatGPT 架构师，刚发布了最新研究成果

更具实用价值的是，LoRA 的 4 个潜在超参数中，有 2 个为冗余项。实际调参只需关注“初始更新规模”与“A 矩阵偏离初始状态的步数”两个维度。

此举直接将调参工作量减少一半。

ChatGPT 架构师，刚发布了最新研究成果

John Schulman：从 OpenAI 到 Thinking Machines

本研究由 OpenAI 联创、曾短暂加入 Anthropic 后迅速转投 Thinking Machines 的 John Schulman 主导。

他博士毕业于加州大学伯克利分校，师从强化学习泰斗 Pieter Abbeel。

在 OpenAI 任职九年期间，他主导了 GPT-3.5、GPT-4 到 GPT-4o 的对齐与后训练工作，被业界誉为“ChatGPT 架构师”。

Google Scholar 显示，其论文引用近 14 万次。

其中最具影响力的是《Proximal policy optimization algorithms》，PPO 算法已成为 RLHF 中强化学习的核心组件。

ChatGPT 架构师，刚发布了最新研究成果

离开 OpenAI 时，Schulman 表示希望回归核心技术研发。这一愿景促使他加入 Thinking Machines，现以首席科学家身份开启新篇章。

参考链接：

[ 1 ] https://www.php.cn/link/991a05e06918a7f3d363117f9692e9c9

[ 2 ] https://www.php.cn/link/6fc838626a3f3a11ad0c84dd302d6a8a

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

年度科技风向标「2025 人工智能年度榜单」评选报名开启啦！我们正在寻找 AI+ 时代领航者点击了解详情

企业、产品、人物 3 大维度，共设立了 5 类奖项，欢迎企业报名参与

一键关注点亮星标

科技前沿进展每日见

以上就是ChatGPT 架构师，刚发布了最新研究成果的详细内容，更多请关注php中文网其它相关文章！

相关标签：

人工智能 chatgpt go mac ai openai gpt gpt-4 架构 math Token 算法人工智能 chatgpt https gpt llama

大家都在看：

苹果iPad Pro M4全面评测：超薄机身下的性能表现飞傲KA13小尾巴推力实测：能否驱动250欧姆大耳达到正常声压？大疆无人机怎么用智能跟随_大疆无人机智能跟随功能使用与效果展示苹果AirPods Pro 3代传闻汇总：健康监测功能值得期待吗？利民TL-C12Pro风扇对比：300元级风冷能否打赢240水冷？

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：红魔 11 Pro 系列 10 月 17 日发布！配第五代骁龙 8 至尊版下一篇：柒开得胜！iGame 柒小希首发纪念版硬件套装正式开售

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

PHP中不使用eval()安全计算数学表达式：基于调度场算法的实现

2025-11-16 12:33:02
Scrapy CSS选择器失效：理解Scrapy如何处理网页及验证响应内容

2025-11-16 12:38:02
Pandas pivot_table 高级技巧：优化列名与时间序列排序

2025-11-16 12:46:33
Go Struct嵌入与mgo持久化：实现BSON文档的扁平化存储

2025-11-16 12:46:45
React 中限制字符串显示的字数：截断过长文本并添加省略号

2025-11-16 12:52:36
Google Domains 域名列表程序化获取：API 现状与限制

2025-11-16 12:57:23
解决 Laravel 与 Mollie Webhook 集成失效问题

2025-11-16 12:57:32
Matplotlib Y轴标签字体大小调整实用指南

2025-11-16 12:57:46
Java中处理并展示多个重复元素的优化方法

2025-11-16 13:01:00
解决React中Fetch API的CORS授权头部问题

2025-11-16 13:02:18

最新问题

雷神ML903星闪鼠标上手体验：国产技术的新突破雷神ML903星闪鼠标搭载国产星闪SLE1.0技术，具备强抗干扰能力与约1毫秒低延迟，实测在复杂电磁环境下稳定性优于传统2.4G；支持三模切换，适配电竞、办公与多设备场景；采用68克轻量化设计，搭配右手人体工学造型与防滑纹理，握感舒适；配备原相PAW3395传感器，支持26000DPI与8000万次微动，性能扎实；内置300mAh电池，续航超70小时，Type-C接口充电便捷，综合表现突出。

2025-11-17 01:39:17

893

键盘无线延迟测试？罗技G913 TKL竞技模式实测无线键盘打游戏有无延迟？罗技G913TKL在开启LIGHTSPEED无线技术竞技模式下，响应速度约1毫秒，实际表现与有线键盘几乎无异，满足高强度电竞需求。其采用专属无线协议而非蓝牙，通过独立频段USB接收器通信，抗干扰强、信号稳定，有效解决按键触发延迟和断连问题。实测在FPS和MOBA游戏中快速操作无拖沓，职业战队亦广泛使用，只要接收器正确插入原生USB口，避免遮挡，即可保障稳定连接，真正实现“无延迟”体验。

2025-11-16 21:43:02

439

大疆无人机怎么起飞_大疆无人机安全起飞操作流程与注意事项首先检查设备与环境，确认螺旋桨完好、电量充足、场地安全且非禁飞区；然后先开遥控器再启动飞行器，完成系统自检并展开机臂；接着在App中设置返航高度、飞行限制并开启新手模式；最后通过“GOFLY”自动起飞或手动解锁后缓慢推杆升空，确保图传稳定且返航点刷新后开始飞行。

2025-11-16 21:38:54

448

大疆无人机怎么连接手机_大疆无人机连接手机步骤与常见问题解决首先检查连接方式是否正确，通过有线或无线Wi-Fi直连将手机与遥控器连接，确保使用原装数据线或OTG转接头；其次开启手机蓝牙和Wi-Fi，连接DJI开头的网络并输入默认密码“12341234”；然后启动遥控器和无人机，打开DJIFly应用完成配对；若无法连接，需更新DJIFly至最新版本，重置遥控器网络设置，或更换兼容的数据线重新尝试。

2025-11-16 21:33:27

435

山灵M1S播放器续航揭秘：DSD512连续播放坚持不到4小时？山灵M1S续航因使用场景而异，官方标称PCM32Bit/384kHz下单端口约14.5小时，平衡口约10.5小时，日常使用可满足全天需求；播放DSD512时功耗增加，极端情况下续航可能不足4小时，但非常态；支持快充，30分钟可充至6小时电量，充满约需两小时，有效缓解电量焦虑。

2025-11-16 21:22:02

414

小米手环9 Pro健康监测验证：心率血氧检测准确度对比医疗设备小米手环9Pro健康监测准确度高，心率数据与医疗设备对比误差在±2bpm以内，血氧检测误差±1%至±2%，联合北医三院研发睡眠呼吸暂停监测功能，具备临床级精度和疾病风险预警能力。

2025-11-16 21:18:58

494

摄像机无法开机怎么办_摄像机无法开机解决方法及常见故障排查首先检查电源适配器是否匹配并稳定供电，确认无问题后排查线缆连接是否牢固，接着验证电池状态，排除存储卡及外部设备干扰，最后通过断电重启或恢复出厂设置解决系统故障。

2025-11-16 21:15:24

832

大疆Matrice 350 RTK实战测试：行业级无人机的实力大疆Matrice350RTK是专为电力、测绘、应急等专业领域设计的高效空中作业平台，具备55分钟超长续航与TB65双电池热替换能力，支持多架次连续作业；O3图传行业版实现三路1080p高清画面回传，并融合4G网络保障复杂环境下的稳定链路；六向避障系统结合IP55防护等级和-20℃至50℃工作温度，支持全天候、高海拔稳定飞行，是一款可靠高效的生产力工具。

2025-11-16 21:09:15

526

苹果妙控键盘双面夹评测：iPad Pro悬浮角度打字稳定性存疑妙控键盘在桌面使用时稳固可靠，双铰链与植绒底设计确保iPadPro稳定，键程1毫米手感接近MacBook；但置于腿上时因重心高易晃动，需辅助支撑改善平衡；充电通过背部触点传输稳定，触控板反馈清脆但缺ESC键，整体体验分场景而定。

2025-11-16 21:07:21

682

千元价位搅局者？Redmi Note 12 Turbo性能续航双测试 RedmiNote12Turbo搭载骁龙7+Gen2处理器，辅以自研调校技术，性能释放强劲，实测《王者荣耀》120帧模式平均帧率达119.7fps，《原神》高画质下接近60fps，温控表现优秀；配备5000mAh电池与67W快充，5小时重度使用后剩余18%电量，3小时综合使用剩余66%，续航媲美旗舰机型；搭配LPDDR5内存、UFS3.1闪存、120HzOLED柔性直屏及SGS低蓝光认证，兼顾流畅体验与护眼需求，机身轻薄且握感舒适，是一款性能、续航与细节体验均衡的高性价比中端机型。

2025-11-16 21:06:05

125

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Python+人工智能全栈工程师(Linux基础篇)

314958次学习
收藏
Vue3.x 工具篇--十天技能课堂

12020次学习
收藏
快速使用API文档与智能Mock

855次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部