salesforce 推出了全新的开源深度研究智能体:sfr-deepresearch(简称 sfr-dr)。该模型基于 openai 开源的小型权重模型,采用强化学习技术进行训练,具备自主推理、网络搜索与代码执行能力,能够独立完成复杂的深度研究任务。
在仅使用网页搜索、浏览器环境和 Python 解释器的情况下,SFR-DR-20B 在纯文本版本的 Humanity's Last Exam 基准测试中达到了 28.7% 的得分,展现出强大的自主研究潜力。

SFR-DR 的核心亮点包括:
核心能力:一个通过强化学习(RL)训练而成的全自主研究代理,可自行完成问题分析、信息检索、逻辑推理与代码编写,实现端到端的研究闭环。
性能表现:
训练方法:
高度自主:无需人为设计多代理协作流程,能自主制定研究计划、推导假设、生成解决方案并执行具体操作
论文链接:https://www.php.cn/link/55f16320eb523947f12d2e94d9630c6e
以上就是Salesforce 开源深度研究 Agent:SFR-DeepResearch (SFR-DR)的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号