deepseek 在 2024 年 11 月 20 日推出了支持深度思考的新模型 deepseek-r1-lite 预览版,现已在其官方网站上线[1]。这是首个类似于 open ai o1 深度思考模型的产品,领先于 claude、qwen 和 gemini 等其他模型。具体的性能评测数据可以在 deepseek 的官方博文中找到。
许多同学已经体验或了解了 DeepSeek 的深度思考能力。本文的目的不是展示其能力,而是探究 DeepSeek 背后的思考逻辑,并尝试编写 Prompt 让 DeepSeek 自己推导出思考过程,可以说是“以魔法对抗魔法”。文末将提供一个推导出的通用 Prompt。

我们测试了两个经典问题:“9.9 和 9.11 哪个大”和“Strawberry 有几个 r”。
9.9 和 9.11 哪个大


Strawberry 有几个 r

我们编写如下提示词,并复制第一步的思考过程,让 DeepSeek 进行深度思考并推导出可能的通用提示词。
DeepSeek 的深度思考过程如下:

最终得出的提示词是:
我们关闭深度思考,并使用刚才获得的提示词,当然这个提示词需要稍作修改才能使用。
问题 1:Strawberry 有几个 r

回答如下,这是没有启用深度思考而得出的回答,可以看到他回答正确了,比深度思考还好用。

问题 2: 9.9 和 9.11 哪个大?
我们直接贴回答,推理步骤清晰,也同样获得了正确的答案。

这个提示词非常好用,对于某些问题,使用这样的提示词效果甚至比深度思考更好,而且不会因为深度思考而等待过多的时间。
[1] 官方网站: https://www.php.cn/link/6226c5b0f6a9b68f3dee542ab5c34545
以上就是最像o1新模型:探索 DeepSeek-R1-Lite 的思维逻辑与 Prompt 构建的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号