LongCat-Flash-Thinking— 美团推出的大型推理模型-人工智能-PHP中文网

LongCat-Flash-Thinking— 美团推出的大型推理模型

聖光之護

发布： 2025-09-23 13:47:33

原创

828人浏览过

longcat-flash-thinking 是美团 longcat 团队研发的一款具备 5600 亿参数的大型推理模型，采用专家混合（moe）架构设计，能够根据任务需求动态激活 186 亿至 313 亿参数，实现性能与效率的最优平衡。该模型经过长思维链冷启动训练和大规模强化学习两个阶段的精心打磨，在形式化推理、智能体行为决策等方面展现出卓越能力，尤其在数学推导、逻辑分析、编程解题等复杂任务中表现突出，广泛服务于科研探索、软件工程、企业智能决策等多个领域，助力人工智能技术走向更广泛的普及应用。

百川大模型

百川智能公司推出的一系列大型语言模型产品

查看详情

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

LongCat-Flash-Thinking的核心功能

复杂问题推理：擅长解决高难度的数学问题（如奥数题目）、逻辑推理挑战以及程序代码生成与验证，支持自动定理证明等高级任务。
智能工具调用：可自主识别任务需求并调用外部工具完成多步骤操作，例如执行计算、查询数据库或运行特定API，提升解决问题的灵活性与效率。
通用对话交互：具备强大的自然语言理解与表达能力，能进行跨领域的知识问答、信息检索与连续对话，适用于客服、咨询等多种场景。
形式化逻辑处理：在数学、物理等需要严格逻辑推演的领域中，能够准确解析和生成形式化语言，支持精确的逻辑验证与理论推导。

LongCat-Flash-Thinking的技术架构

MoE 混合专家系统：整体模型包含 5600 亿参数，通过稀疏激活机制按需调动 186 亿到 313 亿参数参与运算，兼顾高性能与低资源消耗。
双阶段训练策略：
- 第一阶段：长思维链冷启动——利用课程学习方法结合富含推理结构的数据进行监督微调（SFT），构建模型的基础推理链条。
- 第二阶段：大规模异步强化学习——基于 DORA 系统实施领域并行训练，将不同任务领域的优化过程分离后再融合，显著增强泛化能力和深层推理水平。
DORA 强化学习平台：作为底层训练支撑系统，采用流式数据处理、多版本模型管理和弹性共置技术，可在数万个加速器上稳定高效地运行异步训练任务。