
火山引擎正式推出豆包大模型 1.6-vision,作为豆包系列首款具备工具调用功能的视觉深度思考模型,该版本在多模态理解与推理能力方面实现显著提升,并全面支持Responses API。
据悉,这一新模型通过独特的工具调用机制,将图像处理深度整合至其思维链中,能够执行包括图像定位、裁剪、点选、划线、缩放、旋转等精细化操作。同时,模型模拟人类“由整体观察到局部聚焦”的视觉认知过程,在增强推理透明度和可解释性的同时,大幅提升图像分析与处理的准确性和效率。

此外,对Responses API的支持使模型能自主决策并调用相应工具,大幅降低Agent开发中的编码复杂度,显著提升应用构建效率。相较于前代视觉模型Doubao-1.5-thinking-vision-pro,豆包大模型 1.6-vision 在综合使用成本上降低了约50%,为开发者提供更高效、经济的多模态解决方案。
立即进入“豆包AI人工智官网入口”;
立即学习“豆包AI人工智能在线问答入口”;
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号