Anthropic于2025年2月25日深夜正式推出革命性AI模型——Claude 3.7 Sonnet。在官方博文中,Anthropic称,Claude 3.7 Sonnet是Anthropic迄今为止最智能的模型,也是市场上首个混合推理模型。

02191457-2025-03-02T11:14:57.png

作为该系列首款混合推理模型,其突破性架构实现了"即时响应"与"可扩展深度思考"的有机统一。在亚马逊的战略支持下,这款全新AI不仅以两倍于前代旗舰模型Claude 3 Opus的运算速度著称,更在编码领域展现出碾压级优势:在SWE-bench专业测试中,其验证准确率从旧版的33.4%跃升至49%,成功解决64%的复杂编程问题,全面超越GPT-4o、Gemini-1.5 Pro等主流竞品。

该模型的混合推理模式开创性地融合了两种认知维度:当用户启用"扩展思考"模式时,系统可自动生成完整的思维链。例如在解决蒙提霍尔博弈论难题时,模型不仅能在52秒内得出准确结论,还会详细展示概率计算、逻辑推导的全过程。这种动态认知切换能力,使其既能满足实时交互需求,又可胜任需要多步推理的复杂任务。

在技术实现层面,Claude 3.7 Sonnet引入了突破性的"计算机应用"功能。通过API接口,开发者可指令模型像人类一样操作计算机:包括屏幕识别、光标控制、按钮点击、文本输入等完整交互流程。Anthropic团队演示了该模型自动完成网站开发的全过程——从Chrome浏览器导航、文件修改、服务器启动到终端错误修复均自主完成,展现了接近人类开发者的工作流处理能力。