Anthropic周一推出了一款新的混合推理模型和编码代理。据这家独立的生成式AI供应商称,最新的Claude 3.7 Sonnet能够在“即时”模式和“逐步思考”模式之间切换,以不同方式生成响应。
该模型适用于所有Claude订阅计划,并可通过Anthropic API、Amazon Bedrock和Google Cloud Vertex AI访问。
Anthropic表示,与其他推理模型相比,Claude 3.7 Sonnet既是一个标准的大型语言模型(LLM),可执行文本摘要等常规任务,又具备推理能力。用户可以选择模型的响应方式。
在标准模式下(即普通LLM模式),它是上一代3.5 Sonnet的升级版本。而在“扩展思维”模式下,Claude 3.7 Sonnet具备自我反思能力,能够在数学、物理、编码等任务中表现更佳。API用户还可以控制模型的推理时间,并根据需要支付最多128K令牌的计算成本。该模型特别适用于商业应用,如编程任务。
Claude Code:Anthropic的新编码代理
Anthropic还推出了一款新的编码代理——Claude Code。该公司表示,Claude Code能够快速完成通常需要45分钟或更长时间的任务。虽然该代理仍处于早期迭代阶段,但Anthropic计划在未来几周内进行优化。
Claude 3.7 Sonnet和Claude Code的发布,反映了当前生成式AI市场的两大趋势:推理模型和智能代理(Agent)。
推理模型的发展趋势
近年来,推理模型备受关注,特别是在中国初创公司DeepSeek发布其R1模型之后。在此之前,OpenAI和Google也相继推出了推理模型。美国信息技术研究和顾问公司Gartner的分析师Arun Chandrasekaran认为:
“市场正朝着构建更强大的推理模型方向发展,这一趋势并不令人意外。到2025年,我们将看到更多类似的产品。”
Anthropic采用的AI推理方法与其他供应商有所不同。大多数AI供应商倾向于将推理能力与标准LLM分开,而Anthropic选择将两者结合。
Forrester Research分析师Rowan Curran认为,这种混合模式具有优势:
“如果你希望模型尽可能通用,它可能无法在特定任务上表现最佳。而混合模型既能推理,又能执行摘要任务。”
此外,Curran还指出,这类模型不仅适用于数学和科学领域,也可以用于企业实际业务应用。他说,“企业开始将这些AI模型用于规划和目标决策,而不仅仅是数学计算。这是一个很有前景的发展方向。”
Agentic AI:智能代理趋势
除了推理能力,Anthropic的Claude Code还顺应了AI代理化(Agentic AI)的潮流。自2024年以来,Agentic AI领域发展迅猛,Salesforce推出了Agentforce,微软推出了Agents,Google也推出了Agentspace等代理平台。
本周一,Salesforce和Google宣布,Salesforce客户可以使用Gemini构建Agentforce代理,并在Google Cloud上部署Salesforce服务。与此同时,AI搜索公司Perplexity也宣布即将推出一款名为Comet的智能搜索浏览器,以推动代理式搜索的发展。
Claude Code的推出,不仅是Anthropic进军AI代理市场的一步棋,也符合其自身的技术优势。“Anthropic在编码相关任务上一直表现出色。”Chandrasekaran表示。“我预计他们会进一步深入这一领域,特别是在自动化软件开发生命周期(SDLC)方面。”
Curran认为,编码代理对于AI生态系统至关重要,特别是在代码生成、执行API调用等小型任务上。他说,“提供这类能力,将成为AI平台的必然选择。”
不过,Chandrasekaran也指出,Anthropic面临的挑战是如何让其AI代理获得市场认可并成功推广。他说,
“我非常期待看看Anthropic如何制定正确的市场战略,使其AI代理取得成功,同时推动其在应用层面的突破。”