首页 > AI头条  > 正文

Claude4来袭!Anthropic推出"业界最强"AI模型,编程能力全面超越竞争对手

2025-05-23 08:50 · 来源: AIbase基地

在首届开发者大会上,Anthropic推出了两款声称"业界最强"的AI模型,加剧了与OpenAI和谷歌的竞争

Anthropic在周四举行的首届开发者大会上正式发布Claude4模型系列,包括Claude Opus4和Claude Sonnet4两款新模型。该公司声称这些模型在多项流行基准测试中达到业界领先水平,专门针对编程任务进行了优化。

Claude2,Anthropic,人工智能,聊天机器人 
 克劳德

产品特性与定价策略

新发布的Claude4系列具备分析大型数据集、执行长期任务和处理复杂操作的能力。两款模型均在编程任务中表现优异,特别适合代码编写和编辑工作。

在用户访问方面,Sonnet4面向所有用户开放,包括免费和付费用户,而功能更强大的Opus4仅限付费用户使用。API定价方面,Opus4收费为每百万代币15美元(输入)/75美元(输出),Sonnet4为3美元(输入)/15美元(输出)。作为参考,一百万代币约相当于75万个单词,超过《战争与和平》的篇幅。

QQ20250523-084844.png

性能表现与技术创新

根据Anthropic内部测试,Opus4在编程能力评估SWE-bench Verified测试中超越了谷歌Gemini2.5Pro以及OpenAI的o3和GPT-4.1。不过,在多模态评估MMMU和博士级别科学问题测试GPQA Diamond中,该模型仍未能超越OpenAI的o3。

两款模型均采用"混合"架构,既能快速响应,又能进行深度推理。启用推理模式后,模型会在回答前花更多时间思考解决方案,并展示"用户友好型"思维过程摘要。模型还支持并行使用多种工具,能够提取事实并保存至"记忆"中,逐步构建隐性知识库。

开发工具升级

配合新模型发布,Anthropic对Claude Code编程工具进行了重大升级。新版本已与主流IDE集成,并提供SDK支持,允许开发者将其连接至第三方应用程序。该公司还发布了适用于VS Code、JetBrains和GitHub的扩展程序和连接器。

QQ20250523-084852.png

商业野心与市场竞争

此次发布正值Anthropic寻求大幅提升收入之际。据报道,这家由前OpenAI研究人员创立的公司目标在2027年实现120亿美元收益,相比今年预计的22亿美元大幅增长。公司最近完成25亿美元信贷安排,并从亚马逊等投资者处筹集数十亿美元资金。

面对OpenAI和谷歌等竞争对手不断推出强大模型和开发工具的挑战,Anthropic承诺将转向更频繁的模型更新策略,以保持竞争优势。

安全考量

值得注意的是,Anthropic对Opus4实施了更严格的安全措施,包括强化有害内容检测器和网络安全防御。公司内部测试发现,该模型可能"大幅提升"具有STEM背景人士获取生产或部署危险武器的能力,达到了Anthropic的"ASL-3"安全规范级别。

尽管AI模型在代码生成方面仍存在安全漏洞和错误等问题,但其提高编码效率的潜力促使企业和开发者快速采用这些技术。随着AI竞赛的不断升级,Anthropic能否凭借Claude4系列在激烈的市场竞争中占据一席之地,值得持续关注。

  • 相关推荐

今日大家都在搜的词: