首页 > 业界 > 关键词  > Mistral最新资讯  > 正文

1/8成本比肩Claude 3.7,Mistral Medium 3来了

2025-05-08 15:31 · 稿源: 量子位公众号

声明:本文来自于微信公众号 量子位,授权站长之家转载发布。

用1/8成本比肩Claude3.7,刚刚,“欧洲OpenAIMistral AI发布多模态新模型。

MistralMedium3,主打编程和多模态理解,且在性能和成本间进行了平衡。

图片

官方称,在各类基准测试中,Mistral Medium3性能达到或超越Claude Sonnet3.7的90%,且成本大大降低。

Claude3.7Sonnet的价格为每百万输入token3美元,每百万输出token15美元,而Mistral Medium3:

每百万输入token仅0.4美元,每百万输出token2美元。

整体性能,不管是和领先开源模型Llama4Maverick还是和企业级模型Cohere Command A相比,Mistral Medium3都能打得有来有回。

目前,Mistral Medium3API已在Mistral La Plateforme和Amazon Sagemaker上线,不久后还将在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex上推出。

具备一系列企业级能力

下面具体来看看基准测试。

Mistral Medium3在编程和STEM任务中尤为突出。

图片

官方原话是“其性能甚至接近非常大且运行速度慢得多的竞争对手”。

不过呢,既不开放模型权重,也没有透露模型大小……

图片

另外,Mistral AI还发布了第三方人类评估。

人类评估中,Mistral Medium3依旧是在编程方面占优势。

图片

在多模态和其他人语言任务中,相比Llama4Maverick,Mistral Medium3的表现也占上风。

图片

除了测试数据之外,官方还特别强调了其适应企业环境的能力,包括:

  • 混合部署或本地 / 虚拟私有云(VPC)内部署

  • 定制化后期训练

  • 与企业工具和系统集成

企业可以轻松将智能全面集成到系统中,借助Mistral的应用AI解决方案,该模型可以持续进行预训练、全面微调,并融入企业知识库,使其成为针对特定领域训练、持续学习和自适应工作流程的高保真解决方案。

官方称,金融服务、能源和医疗保健领域的客户正在使用该模型测试,通过深入的背景信息来丰富客户服务、实现业务流程的个性化,并对复杂的数据集进行分析。

图片

另外,他们还推出了Le Chat Enterprise,这是一项面向企业的聊天机器人服务,提供了AI Agent建造器之类的工具,并将Mistral的模型与Gmail、Google Drive、SharePoint等第三方服务集成。

据了解,Le Chat Enterprise将很快支持 MCP。

Mistral Medium3发布后引发大批网友关注,有网友为其“高性价比”点赞。

图片

不过也有不少网友吐槽模型没说开源结果又高调地和开源模型比较,有点奇怪。

图片

还有行动派网友,想看什么自己比较。

StabilityAI创始人翻出了Gemini2.5Flash的基准测试结果:

图片

看后表示:

与Gemini2.5Flash竞争是多么困难,Gemini2.5Flash成本比Mistral Medium3低70%。

期待开源模型的发布,这是Mistral的关键优势。

图片

One More Thing

继三月份推出Mistral Small、今日推出Mistral Medium后,Mistral AI透露接下来几周正着手开发“大型”项目。

图片

参考链接:

[1]https://mistral.ai/news/mistral-medium-3

[2]https://x.com/MistralAI/status/1920119463430500541

[3]https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/

举报

  • 相关推荐