法国初创公司 Mistral 再次引发关注,他们与开源团队 All Hands AI 合作推出了全新语言模型 Devstral。这一模型不仅拥有240亿个参数,而且所需的计算资源显著低于许多同类产品,使其成为本地部署及设备端使用的理想选择。对于那些拥有 RTX4090显卡或32GB 内存的用户而言,Devstral 可以轻松运行,带来了更加灵活的使用体验。
在开源社区的声望逐渐提升的背景下,Mistral 通过 Devstral 向开发者们证明了他们的实力。尽管该公司的 Medium3大模型曾因未开源而受到批评,但此次的开放态度让人倍感振奋。Devstral 遵循宽松的 Apache2.0许可证,允许开发者和组织自由地进行修改、部署和商业化,这将为众多项目带来新的可能性。
图源备注:图片由AI生成,图片授权服务商Midjourney
Devstral 的设计初衷是解决现实世界的软件工程难题。虽然许多大型语言模型在编程任务中表现出色,如编写独立函数或进行代码补全,但它们在处理复杂代码库的上下文关联上却显得力不从心。Devstral 则专注于这一领域,能够有效解决真实的 GitHub 问题,并兼容 OpenHands 和 SWE-Agent 等代码智能体框架。
根据顶级软件工程基准测试 SWE-Bench Verified,Devstral 的表现相当出色,得分为46.8%,远超其他开源模型,甚至领先于一些闭源模型,如 GPT-4.1-mini,足足高出20个百分点。这一成绩展示了 Devstral 在实际编程能力上的潜力。
在同一测试框架下,Devstral 的表现也超过了许多参数更为庞大的模型,如 Deepseek-V3-0324和 Qwen3232B-A22B。其显著的效率和优越的性能让开发者们对其赞不绝口。
此外,Devstral 还可通过 Mistral 的 Le Platforme API 访问,定价为每百万输入 Token0.10美元,每百万输出 Token0.30美元,极具性价比。