首页 > AI头条  > 正文

法国AI实验室 Mistral 推出Magistral推理模型,开启智能新纪元!

2025-06-11 09:23 · 来源: AIbase基地

法国人工智能实验室 Mistral 近日正式推出了其首个推理模型系列 ——Magistral,标志着其在 AI 领域的又一重要进展。该系列包含两个版本:Magistral Small 和 Magistral Medium,旨在提升在数学和物理等领域的逻辑推理能力。这些模型通过分步骤解决问题,与 OpenAI 的 o3模型和谷歌的 Gemini2.5Pro 等其他推理模型不无相似之处。

mistral

Magistral Small 的参数达到240亿,并已在人工智能开发平台 Hugging Face 上开放下载,采用 Apache2.0许可证,方便开发者使用。而 Magistral Medium 则是一个更强大的版本,目前处于预览阶段,用户可以通过 Mistral 的 Le Chat 聊天平台、公司 API 及第三方合作伙伴的云服务进行体验。

Mistral 在其官方博客中指出,Magistral 适用于多种企业级应用,包括结构化计算、程序逻辑和基于规则的系统。通过多步骤逻辑的微调,Magistral 能够增强可解释性,并向用户提供可追溯的思考过程,这对于很多需要高透明度的行业尤为重要。

image.png

尽管 Mistral 在资金和技术上具备一定实力,近年来却在推理模型的开发上落后于一些顶尖实验室。根据自家基准测试,Magistral 在评估物理、数学和科学能力的 GPQA Diamond 和 AIME 测试中表现不如 Gemini2.5Pro 和 Claude Opus4。而在编程基准测试 LiveCodeBench 中,Magistral Medium 同样未能超越 Gemini2.5Pro 的成绩。

尽管如此,Mistral 依旧强调 Magistral 的独特优势。该模型在 Le Chat 平台上的答题速度是竞争对手的10倍,并且支持包括意大利语、阿拉伯语、俄语和简体中文等多种语言。此外,Mistral 表示,Magistral 专为研究、战略规划、运营优化及数据驱动决策而设计,能够在多因素风险评估和建模方面大显身手。

Magistral 的推出也正值 Mistral 发布 “氛围编程” 客户端 Mistral Code 之后,显示出该公司在编程和企业服务领域的进一步布局。

  • 相关推荐
  • 苹果炮轰AI推理模型:全是假思考!所谓思考只是一种假象

    有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。 苹果团队认为,现有评估主要集中在既定的数学和编码基准上,看模型最终答案是否正确,但可能存在模型训练时见过类似题目。 并且,这些评估大都缺乏对思考过程质量”的分析,比如中间步骤是否逻辑一致、是否绕弯路等。 为了更客观测试推理模型的推理能力,他们设计了4类谜题环境:汉诺塔、�

  • iQOO 15 Ultra首曝:首款骁龙8 Elite 2 Ultra旗舰

    iQOO将于年底推出iQOO 15系列旗舰手机,包含标准版和Ultra版。iQOO 15 Ultra将采用2K LIPO直屏,首批搭载骁龙8 Elite 2平台,配备潜望长焦镜头,支持无线充电和IP68防尘防水。相比上代,Ultra版回归直屏设计,新增主动散热风扇和潜望长焦,影像和性能大幅提升。采用全新LIPO封装工艺,通过优化显示驱动芯片和电路布局,大幅收窄边框。LIPO技术采用高密度连接设计,减少信号传输通道数量和长度,在保证信号稳定性的同时缩小边框宽度。iQOO 15 Pro预计10月亮相,将成为行业首款骁龙8 Elite 2 Ultra旗舰机型。

  • AI日报:夸克发布首个高考志愿大模型;Trae月活跃用户破100万;Manus推出免费无限聊天模式

    【AI日报】今日AI领域热点速览: 1. 夸克APP推出高考志愿大模型,免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式,挑战行业巨头 3. Trae开发者平台月活破百万,累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体",内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具,支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资,拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

  • 谷歌推出 250 美元的 AI Ultra 套餐,重新定义“高端”

    谷歌或许想把 AI Ultra 打造成一个精英创作者工具包,但它也可能正在重新定义“高端”:只是贵而已……

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • 史上最强nova!华为nova 14 Ultra搭载Mate 70同款红枫原色镜头

    华为5月19日发布nova14系列及鸿蒙电脑新品。nova14 Ultra搭载全新红枫原色镜头,由Mate70系列首发,能精准测量全局光谱信息,大幅提升色彩还原度。配备三颗5000万像素RYYB镜头:F2.2潜望长焦支持3.7倍光学变焦、100倍数码变焦及OIS+AIS防抖;F1.4-F4.0十档物理可变光圈防抖镜头;120°超广角微距镜头支持2.5厘米微距。影像系统全面升级,堪称史上最强nova。

  • 三筒!明牌! 海信棉花糖Ultra全家筒开启洗衣“空间自由”时代

    海信洗衣机推出三筒系列新品,满足消费者对分区洗护的健康需求。5月30日,海信在青岛发布"棉花糖Ultra全家筒"系列,包含旗舰版、轻享版和青春版三款产品。旗舰版是全球首款4合1热泵洗烘一体机,支持13kg洗涤+9kg热泵烘干,配备双mini筒独立洗烘;轻享版搭载专利活水洗4.0技术,毛屑去除率达90%;青春版主打高性价比基础分区洗护。产品通过物理分区方式解决母婴、�

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • 李未可AI眼镜新品发布会:零级智能体开启人机交互新纪元

    李未可科技发布2025年度新品,推出三款AI智能眼镜及专属大模型"WAKE-AI任务式交流系统"。核心亮点是"零级智能体ZeroAgent",通过多智能体协同实现任务分发与动态决策,打破传统硬件依赖单一AI功能的局限。新品包括轻量化设计的LAWK City系列(续航14小时,仅重23-27克)和旅拍版LAWK View(支持20种语言翻译)。公司联合米奥兰特国际会展瞄准跨境商务场景,并与博士眼镜达成战略合作,推动AI眼镜线下体验。创始人茹忆强调"AI定义硬件"理念,预测未来十年传统眼镜将全面智能化,轻量化、长时佩戴与场景适配是竞争核心。

  • 迎接颠覆性创新 Ultra新篇章即将展开

    三星Galaxy系列以用户需求为核心,通过折叠屏设计、AI技术和专业级相机等创新功能,打造颠覆性体验。新品Galaxy Ultra整合行业领先硬件配置,优化折叠屏形态下的AI应用,满足用户对轻薄便携和高效办公的需求。产品亮点包括:1)折叠状态下可作为高效办公平台;2)AI语音助手实现智能推荐和信息处理;3)专业摄影系统捕捉精彩瞬间;4)多任务处理提升工作效率。这些创新功能均由专为折叠屏优化的Galaxy AI深度赋能,重新定义智能设备与日常生活的交互方式。

今日大家都在搜的词: