首页 > 业界 > 关键词  > Mistral最新资讯  > 正文

Mistral、AI2 发布新的开源 LLMs:更小,更便宜

2025-01-31 11:12 · 稿源:站长之家

站长之家(ChinaZ.com) 1月31日消息:Mistral AI 和 Allen 人工智能研究所今天发布了新的大型语言模型(LLM),它们声称这些模型在各自类别中属于最先进的。

mistral

Mistral 的模型被称为 Mistral Small 3,而 Allen 人工智能研究所(通常简称 Ai2)发布的则是 Tülu 3 405B。这两款模型都可以在开源许可下使用。

Mistral Small 3 包含 240 亿个参数,远少于市场上最先进的 LLM,这使得它在启用量化后足够小,可以在某些 MacBook 上运行。量化是一种调整模型的技术,旨在在降低硬件资源需求的同时,减少一些输出质量的损失。

在一次内部评估中,Mistral 将 Mistral Small 3 与 Meta Platforms Inc. 发布的开源 LLM Llama 3.3 70B Instruct 进行了对比,后者的参数量是前者的三倍多。Mistral Small 3 提供了与 Llama 3.3 70B 类似的输出质量,但响应速度显著更快。在另一项测试中,这款新模型比 OpenAI 的 GPT-4o mini 提供了更高的输出质量和更低的延迟。

开发人员通常通过创建一个基础模型来构建 LLM,然后使用多种不同的训练方法来细化其输出质量。在构建 Mistral Small 3 时,该公司开发了基础模型,但跳过了后续的细化过程。这使得用户可以根据项目需求自行微调 Mistral Small 3。

该公司预计开发人员将会把这款 LLM 应用于各种任务,特别是在需要低延迟执行外部应用程序任务的 AI 自动化工具中。该公司表示,其一些客户还在机器人技术、金融服务和制造业等行业特定用例中使用 Mistral Small 3。

「Mistral Small 3 是一款预训练和指令式模型,专为应对『80%』的生成式 AI 任务而设计——这些任务需要强大的语言能力和指令跟随性能,并且延迟非常低,」Mistral 的研究人员在博客中写道。

今天 Mistral Small 3 的发布恰逢 Ai2(一个非营利的 AI 研究机构)发布新的 LLM。Tülu 3 405B 是 Meta 去年 6 月发布的开源 Llama 3.1 405B 模型的定制版。在 Ai2 的测试中,Tülu 3 405B 在多个基准测试中超过了原始的 Llama 模型。

该研究小组使用一种它们在 11 月首次详细说明的开发流程创建了这个 LLM。该工作流结合了多种 LLM 训练方法,其中包括 Ai2 自家发明的一种方法。

该工作流的第一步是监督微调。这是一种训练方法,通过向 LLM 提供示例提示和相应的答案,帮助它学习如何响应用户查询。接下来,Ai2 使用了另一种名为 DPO 的训练技术,将 Tülu 3 405B 的输出与一组用户偏好进行对齐。

Ai2 还使用一种名为 RLVR 的内部开发的训练方法进一步优化了模型的能力。RLVR 是强化学习的一种变体,强化学习是广泛应用的 AI 训练技术。Ai2 表示,RLVR 可以使 AI 模型在解决数学问题等任务中表现得更好。

Tülu 3 405B 代表了「完全开放的后训练方法首次应用于最大开放权重模型」,Ai2 的研究人员在博客中写道。「通过这一发布,我们展示了我们在 405B 参数规模上应用后训练方法的可扩展性和有效性。」

举报

  • 相关推荐
  • 智启新元 海创未来—2025中国人工智能大会暨全国人工智能学院院长(系主任)年会全景回顾

    2025年11月29日至30日,由中国人工智能学会(CAAI)主办的2025中国人工智能大会暨全国人工智能学院院长(系主任)年会在北京海淀区盛大开幕。大会以“智启新元+海创未来”为主题,汇聚了来自全国AI行业领军企业、高校院所及科研机构的代表,聚焦“学术-产业-人才”深度联动,探讨“创新链、产业链、人才链”三链融合,旨在为“十五五”人工智能发展注入新动能。会议期间发布了《北京人工智能产业白皮书(2025)》、CAAI系列白皮书及“2026人工智能领域十大问题”,并见证了AI院长联盟的成立以及“CAAI-英博云高校算力支持计划”的启动。大会通过开幕式、主旨报告、专题会议、展览展示及生态签约等多元形式,全面展现了中国人工智能领域的创新活力与发展潜力。

  • 风磐科技入驻AI·镜界南京人工智能生态街

    11月23日,南京人工智能生态街区在软件谷开街,江苏风掣科技入驻并与中兴、华为等数十家企业共同开启AI新篇章。活动由南京市领导及工信部门负责人出席,风掣科技展示了自主研发的磐石智能分析系统,具备200TOPS算力、国产化支持及灵活部署能力,应用于应急布防、智慧安防等领域,助力产业国产化。街区聚焦智能引领与场景示范,推动AI与软件产业深度融合,打造创新生态体系。

  • AI日报:北京发布人工智能产业白皮书;字节发布视频编辑模型Vidi2;快手将发布Kling Omni

    本期AI日报聚焦多项AI领域进展:北京发布人工智能产业白皮书,预计2025年核心产值超4500亿元;字节跳动推出120亿参数视频模型Vidi2,实现视频编辑自动化;西藏首个千亿参数藏语大模型“阳光清言”问世,助力高原AI发展;快手Kling Omni即将发布,支持导演级精准控制,可生成2分钟带原生音频长视频;Meta推出Matrix框架,革新多智能体合成数据生成;国产家庭机器人F1亮相,具备多项家务能力,计划明年上市;豆包App升级语音功能,支持四种方言对话,提升老年人使用体验;豆包手机助手技术预览版发布,旨在提供更高效交互。

  • 华为中国行2025·黑龙江算电融合与人工智能创新发展峰会成功举办

    [中国,黑龙江,2025年11月30日] 以“数智龙江 算电即达”为主题的华为中国行2025·黑龙江算电融合与人工智能创新发展峰会成功举办。本次峰会由黑龙江省发展和改革委员会、黑龙江省工业和信息化厅、黑龙江省数据局、哈尔滨市人民政府、中国计算机行业协会共同指导;由华为技术有限公司、中国华电集团有限公司、国家电力投资集团有限公司、运达能源科技集团股份有限公�

  • “猝死风险AI筛查系统”亮相“2025人工智能+大会”,引领“AI+大健康”新浪潮

    在2025人工智能+大会“AI+大健康”论坛上,沃民高科发布“猝死风险AI筛查系统”。该系统通过30秒头部视频AI分析,实现无创快速筛查,为猝死预防提供新方案。中国是全球心源性猝死人数最多的国家,年轻化趋势明显。该系统部署简便,1分钟内完成评估,适合大规模普筛,已获行业认可,包括1.495亿元服务采购。沃民高科将持续深耕AI健康监测技术,助力全球健康事业发展。

  • 全球AI算力最高!小鹏P7 Ultra/G7 Ultra开启图灵AI芯片升级预约

    今天14点,小鹏Ultra图灵AI芯片硬件升级正式开启预约! 此次升级针对小鹏P7 Ultra与G7 Ultra车型,新增座舱有效算力750TOPS,将是全球AI有效算力最高的座舱。 此次芯片升级将大幅提升座舱智能交互、多任务处理等能力,为用户带来更流畅的车载AI体验。 据官方信息,本次升级搭载的图灵AI芯片”(型号SCP 117AR3),仅需通过拆卸副驾驶地毯下

  • 什么是AI员工?雇佣AI员工后就可以替代人工吗?企业如何发挥AI员工的真正价值?

    本文探讨了AI员工如何从热门概念转变为驱动企业业务增长的核心引擎。文章指出,AI员工并非简单的聊天机器人,而是基于大模型技术、能理解任务并自主执行的智能体,其核心价值在于赋能人类员工、解放管理者精力。AI员工适合处理重复性高、操作繁琐的低价值工作,如客户服务、销售助理和售后支持等,从而让人类员工专注于更具创造性和战略性的任务。企业正确运用AI员工,不仅能提升效率和客户体验,还能构建更强大、高效的人机协同组织,激发增长潜力。

  • 坚果N5 Ultra Max和当贝S7 Ultra Pro怎么选?实测告诉你

    本文对比评测坚果N5 Ultra+Max、当贝S7 Ultra+Pro、极米RS20 Ultra+Max三款国产旗舰智能投影仪。从画质、核心参数、游戏表现、音效、使用体验及护眼功能六大维度进行全方位分析。结果显示,当贝S7 Ultra+Pro在画质色彩还原、暗部细节、系统流畅度方面表现最佳,综合体验最优;极米RS20 Ultra+Max画面锐化明显,适合文字内容观看;坚果N5 Ultra+Max投射画面最大,但存在色彩偏黄、高光过曝等问题。消费者可根据自身对画质、画面大小及使用场景的不同需求进行选择。

  • 3个PCIe插槽、支持4个ECC内存,Ultra 9 285HX企业级迷你工作站铭凡MS-02 Ultra亮相

    铭凡正式推出第二代高性能迷你工作站MS-02Ultra,仅4.8升的超紧凑体积,融合全塔级性能与极致的扩展能力。MS-02Ultra最高搭载Intel® Core™ Ultra9285HX处理器,具备24核心、24线程,最高睿频达5.4GHz,支持100W持续高性能输出,多核性能较前代产品提升高达117%。配合13TOPS NPU,在AI、多媒体、性能释放与能效优化方面都更出色。在扩展能力上,MS-02Ultra堪称“同级天花板”。MS-02Ultra配备3

  • 亿道信息以“AI+终端”与“AI+应用”双轮驱动,开启智能普惠新纪元

    12月3日,亿道信息在深圳举办年度“亿道科技日”,以“Edge+AI,端云协同”为核心,展示公司从产品提供商向场景计算体系构建者的战略转型。活动发布了覆盖个人、家庭、企业、工业、穿戴等核心场景的AI终端矩阵与一体化应用方案,致力于将AI转化为千行百业触手可及的生产力引擎。重点产品包括旗舰AI+PC(算力达180TOPS,预装“小亿AI助手”)、高性能AI+BOX(集成126TOPS算力与96GB显存)及全系列AI服务器矩阵。同时,公司推出“亿道超算AI智能引擎”以降低企业AI部署门槛,并展示AESOF跨平台开放框架,构建开放生态,与英特尔、高通等产业链伙伴深化合作,推动智能技术普惠化。

今日大家都在搜的词: