Mistral、AI2 发布新的开源 LLMs：更小，更便宜

2025-01-31 11:12 · 稿源：站长之家

站长之家(ChinaZ.com) 1月31日消息：Mistral AI 和 Allen 人工智能研究所今天发布了新的大型语言模型（LLM），它们声称这些模型在各自类别中属于最先进的。

mistral

Mistral 的模型被称为 Mistral Small 3，而 Allen 人工智能研究所（通常简称 Ai2）发布的则是 Tülu 3 405B。这两款模型都可以在开源许可下使用。

Mistral Small 3 包含 240 亿个参数，远少于市场上最先进的 LLM，这使得它在启用量化后足够小，可以在某些 MacBook 上运行。量化是一种调整模型的技术，旨在在降低硬件资源需求的同时，减少一些输出质量的损失。

在一次内部评估中，Mistral 将 Mistral Small 3 与 Meta Platforms Inc. 发布的开源 LLM Llama 3.3 70B Instruct 进行了对比，后者的参数量是前者的三倍多。Mistral Small 3 提供了与 Llama 3.3 70B 类似的输出质量，但响应速度显著更快。在另一项测试中，这款新模型比 OpenAI 的 GPT-4o mini 提供了更高的输出质量和更低的延迟。

开发人员通常通过创建一个基础模型来构建 LLM，然后使用多种不同的训练方法来细化其输出质量。在构建 Mistral Small 3 时，该公司开发了基础模型，但跳过了后续的细化过程。这使得用户可以根据项目需求自行微调 Mistral Small 3。

该公司预计开发人员将会把这款 LLM 应用于各种任务，特别是在需要低延迟执行外部应用程序任务的 AI 自动化工具中。该公司表示，其一些客户还在机器人技术、金融服务和制造业等行业特定用例中使用 Mistral Small 3。

「Mistral Small 3 是一款预训练和指令式模型，专为应对『80%』的生成式 AI 任务而设计——这些任务需要强大的语言能力和指令跟随性能，并且延迟非常低，」Mistral 的研究人员在博客中写道。

今天 Mistral Small 3 的发布恰逢 Ai2（一个非营利的 AI 研究机构）发布新的 LLM。Tülu 3 405B 是 Meta 去年 6 月发布的开源 Llama 3.1 405B 模型的定制版。在 Ai2 的测试中，Tülu 3 405B 在多个基准测试中超过了原始的 Llama 模型。

该研究小组使用一种它们在 11 月首次详细说明的开发流程创建了这个 LLM。该工作流结合了多种 LLM 训练方法，其中包括 Ai2 自家发明的一种方法。

该工作流的第一步是监督微调。这是一种训练方法，通过向 LLM 提供示例提示和相应的答案，帮助它学习如何响应用户查询。接下来，Ai2 使用了另一种名为 DPO 的训练技术，将 Tülu 3 405B 的输出与一组用户偏好进行对齐。

Ai2 还使用一种名为 RLVR 的内部开发的训练方法进一步优化了模型的能力。RLVR 是强化学习的一种变体，强化学习是广泛应用的 AI 训练技术。Ai2 表示，RLVR 可以使 AI 模型在解决数学问题等任务中表现得更好。

Tülu 3 405B 代表了「完全开放的后训练方法首次应用于最大开放权重模型」，Ai2 的研究人员在博客中写道。「通过这一发布，我们展示了我们在 405B 参数规模上应用后训练方法的可扩展性和有效性。」

（举报）

相关推荐

关键词：

十方融海小智AI：以科技温度诠释“人工智能+”时代的人文关怀

近日，小女孩“小十三”与十方融海研发的小智AI机器人深情告别的视频走红网络。这段1分17秒的对话不仅让无数网友泪目，更展现了AI技术的情感温度。十方融海团队迅速响应，跨越600公里为女孩送上定制版机器人作为生日礼物，并推出儿童心理陪伴计划。该事件体现了“人工智能+教育”的深刻内涵，彰显科技企业的人文关怀与社会担当，成为“技术向善”的生动实践。
荐市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

9月24日，阿里巴巴股价创下四年新高，单日涨超9%，市值达到约3.32万亿港元，一日增加近3000亿港元。引爆股价的，是阿里集团每年一度的云栖大会。在会上，阿里释放多条重磅消息，尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后，阿里的股价表现就出现了明显的拉升。

阿里巴巴云栖大会股价
微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

微算科技开发了延迟和隐私感知卷积神经网络分布式推理技术，通过创新队列机制和深度强化学习优化CNN推理过程，结合分布式计算与隐私保护机制，在降低边缘设备计算延迟的同时强化数据隐私。该技术将推理任务智能分配到不同节点，减少数据传输范围，实现高效推理与隐私安全的平衡，为智能医疗、交通等领域提供可靠解决方案。

人工智能深度学习隐私保护
荣耀亲选KUMI AI Note发布：支持AI通话录音智能转换 699元

荣耀发布KUMI AI Note智能记事本，售价699元。产品采用磁吸卡片设计，厚度仅2.89mm，重量30g，便于携带。具备五大AI功能：语音转逻辑图、133种语言翻译、断句排版、人物识别及信息整理，转写准确率98%。内置高品质电池，支持24小时连续录音，配备Wi-Fi快传技术（5小时录音30秒传完）。适合会议记录、内容创作等场景，是便携的AI办公助手。

荣耀Magic8系列 KUMI AI
墨刀AI Agent：更懂产品经理的超级智能体上线

2025年AI将进入"智能体时代"，从被动工具升级为能理解意图、辅助决策的伙伴。墨刀AI+Agent专为产品经理打造，具备三层核心能力：懂逻辑（理解需求生成原型）、懂场景（熟悉全流程工作）、懂协作（跨角色沟通优化）。它能贯穿调研、原型、文档、评审等环节，解放重复劳动，让产品经理专注高价值决策，实现从效率提升到决策升级的人机协作新模式。

AI智能体产品经理墨刀AI
被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

本文系统介绍生成式引擎优化(GEO)的核心方法，帮助内容从“给人看”升级为“AI友好型”。关键策略包括：1.采用结构化写作框架，在开头设置可直接回答问题的“黄金段落”；2.运用分步清单、数据标注、FAQ等模块提升内容引用率；3.通过多平台同步分发增加曝光；4.使用AIBase等工具量化监测内容被AI引用的频率与场景，并给出5天落地执行表。

AI搜索友好型内容创作 GEO Generative
从纠结到笃定，问界新M5 Ultra更适合年轻用户

本文对比特斯拉Model Y与问界新M5 Ultra在辅助驾驶、安全配置及购车权益方面的差异。Model Y在高速路段表现稳定，但高阶功能需额外付费；问界新M5 Ultra搭载华为ADS系统，通过多传感器融合实现精准预判和柔顺控制，有效应对复杂路况。安全方面，问界采用高强度车身结构和全向防碰撞系统，获权威安全认证。购车权益上，问界提供包含高阶智驾的综合礼遇，性价比更优。两款�

新能源SUV 特斯拉Model Y
【CIM 加速，AI有方】No.2｜格创东智GT Insights用AI工作流改写半导体智造决策范式

在半导体制造领域，数据驱动的精准决策成为提升良率、降低成本的核心。传统数据分析系统面临三大挑战：技术门槛高、分析周期长、知识传承难。格创东智推出的GT+Insights产品，通过自然语言交互实现“对话即分析”，大幅降低使用门槛。该系统采用语义建模技术，将复杂物理数据转化为业务友好模型，支持分钟级全链路良率根因分析。目前已在多家半导体企业成功落地，助力客户显著提升生产效率，推动行业向智能化持续迈进。

半导体制造数据驱动精准决策
“人工智能+”时代，企业做对什么才能抢占先机？

国务院8月26日发布《关于深入实施“人工智能+”行动的意见》，提出加快AI技术与实体经济深度融合，推动产业智能化升级。到2035年，我国将全面步入智能经济和社会新阶段。金蝶集团作为企业数字化服务商，以“AI优先”为战略，将AI技术深度融入SaaS产品与服务，推出金蝶云·星空EMA平台及多款智能产品，覆盖财务、供应链、差旅等场景，助力企业构建“AI+业务”新能力，实现高效管理与创新发展。

人工智能数字化转型产业智能化
iQOO 15 Ultra已在路上：配置最激进的iQOO旗舰

iQOO产品副总裁罗锋在接受媒体专访时透露，iQOO 15系列还有一款高配版本，目前正在打磨中，面向特定群体，是游戏生产力工具”。此前博主数码闲聊站爆料，iQOO 15 Ultra采用2K LIPO直屏，搭载高通第五代骁龙8至尊版平台，配备潜望长焦，支持无线快充，该机还测试了肩键以及主动散热风扇，支持IP68级防尘防水。对比iQOO 15，iQOO 15的堆料

iQOO 15系列高通第五代骁龙8

今日大家都在搜的词：

热文

3 天
7天

Mistral、AI2 发布新的开源 LLMs：更小，更便宜

十方融海小智AI：以科技温度诠释“人工智能+”时代的人文关怀

荐市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

荣耀亲选KUMI AI Note发布：支持AI通话录音智能转换 699元

墨刀AI Agent：更懂产品经理的超级智能体上线

被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

从纠结到笃定，问界新M5 Ultra更适合年轻用户

【CIM 加速，AI有方】No.2｜格创东智GT Insights用AI工作流改写半导体智造决策范式

“人工智能+”时代，企业做对什么才能抢占先机？

iQOO 15 Ultra已在路上：配置最激进的iQOO旗舰

今日大家都在搜的词：

热文

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

天猫双11今晚8点开卖品类券每人可领万元

余承东官宣华为路由X3 Pro 采用“日照金山”设计

火车免费坐？12306今起又上新功能：积分可兑换车票

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

王腾首次回应下一步计划：称在考虑些创业项目

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

天猫双11今晚8点开卖品类券每人可领万元

站长商机