首页 > 业界 > 关键词  > Mixtral最新资讯  > 正文

Mistral AI推出Mixtral 8x7B:一种改变机器学习的SMoE语言模型 效果堪比GPT-3.5

2024-01-15 11:57 · 稿源:站长之家

## 划重点:

1. 🚀 **创新模型介绍:** Mistral AI 的研究团队推出了基于 Sparse Mixture of Experts(SMoE)模型的 Mixtral8x7B 语言模型,采用开放权重。

2. 🌐 **性能突出:** Mixtral8x7B 在多语言数据(32k令牌上下文大小)的预训练中表现优异,与Llama270B和GPT-3.5相比,性能不逊色甚至更好。

3. 📊 **广泛评估结果:** 与Llama模型进行了详细的比较,Mixtral 在包括数学、代码生成、阅读理解、常识推理等各类任务中均表现出色。

站长之家(ChinaZ.com)1月15日 消息:最新的研究中,Mistral AI 的研究团队推出了一款名为 Mixtral8x7B 的语言模型,该模型基于新的 Sparse Mixture of Experts(SMoE)模型,具有开放权重。该模型被授权使用 Apache2.0许可证,并作为专家混合的稀疏网络仅用作解码器模型。

研究团队透露,Mixtral 的前馈块是从八个不同的参数组中选择的。每个层和令牌都有两个参数组,称为专家,由路由网络动态选择以处理令牌并将它们的结果以加法方式组合。由于每个令牌只使用总参数的一部分,这种方法有效地增加了模型的参数空间,同时保持成本和延迟的控制。

AI客服 AI语音

图源备注:图片由AI生成,图片授权服务商Midjourney

Mistral 通过使用32k token上下文大小的多语言数据进行预训练,表现出色,与Llama270B和GPT-3.5在多个基准测试中相当或更好。其主要优势之一是有效利用参数,允许在小批量大小时更快的推理时间,并在大批量大小时提高吞吐量。

Mixtral 在包括多语言理解、代码生成和数学等测试中,明显优于Llama270B。实验证明,Mixtral能够有效地从其32k令牌的上下文窗口中恢复数据,无论数据在序列中的长度和位置如何。

为确保公正准确的评估,研究团队使用了他们的评估流程重新运行了基准测试,详细比较了Mixtral和Llama模型。评估涵盖了数学、代码、阅读理解、常识思维、世界知识和流行的汇总发现等各种问题。

在0-shot环境中,对常识推理任务进行了评估,包括ARC-Easy、ARC-Challenge、Hellaswag、Winogrande、PIQA、SIQA、OpenbookQA和CommonsenseQA。在5-shot格式中,对世界知识任务进行了评估,包括TriviaQA和NaturalQuestions。阅读理解任务BoolQ和QuAC在0-shot环境中进行评估。数学任务包括GSM8K和MATH,而与代码相关的任务包括Humaneval和MBPP。研究还包括了对AGI Eval、BBH和MMLU的流行的综合发现。

研究还展示了 Mixtral8x7B – Instruct,这是一个专为指令优化的对话模型。在过程中使用了直接偏好优化和监督微调。在人工评估基准中,Mixtral – Instruct在与GPT-3.5Turbo、Claude-2.1、Gemini Pro和Llama270B – 聊天模型的比较中表现更好。类似BBQ和BOLD的基准显示出更少的偏见和更平衡的情感配置。

为促进广泛的可访问性和各种应用,Mixtral8x7B和Mixtral8x7B – Instruct都已获得Apache2.0许可证,允许商业和学术用途。通过添加Megablocks CUDA内核以实现有效的推理,团队还修改了vLLM项目。

论文网址:https://arxiv.org/abs/2401.04088

代码:https://github.com/mistralai/mistral-src

举报

  • 相关推荐
  • Matrixport 加密基金获 FCA 营销许可,机构化投资通道加速成型

    2025年9月11日,Matrixport旗下旗舰产品Crypto Market Index Fund获得英国FCA营销许可,成为首个可在英国向专业投资者私募销售的瑞士加密基金。该基金追踪瑞士SIX交易所的CMI10指数,覆盖BTC、ETH等十大主流加密资产,采用合规基金结构,由FINMA监管。此次突破体现了Matrixport"双轮驱动"战略:持续优化产品结构与深化合规运营,为机构提供透明安全的数字资产配置工具。

  • 影院级视听体验,海信激光电视探索X1 Ultra亮相青博会

    2025年青岛国际消费电子博览会以“智联万物+AI赋未来”为主题,海信激光电视探索X1 Ultra惊艳亮相。该产品采用IMAX影院同源技术,实现110% BT.2020色域和ΔE<0.6的专业色准,配备1000nits纳米光选屏Pro,支持9.1.4声道音响系统,通过德国莱茵护眼认证。创新可卷曲屏幕设计解决大屏入户难题,全球市场份额达65.8%,重新定义家庭影院标准。

  • 都市精英购车指南,问界新M5 Ultra对比小米YU7

    本文聚焦20-30万元区间新能源车市场竞争,通过对比问界新M5 Ultra与小米YU7,强调购车应关注实际体验而非参数堆砌。问界在感知硬件、辅助驾驶算法及主被动安全方面更具优势,搭载华为ADS系统,提供更精准可靠的智能出行体验。目前问界还提供高达3.7万元的购车权益,建议消费者亲身体验后再做选择。

  • 小米最强旗舰!小米17 Ultra入网

    小米新旗舰型号2512BPNDAC获入网许可,支持UWB技术但不支持卫星通信。该机被猜测为小米17 Ultra,将升级前摄、主摄和长焦,采用大R角直屏和极窄边框,搭载骁龙8 Elite Gen5平台,标配无线/有线快充、防水和大容量电池。预计春节前发布,将成为小米最强影像旗舰,值得期待。

  • 小米澎湃OS 3第二批Beta版开启招募:覆盖REDMI K80、小米MIX Flip2等五款

    据小米官方消息,澎湃OS 3第二批Beta版已经开启招募,覆盖五款机型,包括:小米MIX Flip 2、REDMI K80、小米平板7 Ultra、小米平板7、REDMI K Pad。 据了解,澎湃OS 3采用自研底层内核技术平台,深入微架构流水线,识别CPU空转时长,通过一体化调频技术提升效率,整体任务执行效率提升19%。 同时,澎湃OS 3终于登岛”,命名为小米超级岛”,支持三岛并存,能显示待取快递提醒、登�

  • 小米SU7 Ultra原型车1:43合金车模发布:售价149元

    小米汽车于9月23日推出SU7 Ultra原型车1:43比例合金车模,售价149元,9月25日18:00线上开售。车模严格还原原型车设计,包括U型风刀、大尺寸前铲、水滴形大灯及碳纤维后视镜等细节,提供闪电黄和太空银两款配色,分别致敬纽北赛道传奇赛车与首台测试车。材质采用锌合金搭配复合塑料,兼顾强度与轻量化,尺寸122×50×33mm,适合陈列或车载装饰。行业观察认为,小米将高端赛车模型价格下探至百元级,可能引发收藏领域新一轮关注。

  • 小米最强影像旗舰!小米17系列还有Ultra版

    小米集团总裁卢伟冰在直播中透露,小米17系列将推出Pro+Max和Ultra版本。Ultra版将搭载连续光学变焦技术,配备2亿像素大底,实现更顺滑的变焦体验,避免传统变焦系统的跳变、白平衡偏移等问题。爆料称小米17+Ultra或将在春节前发布,比往年提前,标准版和Pro版也将在9月底发布。

  • 海信G7 Ultra显示器参数公布:1152分区+2000nits亮度,黑曜屏加持领跑3K档

    海信G7 Ultra显示器于9月22日开启预约,定位三千元价位段,主打3A游戏画质体验。搭载1152分区Mini-LED背光,峰值亮度达2000nits,支持99% DCI-P3色域和DP2.1接口,实现4K@160Hz与FHD@320Hz双模切换。采用黑曜屏抗反光技术,结合低蓝光护眼功能,兼顾高对比度与舒适视觉。产品旨在突破电竞显示器画质瓶颈,最终售价将于9月26日发布会公布。

  • 新品|灵动式三维扫描系统NimbleTrack Gen2震撼来袭!

    思看科技9月17日发布新一代NimbleTrack+Gen2智能无线三维扫描系统。该系统采用全无线设计,无需贴点,最高精度达0.025mm,支持120FPS高速扫描,单站最远跟踪距离4.2米。创新融合跟踪式与手持式双模式,可覆盖中小型精密件到大型工业件的全场景测量,助力工业检测向高效化、智能化升级。

  • 突破 Mini LED!三星 Micro RGB 引航显示进入 Micro 时代

    三星在京东方MALL举办“AI的呵护”家电线下体验展,展出全球首款Micro RGB电视115MR95F。该电视采用Micro RGB技术,实现100% BT.2020色域覆盖,色彩精准度与对比度达到新高度。搭载AI芯片优化画质,支持144Hz刷新率与杜比全景声,定价199,999元。三星借此布局超高端市场,展示Micro RGB+QD-OLED+Micro LED三大技术矩阵,重塑显示行业格局。

今日大家都在搜的词: