DBRX抢占开源大模型王座编程、数学等领域超越GPT-3.5

2024-03-28 14:22 · 稿源：站长之家

要点:
DBRX成为开源大模型领域新标杆:Databricks发布1320亿参数的DBRX，基础和微调版本均开源，在语言理解、编程、数学等领域超越了GPT-3.5，并且与Gemini1.0Pro和Mistral Medium相媲美。
DBRX性能优异:DBRX在综合基准、编程和数学等方面表现出色，超越了GPT-3.5，并且与闭源模型Gemini1.0Pro和Mistral Medium具有竞争力，展现了强大的语言理解和推理能力。
训练效率高:DBRX模型使用混合专家模型架构，有效提高了训练的计算效率，为开源社区提供了更多可能性，并成为开源大模型领域的新里程碑。

站长之家(ChinaZ.com) 3月28日消息:最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型，还在效率上有所突破。DBRX的基础和微调版本均已发布，为研究和商业应用提供了丰富的资源。

GitHub 链接：https://top.aibase.com/tool/dbrx

基础版:https://huggingface.co/databricks/dbrx-base

微调版:https://huggingface.co/databricks/dbrx-instruct

DBRX采用基于Transformer的仅解码器大语言模型，使用细粒度的专家混合架构，共有1320亿参数。相比其他开源MoE模型，如Mixtral和Grok-1，DBRX更细粒度，使用更多数量的小型专家模型。它使用了旋转位置编码、门控线性单元和分组查询注意力等技术来提高模型质量，并采用了tiktoken存储库提供的GPT-4分词器。DBRX的高效率也是其优势之一，平均只需激活360亿参数即可处理token，推理速度几乎比LLaMA2-70B快两倍。

与此同时，DBRX的推理速度也有了显著提升，在Mosaic AI Model Serving上每秒可达150个token，大大提高了处理效率。这一新模型的出现引发了开发者和媒体的热烈讨论，被誉为开源AI模型领域的新标杆。

DBRX在综合基准测试中表现突出，尤其在编程和数学方面显示出强大的能力。与GPT-3.5相比，DBRX在人类评估和数学推理等方面更胜一筹，同时与Gemini1.0Pro和Mistral Medium等闭源模型相媲美。DBRX的出现不仅提高了开源社区的水平，也为商业应用带来了更多可能性。同时，DBRX还在训练效率方面有所突破，有效提高了混合专家模型的计算效率，为更广泛的应用场景带来了希望。

总的来说，DBRX的问世为开源大模型领域注入了新的活力，展现了令人瞩目的性能和效率。随着其在各项基准测试中的优异表现，DBRX有望成为未来开源大模型发展的重要里程碑，为人工智能领域的进步贡献力量。

（举报）

相关推荐

关键词：

为编程而生？OpenAI 发布 GPT -4.1 系列模型

OpenAI 表示，GPT-4.1 是为开发者量身定制的……

openai gpt-4.1 gpt-4.1mini
字节AI加速文生图技术新突破，GOOG/微美全息引领开源大模型释放科技势能

字节跳动发布豆包1.5深度思考模型，升级文生图能力。该模型在专业领域和通用任务中表现突出，采用MoE架构，总参数量200B，激活参数20B，推理成本优势显著。同时，其图像生成模型Seedream 3.0性能追平GPT-4o等顶尖模型。全球AI产业加速发展，开源模型降低技术门槛，推动商业化落地。微美全息等企业构建开放AI生态，DeepSeek等公司通过开源策略促进技术普惠。行业迎来"开源AI+"新阶段，企业需把握机遇应对挑战。

字节跳动豆包1.5 文生图模型
荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

本文汇总了近期AI领域多项重要进展：1)扣子空间开放测试，无需邀请码即可体验AI协作平台；2)腾讯推出HunyuanCustom视频生成工具，实现音视频同步编辑；3)阿里巴巴ZeroSearch技术降低AI训练成本88%；4)OpenAI新增GitHub连接器，强化代码分析功能；5)联想发布天禧个人超级智能体，具备感知交互能力；6)OpenAI在亚洲推出数据驻留计划；7)Multiverse发布全球首款AI生成多人游戏；8)秘塔AI上线"讲题"功能辅助家长辅导；9)Genspark推出智能电子表格工具AI Sheets；10)Google Gemini API新增缓存功能可节省75%成本；11)PixVerse v4视频生成速度质量双提升；12)快手推出内容净化器KuaiMod；13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度，展现了AI技术的快速发展和广泛应用。

AI产品人工智能技术趋势
荐AI日报：智谱开源32B/9B系列GLM模型并启用Z.ai域名；OpenAI发布GPT-4.1系列模型；阿里魔搭上线MCP广场

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型，并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议，支持商业用途，提升了

人工智能开源模型 GLM模型
荐AI日报：阿里通义千问Qwen3问鼎全球开源模型；Kimi长思考模型API发布；OpenAI发布新一代GPT-4.1模型

【AI日报】汇总了近期AI领域重要动态：1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首，在指令遵循和推理能力上超越闭源模型；2)月之暗面推出Kimi长思考模型API，可解决复杂代码和数学问题；3)OpenAI发布GPT-4.1模型，性能提升显著；4)Google推出Gemini2.5Pro模型，提升开发者编码能力；5)联想发布"天禧超级智能体"，具备多模态感知能力；6)腾讯元宝上线"对话分

AI日报通义千问3 开源模型
刚刚，AI破解50年未解数学难题！南大校友用OpenAI模型完成首个非平凡数学证明

【新智元导读】AI辅助人类，完成了首个非平凡研究数学证明，破解了50年未解的数学难题!在南大校友的研究中，这个难题中q=3的情况，由o3-mini-high给出了精确解。就在刚刚，AI完成了首个非平凡研究数学证明!完成这项研究的，是美国纽约布鲁克海文国家实验室凝聚态物理与材料科学分部的一位华人学者Weiguo Yin。论文地址:https://arxiv.org/abs/2503.23758在这项研究中，作者在一维J_1-J

AI数学证明数学难题非平凡研究
微软上线GPT-image-1模型通过API向开发者开放使用

OpenAI于4月24日发布全新图像生成模型GPT-image-1，通过API向全球开发者开放。该模型支持生成高质量图像，具备多级定制功能，包括控制敏感度、生成效率、背景、输出格式等参数，并推出"吉卜力模式"生成独特风格图像。Adobe、Figma等多家企业已将其集成到产品中。API定价按token计算，低质量图像生成成本约0.02美元/张。OpenAI CEO Sam Altman高度评价该模型，认为其为开发者带来更大创意空间。

OpenAI 图像生成 GPT-image-1
DeepSeek领航大模型普惠化浪潮，xAI/微美全息加速开源AI布局打造新格局

DeepSeek 作为当前最受关注的大模型之一，凭借其技术创新正在加速 AI 普惠化进程。根据机构新报告显示，DeepSeek已经成为全球增长最快的AI工具，其每月新增网站访问量已经超过OpenAI的ChatGPT。DeepSeek市场份额全球第三目前，DeepSeek市场份额6.58%，仅次于ChatGPT和Canva。DeepSeek是继ChatGPT之后的又一现象级AI产品，它的市场份额从2.34%快速增长至6.58%，展现出强劲的增长态势。全球著名�

DeepSeek AI工具技术创新
荐刚刚，OpenAI发布GPT-image-1模型，更强吉卜力版本来啦

OpenAI发布全新图像生成模型GPT-image-1，通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数，并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能，图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著，开发者可通过API实现更多创意场景。新模型在�

OpenAI GPT-image-1 图像生成
开源即支持！基于昇腾MindSpeed MM玩转InternVL3多模态理解最新模型

多模态理解领域当前已成了各家AI大模型公司“军备竞赛”的关键点之一，国内外知名AI大模型公司都争相通过发布最先进的多模态大语言模型展现其在多模态理解领域的前沿能力。近期，上海AI实验室推出了其最新的多模态大语言模型InternVL3 系列，相比上一代InternVL2. 5 模型，该模型展现出卓越的多模态感知和推理能力，同时进一步扩展了其工具使用、GUI代理、工业图像分析等

多模态理解 AI大模型 InternVL3

热文

3 天
7天

DBRX抢占开源大模型王座编程、数学等领域超越GPT-3.5

为编程而生？OpenAI 发布 GPT -4.1 系列模型

字节AI加速文生图技术新突破，GOOG/微美全息引领开源大模型释放科技势能

荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

荐AI日报：智谱开源32B/9B系列GLM模型并启用Z.ai域名；OpenAI发布GPT-4.1系列模型；阿里魔搭上线MCP广场

荐AI日报：阿里通义千问Qwen3问鼎全球开源模型；Kimi长思考模型API发布；OpenAI发布新一代GPT-4.1模型

刚刚，AI破解50年未解数学难题！南大校友用OpenAI模型完成首个非平凡数学证明

微软上线GPT-image-1模型通过API向开发者开放使用

DeepSeek领航大模型普惠化浪潮，xAI/微美全息加速开源AI布局打造新格局

荐刚刚，OpenAI发布GPT-image-1模型，更强吉卜力版本来啦

开源即支持！基于昇腾MindSpeed MM玩转InternVL3多模态理解最新模型

热文

隐私被抛弃，监控成为主流？Meta为其AI眼镜新增人脸识别功能

特朗普关税政策颠覆汽车行业，福特率先开启“涨价潮”！

基于安卓16的三星 One UI 8 本月发布首个测试版本

苹果“为彼此创造”不再？听乔纳森·艾维忆往昔、谈传承

三星推出新型微显示技术，加剧 AR 眼镜竞争

全网最大的“AI色情网站”MrDeepfakes宣布永久关闭

马斯克称地球会被太阳焚化，网友：有科学依据，但…

特朗普准备撤回“AI芯片出口管制”……各国单独谈判

20周年纪念版iPhone迎来重大变革，全屏设计+屏下摄像头

隐私被抛弃，监控成为主流？Meta为其AI眼镜新增人脸识别功能

Anthropic推出Claude网络搜索API，押注“后谷歌时代”信息访问

2025 年，SpaceX 发射了多少枚火箭？

苹果高管称：10 年后，可能 iPhone 将不复存在！

谷歌在Pixel 9 Pro广告中，嘲讽iPhone 17：抄袭、老旧！

不顾特朗普的阻挠，Uber继续全球扩张…携手土耳其及中国企

站长商机

DBRX抢占开源大模型王座 编程、数学等领域超越GPT-3.5

热文

站长商机

DBRX抢占开源大模型王座编程、数学等领域超越GPT-3.5