首页 > 业界 > 关键词  > DBRX最新资讯  > 正文

开源大模型DBRX:1320亿参数,比Llama2-70B快1倍

2024-03-28 15:35 · 稿源:站长之家

**划重点:**

- 💡 Databricks发布MoE大模型DBRX,击败Grok-1和Mixtral等开源模型。

- 💡 DBRX参数量为1320亿,混合专家模型,激活参数量为360亿,比Llama2-70B生成速度快1倍。

- 💡 经过课程学习,DBRX在语言理解、编程、数学和逻辑等方面达到SOTA水平。

站长之家(ChinaZ.com)3月28日 消息:大数据公司Databricks最近发布了一款名为DBRX的MoE大模型,引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型,成为了新的开源之王。这款模型的总参数量达到了1320亿,但每次激活只有360亿参数,并且其生成速度比Llama2-70B快1倍。

image.png

DBRX是由16个专家模型组成,每次推理有4个专家处于激活状态,上下文长度为32K。为了训练DBRX,Databricks团队从云厂商那里租用了3072个H100,历时两个月进行训练。经过内部讨论,团队决定采用课程学习的方法,用高质量数据提高DBRX在特定任务上的能力。这一决策取得了成功,DBRX在语言理解、编程、数学和逻辑等方面均达到了SOTA水平,并在大多数基准测试中击败了GPT-3.5。

Databricks还发布了DBRX的两个版本:DBRX Base和DBRX Instruct,前者是预训练基础模型,后者则经过指令微调。首席科学家Jonathan Frankle透露团队接下来计划对模型进行进一步研究,探索DBRX如何在训练的“最后一周”中获得额外技能。

尽管DBRX受到开源社区的欢迎,但也有人对其“开源”的质疑。根据Databricks公布的协议,基于DBRX打造的产品,如果月活超过7亿,就必须另行向Databricks提交申请。

项目入口:https://top.aibase.com/tool/dbrx

举报

  • 相关推荐
  • Lamett乐迈石晶快装秘籍!让武汉20年老宅“一键焕新”

    武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板,解决潮湿问题,提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化,厨房岛台增进家人互动。全屋原木色调营造温馨氛围,兼顾健康与美学,为五口之家打造安全舒适的生活环境。

  • 王宁掏出迷你版LABUBU

    “这周就要发布Mini版LABUBU,以前可能大家是挂在包上,可能从下周开始,大家甚至可以挂在手机上,它的使用场景会更多,相信它会是一个超级受欢迎的爆款。” 8月20日,在泡泡玛特2025年中期业绩发布会上,泡泡玛特董事长兼CEO王宁化身“带货博主”,从胸前西装口袋中拿出了一个Mini版LABUBU介绍道。 这款即将登场的 Mini 版 LABUBU 仅有掌心大小,延续了LABUBU标志性的搪胶毛�

  • 泡泡玛特不止一个LABUBU

    不可否认,在本周举办的泡泡玛特中期业绩发布会上,LABUBU依然是最引人瞩目的话题中心。THE MONSTERS系列2025H1收入达到48.1亿元,同比增长668%,新品MINI LABUBU即将发售的消息也在海内外社媒引发巨大反响。 尽管位列所有IP第一,THE MONSTERS系列在总收入中的占比也刚刚接近35%。2025年H1,泡泡玛特自有IP中有5个收入超10亿,收入过亿的IP更是达到13个,这其中有MOLLY这样历经十数年的�

  • 大厂盯上AI玩具,你的下一个LABUBU可能出自阿里

    在2025年下半年,大厂的AI争夺战已经卷到了玩具上。 前有OpenAI宣布与玩具巨头美泰合作,后有马斯克推出AI伴侣,如今,京东更是大张旗鼓地要涉足AI玩具赛道。

  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • 迷你LABUBU开售后卖爆 多平台已售罄:电商平台销量破百万

    昨晚22时整,泡泡玛特旗下备受瞩目的迷你版LABUBU系列新品正式开售,迅速点燃了消费者的热情。该系列单个盲盒定价79元,若整套购买则需1106元。其中,主打款心底密码系列搪胶毛绒挂件盲盒更是成为抢购焦点,上线瞬间即被抢购一空。 不少网友提前守候在购买页面,准备第一时间抢购。然而,当时间一到,小程序页面迅速显示“太火爆了”,随后便提示商品已售罄,让众�

  • 印度女子误将Labubu当神明供奉 网友调侃:Labubu正式封神了!

    日,印度一名女子误把中国人气玩偶Labubu当神明供奉,还献上供品,引发网友热议。 据悉,这段视频最初由网友上传至TikTok与X,附文写道:一个印度女孩告诉妈妈,Labubu是中国神明,结果妈妈立刻开始供奉。” 视频中可以看到,女子拿起Labubu玩偶,对着神坛进行传统祈祷仪式,还向玩偶献上水果供品。 有的网友觉得十分搞笑,调侃道:Labubu 正式封神了!”

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • 跨境电商B2B出海新蓝海:规模扩张下千匠方案解锁增长密码

    《中国跨境电商B2B出口发展报告(2025)》显示,全球B2B跨境电商市场迎来结构性扩张黄金期。中国B2B出口增速将持续超越传统外贸,预计2025年规模达6.9万亿元。政策支持、技术赋能、需求红利叠加推动市场发展,工具设备、纺织品类占主导,新兴市场增长强劲。人工智能等技术深度融合加速产业数字化,企业数字化进程提速,未来将向品牌竞争与全产业链降本增效转型。

  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

今日大家都在搜的词: