首页 > AI头条  > 正文

32B参数的“逆袭”!OLMo 2 32B横空出世,叫板GPT-3.5 Turbo

2025-03-18 14:53 · 来源: AIbase基地

近日,艾伦人工智能研究所(AI2)重磅发布了其最新的大型语言模型——OLMo232B。这款模型一经亮相便自带光环,因为它不仅是OLMo2系列的最新力作,更以“完全开放”的姿态,向那些高墙深垒的专有模型发起了强有力的挑战。

OLMo232B最引人注目的特点莫过于其彻彻底底的开源属性。AI2大方地公开了这款模型的所有数据、代码、权重以及详细的训练过程. 这种“坦诚相见”的做法,与一些讳莫如深的闭源模型形成了鲜明对比。

AI2希望通过这种开放协作的方式,促进更广泛的研究和创新,让全球的研究人员都能站在OLMo232B的肩膀上继续前行。毕竟,在一个知识共享的时代,藏着掖着可不是长久之计。

320亿参数加持:实力比肩甚至超越GPT-3.5Turbo

当然,光有开放的精神还不够,实力才是硬道理。OLMo232B拥有320亿参数,这是一个相当可观的数字,标志着其相比前代有了显著的规模提升。

更令人兴奋的是,在多项被广泛认可的学术基准测试中,这款开源模型竟然超越了GPT-3.5Turbo和GPT-4o mini!这无疑给开源AI社区注入了一剂强心针,证明了并非只有“财大气粗”的机构才能做出顶尖的AI模型。看来,用心打磨和巧妙训练也能实现“小马拉大车”的奇效

QQ_1742280716141.png

OLMo232B之所以能取得如此亮眼的成绩,与其精细的训练过程密不可分。整个训练过程分为两个主要阶段:预训练和中期训练。在预训练阶段,模型“啃”下了约3.9万亿tokens的庞大数据集,这些数据来源广泛,包括DCLM、Dolma、Starcoder和Proof Pile II等。这就像让模型博览群书,广泛学习各种语言模式。

而中期训练则专注于Dolmino数据集,这个包含8430亿tokens的高质量数据集,涵盖了教育、数学和学术内容,进一步提升了模型在特定领域的理解能力。这种分阶段、有侧重的训练方式,确保了OLMo232B能够拥有扎实且细致的语言功底。

“省油小能手”:更少算力跑出更高性能

除了性能卓越,OLMo232B在训练效率方面也展现出了惊人的实力。据称,它在达到与领先的开放权重模型相当的性能水平的同时,仅使用了大约三分之一的计算资源,相比之下,像Qwen2.532B这样的模型需要更多的算力。

这就像一位高效率的工匠,用更少的工具和时间,完成了同样甚至更出色的作品,充分体现了AI2在资源高效AI开发方面的投入. 这也预示着,未来可能出现更多“平民级”的强大AI模型,不再是少数巨头的专属。

OLMo232B的发布,不仅仅是一款新的AI模型,更象征着开放和可访问AI发展道路上的一个重要里程碑。通过提供一个完全开放、且性能足以媲美甚至超越部分专有模型的解决方案,AI2有力地证明了,周密的模型设计和高效的训练方法能够带来巨大的突破。这种开放性将鼓励全球的研究人员和开发者积极参与,共同推动人工智能领域的进步,最终惠及整个人类社会。

可以预见,OLMo232B的出现,将为AI研究领域带来一股清新的空气。它不仅降低了研究门槛,促进了更广泛的合作,也为我们展现了一种更具活力和创新性的AI发展路径。至于那些依然紧抱“独家秘方”的AI巨头们,或许也该考虑一下,拥抱开放,才能赢得更广阔的未来。

github:https://github.com/allenai/OLMo-core

huggingface:https://huggingface.co/allenai/OLMo-2-0325-32B-Instruct

  • 相关推荐
  • AI日报:智谱开源32B/9B系列GLM模型并启用Z.ai域名;OpenAI发布GPT-4.1系列模型;阿里魔搭上线MCP广场

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型,并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议,支持商业用途,提升了

  • Create2025百度AI开发者大会举行 文心4.5 Turbo、X1 Turbo发布

    百度在武汉举办Create2025+AI开发者大会,李彦宏强调AI应用创造价值的关键。他指出当前AI模型迭代加速,MCP成为行业标准,但开发者担忧应用快速过时。李彦宏建议开发者选对场景和基础模型,并学习调优方法。百度发布文心大模型4.5 Turbo和X1 Turbo,价格大幅下降80%和50%,性能提升且成本更低,为开发者提供更实惠高效的工具选择。

  • Create2025百度AI开发者大会上热搜 4.5Turbo、X1Turbo发布

    百度在武汉举办2025AI开发者大会,正式发布文心大模型4.5Turbo和X1Turbo两大版本。4.5Turbo在多模态处理能力上实现突破,支持文本、图像、语音跨模态交互,调用成本较前代直降80%,仅为竞品价格的40%。X1Turbo强化深度推理能力,价格较上代降50%,成本仅占竞品的25%。两款产品围绕"多模态、强推理、低成本"三大特性展开,其中4.5Turbo提升逻辑推理与代码生成效率,X1Turbo支持多步骤复杂推理和跨工具调用能力。百度此次定价策略极具竞争力,4.5Turbo成本降至行业主流水平的1/5,瞄准中小企业及个人开发者;X1Turbo虽定位高端,但成本仅为竞品1/4,主要面向科研机构、金融分析等高要求领域。

  • REDMI Turbo 4 Pro哈利波特版发布:国补后售价2379.15

    Redmi推出Turbo4Pro哈利波特联名限定版手机,16GB+512GB版本售价2799元,补贴后2379.15元。该机采用定制斜切DECO设计,融入哈利波特元素,配备6.83英寸1.5K直屏、骁龙8s Gen3处理器、5000万双摄和7550mAh电池,支持90W快充。系统内置魔法主题界面及专属壁纸、图标等。同时推出多款联名配件,包括蓝牙音箱、充电宝等,形成完整周边矩阵。此次合作延续了Redmi在IP联名领域的拓展策略。

  • REDMI Turbo 4官方首次降价:国补1529.15

    4月24日,Redmi发布Turbo 4 Pro新机,12GB+256GB版国补后1529元起。该机搭载天玑8400-Ultra芯片,跑分超180万,采用6.67英寸1.5K直屏,配备2000万前摄+5000万双后摄,内置6550mAh电池支持90W快充,45分钟充满。支持IP68防尘防水、双频GPS,运行澎湃OS 2系统。Turbo 4系列首次降价200元,性价比进一步提升。

  • REDMI Turbo 4 Pro创下2025首销纪录:全价位首销销量第一

    Redmi Turbo4 Pro创下2025年手机首销新纪录,成为全价位段销量冠军。该机型开售一小时销量即超越标准版全天表现,市场反响热烈。采用金属中框和CNC喷砂工艺,配备6.83英寸1.5K直屏,支持120Hz刷新率和3840Hz高频PWM调光。搭载骁龙8s Gen4处理器,安兔兔跑分达240万,内置7550mAh电池支持90W快充。Redmi品牌发言人王腾表示,该机成功印证了品牌在性价比市场的领先地位,其产品设计和用户体验难以被复制。

  • REDMI回应Turbo 4 Pro用金属边框有啥好吹的:2.5K档相当少见

    Redmi发布Turbo 4 Pro首期答疑,回应金属中框、反向快充等用户关注问题。针对"十年前千元机用全金属机身"的质疑,Redmi解释当时采用"天地盖"结构,金属仅作为装饰性外皮;而现代手机采用"三明治"结构,金属中框是核心承力骨架。Turbo 4 Pro采用CNC一体加工金属中框,刚性比普通中框高140%,整机抗弯折强度达700N,可承受70kg重量。Redmi指出金属中框成本是普通中框的2.5倍,在2500元档位实属罕见,强调其结构价值远超十年前的金属机身设计。

  • REDMI Turbo 4 Pro普及金属中框:让2.5K档彻底告别塑料中框!

    Redmi Turbo4 Pro于4月24日发布,外观全面升级:采用CNC喷砂工艺金属中框,质感媲美旗舰机型;航空铝合金材质使整机抗弯折能力达70kg,实测可承受70kg体重仍能正常使用。后盖升级为旗舰级柔雾玻璃,通过700nm精细打磨工艺,平滑度提升30%,呈现雾面丝绒质感。推出三款年轻配色:不白"干"、不焦"绿"、不怕"黑",对应白、绿、黑色系。王腾表示,Redmi希望以2500元档位彻底告别塑料中框手机时代。

  • REDMI Turbo 4 Pro哈利·波特版官宣4月24日发布

    Redmi宣布将于4月24日发布Turbo4 Pro哈利波特联名款手机,这是双方第三次深度合作。该机采用红蓝配色后盖,融入哈利波特系列标志性角色元素,设计充满魔法世界魅力。硬件方面搭载骁龙8s Gen3芯片、6.83英寸1.5K直屏、5000万双摄组合及7550mAh电池+90W快充,性能配置与普通版保持一致。这款定制机型通过精细工艺处理,既致敬原著又满足用户个性化需求,被粉丝誉为"最有诚意的定制版手机"。

  • 32岁男子或因急刹车致脑子漏水:头痛到难以站立

    广州32岁网约车司机阿维因急刹车导致头部剧烈前倾,后出现持续头痛症状。经诊断发现其患有罕见的"脑脊液漏",系急刹时颈椎挥鞭样损伤造成骨刺穿破硬膜所致。经对症治疗后症状消失。专家指出,急刹时头部惯性前冲可能导致颅底骨折,引发脑脊液外漏,造成头痛、头晕等症状,长期不治可能影响脑功能。提醒驾驶时务必系好安全带,进行危险运动时要佩戴头盔等防护装备。(139字)

今日大家都在搜的词: