首页 > AI头条  > 正文

32B参数的“逆袭”!OLMo 2 32B横空出世,叫板GPT-3.5 Turbo

2025-03-18 14:53 · 来源: AIbase基地

近日,艾伦人工智能研究所(AI2)重磅发布了其最新的大型语言模型——OLMo232B。这款模型一经亮相便自带光环,因为它不仅是OLMo2系列的最新力作,更以“完全开放”的姿态,向那些高墙深垒的专有模型发起了强有力的挑战。

OLMo232B最引人注目的特点莫过于其彻彻底底的开源属性。AI2大方地公开了这款模型的所有数据、代码、权重以及详细的训练过程. 这种“坦诚相见”的做法,与一些讳莫如深的闭源模型形成了鲜明对比。

AI2希望通过这种开放协作的方式,促进更广泛的研究和创新,让全球的研究人员都能站在OLMo232B的肩膀上继续前行。毕竟,在一个知识共享的时代,藏着掖着可不是长久之计。

320亿参数加持:实力比肩甚至超越GPT-3.5Turbo

当然,光有开放的精神还不够,实力才是硬道理。OLMo232B拥有320亿参数,这是一个相当可观的数字,标志着其相比前代有了显著的规模提升。

更令人兴奋的是,在多项被广泛认可的学术基准测试中,这款开源模型竟然超越了GPT-3.5Turbo和GPT-4o mini!这无疑给开源AI社区注入了一剂强心针,证明了并非只有“财大气粗”的机构才能做出顶尖的AI模型。看来,用心打磨和巧妙训练也能实现“小马拉大车”的奇效

QQ_1742280716141.png

OLMo232B之所以能取得如此亮眼的成绩,与其精细的训练过程密不可分。整个训练过程分为两个主要阶段:预训练和中期训练。在预训练阶段,模型“啃”下了约3.9万亿tokens的庞大数据集,这些数据来源广泛,包括DCLM、Dolma、Starcoder和Proof Pile II等。这就像让模型博览群书,广泛学习各种语言模式。

而中期训练则专注于Dolmino数据集,这个包含8430亿tokens的高质量数据集,涵盖了教育、数学和学术内容,进一步提升了模型在特定领域的理解能力。这种分阶段、有侧重的训练方式,确保了OLMo232B能够拥有扎实且细致的语言功底。

“省油小能手”:更少算力跑出更高性能

除了性能卓越,OLMo232B在训练效率方面也展现出了惊人的实力。据称,它在达到与领先的开放权重模型相当的性能水平的同时,仅使用了大约三分之一的计算资源,相比之下,像Qwen2.532B这样的模型需要更多的算力。

这就像一位高效率的工匠,用更少的工具和时间,完成了同样甚至更出色的作品,充分体现了AI2在资源高效AI开发方面的投入. 这也预示着,未来可能出现更多“平民级”的强大AI模型,不再是少数巨头的专属。

OLMo232B的发布,不仅仅是一款新的AI模型,更象征着开放和可访问AI发展道路上的一个重要里程碑。通过提供一个完全开放、且性能足以媲美甚至超越部分专有模型的解决方案,AI2有力地证明了,周密的模型设计和高效的训练方法能够带来巨大的突破。这种开放性将鼓励全球的研究人员和开发者积极参与,共同推动人工智能领域的进步,最终惠及整个人类社会。

可以预见,OLMo232B的出现,将为AI研究领域带来一股清新的空气。它不仅降低了研究门槛,促进了更广泛的合作,也为我们展现了一种更具活力和创新性的AI发展路径。至于那些依然紧抱“独家秘方”的AI巨头们,或许也该考虑一下,拥抱开放,才能赢得更广阔的未来。

github:https://github.com/allenai/OLMo-core

huggingface:https://huggingface.co/allenai/OLMo-2-0325-32B-Instruct

  • 相关推荐
  • AI日报:智谱开源32B/9B系列GLM模型并启用Z.ai域名;OpenAI发布GPT-4.1系列模型;阿里魔搭上线MCP广场

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型,并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议,支持商业用途,提升了

  • 苹果官网上架USB-C转3.5毫米音频线:329元

    今天,苹果官网上架USB-C转3.5毫米音频线,售价是329元。这款双向音频线可搭配3.5毫米音频输出和音频输入插孔使用。使用这根连接线,既可将你的AirPodsMax或BeatsStudioPro头戴式耳机连接至3.5毫米接口规格的音频源,也可将你的iPhone或iPad连接至拥有3.5毫米音频插孔的扬声器。

  • 英伟达开源15T数据集:32万个机器人训练轨迹

    全球AI领导者英伟达开源了,用于实体机器人和自动化驾驶的超大训练数据合集——NVIDIAPhysicalAIDataset。这个数据集一共15T,涵盖了超过320,000个机器人训练轨迹,以及多达1,000个通用场景描述包括一个SimReady集合。英伟达表示,未来将继续扩展PhysicalAIDataset,将其建设成世界最大、统一的开源数据集,可用于AI模型、医疗、自动化驾驶等不同领域,加速AI、实体机器人的训练效�

  • REDMI Turbo 4 Pro哈利·波特版官宣4月24日发布

    Redmi宣布将于4月24日发布Turbo4 Pro哈利波特联名款手机,这是双方第三次深度合作。该机采用红蓝配色后盖,融入哈利波特系列标志性角色元素,设计充满魔法世界魅力。硬件方面搭载骁龙8s Gen3芯片、6.83英寸1.5K直屏、5000万双摄组合及7550mAh电池+90W快充,性能配置与普通版保持一致。这款定制机型通过精细工艺处理,既致敬原著又满足用户个性化需求,被粉丝誉为"最有诚意的定制版手机"。

  • AI日报:阿里新模型Qwen3即将来袭;GitHub开源MCP服务器;Runway发布Gen-4 Turbo

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Qwen3即将来袭:阿里云新模型相关支持已正式合并至vLLM代码库阿里云的Qwen3模型即将发布,标志着其在AI领域的又一重要进展。新推出的AI听歌报告能够精准识别用户音乐偏好,场景

  • iQOO Z10 Turbo系列官宣将于4月28日发布

    iQOO正式发布全新Z10 Turbo系列手机,包含标准版与Pro版,搭载天玑8400处理器,Pro版配备第四代骁龙8S芯片。新机在性能、续航及设计上均有显著提升,尤其标准版预计采用满血版8400处理器,带来更强体验。该系列通过vivo蓝绿合作与ARM深度协作,实现性能极致释放,在屏幕体验与稳定性上表现更加优异,适合日常使用或大型游戏,同时延续家族“万窗”设计理念。

  • REDMI Turbo 4 Pro官宣下周发布:同档无敌

    快科技4月18日消息,王腾刚刚正式宣布,REDMI Turbo4Pro将于下周发布。他还介绍,K80系列全面升档以后,产品力横扫同档,而Turbo4Pro是全面进阶的产品,预计将替代原本K80的位置。王腾强调,Pro,代表着更高规格、更高标准、更强体验,我们的目标就是打造一款同档无敌的全面Pro”准旗舰。REDMI Turbo4Pro将实现性能、质感、续航大幅跃升。性能方面,REDMI Turbo4Pro将行业首发搭载高�

  • 连续5个月超3万!小鹏汽车3月交付量33205辆 同比大增268%

    快科技4月1日消息,小鹏汽车在港交所公告,2025年3月,小鹏汽车共交付智能电动汽车33205辆,同比增长268%。至此,小鹏汽车已连续第五个月交付量超过了3万辆。2025年1-3月,小鹏汽车累计交付新车94008台,同比增长331%,环比增长2.7%,超过Q1交付指引上限,再创单季度交付历史新高!3月,小鹏汽车推出2025款G6与G9车型,两款车型上市即热销。其中2025款小鹏G6上市7分钟,大定突破5

  • 海尔油烟机要挑战632米烟管,事关用户

    一场关乎中国家庭厨房健康的极限挑战,即将于 4 月 16 日在莱阳海尔厨电互联工厂内上演,海尔全自动油烟机将正式挑战 632 米长的排烟管。如果挑战成功,则代表着又一项吉尼斯世界纪录诞生,那些事关高层住宅用户的厨房油烟难题也将被彻底终结。 用AI科技破局高层住宅厨房油烟难题 随着城市化进程加速,高层住宅成为主流,当城市天际线不断向上生长,厨房里的油烟却

  • 被吹爆的GPT-4o真有那么强?这有23个案例实测

    距离OpenAI正式发布GPT-4o生图功能,已经过去两周多了。这段时间里,“ChatGPT-4o颠覆了AI图像生成的逻辑”这句话大家应该都听腻了。现在早上一睁眼,先看有没有更新,看看自己有没有落后。

今日大家都在搜的词: