AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

2024-02-02 14:37 · 稿源：站长之家

**划重点:**
1. 🚀 AI2发布了开放语言模型（OLMo），该框架旨在促进大规模语言模型的研究和实验，通过在Hugging Face和GitHub上提供训练代码、模型和评估代码来实现。
2. 🛠 OLMo的首批模型包括7B规模的四个变体和1B规模的一个模型，涵盖不同的架构、优化器和训练硬件，旨在满足多样化的研究需求。
3. 🌍 该项目的目标是建立全球最好的开放语言模型，已经启动不同规模、模态、数据集、安全措施和评估等方面的工作。

站长之家（ChinaZ.com）2月2日消息:AI2最新发布的开放语言模型（OLMo）框架旨在推动大规模语言模型的研究和实验。通过在Hugging Face和GitHub上提供训练代码、模型和评估代码，AI2致力于让学术界和研究人员能够共同研究语言模型的科学，探索新的预训练数据子集对下游性能的影响，以及研究新的预训练方法和稳定性。

该项目的首批模型包括四个7B规模的最终变体，对应不同的架构、优化器和训练硬件，以及一个1B规模的模型，所有模型均在至少2T令牌上进行了训练。这是一个长期计划的第一步，计划继续发布更大规模的模型、经过指导调整的模型以及更多变体。

每个模型都提供完整的训练数据，包括生成训练数据的代码，以及用于分析预训练数据的AI2的Dolma和WIMBD。此外，还提供了完整的模型权重、训练代码、训练日志、以Weights & Biases日志形式呈现的训练指标，以及推理代码。每个模型的训练过程中的500多个检查点也可在HuggingFace上作为修订版本获得。

在创建强大的开放模型时，AI2从许多其他开放和部分开放的模型中吸取了经验，并将它们作为OLMo的竞争基准。该项目的技术报告提到，OLMo7B模型在诸如生成任务或阅读理解（如truthfulQA）等方面超过了Llama2，但在流行的问答任务(如MMLU或Big-bench Hard)上略显落后。

对于1B OLMo模型，使用AI2的Paloma和可在GitHub上获得的检查点进行了分析，以探讨模型在语言预测和模型规模等因素之间的关系。AI2强调Paloma的方法试图通过均匀采样各个领域，更平衡地表示使用语言模型的众多领域。

OLMo框架采用了最新文献中的许多趋势，包括不使用偏见（如PaLM中的稳定性）、PaLM和Llama使用的SwiGLU激活函数、Rotary位置嵌入(RoPE)以及GPT-NeoX-20B的BPE基础标记器的修改版本，旨在减少个人可识别信息。

该发布仅是OLMo和框架的开端，未来计划推出不同规模、模态、数据集、安全措施和评估等方面的工作。AI2鼓励使用OLMo模型，提供了简便的安装步骤和使用示例，并表示未来将推出指导调整的模型、完整的训练日志和wandb报告等功能。

博客网址:https://blog.allenai.org/olmo-open-language-model-87ccfc95f58

项目入口：https://top.aibase.com/tool/olmo

（举报）

相关推荐

关键词：

荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

本文介绍了AI领域多项重要进展：1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen，显著提升建模效率；2)阿里发布多模态大模型HumanOmniV2，准确率达69.33%；3)钉钉AI表格实现1小时处理千项任务；4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级；5)微软推出Deep Research智能体，自动化研究流程；6)香港理工与OPPO联合开源视频超清框架DLoRAL；7)谷歌开源MCP工具箱简化AI与数据库集成；8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。
苹果自研AI模型难产：改用第三方大语言模型

苹果可能会跟OpenAI或Anthropic合作，双方正在谈判讨论一项潜在交易，苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。据悉，OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型，苹果也在进行测试，目前苹果发现Anthropic的AI模型最适合Siri，且与Anthropic初步讨论了一些财务条款，消息称Anthropic要求苹果每年支付数十亿美元的费用，且该费用会随时间�

苹果 Siri OpenAI
Lamett乐迈石晶发布2025新品，中国全屋整装迎来“石晶时代”

乐迈石晶在第27届中国建博会(广州)推出"全屋石晶整装解决方案"，以"要健康·要安全·要石晶"为主题，通过零醛添加、防水防潮、防蛀防霉等八大性能优势重新定义整装标准。该方案采用天然石灰岩和树脂晶体为原料，通过高温高压工艺实现零甲醛释放，适用于全屋空间。乐迈石晶已建立全球研发中心，拥有多项核心专利技术，业务覆盖80多个国家和地区。此次创新不仅推动建材升级，更引领健康人居新趋势，为消费者打造安全舒适的家居环境。
荐AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

本文介绍了AI日报栏目及近期AI领域多项突破性进展：1)智谱推出免费AI Slides工具，基于GLM模型快速生成高质量PPT；2)可灵AI发布可图2.1模型，支持180多种风格图像生成；3)NVIDIA推出DiffusionRenderer技术，实现视频到可编辑3D场景转换；4)墨刀AI新增30秒生成高保真原型功能；5)Higgsfield推出Soul ID工具，10张照片即可生成虚拟形象；6)谷歌DeepMind开源GenAI Processors工具库；7)谷歌Veo新增图像转视频功能；8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。
阳光新能源iSolarSim 2.0仿真软件：搭载AI智能体，开启对话式仿真！

阳光新能源在2025SNEC展会上发布iSolarSim光伏发电仿真软件2.0版本，该软件搭载AI技术实现三大突破：1）首创"实景仿真双引擎"，通过"精准实景+深度实景"双模式，将仿真精度提升2.5%；2）集成行业首个AI智能体，支持对话式仿真操作，计算效率提升90%；3）实现万级方案秒级寻优，3分钟完成万组设计方案仿真，效率提升千倍。软件覆盖地面电站、工商业及家庭光伏�

光伏电站发电仿真 AI技术
HKIT携手WALLX推出创新区块链奖励模型，引领心理治疗与AI技术融合新趋势

香港智能有限公司(HKIT)与WALLX公司合作，将AI技术与心理治疗相结合，开发出基于区块链的奖励和参与模式。该创新系统能精准评估用户心理状态并提供个性化治疗方案，同时利用区块链确保数据安全。双方还推出奖励机制，用户参与心理课程或贡献数据可获得，用于兑换咨询服务或健康产品。这一模式获得市场广泛关注，多家机构表达合作意向，被视为心理健康服�

心理治疗 AI技术区块链
三星Galaxy Z Fold7丨Flip7发布，打造折叠屏AI新范式

2025年7月9日，三星电子发布新一代折叠屏旗舰Galaxy Z Fold7和Galaxy Z Flip7，以及Galaxy Watch8系列智能手表。Fold7采用纤薄设计，展开厚度仅4.2毫米，搭载定制处理器和2亿像素广角镜头，AI功能支持实时翻译和生成式编辑。Flip7配备超大外屏，重量188克，电池容量为系列最大。Watch8系列采用"天圆地方"设计，集成度提升30%，配备BioActive传感器。新品7月9日开启预约，7月25日正式发售，预约用户可享存储升级等优惠。
6.3万起三星Galaxy Z Fold7/Flip7限量版发布：灵感来自Labubu 只有8台

日前，奢侈品牌厂商Caviar推出Cabubu系列定制版三星Galaxy Z Fold7、三星Galaxy Z Flip7。其中，三星Galaxy Z Fold7Cabubu版售价8910美元起（约合6.3万元人民币）、三星Galaxy Z Fold7Cabubu版起售价10340美元(约合7.4万元人民币)。
最新AI模型哪里看？查找最佳AI模型平台推荐

文章介绍了AI领域快速迭代背景下，开发者如何高效追踪最新模型动态。主要渠道包括：1）官方渠道（GitHub、公司官网/博客）；2）科技媒体和社区（Twitter、Reddit等）；3）专业聚合平台（推荐AIbase模型广场）。重点推荐AIbase平台，其优势在于：实时更新全球最新模型、结构化展示关键信息、支持多维筛选排序、直达相关资源链接。建议开发者善用官方渠道获取源头信息，同时�

最新AI模型模型发布研究动态
最强续航小折叠！荣耀Magic V Flip2首曝：5500mAh媲美直板

据博主数码闲聊站爆料，荣耀Magic V Flip2暂定8月发布，是今年电池最大的小折叠，最高实现5500mAh容量，最高80W快充。产品形态上基本还是维持前代方案，采用6.8英寸的LTPO主屏幕，副屏依然是4英寸超大方案，同样支持LTPO高刷。

荣耀Magic V Flip2

热文

3 天
7天

AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

苹果自研AI模型难产：改用第三方大语言模型

Lamett乐迈石晶发布2025新品，中国全屋整装迎来“石晶时代”

荐AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

阳光新能源iSolarSim 2.0仿真软件：搭载AI智能体，开启对话式仿真！

HKIT携手WALLX推出创新区块链奖励模型，引领心理治疗与AI技术融合新趋势

三星Galaxy Z Fold7丨Flip7发布，打造折叠屏AI新范式

6.3万起三星Galaxy Z Fold7/Flip7限量版发布：灵感来自Labubu 只有8台

最新AI模型哪里看？查找最佳AI模型平台推荐

最强续航小折叠！荣耀Magic V Flip2首曝：5500mAh媲美直板

热文

尾号“8个7”手机号拍出320万元溢价率高达146%

王化在小米履职10年雷军：谢谢这十年辛苦的工作和贡献

淘宝闪购：日订单量再次突破8000万创新高

腾讯客服回应误删微信聊天记录可撤销：苹果iOS机型已支持

A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0

黄仁勋与雷军合影上热搜一旁小米SU7 Ultra见证科技双雄会

尾号“8个7”手机号拍出320万元溢价率高达146%

AI日报：xAI 震撼发布Grok4；微软开源全新Phi-4-mini版本；上海

AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模

小米回应AI眼镜没有屏显功能：专注拍摄、AI语音交互

王化在小米履职10年雷军：谢谢这十年辛苦的工作和贡献

比特币首触112000美元：盘中涨幅最高达3%

微信：持续打击非法使用外挂行为进一步强化外挂营销信息治理

OPPO K13 Turbo系列官宣将于7月21日发布内置散热风扇

周杰伦发布第一条抖音视频：回顾成长史粉丝超1200万

荣耀X70支持IP66/IP68/IP69/IP69K 号称行业最高规格防水

站长商机