Allen人工智能研究所推开源模型LLM OLMo 提供模型数据、训练代码等

2024-02-02 10:30 · 稿源：站长之家

站长之家（ChinaZ.com）2月2日消息:Allen人工智能研究机构在Hugging Face和GitHub上发布了首个开放语言模型OLMo，意在通过提供数据、代码、模型和评估工具的开放访问，促进人工智能领域的共同研究。

这一举措的首批模型包括7B和1B规模的变体，覆盖不同架构和训练硬件，为未来更大规模、指令调整等模型的发布奠定基础。每个模型都提供全面的训练数据、权重、代码和评估工具，并在Apache2.0许可证下发布，鼓励合作构建全球最佳的开放语言模型。

截图来自官方

为了创建强大的开放模型，A12在设计中吸取了多个开放和部分开放模型的经验教训，包括EleutherAI的Pythia Suite、MosaicML的MPT模型、TII的Falcon模型和Meta的Llama系列。

对OLMo7B型号进行的评估显示，在生成任务和阅读理解上，它在许多任务上领先于Llama2，但在一些流行的问答任务上略显落后。通过与不同模型进行比较，OLMo展现出自己的优势和劣势，成为Llama2等流行模型的有力替代品。

在技术方面，OLMo的架构遵循了最新文献的趋势，包括不使用偏差、SwiGLU激活函数、Rotary位置嵌入（RoPE）等。通过一系列实验和调整，AI2发布了OLMo的第一个版本，并鼓励阅读技术报告以深入了解模型架构和培训方法。

未来，A12计划在OLMo家族中推出不同模型尺寸、模态、数据集、安全措施和评估方法，以共同构建全球最佳的开放语言模型。

OLMo的推出标志着AI2在开放研究领域的重要一步，其框架和模型的开放性为学者和研究人员提供了广泛的研究问题，推动了人工智能领域的不断发展。通过提供权重的开放访问，并鼓励合作，Allen致力于共同构建全球最卓越的开放语言模型，助力人工智能技术的进步。

（举报）

相关推荐

关键词：

模型

我国首个政务大模型安全国家标准发布百度深度参与制定

日前，我国首个针对政务大模型的安全国家标准《政务大模型应用安全规范》（下称《规范》）正式发布。百度作为核心参编单位，凭借其在人工智能安全及政务服务领域的深厚积累，深度参与了该标准的制定工作，为政务大模型的安全选用、部署运行、护栏建设和合规落地提供了专业支持。《规范》由国家工业信息安全发展研究中心牵头，联合百度等国内领先企业共同制定�

政务大模型安全国家标准百度参编
破解海外旅游语言困境，时空壶新T1以端侧模型开启全球畅行

国庆假期临近，海外旅游热度攀升，语言沟通成为游客面临的主要障碍。网络不稳定更使依赖在线翻译工具的旅行者陷入困境。时空壶新T1翻译机通过端侧AI模型，实现无网或弱网环境下的流畅翻译，支持31种语言互译，覆盖全球98%主流旅游地。其离线翻译准确率达90%，响应迅速，并具备拍照翻译和降噪功能，有效解决机场、餐厅等嘈杂场所的沟通难题。新T1助力游客跨越语言壁垒，尽享无忧旅程，真正实现“无网也能畅行全球”。

海外旅游语言沟通翻译机
荐AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

本期AI日报聚焦多领域技术突破：阿里云推出全球首个全模态AI模型Qwen3-Omni，支持文本、图像、音频和视频统一处理；百度发布多尺寸视觉理解模型Qianfan-VL，优化企业级应用。苹果扩展Image Playground平台，引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议，推动AI支付安全创新。钉钉上线AI表格助手，支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型，性能显著提升。Kimi推出Agent会员服务，智元机器人开源全球首个通用具身智能模型GO-1，降低技术门槛促进行业创新。

AI模型全模态阿里云
荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking；阿里开源Wan-Animate模型革新AI视频生成；字节跳动发布豆包翻译模型，支持28种语言互译；华为与浙大联合推出安全大模型DeepSeek-R1-Safe；阿里云即将发布跨模态模型Qwen3-Omni；xAI推出计算成本降低98%的Grok4Fast模型；YouTube发布多项AI创作辅助功能；IBM推出轻量级文档处理模型Granite-Docling-258M；中科院发布类脑大模型SpikingBrain实现百倍速度突破；OpenAI将推出仅限Pro用户的计算密集型新功能。

AI日报美团大模型 LongCat-Flash-Thinking
推荐国内优势智驾：Momenta凭借飞轮大模型，带来极致流畅的驾驶体验

Momenta作为国内智能驾驶领域的领先者，凭借其创新的飞轮大模型技术，实现了端到端的自动驾驶解决方案。该技术将感知与规划整合，有效解决长尾问题，提升系统可靠性和稳定性。其R6飞轮大模型采用强化学习，具备持续进化能力，适应复杂路况。Momenta与宝马、奥迪等全球主流车企深度合作，方案已成功应用于广汽丰田、东风日产等车型，并在欧洲、澳大利亚等市场落地，展现出强大的全球适应性和技术优势。选择Momenta，即选择了经过验证的可靠技术和持续升级的智能驾驶体验。

智能驾驶系统技术实力 Momenta
没想到，音频大模型开源最彻底的，居然是小红书

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源33款、31款各类型大模型。这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域，而音频生成占比很小。

开源 AI社区音频生成
直击企业AI安全痛点，百度智能云发布《千帆大模型平台安全白皮书》为大模型落地护航

百度智能云千帆大模型平台4.0发布《千帆大模型平台安全白皮书》，系统阐述企业级AI安全框架。白皮书聚焦平台安全、模型安全、数据安全、内容合规等六大维度，提出覆盖全生命周期的防护方案，包括混合云部署、数据加密传输、模型防窃取及内容过滤机制，助力企业安全使用大模型技术，推动AI在合规可信环境下赋能业务创新。

大模型平台企业级安全数据安全
云栖大会智舱黑科技：全球首个全模态端侧大模型解决方案，斑马智行首发

9月24日，2025云栖大会在杭州开幕，主题为“云智一体·碳硅共生”，汇聚全球50多国2000余位嘉宾探讨AI、云计算与产业应用趋势。阿里云发布7款通义大模型，其中Qwen3-Omni作为行业首个端到端全模态AI大模型，在36项基准测试中实现22项SOTA，性能全面突破。大会聚焦多模态技术，斑马智行宣布率先接入Qwen3-Omni，并与阿里云、高通联合推出端到端全模态端侧大模型方案Auto+Omni，具备主动智能、断网可用、隐私无忧三大特点，推动汽车智能座舱从指令交互向Always-on主动服务升级。首批搭载方案车型将于2026年量产，标志着汽车智能化迈入“自主行动”新阶段。大会将持续至26日，预计更多创新技术将亮相。

云栖大会通义大模型 AI技术
“全链覆盖”“全向集成”|移动云开启大模型普惠应用新篇章

国际数据公司报告显示，2024年中国MaaS市场规模达7.1亿元，同比增长215.7%，预计2024-2029年复合增长率将达66.1%。随着AI大模型落地，企业对全生命周期工具链、开发平台及通用模型需求激增。移动云通过构建四层云智算架构，提供一站式模型服务，推动AI普惠化。平台已服务30余家央企，覆盖6大行业，未来将持续提升算力智能化水平，助力各行业轻量化拥抱AI时代。

AI大模型 MaaS市场智算服务
小度发布多模态智能摄像机，AI大模型重塑家庭看护体验

小度科技推出首款多模态智能摄像机C800，搭载800万像素4K超清摄像头，支持AI大模型技术。该产品不仅能实现高清监控，还具备智能行为识别、语音交互等功能，可自定义看护提醒。结合视觉与语音交互，支持复杂语义查询和家庭设备联动，扩展智能家居应用场景。目前产品已全网发售，年底还将推出三摄版本，持续探索AI硬件创新。

AI大模型智能硬件小度科技

今日大家都在搜的词：

热文

3 天
7天

Allen人工智能研究所推开源模型LLM OLMo 提供模型数据、训练代码等

我国首个政务大模型安全国家标准发布百度深度参与制定

破解海外旅游语言困境，时空壶新T1以端侧模型开启全球畅行

荐AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

推荐国内优势智驾：Momenta凭借飞轮大模型，带来极致流畅的驾驶体验

没想到，音频大模型开源最彻底的，居然是小红书

直击企业AI安全痛点，百度智能云发布《千帆大模型平台安全白皮书》为大模型落地护航

云栖大会智舱黑科技：全球首个全模态端侧大模型解决方案，斑马智行首发

“全链覆盖”“全向集成”|移动云开启大模型普惠应用新篇章

小度发布多模态智能摄像机，AI大模型重塑家庭看护体验

今日大家都在搜的词：

热文

AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问

雷军称没什么好犹豫的：50岁正是闯的年纪

小米非常非常缺人上热搜雷军谈小米成功秘诀

小米17标准版正式发布：售价4499元起首发第五代骁龙8至尊版

苹果回应iPhone17 Pro划痕：展示机问题将改善

雷军：小米17标准版加量不加价年度演讲时长大约2个半小时

AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布

卢伟冰：小米17全球首发骁龙8 Elite Gen5

小米汽车定制服务发布：每月限量 40 台选配金额需超10万元

全新问界M7正式上市：24小时大定破4万

华为WATCH GT 6/Pro系列手表发布售价1488元起

雷军公布小米17标准版外观：1.18mm窄边框、6.3英寸直屏

全新问界M7小订破22万：将于明晚上市公布价格

AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推

AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-

AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推

ColorOS 16将于10月15日发布 Find X9系列全球首发搭载

折叠屏iPhone细节曝光采用超薄钛合金：预计售价2000美元起

雷军演讲主题《改变》官宣：聊玄戒芯片和小米汽车背后的故事

小米平板8系列搭载11.2英寸3.2K旗舰屏

站长商机