首页 > 业界 > 关键词  > OLMo最新资讯  > 正文

AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

2024-02-02 14:37 · 稿源:站长之家

**划重点:**

1. 🚀 AI2发布了开放语言模型(OLMo),该框架旨在促进大规模语言模型的研究和实验,通过在Hugging Face和GitHub上提供训练代码、模型和评估代码来实现。

2. 🛠 OLMo的首批模型包括7B规模的四个变体和1B规模的一个模型,涵盖不同的架构、优化器和训练硬件,旨在满足多样化的研究需求。

3. 🌍 该项目的目标是建立全球最好的开放语言模型,已经启动不同规模、模态、数据集、安全措施和评估等方面的工作。

站长之家(ChinaZ.com)2月2日 消息:AI2最新发布的开放语言模型(OLMo)框架旨在推动大规模语言模型的研究和实验。通过在Hugging Face和GitHub上提供训练代码、模型和评估代码,AI2致力于让学术界和研究人员能够共同研究语言模型的科学,探索新的预训练数据子集对下游性能的影响,以及研究新的预训练方法和稳定性。

image.png

该项目的首批模型包括四个7B规模的最终变体,对应不同的架构、优化器和训练硬件,以及一个1B规模的模型,所有模型均在至少2T令牌上进行了训练。这是一个长期计划的第一步,计划继续发布更大规模的模型、经过指导调整的模型以及更多变体。

每个模型都提供完整的训练数据,包括生成训练数据的代码,以及用于分析预训练数据的AI2的Dolma和WIMBD。此外,还提供了完整的模型权重、训练代码、训练日志、以Weights & Biases日志形式呈现的训练指标,以及推理代码。每个模型的训练过程中的500多个检查点也可在HuggingFace上作为修订版本获得。

image.png

在创建强大的开放模型时,AI2从许多其他开放和部分开放的模型中吸取了经验,并将它们作为OLMo的竞争基准。该项目的技术报告提到,OLMo7B模型在诸如生成任务或阅读理解(如truthfulQA)等方面超过了Llama2,但在流行的问答任务(如MMLU或Big-bench Hard)上略显落后。

对于1B OLMo模型,使用AI2的Paloma和可在GitHub上获得的检查点进行了分析,以探讨模型在语言预测和模型规模等因素之间的关系。AI2强调Paloma的方法试图通过均匀采样各个领域,更平衡地表示使用语言模型的众多领域。

OLMo框架采用了最新文献中的许多趋势,包括不使用偏见(如PaLM中的稳定性)、PaLM和Llama使用的SwiGLU激活函数、Rotary位置嵌入(RoPE)以及GPT-NeoX-20B的BPE基础标记器的修改版本,旨在减少个人可识别信息。

该发布仅是OLMo和框架的开端,未来计划推出不同规模、模态、数据集、安全措施和评估等方面的工作。AI2鼓励使用OLMo模型,提供了简便的安装步骤和使用示例,并表示未来将推出指导调整的模型、完整的训练日志和wandb报告等功能。

博客网址:https://blog.allenai.org/olmo-open-language-model-87ccfc95f58

项目入口:https://top.aibase.com/tool/olmo

举报

  • 相关推荐
  • Lamett乐迈石晶快装秘籍!让武汉20年老宅“一键焕新”

    武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板,解决潮湿问题,提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化,厨房岛台增进家人互动。全屋原木色调营造温馨氛围,兼顾健康与美学,为五口之家打造安全舒适的生活环境。

  • 八年深耕铸就“即刻精彩”,HOLLYLAND猛玛2025秋季新品发布会前瞻

    猛玛将于2025年8月26日举办品牌战略暨秋季新品发布会,系统呈现其全球战略布局与技术成果。深耕无线音视频领域八年,猛玛致力于打造全球创作者信赖的“创作底座”,通过技术创新降低专业设备门槛,推动创作工具智能化与普惠化。发布会将首次系统阐释品牌使命“科技助力轻松表达,丰富人类精神世界”,并带来秋季重磅新品,展现对创作全流程需求的深入覆盖。

  • 全链路布局+硬核技术突破,HOLLYLAND猛玛为500万创作者打造专业级创作体验

    HOLLYLAND猛玛在内容创作行业爆发式增长背景下,专注解决创作者痛点,通过自主研发无线传输、音频处理与成像算法等技术,构建覆盖音视频采集、信号传输到成品输出的全流程生态。其产品包括极影Ultra无线图传系统、微影APP图传、专业通话系统等,实现从高端专业到消费级产品的全面布局,显著提升创作效率,降低门槛,助力全球创作者。

  • 淘宝直播请call赵露思

    今年的暑假大戏,赵露思直播告一段落。 截至目前,距离她上次公开直播已经过去了十余天,她的社交动态也基本停留在这一刻暂未更新。就在8月19日直播中,赵露思首次表态,表示“现在很愿意做网红”,这一宣言并非偶然,就在前一天,她注销了拥有3119万粉丝的微博账号,彻底切断传统明星的流量锚点。

  • 国内首款模块化四足机器人-Apollo 从“白犀”吉尼斯纪录走来,引领行业进入“定制化时代”

    国内首款模块化工业级四足机器人Apollo正式亮相。该机器人由浙江大学杭州国际科创中心研发,延续了前代“白犀”的速度优势,以模块化设计为核心突破,实现性能、场景适配与运维效率的全面革新。Apollo具备140kg负载能力、5.5小时续航,支持快速换电与多场景灵活定制,适用于高危险厂区巡检、应急救援等工业应用,推动四足机器人向定制化解决方案跨越。

  • 15天快装开业,Lamett乐迈石晶地墙品类投资模式解析

    贝壳研究院数据显示,2025年中国存量房装修市场规模将达3.34万亿元,消费者对健康环保、便捷高效的家装需求持续攀升。乐迈石晶作为全球石晶品类开创者,推出"100㎡开店、10余万投资、15天极速开业"轻资产模式,携手经销商掘金"新房整装+旧房改造"市场。其首创的石晶地板和石晶柜板技术,实现从地面材料向墙面、柜体等全屋空间应用的跨越,构建"地墙柜一体化"健康整装系统。凭借"零醛添加、防水防潮"等核心性能优势,石晶材料正加速替代传统建材。目前乐迈石晶在全球拥有10余家工厂及销售机构,业务遍及80多个国家和地区,为高端住宅及商业空间提供整体解决方案。

  • 当折叠屏遇上AI 探秘开发Samsung One UI 8的幕后故事

    三星One UI 8与Galaxy Z Fold7/Flip7同步亮相,深度融合折叠形态与AI技术,带来全新交互体验。通过与谷歌紧密合作,新系统首批预装Android 16,用户可提前体验最新功能。系统聚焦多模态AI、折叠屏优化UX及个性化设计,并强化安全防护。开发团队透露,三星与谷歌从早期规划便协同开发,实现高效多任务处理与创新功能,未来将继续深化AI生态合作。

  • AI赋能三星新一代折叠屏旗舰Galaxy Z Fold7 | Z Flip7,重塑折叠屏体验

    三星新一代折叠屏旗舰Galaxy Z Fold7和Z Flip7于2025年7月25日上市,搭载基于One UI 8系统深度优化的Galaxy AI,实现多模态智能助手与折叠形态的深度融合。通过与火山引擎、百度智能云等国内伙伴合作,打造更贴心的本地化AI体验,覆盖即时搜索、实时翻译、智能创作等功能,显著提升办公、娱乐及日常使用效率,标志着折叠屏手机正式进入“AI深度融合”新阶段。

  • 真AI更惊艳 微星推出AI电竞显示器MPG 271QR QD-OLED X50流光

    微星科技将于8月26日推出全球首款搭载AI CARE传感器的27英寸2K QD-OLED游戏显示器MPG271QR QD-OLED X50流光。该产品具备500Hz刷新率和0.03ms响应时间,集成AI人体检测功能,可自动优化显示设置并延长面板寿命。采用本地化处理的OLED Care 3.0技术确保用户隐私安全,同时通过VESA ClearMR 21000和DisplayHDR True Black 500认证,提供卓越画质。首发售价6999元,参与活动可获赠500E卡。

  • 流放之路2新赛季上线,详细steam锁国区下载体验教程

    《流放之路2》第三赛季“第三法令”将于8月29日上线,带来全新剧情探索卡鲁伊部落家园恩加玛卡努伊群岛,支持八大岛屿任意顺序挑战。新增10多个新Boss和百余种新怪物,移除“残酷难度”,角色翻滚后可进入冲刺状态,适用所有职业。宝石系统改善,可无限同类叠加和多等级升级;新增职业且职业技能全面增强。2025年8月30日至9月2日开启国际服免费畅玩活动,进度可继承�

今日大家都在搜的词: