首页 > AI头条  > 正文

​艾伦人工智能研究所推出 Molmo 2 开源视频语言模型

2025-12-17 09:53 · 来源: AIbase基地

近日,艾伦人工智能研究所(Ai2)发布了全新的 Molmo2开源视频语言模型。这一系列新模型和相关训练数据展示了该非营利机构在开源领域的坚定承诺,特别是在企业希望掌控模型使用的背景下,这无疑是一项重大利好。

image.png

Molmo2包含几种不同的模型版本,包括基于阿里巴巴 Qwen3语言模型的 Molmo2-4B 和 Molmo2-8B,此外还有基于 Ai2Olmo 语言模型的完全开源版本 Molmo2-O-7B。除了模型,Ai2还推出了九个新的数据集,这些数据集包括多图像和视频输入的长格式质量保证数据集,以及一个开放的视频指向和跟踪数据集。

Molmo2的一个显著特点是其增强的功能。根据 Ai2的介绍,Molmo2-O-7B 是一个透明模型,允许用户进行端到端的研究和定制。这意味着用户可以全面访问视觉语言模型及其语言学习模型(LLM),从而能够更灵活地调整模型以满足特定需求。

Molmo2模型支持用户提问关于图像或视频的问题,并能够基于视频中识别的模式进行推理。Ai2的感知推理和交互研究主管 Ranjay Krishna 表示,这些模型不仅能给出答案,还能够在时间和空间上明确指出某些事件发生的时刻。此外,Molmo2还具备生成描述性字幕、追踪物体数量以及检测长视频序列中的罕见事件等能力。

用户可以在 Hugging Face 和 Ai2Playground 上使用 Molmo2,后者是 Ai2提供的平台,用户可以体验各种工具和模型。该发布彰显了 Ai2对开源的坚持,分析师 Bradley Shimmin 指出,发布与模型相关的数据和权重对于企业至关重要,尤其是在重视数据主权的背景下。

Molmo 系列的模型参数相对较小(40亿或80亿个参数),这对于很多企业来说更加经济实惠。Shimmin 强调,企业逐渐意识到,模型的大小并不是唯一的关键,训练数据的透明度和负责性同样重要。

项目:https://allenai.org/blog/molmo2

划重点:

1. 🚀 Ai2发布 Molmo2系列开源视频语言模型,增强了企业对模型使用的掌控。

2. 🎥 新模型支持多图像和视频输入,能够进行事件推理和生成描述性字幕。

3. 📊 Ai2坚持开源承诺,强调数据透明度和模型定制化的重要性。

  • 相关推荐
  • 宜信唐宁乌镇倡议:设首席AI官让人工智能更有温度

    在2025年世界互联网大会乌镇峰会上,宜信公司CEO唐宁前瞻性地呼吁企业设立“首席AI官”,以此推动人工智能从冰冷的效率工具,演进为富有人文温度的协同伙伴。这一主张不仅呼应了峰会“共筑开放合作、安全普惠的数智未来”的主题,更为AI的发展路径注入了“暖心”与“共情”的关键维度,描绘出一幅人机深度协作、效率与温度并重的新图景。在乌镇峰会“前沿人工智能

  • 百惠金控:人工智能概念股活跃 政策与资本双动力带动行业升温

    百惠金控指出,近期人工智能及人形机器人概念股在香港市场表现持续活跃,市场气氛明显升温。受行业发展红利驱动,包括香港及亚洲科技板块在内的多地市场相关板块均出现正面反应。在港上市的相关企业如MINIMAX-WP、优必选、三花智控及金山云等股价纷纷上扬,反映资本市场正重新评估人工智能大模型及机器人产业的成长空间与潜在商业价值。此外,新上市的诺比人工智能科技首日股价飙升超300%,进一步印证市场对优质AI标的的热烈追捧。政策层面,中国及香港政府均推出多项支持措施,构建从上游核心零部件到下游应用场景的完整政策生态。百惠金控亦积极参与推动行业发展,并在资本市场扮演关键角色,曾协助“人形机器人第一股”优必选在港交所上市。展望未来,香港市场凭借“一国两制”优势、国际金融中心地位与科创生态完善,有望成为汇聚全球资本、技术与企业的区域科创枢纽。

  • 深耕AI+教育!简知科技入选2025广州市“人工智能+教育”典型案例及“人工智能+”百家案例精选荟

    2025年12月24日,广州举办人工智能算力应用及产业发展联盟年度峰会。简知科技凭借其在“人工智能+教育”领域的实践成果,成功入选2025年广州市“人工智能+教育”典型案例及“人工智能+”百家案例精选。这体现了政府和行业对其推动AI与教育场景融合、建设智能教育服务生态贡献的肯定。其核心自研的“简智AI大模型”已通过国家生成式人工智能服务备案,为教学流程管理、知识体系构建与个性化学习等关键环节提供技术支撑。公司将持续深化AI与教育全场景的融合应用,助力建设更加智能化、个性化的终身学习体系。

  • 2026高交会人工智能产业链展、机器人产业链展招商正式启动

    第二十八届中国国际高新技术成果交易会(高交会)将于2026年11月26日至28日在深圳举办。本届高交会首次以“双馆并行、各自成链”方式,独立呈现人工智能与机器人两大产业板块,标志AI正从“赋能角色”走向“产业主角”,机器人则迈入以具身智能为核心的系统化发展新阶段。展会旨在全面呈现新一代智能技术对产业体系与社会形态的深刻重塑,打造从算法、算力、数据到载体、场景的完整产业闭环,成为全球最具前瞻性的智能科技展示高地。

  • 搭载人工智能,数字王国深化全面转型

    数字王国集团发布HANBAO.AI一站式影像创作平台,旨在推动人工智能在文娱和科创领域的场景化应用。该平台聚合AI大模型,提供覆盖文本、图像和音频的集成工具库,赋能创作者高效输出高阶影像。数字王国围绕新工艺、新模态、新场景、新赋能持续探索,并联合十余家标杆企业构建“人工智能+”战略联盟,加速技术迭代与创意提炼在关联产业的部署与运作。

  • 即构推出AI音视频能力矩阵 助力应用突围增长

    如今,移动应用市场竞争进入了存量博弈新阶段,应用内的新玩法复制成本低,单靠独创模式难以吸引用户留存。Sensor Tower数据显示,全球应用商店双寡头垄断格局稳固,头部应用占据超60%用户时长,中小应用突围愈发艰难。行业增长逻辑已转向内容质量与优质体验,音视频质量低下可能导致用户留存与转化显著下滑。尤其是在直播语聊、网课、电商、音视频创作工具等高频�

  • 从“看家”到“懂家”:海雀大模型摄像头,重塑家庭主动智能新范式

    1月8日至11日,海雀科技在阿里云通义千问智能硬件展上发布搭载AI大模型的海雀摄像头。该产品不仅是家用智能摄像头首次在设备端直接使用大模型,更标志着摄像头从被动记录工具向主动服务的AI伙伴转变。海雀摄像头能看、会听、会思考、会执行指令,深入家庭场景,为育儿家庭提供“全能陪聊搭子”与“安心守护者”,为有老人的家庭提供“可对话的养生助手”,并成为所有家庭的“智能管家”。通过千万用户数据,海雀精准切入需求,以“主动智能”引领行业,为AI硬件赛道提供了从技术堆砌到场景融合的参考范本。

  • AI日报:电信开源MoE大模型TeleChat3;微信推出AI小程序成长计划;谷歌测试Nano Banana2Flash 图像模型

    本期AI日报聚焦行业动态与产品更新。微信推出AI小程序成长计划,提供免费资源助力开发者。中国电信开源千亿参数MoE大模型TeleChat-3,实现国产算力训练。谷歌测试新图像模型Nano Banana2Flash,主打高性价比。马斯克宣布Grok新版上线,全球用户突破3000万。ChatGPT全面接入主流App,可一键订酒店、点外卖等。此外,高德打车上线“AI服务卫士”提升安全,AI助手“ima”新增PPT生成功能,Plaud推出AI录音笔,智元与MiniMax合作定制个性化机器人语音。

  • 昇思人工智能框架峰会 | MindSpore Lite混合精度推理,实现内存节省30%,助力鸿蒙翻译模型轻量化部署

    昇思MindSpore开源社区将于2025年12月25日在杭州举办昇思人工智能框架峰会。届时,MindSpore Lite团队将分享基于MindSpore Lite的端侧AI推理优化技术实践,重点介绍CPU混合精度推理方案在鸿蒙翻译模型部署中的应用。该方案通过混合精度子图调度、IO免拷贝等关键技术,将鸿蒙内置翻译模型的推理内存优化至66MB,相比原始100MB以上显著降低,支持模型在鸿蒙6.0上线部署。文章还详细阐述了MindSpore Lite的模型转换流程、推理API及性能验证方法,展示了其在降低内存、提升性能方面的优势,为开源模型的商用部署提供技术保障。

  • 罗福莉回应AI天才少女标签:只是一个普通的研究者

    近日,北京大学更新了一期北大校友、小米MiMo大模型负责人罗福莉的最新访谈视频。视频中,罗福莉针对外界贴在她身上的“AI天才少女”标签作出回应。她坦言,为了获取关注度和注意力,人们往往会给某部分人打上刻板且具讨论话题性的标签,但她很快便不将其放在心上,认为自己只是一名普通平凡的研究者。

今日大家都在搜的词: