Genmo发布开源视频生成模型Mochi1：媲美Runway、可灵，用户可免费用

2024-10-23 10:47 · 来源： AIbase基地

最近，AI 视频公司 Genmo 宣布推出 Mochi1，这是一个全新的开源视频生成模型，用户可以通过文本提示生成高质量的视频。Mochi1的表现被认为与当前市场上领先的闭源竞争对手如 Runway、Luma AI 的 Dream Machine、快手的可灵、Minimax 的 Hailuo 等等相媲美，甚至更优。

该模型在 Apache2.0许可证下开放，用户无需支付费用就能享受到尖端的视频生成技术，而其他竞争产品的收费标准则从有限的免费计划到每月高达94.99美元不等。

用户可以在 Hugging Face 上免费下载 Mochi1的模型权重和代码，不过，想要在个人设备上运行这个模型，至少需要四块 Nvidia H100GPU。为了让用户体验 Mochi1的功能，Genmo 还提供了一个在线的试玩平台，让大家可以亲自尝试这项新技术。

Mochi1生成的视频效果案例：

根据 Genmo 的说法，Mochi1擅长遵循详细的用户说明，允许对生成视频中的字符、设置和操作进行精确控制。Genmo 已经声称，在内部测试中，Mochi1在快速粘附和运动质量方面击败了大多数其他视频 AI 模型，包括专有的竞争对手 Runway 和 Luna。

Mochi1在视频生成领域取得了显著的进展，包括高保真运动表现和精准的提示遵循能力。Genmo 的 CEO Paras Jain 表示，他们的目标是缩小开放源代码和闭源视频生成模型之间的差距。他强调，视频是最重要的交流形式，因此他们希望将这项技术推广给更多的人。

与此同时，Genmo 还宣布完成了2840万美元的 A 轮融资，投资者包括 NEA 和多家风险投资公司。Jain 指出，视频生成不仅仅是娱乐或内容创作，还是未来机器人和自主系统的重要工具。

Mochi1的架构基于 Genmo 独创的非对称扩散变换器（AsymmDiT），这是迄今为止发布的最大开源视频生成模型，参数高达100亿。这个模型专注于视觉推理，使其在处理视频数据方面更具优势。

Mochi1生成的视频效果案例:

尽管 Mochi1已经展现出强大的功能，但目前仍有一些局限性，比如目前支持的分辨率为480p，且在复杂运动场景中可能会出现轻微的视觉失真。Genmo 计划在年内推出支持720p 分辨率的 Mochi1HD 版本，以提升用户体验。

试玩入口:https://www.genmo.ai/play

模型下载:https://huggingface.co/genmo/mochi-1-preview

划重点:
🌟 Mochi1是 Genmo 推出的开源视频生成模型，用户可免费使用，性能媲美多款闭源产品。
💰 Genmo 完成了2840万美元的 A 轮融资，旨在推动 AI 视频技术的民主化。
🎥 未来将推出 Mochi1HD 版本，解决当前480p 分辨率和复杂运动场景中的一些局限。

相关推荐

荐AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm1；MiniMax Speech 2.5语音生成模型上线

AI日报栏目聚焦人工智能领域最新动态：1)阿里发布Qwen3-4B轻量级模型，手机端可运行；2)小红书开源多模态大模型dots.vlm1，在图表推理方面表现突出；3)MiniMax推出语音生成模型Speech2.5，多语种表现提升；4)Midjourney推出HD视频模式，提升专业影像质量；5)Cursor1.4版本增强异步任务处理能力；6)谷歌否认AI搜索影响网站流量，但数据显示用户行为改变；7)MiniCPM-V4.0开源发布，号称"手机上的GPT-4V"；8)AMD与高通宣布支持OpenAI的gpt-oss系列模型；9)腾讯开源WeKnora文档智能解析工具；11)疑似GPT-5信息在GitHub泄露；12)FlowSpeech实现书面语转口语的TTS技术突破。
奥特曼发布免费用GPT-5！基准图错误遭全网吐槽马斯克也拆台了

当地时间8月7日，OpenAI 推出全新人工智能模型 GPT-5。据悉，GPT-5是OpenAI的首个统一”人工智能模型，它融合了o系列模型的推理能力以及GPT系列快速响应的优势。借助GPT-5，ChatGPT能够代表用户完成多种任务，例如生成软件应用、管理用户日程或创建研究简报。并且，GPT-5将作为默认模型向所有ChatGPT免费用户开放，用户也能借此体验深度推理功能。不过，据媒体机器之心Pro”
昇腾算力赋能视频生成革命浙江大学团队攻克长时一致性难题

浙江大学朱凌霄团队基于昇腾AI平台，研发出首个无需训练的长序列视觉指令生成框架LIGER，解决了视频生成领域长期存在的时序一致性难题。该技术通过历史提示和视觉记忆机制保持内容连贯性，并采用基于DDIM反演的记忆校准技术提升准确性。团队还提出引导式渐进蒸馏方法，在保持视频质量基础上实现8倍加速。研究成果入选ICLR2025，构建了包含569个任务的评估数据集。未来将深化多模态生成技术研究，构建自主创新的技术生态体系。

视频生成长视频生成计算资源优化
谷歌DeepMind发布Genie 3世界模型：支持实时生成交互式3D环境

据媒体报道，谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。该模型能够根据用户的文本提示，快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界，更创新性地引入了可提示世界事件” 功能。用户通过简单文本指令，即可实时修改虚拟环境，显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能（AGI）的�
荐AI日报：火山引擎发布豆包3.0；通义开源Qwen3非思考模型；谷歌偷偷升级Imagen 4

【AI日报】栏目聚焦人工智能领域最新动态：1)火山引擎发布豆包系列AI模型升级，包括图像编辑3.0、同声传译2.0等；2)通义千问开源Qwen3-30B模型，支持多语言处理；3)OpenAI推出ChatGPT Study学习助手；4)中国发布HYPIR图像复原大模型；5)谷歌NotebookLM新增视频概览功能；6)谷歌Imagen4图像生成模型升级，性能媲美GPT-4o；7)昆仑万维开源多模态模型Skywork UniPic；8)理想汽车发布首搭VLA大模型的i8纯电SUV；9)谷歌在英国推出AI搜索模式；10)OWL团队开源多智能体协作工具；11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

人工智能图像编辑同声传译
首款自研玄戒T1手表！REDMI Watch 5手表微信内测招募

小米官方账号@玩转小米澎湃OS 发布了REDMI Watch 5内测特邀用户招募”。据介绍，此次招募主要为了测试表端微信应用，可以实现手表端就能轻松回复消息，无需频繁拿出手机。简洁界面适配手表屏幕，操作简单直观，支持在手表上回复文字、表情。报名时间：2025年8月8日-8月10日体验时间：2025年8月11日-8月15日
钛动首战WAIC：用全球营销AI Agent重构出海底层逻辑

2025世界人工智能大会(WAIC)在上海开幕，全球AI领域目光聚焦于此。钜动科技首次亮相大会，发布全球首个营销AI+Agent——Navos，覆盖营销全链路多个环节，助力企业出海营销效率提升。Navos通过多角色Agent协同，实现从洞察到优化的全流程智能化，并整合行业大数据提供精准决策。同时展出的智能创意营销工具Tec-Creative2.0，运用AIGC技术快速生成爆款营销素材。钜动科技CEO李述昊表示，AI正打破文化差异和效率瓶颈，推动营销从"经验驱动"迈向"智能决策"新时代。

人工智能大会 AI技术创新全球营销AI
阿里开源通义万相2.2：可生成电影级高清视频

阿里云宣布旗下通义万相2.2模型正式开源。通义万相2.2最令人瞩目的，当属其生成电影级高清视频的能力。目前，该模型单次便可生成5秒的高清视频。这5秒视频绝非普通水准。在光影、色彩、构图以及人物微表情等细节处理上，通义万相2.2达到了专业电影制作的水平。此次开源，通义万相2.2推出了文生视频（Wan2.2-T2V-A14B）、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-

阿里云通义万相高清视频
调动不同AI大模型费用怎么算?AI模型费用计算神器算清每一分投入!

本文探讨了企业在调用不同AI大模型时的费用计算问题。随着GPT-4、Claude、文心一言等模型广泛应用，各厂商的计费规则差异显著：有的按Token收费，有的按调用次数，还有地区定价差异。相同任务在不同模型上的成本可能相差10倍。文章推荐使用AIbase费用计算器（https://model.aibase.com/zh/calculator），该工具覆盖主流模型，支持自定义参数，能快速对比不同模型的调用成本，帮助企业实现精准预算控制，选择最具性价比的AI服务方案。

AI大模型费用计算隐性成本
荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

AI日报栏目聚焦人工智能领域最新动态：1)Claude Opus4.1发布，编程能力提升74.5%；2)OpenAI开源GPT-OSS-120B和20B模型；3)谷歌DeepMind推出革命性3D世界模型Genie3；4)谷歌Gemini新增AI故事书生成功能；5)ElevenLabs推出商用AI音乐生成器；6)百度智能云发布首批AI数字员工；7)OpenAI估值或达5000亿美元；8)00后创业者推出云端AI协作开发工具Vinsoo；9)腾讯启动2026校园招聘，重点培养AI人才；10)马斯克宣�

人工智能编程能力数据分析

今日大家都在搜的词：

热文

3 天
7天

Genmo发布开源视频生成模型Mochi1：媲美Runway、可灵，用户可免费用

荐AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm1；MiniMax Speech 2.5语音生成模型上线

奥特曼发布免费用GPT-5！基准图错误遭全网吐槽马斯克也拆台了

昇腾算力赋能视频生成革命浙江大学团队攻克长时一致性难题

谷歌DeepMind发布Genie 3世界模型：支持实时生成交互式3D环境

荐AI日报：火山引擎发布豆包3.0；通义开源Qwen3非思考模型；谷歌偷偷升级Imagen 4

首款自研玄戒T1手表！REDMI Watch 5手表微信内测招募

钛动首战WAIC：用全球营销AI Agent重构出海底层逻辑

阿里开源通义万相2.2：可生成电影级高清视频

调动不同AI大模型费用怎么算?AI模型费用计算神器算清每一分投入!

荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

今日大家都在搜的词：

热文

李想回应理想被黑：知道是谁干的背后有专业水军

AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKB

小米智能摄像机4C 3.5K发布：支持600万像素售价199元

荣耀畅玩70 Plus开售：售价1199元起电池耐用5年

iQOO Z10 Turbo+首销战绩公布：为Z10 Turbo Pro的174%

微信内存一下就少了10G上热搜无需担心误删重要资料

iPhone17系列仅标准版没涨价分析师称Pro机型将上调50美元

AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashen

海底捞回应“改为半自助模式” 客服辟谣：系不实传闻

AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌

苹果iOS 26 Beta 5上线：细节优化更新内容一览

AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm

第五人格崩了上热搜网易旗下多款游戏回应：紧急排查中

理想i8宣布统一版本：标配即顶配并降价1万元

荣耀Magic7 Pro 16+512G卫星通信版开售：售价5199元

站长商机