首页 > AI头条  > 正文

Genmo发布开源视频生成模型Mochi1:媲美Runway、可灵,用户可免费用

2024-10-23 10:47 · 来源: AIbase基地

最近,AI 视频公司 Genmo 宣布推出 Mochi1,这是一个全新的开源视频生成模型,用户可以通过文本提示生成高质量的视频。Mochi1的表现被认为与当前市场上领先的闭源竞争对手如 Runway、Luma AI 的 Dream Machine、快手的 可灵、Minimax 的 Hailuo 等等相媲美,甚至更优。

image.png


该模型在 Apache2.0许可证下开放,用户无需支付费用就能享受到尖端的视频生成技术,而其他竞争产品的收费标准则从有限的免费计划到每月高达94.99美元不等。

用户可以在 Hugging Face 上免费下载 Mochi1的模型权重和代码,不过,想要在个人设备上运行这个模型,至少需要四块 Nvidia H100GPU。为了让用户体验 Mochi1的功能,Genmo 还提供了一个在线的试玩平台,让大家可以亲自尝试这项新技术。

Mochi1生成的视频效果案例:

根据 Genmo 的说法,Mochi1擅长遵循详细的用户说明,允许对生成视频中的字符、设置和操作进行精确控制。Genmo 已经声称,在内部测试中,Mochi1在快速粘附和运动质量方面击败了大多数其他视频 AI 模型,包括专有的竞争对手 Runway 和 Luna。

image.png

image.png

Mochi1在视频生成领域取得了显著的进展,包括高保真运动表现和精准的提示遵循能力。Genmo 的 CEO Paras Jain 表示,他们的目标是缩小开放源代码和闭源视频生成模型之间的差距。他强调,视频是最重要的交流形式,因此他们希望将这项技术推广给更多的人。

与此同时,Genmo 还宣布完成了2840万美元的 A 轮融资,投资者包括 NEA 和多家风险投资公司。Jain 指出,视频生成不仅仅是娱乐或内容创作,还是未来机器人和自主系统的重要工具。

Mochi1的架构基于 Genmo 独创的非对称扩散变换器(AsymmDiT),这是迄今为止发布的最大开源视频生成模型,参数高达100亿。这个模型专注于视觉推理,使其在处理视频数据方面更具优势。

Mochi1生成的视频效果案例:

尽管 Mochi1已经展现出强大的功能,但目前仍有一些局限性,比如目前支持的分辨率为480p,且在复杂运动场景中可能会出现轻微的视觉失真。Genmo 计划在年内推出支持720p 分辨率的 Mochi1HD 版本,以提升用户体验。

试玩入口:https://www.genmo.ai/play

模型下载:https://huggingface.co/genmo/mochi-1-preview

划重点:

🌟 Mochi1是 Genmo 推出的开源视频生成模型,用户可免费使用,性能媲美多款闭源产品。

💰 Genmo 完成了2840万美元的 A 轮融资,旨在推动 AI 视频技术的民主化。

🎥 未来将推出 Mochi1HD 版本,解决当前480p 分辨率和复杂运动场景中的一些局限。

  • 相关推荐
  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • 奥特曼发布免费用GPT-5!基准图错误遭全网吐槽 马斯克也拆台了

    当地时间8月7日,OpenAI 推出全新人工智能模型 GPT-5。 据悉,GPT-5是OpenAI的首个统一”人工智能模型,它融合了o系列模型的推理能力以及GPT系列快速响应的优势。 借助GPT-5,ChatGPT能够代表用户完成多种任务,例如生成软件应用、管理用户日程或创建研究简报。 并且,GPT-5将作为默认模型向所有ChatGPT免费用户开放,用户也能借此体验深度推理功能。 不过,据媒体机器之心Pro”

  • 昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题

    浙江大学朱凌霄团队基于昇腾AI平台,研发出首个无需训练的长序列视觉指令生成框架LIGER,解决了视频生成领域长期存在的时序一致性难题。该技术通过历史提示和视觉记忆机制保持内容连贯性,并采用基于DDIM反演的记忆校准技术提升准确性。团队还提出引导式渐进蒸馏方法,在保持视频质量基础上实现8倍加速。研究成果入选ICLR2025,构建了包含569个任务的评估数据集。未来将深化多模态生成技术研究,构建自主创新的技术生态体系。

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • AI日报:火山引擎发布豆包3.0;通义开源Qwen3非思考模型;谷歌偷偷升级Imagen 4

    【AI日报】栏目聚焦人工智能领域最新动态:1)火山引擎发布豆包系列AI模型升级,包括图像编辑3.0、同声传译2.0等;2)通义千问开源Qwen3-30B模型,支持多语言处理;3)OpenAI推出ChatGPT Study学习助手;4)中国发布HYPIR图像复原大模型;5)谷歌NotebookLM新增视频概览功能;6)谷歌Imagen4图像生成模型升级,性能媲美GPT-4o;7)昆仑万维开源多模态模型Skywork UniPic;8)理想汽车发布首搭VLA大模型的i8纯电SUV;9)谷歌在英国推出AI搜索模式;10)OWL团队开源多智能体协作工具;11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

  • 首款自研玄戒T1手表!REDMI Watch 5手表微信内测招募

    小米官方账号@玩转小米澎湃OS 发布了REDMI Watch 5内测特邀用户招募”。 据介绍,此次招募主要为了测试表端微信应用,可以实现手表端就能轻松回复消息,无需频繁拿出手机。 简洁界面适配手表屏幕,操作简单直观,支持在手表上回复文字、表情。 报名时间:2025年8月8日-8月10日 体验时间:2025年8月11日-8月15日

  • 钛动首战WAIC:用全球营销AI Agent重构出海底层逻辑

    2025世界人工智能大会(WAIC)在上海开幕,全球AI领域目光聚焦于此。钜动科技首次亮相大会,发布全球首个营销AI+Agent——Navos,覆盖营销全链路多个环节,助力企业出海营销效率提升。Navos通过多角色Agent协同,实现从洞察到优化的全流程智能化,并整合行业大数据提供精准决策。同时展出的智能创意营销工具Tec-Creative2.0,运用AIGC技术快速生成爆款营销素材。钜动科技CEO李述昊表示,AI正打破文化差异和效率瓶颈,推动营销从"经验驱动"迈向"智能决策"新时代。

  • 阿里开源通义万相2.2:可生成电影级高清视频

    阿里云宣布旗下通义万相2.2模型正式开源。 通义万相2.2最令人瞩目的,当属其生成电影级高清视频的能力。目前,该模型单次便可生成5秒的高清视频。 这5秒视频绝非普通水准。在光影、色彩、构图以及人物微表情等细节处理上,通义万相2.2达到了专业电影制作的水平。 此次开源,通义万相2.2推出了文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-

  • 调动不同AI大模型费用怎么算?AI模型费用计算神器算清每一分投入!

    本文探讨了企业在调用不同AI大模型时的费用计算问题。随着GPT-4、Claude、文心一言等模型广泛应用,各厂商的计费规则差异显著:有的按Token收费,有的按调用次数,还有地区定价差异。相同任务在不同模型上的成本可能相差10倍。文章推荐使用AIbase费用计算器(https://model.aibase.com/zh/calculator),该工具覆盖主流模型,支持自定义参数,能快速对比不同模型的调用成本,帮助企业实现精准预算控制,选择最具性价比的AI服务方案。

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

今日大家都在搜的词: