Sand AI 开源 MAGI-1 视频生成模型：无限扩展、高保真

2025-04-22 09:46 · 来源： AIbase基地

2025 年 4 月 21 日，Sand AI 发布开源视频生成模型 MAGI-1，以其创新的自回归扩散架构和卓越性能，迅速成为生成式 AI 领域的焦点。

该模型采用 Apache 2.0 许可，代码、权重和推理工具已在 GitHub 和 Hugging Face 开放，为全球开发者提供强大创作工具。

MAGI-1 基于扩散变换器架构，引入块因果注意力、并行注意力块、Sandwich 规范化等技术创新，通过分块生成（每块 24 帧）实现高效视频生成。其独特流水线设计支持并行处理，最多可同时生成四个块，大幅提升效率。

模型通过快捷蒸馏技术，支持灵活的推理预算，并在物理行为预测和时间一致性上表现优异，适用于长篇叙事和复杂动态场景。MAGI-1 的“无限视频扩展”功能允许无缝延长视频内容，结合“秒级时间轴控制”，用户可通过逐块提示实现场景转换和精细化编辑，满足影视制作、讲故事等需求。

在图像到视频任务中，模型展现出高保真输出，原生分辨率达 1440x2568px，动作流畅、细节逼真。作为开源模型，MAGI-1 提供 Docker 部署支持，24B 参数版本需 8 张 H100 GPU，未来 4.5B 版本将适配单张 RTX 4090，降低使用门槛。

社区反馈称赞其生成质量和指令遵循能力，评分超 Kling 1.6 和 Wan 2.1，但在非现实风格内容上仍有优化空间。

在竞争激烈的视频生成领域，MAGI-1 以开源和自回归架构脱颖而出。Sand AI 计划推出更轻量化版本，并深化硬件优化，未来或推动实时生成、虚拟现实等应用。MAGI-1 的发布不仅是技术突破，更是对开源生态的贡献，有望重塑视频创作格局。

Github Page: https://github.com/SandAI-org/Magi-1

Hugging Face: https://huggingface.co/sand-ai/MAGI-1

相关推荐

荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

本文介绍了AI领域多项最新进展：1)B站团队推出开源动漫视频生成模型AniSora，支持多种风格创作；2)OpenAI发布编程智能体Codex，提升开发效率；3)Google测试AI问答功能AI Mode；4)ChatGPT将整合MCP协议，支持第三方AI服务对接；5)阿里推出ZeroSearch框架，减少对搜索引擎的依赖；6)Stability AI与Arm合作推出手机端音频生成AI；7)Qwen发布WorldPM系列大模型；8)GPT-5将整合多款产品功能；9)ListenHub上线AI播客生成工具；10)QQ浏览器升级为AI浏览器；11)数学建模AI助手MathModelAgent面世；12)GenSpark推出全球首个智能下载代理；13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

AI日报动漫视频生成 AniSora
对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3，对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频，还能为人物对话、鸟鸣等场景自动匹配音效，实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户，月费249.99美元，并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是，谷歌在AI图像生成领域并非一帆风顺，此前Imagen 3曾因生成含历史错误的图像引发争议。

谷歌视频生成模型 Veo
必应引入OpenAI的Sora视频生成器，完全免费使用

微软表示：“Bing 视频生成器体现了我们让 AI 视频创作变得全民可及的努力。我们相信，创造力应当轻松且人人可用，从而助力你的探索与表达。”

必应搜索微软搜索引擎 Sora视频模型
荐多模态2025：技术路线“神仙打架”，视频生成冲上云霄

一场大会，聚集了中国多模态大模型的“半壁江山”。智源大会2025为期两天的论坛中，汇集了学界、创业公司和大厂等三方的热门选手，关于多模态的集中讨论达到了前所未有的热度。其中，创业公司就有爱诗科技、生数科技、Sand.ai、智象未来、Luma AI、智谱等六家公司创始人、CEO分享心得;隶属大厂队的字节、腾讯、百度的多模态技术负责人，以及学术界的人大和MIT（麻省�

多模态大模型智源大会2025 人工智能技术
Baidu Steamer-I2V推动视频生成技术突破，擎舵平台赋能原生创意营销

百度推出全球领先的视频生成模型Baidu Steamer-I2V，以89.38%综合评分登顶VBench榜单。该模型通过精准画面控制、高清画质和中文语义优化，能将静态图像转化为连贯动态视频。百度营销平台迎来2周年，已服务超13万家企业，日均生产素材超10万+。在"AI驱动营销全链路升级"主题下，百度与核心代理商共同探讨AIGC技术突破与创意升级，推出"AI创"原生创意大赛。百度商业体系表示将持续巩固传统广告优势，同时突破创意边界，实现营销效果飞跃。未来百度将优化模型性能，拓展应用场景，推动营销行业迈向"一杯咖啡时间完成创意生产"的全智能化时代。

AI营销视频生成模型百度Steamer-I2V
快手可灵AI上线2.1系列模型：生成5秒视频不到1分钟

快手旗下可灵AI发布2.1系列模型，包含720p标准版和1080p高品质版，在性价比、生成速度和质量三大维度实现突破。新模型生成5秒视频仅需20-35灵感值，与上代保持相同成本；1080p视频生成时间不到1分钟，快于行业同级产品2-3倍。模型在动态表现、物理模拟和语义理解方面均有优化，人物动作更真实自然。可灵AI自发布以来发展迅猛，全球用户突破2200万，月活增长25倍，累计生成1.68亿视频和3.44亿图片。商业化进程加速，2025年Q1营收超1.5亿元人民币，展现强劲市场潜力。

可灵AI 可灵2.1 AI视频创作
荐AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

本文汇总了AI领域最新动态：1)中国信通院发布智能体开发标准，推动AI商业化进程；2)阿里推出QwenLong-L1-32B长文本推理模型，性能媲美Claude-3；3)GPT-4o语音模式升级，新增唱歌功能；4)秘塔AI搜索推出极速模型，响应速度达400tokens/秒；5)谷歌发布LMEval评估框架，统一大模型评测标准；6)Chrome浏览器集成Gemini AI助手；7)阿联酋全民免费使用ChatGPT Plus；8)苏州成立60亿元AI产业基金；9)法国Kyutai实验室推出10秒定制语音的Unmute系统；10)UAV-Flow项目实现无人机语音精准控制；11)Claude将升级支持百万字上下文和记忆功能；12)百度心响iOS版上线；13)夸克推出高考深度搜索功能；14)Chrome v137开发者工具升级；15)美团AI业务接近GPT-4o水平；16)Direct3D-S2实现3D生成速度提升10倍；17)OpenAI计划2026年推出首款AI硬件。

人工智能软件开发 AI标准
荐AI日报：夸克发布首个高考志愿大模型；Trae月活跃用户破100万；Manus推出免费无限聊天模式

【AI日报】今日AI领域热点速览： 1. 夸克APP推出高考志愿大模型，免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式，挑战行业巨头 3. Trae开发者平台月活破百万，累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体"，内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具，支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资，拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

人工智能高考志愿 AI应用
豆包大模型1.6发布：全球第一梯队！可生成1080p高品质视频

字节跳动旗下豆包大模型正式升级为1.6版，在推理、数学、指令遵循、Agent等方面的能力均有较大提升，同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。豆包大模型1.6包括三部分，分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。其中，豆包1.6支持on/off/auto三种思考模式，豆包1.6-thinking强化了思考能力，支持多模态，在多个权威测评集上达到了全球第一梯队�

豆包大模型字节跳动视频生成模型
荐AI日报：昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

本文介绍了AI领域最新动态：1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用；2)研究显示ChatGPT能提升K12学生成绩近87%；3)谷歌视频生成工具Veo3扩展至更多地区；4)谷歌发布三款Gemma模型变体，覆盖医疗、手语翻译和海豚语言研究；5)VideoTutor实现一句话生成定制教学视频；6)字节跳动开源多模态模型BAGEL；7)Rork支持无代码开发iOS/Android应用；8)AingDesk降低AI助手开发门槛；9)Claude4登陆亚马逊Bedrock平台；10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

人工智能移动办公 AI应用

今日大家都在搜的词：

热文

3 天
7天

Sand AI 开源 MAGI-1 视频生成模型：无限扩展、高保真

荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

必应引入OpenAI的Sora视频生成器，完全免费使用

荐多模态2025：技术路线“神仙打架”，视频生成冲上云霄

Baidu Steamer-I2V推动视频生成技术突破，擎舵平台赋能原生创意营销

快手可灵AI上线2.1系列模型：生成5秒视频不到1分钟

荐AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

荐AI日报：夸克发布首个高考志愿大模型；Trae月活跃用户破100万；Manus推出免费无限聊天模式

豆包大模型1.6发布：全球第一梯队！可生成1080p高品质视频

荐AI日报：昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

今日大家都在搜的词：

热文

从心脏、到血管……3D打印开启“器官替换”时代

无缝且安全的密钥导入、导出功能将登陆苹果系统

点击已死？“AI引用”才是流量未来，SEO正在被SAO、AEO取代

李世石：AI不会“解读”……直觉依然属于人类！

苹果研究发现：AI 模型在遇到复杂难题时会“崩溃放弃”

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

苹果举行WWDC 25开发者大会 iOS 26更新汇总

iOS26的这五大“新功能”，我在安卓机上已经用了好几年！

苹果公布 Intel Mac 支持终止时间表，Rosetta 2 也将逐步淘汰

格力否认董明珠孟羽童直播是策划：就是一次很自然的会面

从心脏、到血管……3D打印开启“器官替换”时代

无缝且安全的密钥导入、导出功能将登陆苹果系统

站长商机