首页 > AI头条  > 正文

全球首个自回归视频生成大模型 MAGI-1 重磅发布,Swin Transformer 团队引领视频创作新潮流

2025-04-22 14:23 · 来源: AIbase基地

在视频生成领域,最近涌现出了一位强劲的新选手 ——MAGI-1。这款由马尔奖和清华特奖得主曹越领导的创业公司 Sand AI 推出的自回归视频生成大模型,正在重新定义视频创作的可能性。MAGI-1通过预测视频块的序列来生成视频,以其自然流畅的效果和多个可下载版本引发广泛关注。

MAGI-1在生成视频时具有诸多优越性能。首先,它提供了无缝流畅的视频体验,能够生成连续的长视频场景,没有尴尬的剪辑或突兀的拼接,仿佛是电影一般。此外,MAGI-1还实现了秒级的时间轴精准控制,让用户能够精确调整每一秒的画面内容。这一功能为创作者提供了更多的灵活性,使得每个细节都能得以完美呈现。

QQ20250422-142128.jpg

运动的自然度也是 MAGI-1的一大亮点。与其他 AI 生成的视频相比,MAGI-1生成的画面动作更加流畅生动,场景切换也更加顺滑。这一特点使得视频在叙事性和观赏性上都大大提升。

测试结果显示,MAGI-1的效果非常不错。机器之心在尝试生成 “走红毯的马斯克” 时,结果令人满意,显示出模型在图像到视频(I2V)任务中的优异表现。同时,Sand AI 也推出了视频扩展功能,允许用户在已有视频的基础上继续生成新片段,无需手动拼接,大大提高了创作效率。

MAGI-1的背后,团队透露了许多技术创新。这款模型利用了自回归预测视频块序列的方法,能够对视频中的噪声进行去噪处理,并具备流式生成的能力。此外,MAGI-1通过多项算法创新和基础设施设计,在高保真视频生成、指令控制和实时部署方面展现了很大的潜力。

随着 MAGI-1的发布,创作者们将迎来视频创作的新纪元,令人期待这款模型未来的发展及其在行业中的广泛应用。

项目地址:https://github.com/SandAI-org/Magi-1

  • 相关推荐
  • 视频生成模型Vidu Q1怎么用?Vidu Q1官网是什么?

    国产视频生成大模型Vidu Q1在性能、价格和功能上实现重大突破。该模型由生数科技推出,在VBench评测中超越Sora等国内外顶尖模型,支持1080p高清视频生成,每秒价格低至3毛钱。其首尾帧功能仅需两张图即可实现电影级运镜效果,支持多元风格生成和48kHz高采样率混音功能。Vidu Q1已深度赋能影视、广告、动漫等行业,大幅降低创作门槛。

  • 可灵AI开启视频生成2.0时代!全球用户数已突破2200万

    4 月 15 日,快手可灵AI在北京中关村国际创新中心举行“灵感成真”2. 0 模型发布会,宣布基座模型再次升级,面向全球正式发布可灵2. 0 视频生成模型及可图2. 0 图像生成模型。

  • 谷歌Gemini整合Veo 2视频生成模型,8秒720P视频轻松搞定

    谷歌宣布又有一款 AI 模型将加入 Gemini,但这次它不仅仅是一个聊天机器人。

  • 国家天文台、阿里云联合发布全球首个太阳AI大模型:耀斑预报准确率超91%

    中科院国家天文台联合阿里云,发布了全球首个太阳AI大模型金乌”,基于阿里通义千问系列开源模型,目前在M5级太阳耀斑预报上准确率超91%,这也是该级别太阳耀斑预报的最高水平。太阳耀斑是太阳表面发生的剧烈能量释放事件,会辐射出大量带电高能粒子,影响地球电磁环境,严重时可造成大范围停电,威胁在轨卫星、空间站的安全。值得一提的是,中科院国家天文台的星语”大模型、中科院青藏高原研究所的全球首个水能粮大模型洛书”、中科院南海所的珊瑚礁多模态大模型瑶华”,都是基于阿里通义千问系列模型打造的。

  • 广州市宝承电子总经理唐泽楠荣获国十大牛商,引领AI机箱新潮流

    2025 年 4 月 19 日,在深圳凤凰大厦举办的“第十六届全国十大牛商颁奖典礼”,广州市宝承电子科技有限公司(以下简称“宝承电子”)凭借其在服务器机箱深度定制领域的卓越成就与全域网络营销的创新实践,从全国数千家企业中脱颖而出,斩获“全国十大牛商”殊荣。公司CEO唐泽楠代表团队登台领奖并发表致辞,分享了宝承电子在AI时代助力数字经济、赋能企业发展的战略与

  • 创维光伏斩获行业双料大奖 智慧能源战略引领产业升级新潮流

    3 月初,在第七届中国户用和工商业光储充行业大会上,深圳创维光伏技术服务有限公司(以下简称"创维技术服务")凭借在技术创新与服务领域的突出表现,斩获"创新服务机构奖"与"系统品牌奖"两项殊荣。同时,公司智慧能源事业部副总经理刘平同步荣获"年度人物奖"。此次获奖不仅是对企业综合实力的权威认证,更彰显了创维技术服务在新能源服务领域的标杆地位。专业筑�

  • 安卓视频拍摄第一次比肩iPhone!vivo X200 Ultra首发焦段专业视频创作

    快科技4月14日消息,今天下午,vivo举行vivo X系列蓝图影像技术沟通会。在这次活动上,vivo宣布X200 Ultra带来全焦段专业视频创作,视频拍摄能力领先安卓阵营,比肩iPhone。据悉,vivo X200 Ultra支持全焦段4K 60fps 10bit Log,随手拍都是原生电影素材;支持全焦段4K 120fps电影慢动作,延长转瞬即逝的精彩瞬间;还有行业独家的全焦段4K延时摄影,让自然美学触手可及。更重要的是,vivo X

  • DF蓄电池加速拓展,湖南四城新店开业引领行业新潮流

    3 月 27 日,DF蓄电池在湖南省长沙、衡阳、株洲和郴州四大城市隆重开设官方旗舰店,标志着品牌在湖南市场的持续扩张与影响力飞跃。这四家新店的开业,不仅是湖南地区的盛事,也进一步巩固了DF蓄电池在国内市场的头部地位。品牌实力再升华,旗舰店遍布全国作为全球知名的蓄电池品牌,DF始终秉持国际化品质,致力于为消费者提供高端智能的电池解决方案。同时,DF也率

  • 全球首个!百度发布内容操作系统沧舟OS 让AI无所不能

    百度在Create2025开发者大会上推出全球首个内容领域操作系统"沧浪OS"。该系统支持全模态内容输入输出、多智能体调用,适配MCP协议,突破场景和入口限制,实现端到端交付。沧浪OS整合百度文库、网盘等产品线的AI业务框架,包含数百个经过验证的Agent工具,支持跨模态、跨格式的内容理解。系统打通百度文库、学术数据库及全网公开内容,同时支持用户授权的本地或网盘私有内容。目前沧浪OS已全面拥抱MCP生态,通过标准化协议对外开放核心能力,降低接入门槛,推动AI应用普及。

  • 全球首个!高德发布AI导航智能体 情绪价值拉满

    快科技4月14日,高德地图正式宣布推出全球首个基于地图的AI导航智能体(NaviAgent)。高德表示,AI导航智能体将推动导航由传统出行工具,向会思考、能预判、有温度”的智能出行伙伴蜕变。据技术负责人介绍,传统导航像按剧本演戏,预设路线后便机械执行;而我们的智能体更像经验丰富的老司机,能实时感知路况、预判风险并主动调整策略。”例如,它能提前预判前方路况�

今日大家都在搜的词: