首页 > 业界 > 关键词  > AtomoVideo最新资讯  > 正文

阿里巴巴推出高保真图像到视频生成框架AtomoVideo

2024-03-06 09:25 · 稿源:站长之家

站长之家(ChinaZ.com)3月6日 消息:近日,阿里巴巴在人工智能领域再次取得突破,推出了一款名为AtomoVideo的高保真图像到视频生成框架。这一技术的问世,标志着基于文本到图像生成技术的视频生成领域取得了显著的快速发展。

据官方介绍,AtomoVideo的核心在于其多粒度图像注入技术,这一技术使得生成的视频对于给定的图像具有更高的保真度。这意味着,通过AtomoVideo生成的视频,能够更好地保留原始图像的细节和特征,从而使得生成的视频更加逼真。目前,阿里只发布了AtomoVideo的论文,代码,试玩页面等还未公布。

image.png

项目地址:https://top.aibase.com/tool/atomovideo

此外,AtomoVideo还得益于高质量的数据集和训练策略,这使得其在保持卓越的时间性的同时,实现了更大的运动强度,一致性和稳定性。这意味着,无论是在动作的连贯性,还是在动作的稳定性上,AtomoVideo都能表现出色。

AtomoVideo的架构也具有很高的灵活性,它可以灵活地扩展到视频帧预测任务,通过迭代生成实现长序列预测。这使得AtomoVideo在处理长序列的视频预测任务时,也能够保持良好的性能。

值得一提的是,由于适配器训练的设计,AtomoVideo可以很好地与现有的个性化模型和可控模块结合。这使得AtomoVideo在实际应用中,可以根据需要进行个性化定制,以满足不同用户的需求。

不过从AK大神发布的演示来看,AtomoVideo生成的视频质量和sora相比差距较大,和SVD相比也有一些差距,希望后续会有更大的提升吧。

举报

  • 相关推荐
  • 菁彩Vivid搭载车量超百万,携手车企迎来车载应用新里程碑!

    2025年11月5日,世界超高清视频产业联盟在深圳举办UWA+峰会,宣布中国自主三维音频标准“菁彩声”(Audio Vivid)车载应用装机量突破100万台。该标准基于AI技术,支持7阶HOA渲染与128轨实时处理,解码延迟低于80ms,实现三维空间精准定位与“黄金听音位”个性化体验。已覆盖鸿蒙智行、奇瑞等十余家车企29款车型,获IEC国际标准认证,与Dolby AC-4等并列全球四大三维音频标准。通过构建“标准-内容-终端”生态,推动中国音频产业从技术领先迈向市场引领。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • TME们的黄金时代,迎来AI终结者

    过去十年,中国与全球的音乐流媒体平台都在同一套逻辑下运行:依赖庞大的版权曲库、依赖订阅制、依赖“以版权为护城河”的内容供给方式,稳稳地坐在产业链的中心位置。 无论是 TME,还是网易云,平台之间的竞争从本质上都不是产品之争,而是版权之争——谁拥有更完整的曲库、谁能锁定更多独家资源,谁就拥有更牢固的用户粘性。 然而,随着AI音乐过去一年里爆发式

  • 华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

    华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端,于2023年9月首次发布,由刘德华代言。新款采用18K黄金材质,设计灵感源自航海轮舵,表圈手工镶嵌六颗黄金,搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计,尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理,智能模式下续航达8天。新品将于11月15日10:08开启预售,面向追求高端独特风格的消费者。

  • 信锐助力TCL获 “2025中国IDC未来企业大奖联接领军者”优秀奖!

    10月17日,TCL空调办公网络智能连接与体验升级项目在IDC中国CIO峰会获“2025未来企业连接领军者”优秀奖。该项目依托信锐“AI+网络自动驾驶”理念,通过全网智能2.0与小信GPT方案重构企业网络管理模式,实现从感知、分析到决策的智能闭环,助力TCL实现20+维度数据采集、7*24小时AI调优及自然语言交互运维,推动企业数字化转型升级。

  • AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

    本期AI日报聚焦多领域突破:OpenAI视频应用Sora登陆安卓平台并引入付费角色功能;网易云音乐推出AI调音大师实现智能音效适配;字节跳动高薪布局人形机器人赛道;谷歌Gemini平台将升级图像生成技术;llama.cpp实现多模态革命;特斯拉秘密实验室通过行为数据训练机器人;上海首例AI著作权案宣判保护原创;微软推出自研图像生成器MAI-Image-1,在创意效率与质量间取得平衡。

  • 50人团队、1亿美元ARR,AI PPT还在续写“神话”?

    AI 生成 PPT 可以说是去年的热门赛道,尤记得关于这类产品是否具有真正竞争力的热烈讨论,而2025年9月份的数据显示,赛道头部的明星创企 Gamma 却已经默默接近3000万的访问量。并且,今天官宣了由 a16z 领投的6800万美元 B 轮融资,融资后估值达到21亿美元。 而不仅 Gamma,根据 AI 产品榜数据,9月份,AIPPT 赛道的 Top3产品流量平均涨幅30%+,更有一款

  • 确定出席!知名媒体人胡锡进将致辞Yandex Market官方品牌峰会!

    知名媒体人胡锡进近日表示,跨境电商已成为当前风口,国内电商利润普遍压缩至个位数,而跨境电商利润率普遍超过15%,做得好甚至能超50%。他援引案例指出,中国电商在供应链、运营经验及技术应用方面具备优势,转型跨境电商成功率高。俄罗斯电商市场增长迅猛,2025年上半年销售额超5.3万亿卢布,同比增长36%,预计全年将超14.7万亿卢布。Yandex Market平台上半年跨境订单增长10倍,吸引全球卖家关注。为助力中国卖家开拓俄罗斯市场,Yandex Market将于11月29日在深圳举办品牌峰会,胡锡进将首次出席并分享机遇。

  • 智检加速:AI云测试如何为香港企业 IT 项目减负40%人力成本

    香港企业在App研发中面临高昂人力成本与复杂技术栈挑战,导致测试效率低、交付缓慢。Testin云测通过AI驱动的自动化测试方案,整合云端资源与专业服务,实现降本增效:硬件投入优化50%,人力成本降低40%;AI脚本生成技术提升测试效率60%,支持跨平台复用;精准OCR识别助力迭代周期缩短50%。聚焦金融、政企、交通等重点行业,提供符合国际标准的安全测试保障,助力企业从人力密集型向技术密集型转型,以更高质量、更快速度赢得市场竞争。

  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

今日大家都在搜的词: