首页 > 业界 > 关键词  > 图像生成视频最新资讯  > 正文

Animate Anyone引发人们对虚假视频泛滥的担忧

2023-12-05 10:12 · 稿源:站长之家

要点:

  • 由阿里巴巴智能计算研究所研发的“Animate Anyone”是一种新的生成视频技术,能够将静态图像转换为高度逼真的动态深度伪造视频。

  • 该技术改进了之前的图像到视频系统,解决了以往存在的幻觉问题,使生成的视频更为逼真,尽管仍存在一些问题,尤其是在处理眼睛和手部动作方面。

  • 这一技术的发展引发了对滥用的担忧,因为有人可以利用个人照片制作逼真的虚假视频,结合面部动画和语音捕捉技术,可能导致虚假信息的广泛传播。

站长之家(ChinaZ.com)12月5日 消息:随着阿里巴巴智能计算研究所开发的“Animate Anyone”技术的推出,图像生成视频的领域迈出了重要一步。该技术通过从参考图像提取面部特征、模式和姿势等细节,然后将这些细节映射到略微不同的姿势上,生成一系列图像,形成动态视频。相较于之前的技术,新模型在保留基本和精细细节方面取得了显著的改进。

image.png

然而,尽管取得了进展,该技术仍存在一些挑战,尤其是在处理眼睛和手部动作时。技术开发团队强调了一个新的中间步骤,使模型能够在一致的特征空间中全面学习与参考图像的关系,从而显著提高外观细节的保留。在展示的几个场景中,时尚模特能够以各种姿势展示服装而不失真,二维动漫角色生动地跳舞,梅西也展示了一些基本动作。

image.png

尽管技术在不断进步,但人们对其潜在滥用感到担忧。通过一个高质量的个人照片,恶意行为者可以制作出几乎任何虚假视频,而结合面部动画和语音捕捉技术,甚至可以让被伪造的人表达任何言论。尽管目前技术过于复杂且存在缺陷,但在人工智能领域,这种状况往往不会持续太久。

尽管该团队尚未将代码公开,但他们表示正在积极准备演示和代码以供公开使用。鉴于当前网络上已充斥着静态深度伪造图片和文本对话,一旦出现大量虚假视频,我们可能会面临一场信息混乱的风险。未来将会揭示互联网是否会迎来“舞蹈伪造”的狂潮,这可能比我们预想的还要更快到来。

举报

  • 相关推荐
  • 免费生成10秒高清视频!通义App接入通义万相2.5

    在2025云栖大会上,阿里发布通义万相Wan2.5 Preview系列模型,覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步,可生成匹配画面的人声、音效和BGM,时长从5秒提升至10秒,支持24帧/秒的1080P高清输出,降低影视级创作门槛。模型指令遵循能力增强,支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频,每日免费使用15次,支持导出无水印视频。同时,图像生成能力全面升级,可生成中英文字符和图表,支持图像编辑功能,一句话即可完成P图。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • 谁在视频号上,为短剧“买单”?

    ​短剧的风这下是真的吹到了视频号。 “00后帅气多金董事长爱上干保洁40岁离异的我”;“和自己闪婚的黄昏恋老伴,竟然是豪门。”……最近小编一打开手机随便刷一刷视频号,便能邂逅许多爆款“雷人”短剧。 前几天,就连金融反腐题材的《K线成长记》都火了,证券时报发的全集转发就突破1万+。 它们剧情够爽、反转够快,即便有的剧情夸张、逻辑欠缺,依旧赢得网友

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • QQ传文件功能升级,闪传功能便捷支持长假批量传图

    国庆假期临近,QQ推出“闪传”功能,解决大文件传输难题。单文件上限提升至10GB,支持批量发送与不限速传输,用户可生成链接或二维码直接分享至微信等平台,接收方无需登录QQ即可下载。该功能适用于旅行照片、婚礼影像快速分享,也便于办公人群传输设计稿、项目资料,实现跨平台无缝协作。测试期间获用户好评,摄影师称其大幅提升节日期间紧急交片效率。QQ持续优化核心功能,强化独特价值。

  • 从撕吧到丝瓜,短视频模仿秀进化史

    “火之前还觉得挺快乐的,老师还有同学都特别和蔼可亲的。但火了之后就感觉,人都突然变了。就同学什么的,都觉得你像个怪物一样。” 在抖音人物故事《生活闪亮时2025》“美错如是”里,18岁的钟美美回到母校,回想2020年的那场爆火,依旧胆战心惊。 互联网与现实就是那么割裂,并行着两个时代的道德体系。硬糖君小学写作文,爱用“光阴似箭,日月如梭”凑字数。

  • 店长连续工作超8小时 因闭眼2秒视频遭解雇 法院判了

    9月26日,广州市中级人民法院、广州市人力资源和社会保障局、广州市总工会联合发布了新一批劳动争议典型案例。 其中,有一则案例引发广泛关注:一位零售店店长竟因闭眼休息、上厕所等看似平常的行为被公司解雇。 2021年3月,余某入职某零售公司,担任该公司位于某商场门店的店长一职,全面负责门店的日常管理工作。 然而,2024年9月26日,某零售公司却以余某工作�

  • 海尔冰箱联合央视频发起囤鲜挑战

    9月21日,海尔冰箱联合央视视频发起“一台冰箱装下中国百味”挑战。活动首站成都,现场展示科学收纳格局与磁控全空间保鲜科技,实现食材分类精准储存,杜绝串味。挑战难点在于食材种类繁多、保鲜要求苛刻,海尔麦浪冰箱凭借576L大容量、M5分储格局及阻氧干湿分储技术,成功保持各类食材新鲜口感。在火锅宴现场,所有食材经涮煮检验,获一致好评。该冰箱搭载获国家科技进步奖的磁控保鲜科技,满足超3500种食材储鲜需求,为9月26日新品发布会预热。

  • 当视频播客陷入“形式之争”,成就UP主才是真正的增量

    随着B站推出“视频播客出圈计划”,抖音、小红书等平台相继加码,名人效应与资源倾斜不断助推着这一内容形态站上风口。与此同时,质疑也随之而来,“播客视频化是否只是一个伪命题?”“到底是视频播客化还是播客视频化?”等议论愈演愈烈。 而在这些争论之外,一个更值得思考的议题正在浮现:当公众在讨论视频播客的概念是否成立时,行业能否借此机会跳出形式之�

今日大家都在搜的词: