首页 > 业界 > 关键词  > 图像生成视频最新资讯  > 正文

Animate Anyone引发人们对虚假视频泛滥的担忧

2023-12-05 10:12 · 稿源:站长之家

要点:

  • 由阿里巴巴智能计算研究所研发的“Animate Anyone”是一种新的生成视频技术,能够将静态图像转换为高度逼真的动态深度伪造视频。

  • 该技术改进了之前的图像到视频系统,解决了以往存在的幻觉问题,使生成的视频更为逼真,尽管仍存在一些问题,尤其是在处理眼睛和手部动作方面。

  • 这一技术的发展引发了对滥用的担忧,因为有人可以利用个人照片制作逼真的虚假视频,结合面部动画和语音捕捉技术,可能导致虚假信息的广泛传播。

站长之家(ChinaZ.com)12月5日 消息:随着阿里巴巴智能计算研究所开发的“Animate Anyone”技术的推出,图像生成视频的领域迈出了重要一步。该技术通过从参考图像提取面部特征、模式和姿势等细节,然后将这些细节映射到略微不同的姿势上,生成一系列图像,形成动态视频。相较于之前的技术,新模型在保留基本和精细细节方面取得了显著的改进。

image.png

然而,尽管取得了进展,该技术仍存在一些挑战,尤其是在处理眼睛和手部动作时。技术开发团队强调了一个新的中间步骤,使模型能够在一致的特征空间中全面学习与参考图像的关系,从而显著提高外观细节的保留。在展示的几个场景中,时尚模特能够以各种姿势展示服装而不失真,二维动漫角色生动地跳舞,梅西也展示了一些基本动作。

image.png

尽管技术在不断进步,但人们对其潜在滥用感到担忧。通过一个高质量的个人照片,恶意行为者可以制作出几乎任何虚假视频,而结合面部动画和语音捕捉技术,甚至可以让被伪造的人表达任何言论。尽管目前技术过于复杂且存在缺陷,但在人工智能领域,这种状况往往不会持续太久。

尽管该团队尚未将代码公开,但他们表示正在积极准备演示和代码以供公开使用。鉴于当前网络上已充斥着静态深度伪造图片和文本对话,一旦出现大量虚假视频,我们可能会面临一场信息混乱的风险。未来将会揭示互联网是否会迎来“舞蹈伪造”的狂潮,这可能比我们预想的还要更快到来。

举报

  • 相关推荐
  • 爱诗科技下注的AI视频,正在比它预期的更「快」落地

    「我们决定全力投入视频生成领域,因为我们坚信视频生成一旦能够落地,其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中,这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。 短短两年后,视频大模型的产品化和商业化潜力已经如王长虎判断的那样,在快速落地,形成自己的创作生�

  • 长视频,要MCN化?

    过去十多年,长视频平台习惯用头部综艺与大剧撬动增长:内容够强,自然破圈,声量带动会员与广告。 这套“内容中心逻辑”曾行之有效。 但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事,三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩,哪怕是重金制作,也可能上线当周见顶、难以延展。 在这种环境下,平台不得不寻找新的增长方式。�

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 从代码生成到智能开发:北大发布基于昇腾平台软件开发解决方案

    北京大学李戈教授团队在昇腾算力支持下,成功研发基于昇腾平台的智能化软件开发系统。该系统通过大模型自动代码生成与优化技术,显著提升开发效率。核心成果包括:aiXcoder-7B模型在昇腾NPU上高效适配,推理速度提升至原版四倍;构建DeepSeek-V3Agent智能开发系统,实现从单一编码到复杂场景协同的升级。结合昇腾SmoothQuant量化技术与MindIE推理引擎,支持高精度低精度部署,具备代码补全、研发问答等一站式开发能力,推动软件工程进入高效、智能、自主化新阶段。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • 豆包-应用生成·「一点都不技术」创作挑战赛开赛!

    英特尔联合豆包-应用生成发起“一点都不技术”创作挑战赛,旨在通过零代码AI工具降低创意门槛。用户只需输入一句话或一张图,即可在5分钟内生成网页、工具或小游戏等多样化作品。赛事设置总价值20万元奖励,包含现金及火箭发射观礼等特色福利,并构建“创作-交流-成长”的完整生态,推动AI技术普惠。活动将持续至2025年12月8日,让每个平凡创意都有机会落地生花。

  • NuwaAI V1.0发布!一句话生成数字人,全面升级数字生产力

    在2025年中国国际高新技术成果交易会上,邦彦技术股份有限公司发布NuwaAI V1.0,实现"一句话生成可执行任务的数字人"核心功能。用户通过自然语言指令即可生成具备身份设定、表达能力和完整任务执行流程的数字人,覆盖教育、商业、媒体等场景。该系统支持自动规划内容结构、协调节奏,并能执行发布会主持等全流程工作,标志着数字人从"内容展示"向"任务执行体"的重要转变,为行业提供可持续的生产力工具。

  • 小米超级小爱AI大模型推出随心修图功能

    小米宣布超级小爱AI大模型推出随心修图功能,用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式:在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求:超级小爱需v7.8.50及以上,相册编辑功能需v2.1及以上,相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级,支持全局多模态交互和自然语音搜索,提升使用体验。

  • 具身智能产业迎来爆发期:十大观察揭示未来发展蓝图

    上海财经大学数字研究院近日发布报告指出,具身智能正从实验室走向规模化应用,成为推动高质量发展的新增点。报告从技术突破、产业瓶颈、应用场景等十个维度剖析了该领域发展态势,强调大模型与多模态技术正开启新篇章。当前面临芯片性能、数据标准、硬件成本、模型安全等挑战,产业呈现“上游依赖进口、中游集成难度大、下游需求旺盛”格局。市场竞争呈现巨�

  • 百度搜索AI API全面开放 绝大多数结果由AI生成

    11月13日,百度创始人李彦宏在2025百度世界大会上宣布,百度搜索已实现绝大多数结果由AI生成,首条结果富媒体覆盖率高达70%。他强调,百度正通过AI技术深度重构搜索结果页,从传统文字链接模式转向以图片、视频等富媒体内容为核心的AI应用。李彦宏指出,百度是全球搜索引擎中对AI化改造最激进的,正引领行业进入全新时代。他还表示,企业需善用AI方能立于不败之地,个人也需掌握AI技能以掌控未来。目前,百度已通过AI+API开放搜索能力,与三星、荣耀、vivo等主流厂商建立合作,共同探索AI搜索的无限可能。

今日大家都在搜的词: