首页 > 业界 > 关键词  > 多模态视频生成最新资讯  > 正文

腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

2025-05-09 13:05 · 稿源: 快科技

快科技5月9日消息,腾讯混元宣布今天正式推出并开源全新的多模态定制化视频生成工具HunyuanCustom

据悉,该模型基于混元视频生成大模型(HunyuanVideo)打造,主体一致性效果超过现有的开源方案。

据介绍,HunyuanCustom融合文本、图像、音频、视频等多模态输入生视频的能力,是一款具备高度控制力和生成质量的智能视频创作工具

腾讯表示,HunyuanCustom模型能实现单主体视频生成、多主体视频生成、单主体视频配音、视频局部编辑等能力,其生成的视频与用户输入的参考主体能保持高度一致。

在部分场景下,创作者希望保持人物一致的情况下,改变人物所在的环境和动作。

但此前的视频生成模型都无法实现。

而HunyuanCustom通过引入身份增强机制和多模态融合模块,真正实现图像提供身份,文本定义一切”。

HunyuanCustom可以满足视频创作者、短视频博主、电商从业者、广告创意人等不同用户和场景的需求。

比如,在广告场景中,可以快捷变换商品背景、模特可以快速换衣服;在电商和客服场景中,可以快速低成本制作出生动的数字人商品介绍视频,或者制作特定穿着的数字人客服视频;在影视场景中,快速制作短剧和小故事短视频。

此外,通过业内领先的主体一致性建模能力,HunyuanCustom在单人、非人物体、多主体交互等多种场景,都能保持身份特征在视频全程的一致性与连贯性。人物不会变脸”,物体不会漂移”。

目前,单主体生成能力已经开源并在混元官网上线,用户可以在模型广场-图生视频-参考生视频”中体验,其他能力将于5月内陆续对外开源。

单主体生成能力下,用户只需上传一张目标人物或物体的图片,并提供一句如他正在遛狗”的文本描述,Hunyuan Custom就能在完全不同的动作、服饰与场景中生成连贯自然的视频内容。

在多主体视频的生成中,用户提供一张人物和一张物体的照片,并输入文字描述,即可能让这两个主体按要求出现在视频里。而Hunyuan Custom不止于图像和文本的配合,还具备强大的扩展能力。

在音频驱动(单主体)模式下,用户可以上传人物图像并配上音频语音,模型便可生成人物在任意场景中说话、唱歌或进行其他音视频同步表演的效果,广泛适用于数字人直播、虚拟客服、教育演示等场景。

在视频驱动模式下,Hunyuan Custom支持将图片中的人物或物体自然地替换或插入到任意视频片段中,进行创意植入或场景扩展,轻松实现视频重构与内容增强。

举报

  • 相关推荐
  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • Sora 2生成已故名人视频引亲属不满 OpenAI回应:重视反馈 将迅速纠正失误

    OpenAI 近日推出的 Sora 2 模型引发广泛关注,其默认禁止生成在世公众人物视频,用户纷纷尝试生成各类创意内容。然而,创作者与观众很快发现这一限制存在明显漏洞该模型允许生成已故公众人物的影像,从而在伦理层面引发争议。 社交媒体上已涌现大量AI复活”名人的案例,例如李小龙主持DJ现场、迈克尔杰克逊表演单口喜剧等。尽管OpenAI在每段生成视频上添加动态水印,�

  • 全球首个!OpenAI将推“AI版抖音”:禁止上传实拍内容 视频100%由AI生成

    国庆假期前夕,OpenAI发布了Sora 2,一款旗舰视频和音频生成模型。 据介绍,Sora 2可以完成以前的视频生成模型难以完成的事情,比如运动员的奥林匹克体动作、桨板上的后空翻,准确模拟浮力和刚度的动态等等,并擅长现实主义、电影和动漫风格。 一则来自《连线》杂志的重磅爆料更是指出,OpenAI的下一步棋,并非简单升级一个模型,而是要亲自下场,推出一个独立的AI影�

  • AI日报:Veo 3.1可生成1分钟视频;蚂蚁发布万亿参数语言模型 Ling-1T;Lovart可免费玩Sora2

    本期AI日报聚焦多项技术突破:Veo 3.1视频生成模型实现角色一致性与多场景叙事升级;蚂蚁发布万亿参数Ling-1T语言模型,推理能力领跑行业;xAI推出电影级视频生成模型Imagine v0.9;软银斥资53.75亿美元收购ABB机器人业务布局物理AI;Vercel v0新增图像编辑功能简化设计流程;OpenAI Sora2首日安装量飙升至应用商店第三,同时引发深度伪造伦理担忧;Lovart平台限时免费开放Sora2无水印视频生成;ChatGPT推出应用生态,正式升级为多功能服务平台。

  • 爱诗科技,一家AI视频创业公司的生存哲学

    “你还是回去吧,大模型在中国没有机会。” 2023年刚创业,爱诗科技创始人兼CEO王长虎收到了天使投资人朱啸虎的“劝退”。 但两年时间过去,两个节点颠覆了投资人对AI视频生成赛道的固有印象。先是

  • 女生找回手机后发现相册多了段视频 学子暖心归还引全网寻人

    ​2025年10月6日,游客小蒋在苏州拙政园游玩拍照时,不慎将新购的手机遗落。据悉,这部手机是小蒋工作后用积蓄购买的,意义非凡。约20分钟后,小蒋察觉手机丢失,心急如焚地返回寻找。 幸运的是,当小蒋回到遗落地点时,4名来自大连理工大学的学生正主动拿着她的手机等待失主。在确认小蒋身份无误后,这四名学生未留下姓名便悄然离开,展现了当代大学生的高尚品�

  • 保时捷女销冠被合成AI不雅视频:称被造黄谣已报案

    近日,连续两年蝉联青岛保时捷中心销售冠军的女销售牟倩文,因遭遇AI伪造视频恶意诽谤事件引发广泛关注。这位在2023年、2024年累计售出170台保时捷的销冠,通过个人社交账号发布声明称,近期发现大量利用AI技术合成的虚假视频在网络传播,这些视频内容纯属伪造,已对其个人名誉及正常生活造成严重影响。 据牟女士介绍,不法分子不仅通过AI技术制作与其面部特征相似�

  • 谁在视频号上,为短剧“买单”?

    ​短剧的风这下是真的吹到了视频号。 “00后帅气多金董事长爱上干保洁40岁离异的我”;“和自己闪婚的黄昏恋老伴,竟然是豪门。”……最近小编一打开手机随便刷一刷视频号,便能邂逅许多爆款“雷人”短剧。 前几天,就连金融反腐题材的《K线成长记》都火了,证券时报发的全集转发就突破1万+。 它们剧情够爽、反转够快,即便有的剧情夸张、逻辑欠缺,依旧赢得网友

  • 腾讯混元图像3.0登顶LMArena榜一

    腾讯混元图像3.0模型发布仅一周,即在全球26个顶尖大模型中脱颖而出,登顶LMArena权威榜单首位,成为AI生图领域新王者。其成功得益于三大核心优势:能运用知识推理生成有逻辑内涵的图像;精准实现中英文长文本及细节标注的渲染;兼具真实质感与审美把控。作为开源模型,混元系列已构建覆盖多模态的技术生态,社区衍生模型超3000个,其中混元3D模型下载量超260万次,是全球最受欢迎的3D开源模型。未来腾讯将持续拓展其应用边界。

  • 女生找回手机后发现相册多了段视频 全网寻找的4位大学生找到了:想给机主留一个小礼物

    全网寻找的大连理工大学的4名好心人,找到了。 6日,游客小蒋在苏州拙政园里不慎遗失了手机,正当她和男友着急四处寻找时,4名年轻人就主动上前询问,送回了手机。 还没来得及当面表达感谢,他们就匆匆离开了。回到酒店后,小蒋发现手机相册里多了一段可爱

今日大家都在搜的词: