首页 > AI头条  > 正文

Vidu推出“主体参照”功能 解决AI生成视频中的角色一致性问题

2024-09-11 14:38 · 来源: AIbase基地

近日,由生数科技和清华大学联合研发的国内首个纯自研原创视频大模型Vidu推出了“主体参照”功能,该功能能够实现对任意主体的一致性生成,让视频生成更加稳定、可控。目前该功能面向用户免费开放。

“主体参照”功能解决了AI生成视频中的角色一致性问题。通过上传任意主体的一张图片,Vidu就能够锁定该主体的形象,通过描述词任意切换场景,输出主体一致的视频。

该功能不局限于单一对象,而是面向“任意主体”,无论是人物、动物、商品,还是动漫角色、虚构主体,都能确保其在视频生成中的一致性和可控性。

生数科技董事长、CEO唐家渝表示,“主体参照”功能代表着AI完整叙事的开端,AI视频创作也将迈向更高效、更灵活的阶段。

此外,中央广播电视总台导演、AIGC艺术家石宇翔创作了一条动画短片《夏日的礼物》,并表示,“主体参照”功能摆脱了静态图片的束缚,生成的画面更具感染力和自由度,让创作的连贯性大大提升。

该功能的推出标志着AI视频创作进入了一个新时代,未来将继续探索如何精确控制多主体交互、风格统一、多变场景稳定切换等复杂元素,以满足更高层次的叙事需求。

  • 相关推荐
  • 美国女子AI生成号码中10万美元彩票

    美国密歇根州45岁女子塔米卡·卡维通过ChatGPT随机生成的号码购买强力球彩票,意外赢得10万美元奖金。她平时极少购彩,此次因奖池超10亿美元突发奇想尝试AI选号,结果精准匹配4个白球和1个强力球号码,更因选择翻倍选项使奖金翻倍。这已是今年第二起AI推荐号码中奖案例,此前弗吉尼亚州一名女子同样通过ChatGPT选中15万美元。彩票机构紧急提醒公众:开奖完全随机,AI无法提高中奖概率。此事引发对技术伦理的讨论,部分专家担忧会催生“AI玄学”市场。

  • AI日报:阿里夸克“C计划”曝光;Veo3.1将增加视频“精确编辑”功能;Anthropic推出Claude Code网页版

    今日AI领域动态:阿里夸克启动"C计划"布局对话式AI应用,剑指字节"豆包";Anthropic推出Claude Code网页版,支持浏览器直接编码;谷歌Veo新增视频"精确编辑"功能,提升创作效率;Fish Audio升级S1语音克隆模型,10秒即可复刻真人声音;AWS美东故障影响ChatGPT等多项服务;DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈;Adobe推出AI Foundry服务,支持企业定制品牌AI模型;Anthropic发布Claude for Life Sciences,加速生命科学研究。

  • GEO是什么意思?GEO如何优化在AI搜索中的排名?

    GEO(生成式引擎优化)是适应AI搜索环境的内容优化策略,旨在系统性提升品牌在AI生成答案中的可见度、引用率和可信度。其核心原则包括:语义理解优先、内容结构化、权威信源建设、对话式内容设计。AI搜索用户年增长43%,超68%用户表示AI答案直接影响品牌信任度。实施GEO需通过研究分析、内容优化、技术标记和持续监测迭代。AIBase工具可量化品牌在主流AI平台的表现,帮助建立基准、发现差距并指导优化方向。

  • Vidda 火星基地亮剑:C5 领衔四件套,改写影音产品性能规则

    Vidda在AWE展会发布多款创新产品:C5无界Master投影仪搭载SST架构DMD芯片、双激光器和122mm影院级镜头,实现6800CVIA高亮度和精准色彩;发现X2026电视采用"墨晶屏"技术,解决强光反光问题;同时推出V11开放式耳机与G11智能眼镜,以轻量化设计提升佩戴体验。整场发布会通过实机拆解和极限测试,展现品牌"技术平权"理念,强调用户体验优先于参数竞争。

  • 菁彩Vivid影院技术新标准发布,国产自研影音技术再升级

    在高质量观影与产业发展需求驱动下,中国电影科研所联合行业机构研发"菁彩影院技术",制定LED影院图像发行母版与音频处理器两项技术标准。该技术融合自主创新的菁彩Vivid技术与国际标准,实现高亮度、高动态范围等优质画面效果,支持沉浸式音频处理。目前全国已部署约180块LED电影屏,相关影片正式上映,标志着我国在高格式电影技术领域取得突破,为国产技术国际化提供支撑。

  • 全球首个!OpenAI将推“AI版抖音”:禁止上传实拍内容 视频100%由AI生成

    国庆假期前夕,OpenAI发布了Sora 2,一款旗舰视频和音频生成模型。 据介绍,Sora 2可以完成以前的视频生成模型难以完成的事情,比如运动员的奥林匹克体动作、桨板上的后空翻,准确模拟浮力和刚度的动态等等,并擅长现实主义、电影和动漫风格。 一则来自《连线》杂志的重磅爆料更是指出,OpenAI的下一步棋,并非简单升级一个模型,而是要亲自下场,推出一个独立的AI影�

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • 革命来临:在生成式 AI 时代,SEO该怎么做

    生成式AI正重塑SEO规则:搜索入口从点击列表转向答案直呈,SEO核心从"优化排名"升级为"优化被引用"。需打造能被AI摘录的内容(如FAQ、结构化数据),强化语义结构与权威性,监控"被AI引用"新指标。推荐使用AIBase GEO等工具量化AI可见性,实现从流量获取到答案源头的战略转型。

  • 如何提高网站在AI摘要中的可见性?网站 GEO 优化应该这样做

    在AI驱动的搜索时代,Google的AI摘要成为用户获取信息的首选方式,但也带来零点击加剧、网页点击率下降等挑战。文章提出从内容、结构、技术、权威与监测五大维度系统优化网站AI可见性:内容上采用问答结构、列表格式和语义覆盖;技术上确保页面可抓取、加载快速;强化E-E-A-T权威信号;并借助专业工具持续监测优化。通过综合策略可显著提升网站在AI摘要中的曝光机会。

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天,刚把师父从妖怪嘴里救出来,师父身上都还是热乎的,我们就马不停蹄开始出发了。」在抖音,都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播,各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

今日大家都在搜的词:

热文

  • 3 天
  • 7天