Vidu推出“主体参照”功能解决AI生成视频中的角色一致性问题

2024-09-11 14:38 · 来源： AIbase基地

近日，由生数科技和清华大学联合研发的国内首个纯自研原创视频大模型Vidu推出了“主体参照”功能，该功能能够实现对任意主体的一致性生成，让视频生成更加稳定、可控。目前该功能面向用户免费开放。

“主体参照”功能解决了AI生成视频中的角色一致性问题。通过上传任意主体的一张图片，Vidu就能够锁定该主体的形象，通过描述词任意切换场景，输出主体一致的视频。

该功能不局限于单一对象，而是面向“任意主体”，无论是人物、动物、商品，还是动漫角色、虚构主体，都能确保其在视频生成中的一致性和可控性。

生数科技董事长、CEO唐家渝表示，“主体参照”功能代表着AI完整叙事的开端，AI视频创作也将迈向更高效、更灵活的阶段。

此外，中央广播电视总台导演、AIGC艺术家石宇翔创作了一条动画短片《夏日的礼物》，并表示，“主体参照”功能摆脱了静态图片的束缚，生成的画面更具感染力和自由度，让创作的连贯性大大提升。

该功能的推出标志着AI视频创作进入了一个新时代，未来将继续探索如何精确控制多主体交互、风格统一、多变场景稳定切换等复杂元素，以满足更高层次的叙事需求。

相关推荐

美国女子AI生成号码中10万美元彩票

美国密歇根州45岁女子塔米卡·卡维通过ChatGPT随机生成的号码购买强力球彩票，意外赢得10万美元奖金。她平时极少购彩，此次因奖池超10亿美元突发奇想尝试AI选号，结果精准匹配4个白球和1个强力球号码，更因选择翻倍选项使奖金翻倍。这已是今年第二起AI推荐号码中奖案例，此前弗吉尼亚州一名女子同样通过ChatGPT选中15万美元。彩票机构紧急提醒公众：开奖完全随机，AI无法提高中奖概率。此事引发对技术伦理的讨论，部分专家担忧会催生“AI玄学”市场。

人工智能彩票 ChatGPT
AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”功能；Anthropic推出Claude Code网页版

今日AI领域动态：阿里夸克启动"C计划"布局对话式AI应用，剑指字节"豆包"；Anthropic推出Claude Code网页版，支持浏览器直接编码；谷歌Veo新增视频"精确编辑"功能，提升创作效率；Fish Audio升级S1语音克隆模型，10秒即可复刻真人声音；AWS美东故障影响ChatGPT等多项服务；DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈；Adobe推出AI Foundry服务，支持企业定制品牌AI模型；Anthropic发布Claude for Life Sciences，加速生命科学研究。

AI 对话式AI 阿里巴巴
GEO是什么意思？GEO如何优化在AI搜索中的排名？

GEO（生成式引擎优化）是适应AI搜索环境的内容优化策略，旨在系统性提升品牌在AI生成答案中的可见度、引用率和可信度。其核心原则包括：语义理解优先、内容结构化、权威信源建设、对话式内容设计。AI搜索用户年增长43%，超68%用户表示AI答案直接影响品牌信任度。实施GEO需通过研究分析、内容优化、技术标记和持续监测迭代。AIBase工具可量化品牌在主流AI平台的表现，帮助建立基准、发现差距并指导优化方向。

GEO 生成式引擎优化 AI搜索优化
Vidda 火星基地亮剑：C5 领衔四件套，改写影音产品性能规则

Vidda在AWE展会发布多款创新产品：C5无界Master投影仪搭载SST架构DMD芯片、双激光器和122mm影院级镜头，实现6800CVIA高亮度和精准色彩；发现X2026电视采用"墨晶屏"技术，解决强光反光问题；同时推出V11开放式耳机与G11智能眼镜，以轻量化设计提升佩戴体验。整场发布会通过实机拆解和极限测试，展现品牌"技术平权"理念，强调用户体验优先于参数竞争。
菁彩Vivid影院技术新标准发布，国产自研影音技术再升级

在高质量观影与产业发展需求驱动下，中国电影科研所联合行业机构研发"菁彩影院技术"，制定LED影院图像发行母版与音频处理器两项技术标准。该技术融合自主创新的菁彩Vivid技术与国际标准，实现高亮度、高动态范围等优质画面效果，支持沉浸式音频处理。目前全国已部署约180块LED电影屏，相关影片正式上映，标志着我国在高格式电影技术领域取得突破，为国产技术国际化提供支撑。

电影放映技术高格式电影沉浸式音频
全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

国庆假期前夕，OpenAI发布了Sora 2，一款旗舰视频和音频生成模型。据介绍，Sora 2可以完成以前的视频生成模型难以完成的事情，比如运动员的奥林匹克体动作、桨板上的后空翻，准确模拟浮力和刚度的动态等等，并擅长现实主义、电影和动漫风格。一则来自《连线》杂志的重磅爆料更是指出，OpenAI的下一步棋，并非简单升级一个模型，而是要亲自下场，推出一个独立的AI影�

OpenAI Sora 2
荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

本期AI日报聚焦多项技术更新：谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能；通义千问推出记忆功能提升对话连贯性；Sora2免费用户可生成15秒视频，Pro版支持25秒；百度文心助手升级8种创作模式；谷歌Flow工具增强视频光影编辑与音频合成能力；Anthropic发布高性价比Claude Haiku 4.5；北京查处首例AI虚假广告案，涉伪造主持人带货；阿里推出响应仅200毫秒的编程工具Qoder CLI。

AI 视频生成谷歌
革命来临：在生成式 AI 时代，SEO该怎么做

生成式AI正重塑SEO规则：搜索入口从点击列表转向答案直呈，SEO核心从"优化排名"升级为"优化被引用"。需打造能被AI摘录的内容（如FAQ、结构化数据），强化语义结构与权威性，监控"被AI引用"新指标。推荐使用AIBase GEO等工具量化AI可见性，实现从流量获取到答案源头的战略转型。

生成式AI SEO变革搜索入口
如何提高网站在AI摘要中的可见性?网站 GEO 优化应该这样做

在AI驱动的搜索时代，Google的AI摘要成为用户获取信息的首选方式，但也带来零点击加剧、网页点击率下降等挑战。文章提出从内容、结构、技术、权威与监测五大维度系统优化网站AI可见性：内容上采用问答结构、列表格式和语义覆盖；技术上确保页面可抓取、加载快速；强化E-E-A-T权威信号；并借助专业工具持续监测优化。通过综合策略可显著提升网站在AI摘要中的曝光机会。

AI Overviews 零点击现象
短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成

今日大家都在搜的词：

热文

3 天
7天

Vidu推出“主体参照”功能解决AI生成视频中的角色一致性问题

美国女子AI生成号码中10万美元彩票

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”功能；Anthropic推出Claude Code网页版

GEO是什么意思？GEO如何优化在AI搜索中的排名？

Vidda 火星基地亮剑：C5 领衔四件套，改写影音产品性能规则

菁彩Vivid影院技术新标准发布，国产自研影音技术再升级

全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

革命来临：在生成式 AI 时代，SEO该怎么做

如何提高网站在AI摘要中的可见性?网站 GEO 优化应该这样做

短视频加速跑入AI时代

今日大家都在搜的词：

热文

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

天猫双11今晚8点开卖品类券每人可领万元

余承东官宣华为路由X3 Pro 采用“日照金山”设计

火车免费坐？12306今起又上新功能：积分可兑换车票

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

王腾首次回应下一步计划：称在考虑些创业项目

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

天猫双11今晚8点开卖品类券每人可领万元

站长商机

Vidu推出“主体参照”功能 解决AI生成视频中的角色一致性问题

今日大家都在搜的词：

热文

站长商机

Vidu推出“主体参照”功能解决AI生成视频中的角色一致性问题