首页 > AI头条  > 正文

百度曦灵数字人平台升级 支持文生 3D 数字人、音色克隆等功能

2024-06-19 08:59 · 来源: AIbase基地

站长之家(ChinaZ.com)6月19日 消息:自6月20日起,百度智能云曦灵数字人平台将迎来一次重大的革新升级。这次升级不仅实现了精美2D/3D数字人的高效低成本生成,更在直播、短视频、对话等多个场景内实现了矩阵式打通,全面提升了用户体验。无论是企业IP打造、文旅IP设计,还是娱乐IP开发,曦灵平台都能提供一站式智能、便捷、好用的数字人服务。

全新升级的曦灵平台在数字人生成上展现了令人瞩目的能力。用户只需简单输入一句描述人像风格的文案,系统便能模仿人类思维,在短短10分钟内自动生成逼真的3D数字人。这种快速而精准的生成方式,为企业、文旅和娱乐等多个领域提供了全新的IP创造可能。

微信截图_20240619085847.png

在2D数字人克隆方面,曦灵平台同样展现了出色的技术实力。用户只需上传一张清晰的正面照,平台便能在秒级时间内生成对应的2D数字人形象。对于那些需要大批量生成数字人,但又缺乏视频拍摄条件的场景,如AI名片、保险经纪人等,这一功能无疑提供了极大的便利。

除了形象克隆,曦灵平台还提供了极速克隆和精品克隆两种选择。极速克隆仅需1-4分钟的闭嘴视频进行训练,半小时内即可完成克隆,口型特征基于大模型匹配结果,适用于追求效率的应用场景。而精品克隆则需要一段5-8分钟的张口视频进行训练,能够1:1还原真人,高度拟真,适用于对真人进行数字分身且要求高度还原的场合。

此外,曦灵平台还提供了音色克隆功能。用户只需30秒的录音,就能生成专属的定制音色,用于数字人的播报和内容生产,为用户提供了更多个性化的选择。

  • 相关推荐
  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • 闪剪AI有多香?定制数字人+方言语音克隆+智能成片,这功能真的太懂小白了

    文章介绍了"闪剪AI"这款智能视频生成工具如何帮助实体商家解决线上获客难题。该工具具有三大核心功能:1)30秒视频即可1:1复制用户形象和声音的数字人功能;2)自动生成符合本地化需求的实体店营销文案;3)智能成片功能,无需剪辑就能制作高质量短视频。此外还支持多方言配音、直播切片等特色功能,大幅降低内容创作门槛。作者作为技术小白亲身验证,该工�

  • ZEGO AI Agent:支持一张图生成数字人

    即构科技推出AI Agent2.4,用户只需上传一张正面照即可生成1080P高清数字人,支持实时互动对话。该技术具备400ms超低延迟、2秒内完成自然交互响应,唇形同步准确,支持文本/音频/语音流驱动。适用于教育、客服等场景,提供API灵活定制,实现低成本批量生成。核心技术融合照片驱动与实时AI交互引擎,在生成效率、拟真度方面显著提升,带来低门槛、高沉浸的数字人互动体验。

  • 闪剪AI:一键生成数字人营销视频,助力商家轻松实现内容获客

    闪剪AI是一款专为营销视频制作设计的智能工具,主要解决实体商家和小白用户制作高质量营销视频的痛点。核心功能包括:1)一键生成数字人视频,支持定制专属形象;2)提供1000+数字人模特素材;3)多语种语音克隆,实现本地化内容;4)内置爆款文案素材库;5)智能成片功能简化制作流程;6)照片数字人让静态图片"开口说话";7)直播切片功能实时引流。该工具

  • AI日报:百度发布“绘想”平台与MuseSteamer;阿里音频驱动全身数字人模型OmniAvatar

    【AI日报】今日AI领域重要动态:1.开源语音大模型Step-Audio-AQAA发布,实现音频到语音的端到端自然转换;2.百度推出"绘想"平台与MuseSteamer,通过AI一键生成专业级视频;3.浙大与阿里联合发布OmniAvatar,音频驱动数字人技术取得突破;4.百度搜索迎十年来最大改版,新增智能框、百看和AI助手功能;5.xAI开发者控制台新增Grok4及Grok4Code引用,预示新一代AI模型即将发布;6.Gemin

  • 百度网盘上线知识问答功能:你的数据会自己“说话”了

    ,百度网盘宣布上线知识问答”功能,变成活的知识库”。 据了解,百度网盘通过AI技术整合用户在网盘中的数据,如学习资料、生活照片、办公文件等多源信息,形成结构化知识库。 它帮助用户快速查找”、问答”、创作”,实现知识的长期沉淀与高效复用。 从存储工具到知识中枢,百度网盘实现了从被动存储”到主动管理”的升级,构建你的第二大脑”。 它支持多模�

  • 高德地图上线AR打卡功能:实现3D立体打卡 生成专属打卡视频

    阿里巴巴旗下高德地图正式上线创新AR打卡功能,通过深度整合AI技术与地图服务,为用户带来虚实融合的沉浸式打卡体验,无缝连接现实世界。 该功能依托前沿AI空间融合技术,突破传统二维地图限制,首创3D立体打卡。用户打开最新版高德地图App,点击右上角 ”号即可轻松开启AR之旅。 支持图片、视频、趣味AR道具及虚拟形象等多种打卡形式,完成打卡后系统将自动生成并

  • 最重要的搜索阵地,百度想誓死守住

    AI搜索的东风刮过两年,百度终于下决心,对自家搜索引擎“动刀子”。 7月2日,百度宣布开启十年来最大一次搜索改版,正式将搜索框改版成支持千字输入的“智能框”,从“给链接”跨越到了“给答案”。另外靠着智能体,百度搜索也进入了“解决任务”的阶段,并集成了AI写作、AI图片/视频生成等一系列服务。 当然,这还不够。在阿里夸克、字节豆包等产品不断往自家�

  • TDBC大会揭幕:百度智能云再造数据与AI新连接,激活大模型生命线

    中国通信标准化协会等机构联合主办的"TDBC2025可信数据库发展大会"在京召开。会上公布了上半年"可信数据库"评估测试结果,百度智能云向量数据库VectorDB成为国内首批完成测试的向量数据库产品。该测试覆盖稠密向量检索、多向量检索、标量向量融合检索三种场景,评估指标包括索引构建时间、QPS、延迟、资源占用等多个维度。百度智能云总架构师朱洁指出,超过50%的AI项目时间消耗在数据治理环节,提出构建"智能数据基座"实现数据统一管理,形成"Data+AI+App"闭环。百度智能云通过湖仓一体架构提升AI训练数据效率,智能调度CPU/GPU算力优化资源分配,预计到2028年多数生成式AI应用将直接基于企业数据平台构建。

  • AIGC赋能营销革命:网娱互动如何重构数字传播新生态

    文章探讨了数字化营销中品牌传播效率的瓶颈问题。传统内容生产方式陷入同质化困境,热点追踪和跨平台协作困难。网娱互动凭借AIGC技术打破僵局,通过智能算法与自动化流程深度融合,实现个性化精准传播,带来营销效率的指数级提升。AIGC智能引擎颠覆传统生产流程,实时抓取热点数据与用户画像,差异化产出原创内容。技术重构了营销成本结构,人力成本直降60%,团队转向策略优化与资源调度。未来趋势是从内容生成到智能生命体的进化,AIGC将打通短视频时代的传播链路,推动营销向"策略-执行-优化"自主决策的智能生命体进化。网娱互动的技术发展历程,正是营销行业迈向智能化的生动缩影。

今日大家都在搜的词: