首页 > 业界 > 关键词  > 计算机视觉最新资讯  > 正文

百度AI领域新专利获授权:虚拟数字人说话将更像真人

2023-02-13 15:00 · 稿源: 快科技

近日,北京百度网讯科技有限公司的虚拟对象驱动方法、深度学习网络的训练方法及装置”专利获授权(申请公布号:CN115345968A)。

百度AI领域新专利获授权:虚拟数字人说话将更像真人

根据专利摘要显示的信息,则以专利涉及人工智能相关的深度学习、计算机视觉、虚拟 / 增强现实和图像处理技术领域,可应用于虚拟数字人、元宇宙等场景。

具体实现方案包括:响应于获取的语音数据,确定初始语音特征;对初始语音特征进行时序增强处理,得到目标语音特征;基于目标语音特征和目标虚拟对象的基准面部图像,生成唇形图像序列;根据唇形图像序列,对目标虚拟对象进行驱动,使目标虚拟对象执行与语音数据匹配的唇部动作。

简单来说,依靠该专利,基于人工智能深度学习,虚拟数字人在发声时,嘴唇部分的肌肉动作能够更为贴近真人,从而实现整体拟真度的提升。

在后续,基于这一技术,以及百度公布的类ChatGPT项目文心一言(ERNIE Bot),百度有望推出高度拟真,且可以与用户自然对话的虚拟形象。

举报

  • 相关推荐
  • 百度AI:熬过“起大早”的孤独,等来时代的奖励

    AI的故事,又进入到了新阶段。 11月13日,第20届百度世界大会举行。在这场被视为AI行业风向标的会议上,百度创始人李彦宏发表了题为《效果涌现》的主旨演讲。他表示,当前,“我们更关心如何让AI与我们要做的每一项任务,都能有机结合,让AI成为企业发展和个人成长的原生推动力。” 这场演讲的核心,恰恰道出了AI产业的分水岭——从“智能涌现”迈向“效果涌现”。

  • 百度搜索推出“百度猎户座”AI引擎,涵盖基座模型、搜索AI API、 MCP、垂类优势能力

    2025年11月13日,百度发布“百度猎户座”AI引擎,全面开放25年搜索技术与前沿AI能力。该系统整合底座模型、搜索API、MCP及垂直领域能力,基于多智能体架构统一连接信息、工具、服务与模型,融合搜索技术优势与全网MCP生态资源。即日起对外开放,支持企业快速接入打造专属AI应用。同时,文心助手上线个性化记忆功能,视频生成推出“参考生成”玩法,AI短剧创作平台免费提供超30万部IP资源及全流程工具。

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 百度Q3财报:AI业务增长超50% 萝卜快跑季度单量增长212%

    今日,百度发布2025年第三季度财报显示,该季度总营收312亿元,核心营收247亿元。 三季度,百度首次披露AI业务收入,显示同比增长超50%。

  • 百度搜索AI API全面开放 绝大多数结果由AI生成

    11月13日,百度创始人李彦宏在2025百度世界大会上宣布,百度搜索已实现绝大多数结果由AI生成,首条结果富媒体覆盖率高达70%。他强调,百度正通过AI技术深度重构搜索结果页,从传统文字链接模式转向以图片、视频等富媒体内容为核心的AI应用。李彦宏指出,百度是全球搜索引擎中对AI化改造最激进的,正引领行业进入全新时代。他还表示,企业需善用AI方能立于不败之地,个人也需掌握AI技能以掌控未来。目前,百度已通过AI+API开放搜索能力,与三星、荣耀、vivo等主流厂商建立合作,共同探索AI搜索的无限可能。

  • 百度发布全球最大通用智能体 活跃用户超2000万

    在百度世界2025大会上,百度正式宣布其智能体产品GenFlow3.0已在百度文库与百度网盘全端上线,目前活跃用户突破2000万,已成为全球规模最大的通用智能体,致力于帮助用户在工作、学习和生活中成为超级个体”。 GenFlow3.0被定位为全球首个全端通用智能体,具备更强大的多模态通用能力,可实现全模态内容的输入、处理与输出。 该产品采用中心化原生Multi-Agent架构,结合行�

  • 百度发布 2025 年第三季度财报:AI 业务收入同比增长超 50%

    日,百度正式发布2025年第三季度财报,数据显示,公司当季总营收达312亿元,其中百度核心业务营收247亿元,AI业务成为核心增长引擎,收入同比增长超50%,展现出强劲的商业化落地能力。 在AI云领域,百度实现33%的同比增长,其中AI高性能计算基础设施的订阅收入同比激增128%。财报披露,百度千帆大模型平台已完成全面升级,推出整套Agent Infra解决方案,进一步强化模型服�

  • 百度世界2025:罗永浩数字人同款慧播星高说服力技术向全球开放

    在今日盛大举行的百度世界大会上,百度公司宣布了一项重大举措——“罗永浩”同款慧播星高说服力数字人技术正式向全球开放。百度创始人李彦宏在大会上强调,数字人技术并非简单的应用工具,而是AI时代的一种基础性技术,甚至可能成为全新的通用交互界面,引领未来人机交互的新潮流。 据百度公布的数据显示,在今年双 11 购物节期间,慧播星数字人带货成绩斐然,

  • 百度旗下小度AI眼镜Pro正式开售:售价2299元

    站长之家(ChinaZ.com)11月10日 消息:今日,百度旗下备受瞩目的小度 AI 眼镜 Pro 正式开启发售,售价定为2299元,这一消息迅速吸引了众多科技爱好者和消费者的目光。在外观设计上,小度 AI 眼镜 Pro 提供了波士顿和猫眼两种时尚款式,满足了不同消费者的审美需求。镜片方面,用户既可以选择墨镜款式,也能挑选光致变色镜片,而且支持直接配近视镜片,无需采用夹片设计,为

  • 百度发布小度AI眼镜Pro:集成四大核心AI能力 售价2299元

    11月13日,2025百度世界大会在京开幕。百度集团副总裁、小度科技CEO李莹发布全新智能穿戴设备——小度AI眼镜Pro,售价2299元,已在电商平台开售。产品集成四大AI核心能力:AI识物可快速识别物体信息;AI翻译支持36种语言实时互译,针对医疗、金融领域优化术语库;AI备忘通过语音即时记录信息;AI会议纪要能自动提炼要点并生成待办清单。设备主打轻便舒适,整机重39克,提供两种时尚款式,支持定制镜片,具备IP54防护等级。硬件搭载第一代骁龙AR1平台,配备2GB+32GB存储,采用索尼1200万像素镜头,支持4K拍照与1440p视频录制。内置173mAh电池,配合智能眼镜盒可实现68小时综合续航。

今日大家都在搜的词: