Meta AI发布炸裂项目audio2photoreal 可将音频生成全身逼真的虚拟人物形象

2024-01-04 17:49 · 稿源：站长之家

站长之家（ChinaZ.com）1月4日消息:Meta AI最近发布了一项引人注目的技术，他们成功地开发出一种能够从音频中生成逼真的虚拟人物形象的系统。

这个系统能够根据多人对话中的语音生成与对话相对应的逼真面部表情、完整身体和手势动作。这些虚拟人物不仅在视觉上非常逼真，而且能够准确地反映出对话中的手势和表情细节，例如指点、手腕抖动、耸肩、微笑和嘲笑等。

项目及演示:https://people.eecs.berkeley.edu/~evonne_ng/projects/audio2photoreal/

代码:https://top.aibase.com/tool/audio2photoreal

Demo:https://colab.research.google.com/drive/1lnX3d-3T3LaO3nlN6R8s6pPvVNAk5mdK

这个系统的工作原理如下:

首先，Meta AI团队捕获了一组丰富的双人对话数据集，这些数据集能够提供逼真的重建。然后，他们构建了一个复合运动模型，其中包括面部运动模型、引导姿势预测器和身体运动模型。

在生成面部运动时，系统使用预训练的唇部回归器处理音频，提取与面部运动相关的特征，并利用条件扩散模型生成面部运动。

在生成身体运动时，系统根据音频自回归地输出每秒1帧的向量量化（VQ）引导姿势。然后，将音频和引导姿势输入到扩散模型中，以每秒30帧的速度生成高频身体运动。

最后，生成的面部和身体运动被传入训练好的虚拟人物渲染器，生成逼真的虚拟人物。

最终展示的结果是根据音频生成的全身逼真虚拟人物，这些虚拟人物能够表现出对话中的细微表情和手势动作。

这项技术的发布将为虚拟人物的创造和应用领域带来巨大的进步。无论是在游戏开发、虚拟现实还是电影制作领域，这种能够从音频中生成逼真虚拟人物的系统都将发挥重要作用。

Meta AI的成果再次展示了他们在人工智能领域的卓越能力和创新精神。他们不断推动着技术的边界，为我们带来了一个全新的虚拟人物生成的时代。我们可以期待在不久的将来，这种技术将成为我们生活中不可或缺的一部分。

（举报）

相关推荐

关键词：

Meta

软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

在“软件定义汽车”浪潮下，智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而，传统软件测试模式成本高、耗时长，难以覆盖复杂场景，易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破：需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式，测试工程师角色转向质量策略师。到2027年，超80%企业将集成AI测试工具，汽车行业2025年成为转型关键节点。

软件定义汽车智能汽车座舱体验
TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

TabTab是一款全链路AI数据分析助手，核心功能包括多源数据连接（支持文档、数据库、电商平台等）、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互，降低分析门槛，让非技术人员也能快速完成客户洞察、销售业绩等分析，显著提升效率。产品定位中立，致力于构建多元化AI效率提升生态。

数据驱动效率提升智能体
文远知行斩获美国以外首张城市级L4 Robotaxi商运牌照，中东规模化布局提速

11月10日，文远知行获阿联酋政府批准，取得全球首张城市级L4自动驾驶商业化运营牌照，可在阿布扎比开展无安全员的Robotaxi服务。这标志着其在中东实现纯无人运营落地。服务将通过Uber等平台上线，计划2026年车队扩至千台，2030年达数万台。凭借近百万公里数据与政府支持，公司将在阿布扎比实现单车盈亏平衡，并以此为起点推动全球智慧交通发展。

文远知行 Robotaxi L4自动驾驶
国内首个！火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

火山引擎推出国内首个融合国家智库理论框架与大规模实战验证的数据智能体评测体系，同步发布《2025数据智能体实践指南》。该体系直面传统评测重技术轻业务、预设答案难适配动态场景、局部能力检验不足三大痛点，确立业务关联性、可操作性与前瞻性设计原则。覆盖分析洞察、可视化呈现、鲁棒性三大核心维度，通过151道测试题量化智能体能力并划分达标/工业可用/专业研究三级标准。采用标准化闭环流程与自动化评分机制，为数字化转型深水区企业提供选型优化依据，推动产业智能化进入精准量化新阶段。

数据智能体评测体系多模态数据
小鹏将推出3款全球化Robotaxi 2026年同步开启试运营

小鹏汽车在2025科技日宣布，将于2026年推出三款全栈自研L4级Robotaxi，同步开启试运营。该车型搭载4颗图灵AI芯片，算力达3000TOPS，配备第二代VLA模型，具备强大泛化学习能力，能自适应全球不同交通习惯。作为中国首款全栈自研Robotaxi，无需额外改装，不依赖高精地图即可实现量产。车辆提供两套智驾方案，分别侧重通勤效率与极致安全，并在六大关键系统采用双冗余设计，确保行驶安全。小鹏还将开放Robotaxi SDK，与高德地图等伙伴共建全球服务生态。

小鹏Robotaxi L4级自动驾驶全栈自研
科杰科技&甲子光年：2025中国Data&AI数据基础设施白皮书

当前全球正经历地缘政治重塑与人工智能革命驱动的深刻变革。全球化向区域化演进，供应链加速本土化，AI从前沿技术跃升为核心生产力。麦肯锡研究显示，生成式AI有望为全球经济贡献7万亿美元，中国预计占2万亿美元，接近全球总量三分之一。传统数据系统难以满足AI对实时性、多模态处理和高弹性算力的需求，企业需构建新一代数据基础设施，实现数据生产、治理与AI应用的动态融合，突破"数据烟囱"，支持跨场景智能部署。Data&AI一体化将推动数据价值从效率提升向产业协同跃升，成为智能社会的核心引擎。

地缘政治人工智能经济增长
数据智能体 TabTabAI 正式上线，零门槛上手，让 “数据分析” 人人可用

AI数据智能体TabTabAI正式上线，以“零门槛交互+全流程自主处理”为核心优势，打破数据分析技术壁垒。该工具通过自然语言对话，支持多源数据采集、智能处理、深度洞察与可视化，让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力，覆盖从数据收集到决策建议的全链路，助力用户将原始数据高效转化为精准决策依据，真正实现“人人都是数据分析师”。

数据分析数据驱动 AI数据智能体
进博会“全勤生”三星的AI全景图：AI Home中国首秀

三星在进博会上首次展出AI+Home智能家庭解决方案，通过Bespoke AI、Vision AI和Galaxy AI三大模块，实现全场景智慧生活。AI正从"会语言"向"会行动"演进，软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势，打破端侧AI的性能、算力与存储"不可能三角"，构建起覆盖手机、电视、家电的生态闭环。未来，AI将全面接管生活，让科技真正服务于人。

端侧AI AI Home
重磅预告：全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析，覆盖数据获取、建模到可视化全流程。用户可用自然语言交互，系统自主规划任务并输出可维护结果，支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手，旨在降低分析门槛，助力企业高效挖掘数据价值，适用于数据分析师、营销人员等各类用户。

AI数据分析 Multi-Agent系统数据可视化
理想汽车为车辆起火事件致歉！李想：这次MEGA是主动召回生命只有一次我们不能等

10月31日，北京理想汽车主动召回部分车辆。因冷却液防腐蚀性能不足，极端情况下可能导致动力电池和电机控制器冷却铝板腐蚀泄漏，引发故障灯亮、动力受限或无法充电，甚至电池热失控。CEO李想称此为主动召回，强调即便事故概率仅万分之一，但生命只有一次，必须及时处理安全隐患。

理想汽车召回冷却液防腐性能动力电池热失控

今日大家都在搜的词：

热文

3 天
7天

Meta AI发布炸裂项目audio2photoreal 可将音频生成全身逼真的虚拟人物形象

软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

文远知行斩获美国以外首张城市级L4 Robotaxi商运牌照，中东规模化布局提速

国内首个！火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

小鹏将推出3款全球化Robotaxi 2026年同步开启试运营

科杰科技&甲子光年：2025中国Data&AI数据基础设施白皮书

数据智能体 TabTabAI 正式上线，零门槛上手，让 “数据分析” 人人可用

进博会“全勤生”三星的AI全景图：AI Home中国首秀

重磅预告：全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

理想汽车为车辆起火事件致歉！李想：这次MEGA是主动召回生命只有一次我们不能等

今日大家都在搜的词：

热文

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

鸿蒙智行：智界R7累计交付量破10万台

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

特斯拉Model Y L上线外放电功能最高可输出2200瓦功率

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

华为Mate70 Air官宣今日开启预售

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

何小鹏回应机器人IRON里是真人质疑：感谢认可

iPhone Air 2或新增1颗镜头：继续沿用6.5英寸高刷中屏

俞敏洪发文确认孙东旭离职：保持着良好的沟通

站长商机