首页 > AI头条  > 正文

阿里虚拟人项目TaoAvatar:可在AR场景说话的全身虚拟人,有表情和动作

2025-03-25 09:29 · 来源: AIbase基地

近日,阿里巴巴集团旗下的研究团队低调发布了一项引人瞩目的新技术——TaoAvatar。这项创新项目专注于构建照片级逼真的3D 全身可说话虚拟人,旨在为增强现实(AR)应用带来革命性的体验,让数字世界中的互动更加生动自然。TaoAvatar 的出现,预示着我们未来的 AR 体验拥有了能听、能说、有表情、有动作的“虚拟化身”

QQ20250325-092514.png

打破次元壁,AR场景中栩栩如生的“你”

TaoAvatar 最核心的功能在于其能够创建与真人高度相似的3D 全身虚拟形象。更重要的是,这些虚拟形象并非 статичные 模型,而是能够在 AR 的3D 场景中进行实时对话

QQ_1742865979553.png

想象一下,在未来的电商直播中,你看到的不再是平面的主播画面,而是一个立体的、如同真人大小的虚拟形象,在你的房间里热情地介绍商品。在全息通讯中,远方的朋友将以生动的3D 形象出现在你面前,仿佛近在咫尺。

表情丰富,肢体自然:打造有“灵魂”的虚拟人

为了让 AR 体验更加真实,TaoAvatar 在面部表情和身体动作的控制方面下了很大功夫。

通过集成 Audio2BS 模型,虚拟人的面部表情和手势能够根据语音内容动态生成,实现口型、表情和动作的自然同步。这意味着虚拟人在说话时,不仅嘴巴会动,还会伴随着自然的眼神交流和肢体语言,使其看起来更富有情感和生命力

实时渲染,流畅体验:90FPS畅游AR世界

对于 AR 应用而言,流畅的体验至关重要。TaoAvatar 采用了 3D 高斯溅射(3DGS)技术,实现了高质量的实时渲染

即使在像 Apple Vision Pro 这样的高清立体显示设备上,TaoAvatar 也能保持 90帧每秒的流畅运行。这保证了用户在使用 AR 应用时,虚拟人的动作和交互都能够平滑自然,毫无卡顿感,从而带来更佳的沉浸式体验。

轻量高效,多平台兼容:未来AR触手可及

除了高质量的渲染,TaoAvatar 还具备低存储需求和良好的跨平台兼容性。这使得它能够部署在各种移动和 AR 设备上,例如 Apple Vision Pro。

为了实现高性能和低资源占用,TaoAvatar 团队首先构建了一个个性化的服装扩展 SMPLX 网格,并将高斯纹理与之对齐。然后,他们利用教师网络学习复杂的姿态相关的非刚性变形,并通过知识蒸馏技术将其“烘焙”到一个轻量级的 MLP 网络中。

此外,他们还开发了可学习的高斯混合形状来增强外观细节。这些技术的结合,使得 TaoAvatar 在保证渲染质量的同时,也具备了在资源受限的移动设备上运行的能力,为未来的普及奠定了基础。

展望未来:TaoAvatar开启AR沉浸式交互新时代

TaoAvatar 的发布,不仅展示了阿里巴巴在3D 虚拟人技术上的最新进展,更预示着 AR 应用将迎来更加沉浸和自然的交互方式。无论是远程协作、在线教育、虚拟社交还是数字娱乐,TaoAvatar 都有望发挥重要作用,让用户在 AR 世界中拥有一个可沟通、有情感的“数字替身”

项目入口:https://top.aibase.com/tool/taoavatar



  • 相关推荐
  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

  • 数据智能体 TabTabAI 正式上线,零门槛上手,让 “数据分析” 人人可用

    AI数据智能体TabTabAI正式上线,以“零门槛交互+全流程自主处理”为核心优势,打破数据分析技术壁垒。该工具通过自然语言对话,支持多源数据采集、智能处理、深度洞察与可视化,让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力,覆盖从数据收集到决策建议的全链路,助力用户将原始数据高效转化为精准决策依据,真正实现“人人都是数据分析师”。

  • “全球Robotaxi第一股”文远知行:港股上市临近,商业化进程加速

    文远知行通过港交所聆讯,正式进入港股上市冲刺阶段,将构建“美股+港股”双资本平台。作为全球自动驾驶标杆企业,其产品已在7个国家获自动驾驶牌照,在11国30城开展测试运营,安全运营超2200天。技术层面,预测算法误差控制在0.2米内,感知模型延迟小于10毫秒,系统检测精度达99%。成本大幅下降,单车成本降至几十万元,二季度营收同比增长60.8%,自动驾驶网约车业务猛增836.7%。近期获准在北京开展夜间道路测试,向全天候服务网络迈出关键一步。随着技术成熟与商业模式验证,万亿级自动驾驶市场正迎来规模化运营拐点。

  • VITA平台赋能AI办公,沸蛇AI语音鼠标提升办公效率

    云决科技推出VITA一站式AI办公平台,结合自研AI语音鼠标,通过软硬件协同创新提升企业效率。该平台集成DeepSeek等大模型,用户无需切换工具,语音即可调用文字处理、数据分析、创意设计等多元功能,实现会议纪要生成、PPT自动制作、视频一键合成等操作,节省80%工作时间。针对教育、IT、行政等不同行业提供专属解决方案,整合100多个AI应用场景和200多种模板,持续优化产品功能,致力于成为职场人士提升效率的智能助手。

  • 科杰科技&甲子光年:2025中国Data&AI数据基础设施白皮书

    当前全球正经历地缘政治重塑与人工智能革命驱动的深刻变革。全球化向区域化演进,供应链加速本土化,AI从前沿技术跃升为核心生产力。麦肯锡研究显示,生成式AI有望为全球经济贡献7万亿美元,中国预计占2万亿美元,接近全球总量三分之一。传统数据系统难以满足AI对实时性、多模态处理和高弹性算力的需求,企业需构建新一代数据基础设施,实现数据生产、治理与AI应用的动态融合,突破"数据烟囱",支持跨场景智能部署。Data&AI一体化将推动数据价值从效率提升向产业协同跃升,成为智能社会的核心引擎。

  • 雷军晒新疆亲测小米YU7照片:单手握方向盘 表情轻松

    今天,小米集团创始人雷军在社交媒体晒出一组在新疆亲测小米汽车YU7的照片。 画面中,他单手握持方向盘,神情轻松惬意,背景是新疆壮丽的雪山戈壁景观。 这也契合雷军的新年目标,除了交付30万辆车、健身打卡100次外,还有去更多地方看看美景、尝尝美食,顺便测测汽车。 从照片细节来看,小米YU7的内饰设计尽显高端质感,橙黑撞色的真皮座椅搭配精致的车内工艺,

  • iOS 26液态玻璃效果能关了 苹果iOS 26.1 Beta 4新增液态玻璃开关

    苹果公司10月21日向iPhone用户推送iOS 26.1开发者预览版Beta4更新,新增Liquid Glass液态玻璃透明度切换开关,用户可将界面调整为“色调”模式以增强通知可读性。此次更新延续iOS 26的液态玻璃设计语言,带来更沉浸的视觉体验。同时支持关闭锁屏滑动相机功能避免误触,并扩展Apple Intelligence对丹麦语、荷兰语、繁体中文等七种语言的支持,让更多地区用户享受智能服务。

  • 特斯拉新一代Roadster年内亮相 马斯克曾称零百加速不到1秒

    特斯拉首席设计师弗朗茨冯霍尔茨豪森近日在一档播客节目中明确表示,新一代特斯拉Roadster将按计划于今年亮相,研发进展顺利且已接近完成。 作为特斯拉的最强性能版本车型,新一代Roadster的性能参数一直受到网友关注。 特斯拉CEO马斯克此前曾披露,该车型设定了极为大胆的性能目

  • 重新定义开放式耳机通讯体验:开石OpenRock推出全球首款可拆卸磁吸咪杆开放式耳机,于Kickstarter震撼上线

    OpenRock推出全球首款可拆卸磁吸开放式耳机Link20,搭载独家MagShield™ FusionTech磁吸连接技术,解决传统开放式耳机通话质量差的痛点。产品采用人体工学近场音孔设计,配合5麦克风阵列与AI降噪系统,实现高清通话与Hi-Fi级音质。单耳仅重9克,支持IPX7防水与13小时续航,现已在Kickstarter开启首发预售,早鸟价105美元。

  • 王腾发文祝REDMI K90 Pro Max大卖 王化回复“拥抱”表情

    Redmi宣布将于10月23日全球首发K90 Pro Max,定位“史上最强K系列”。前品牌总经理王腾时隔多月更新微博为新机预热,称其为研发团队倾注心血的巅峰之作。小米内部高管集体互动响应,卢伟冰透露该机将实现“脱胎换骨式升级”,直言这是4000元价位段最具竞争力的产品,凭借极致性能“通杀”同价位市场。

今日大家都在搜的词: