首页 > 业界 > 关键词  > GaussianAvatars最新资讯  > 正文

新AI技术Gaussian Avatars:让AI轻松模仿瞪眼、挑眉等表情

2023-12-06 13:55 · 稿源:站长之家

划重点:

🔗慕尼黑工业大学等机构的研究团队成功开发了一项名为GaussianAvatarsAI技术

🤖 GaussianAvatars技术:可控逼真头部虚拟,挑战面部极端表情和细节

👀、张嘴、瞪眼、挑眉等表情,通过GaussianAvatars技术都能成功模仿

站长之家(ChinaZ.com)12月6日 消息:近期,慕尼黑工业大学等机构的研究团队成功开发了一项名为Gaussian Avatars的AI技术,能够在表情、姿态和视角上实现完全可控的逼真头部。这一技术引起了广泛关注,尤其是在复制人类面部极端表情和细节方面取得了显著进展。

张嘴、瞪眼、挑眉等表情,通过GaussianAvatars都能被AI成功模仿,甚至在加大难度的情况下,模仿的效果仍然非常到位。这使得视频诈骗变得更加难以防范,因为虚拟人物头像可以完美复现各种夸张的表情,从而欺骗观众。

image.png

Gaussian Avatars的方法基于三维高斯splats,通过在FLAME(对整个头部进行建模)网格的每个三角形中心初始化一个3D高斯来实现动态3D人头表示。在动画化FLAME网格时,每个高斯模型会根据其父三角形进行平移、旋转和缩放,形成辐射场以弥补网格未准确对齐的问题。

为了提高虚拟人物的重建质量,研究团队引入了绑定继承策略,同时在保真度和鲁棒性之间寻找平衡,以实现新颖的表情和姿态的动画化。实验结果显示,GaussianAvatars在新颖视图渲染、驾驶视频重现等方面表现优异,远远超过现有研究。

GaussianAvatars技术的成功开发意味着AI模仿能力已经达到了令人印象深刻的水平,为虚拟形象的动态表现提供了更多可能性,但同时也引发了对于如何应对潜在滥用的担忧。这一研究成果将在计算机视觉和图形学领域引发深远的影响,促使我们重新思考在数字时代面对虚拟表情的防范策略。

论文链接:https://arxiv.org/pdf/2312.02069.pdf

项目主页:https://shenhanqian.github.io/gaussian-avatars

举报

  • 相关推荐
  • 星耀南山、创见未来,「X-Day」西丽湖路演社创业之星Next Star专场燃动科创热潮

    11月15日,“X-Day”西丽湖路演社在深圳大学城举办“创业之星”Next+Star百万奖金全球赛专场,联动政府、投资、金融等多方资源,构建资本对接桥梁,助力创新项目落地南山。活动汇聚6个硬核项目,覆盖AI、生物医药等领域,展现前沿产业活力。平台通过常态化路演与赛事联动,已促成超5.3亿元股权融资及2.34亿元银行授信,持续优化区域科创生态,彰显南山“鼓励创新、支持创业”的浓厚氛围。

  • AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

    本期AI日报聚焦多领域突破:OpenAI视频应用Sora登陆安卓平台并引入付费角色功能;网易云音乐推出AI调音大师实现智能音效适配;字节跳动高薪布局人形机器人赛道;谷歌Gemini平台将升级图像生成技术;llama.cpp实现多模态革命;特斯拉秘密实验室通过行为数据训练机器人;上海首例AI著作权案宣判保护原创;微软推出自研图像生成器MAI-Image-1,在创意效率与质量间取得平衡。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 从“实现需求”到“共创价值”:AI Native时代需要什么样的工程师团队?

    在1024程序员节,小红书技术副总裁风笛出席CCF工程师文化日五周年庆典,分享AI时代技术团队转型方向。他指出传统开发模式下工程师仅1/3时间编码,其余被会议沟通挤占,导致技术成长受阻、创新力下降。提出AI Native时代需重构协作模式:通过任务导向的扁平化组织,让工程师从需求执行者转变为价值创造者。以48小时上线翻译功能为例,展示新型协作效能。强调AI不会取代工程师,而是将其角色提升至系统定义和复杂性管理的新高度。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • AI全面落地双11,淘宝走出一条和OpenAI不同的路

    ​今年的双11已经进入最后阶段,消费者和商家都有一个明显的感受是,AI的浓度真的很高,并且AI的全面落地应用,真的在改变传统用户购物、商家经营的链路。 消费者能感受到两个比较明显的变化:一个是AI导购开始走进真实的购物场景。淘宝为双11投入了六款AI导购类产品,其公布的数据显示,AI万能搜已经帮助消费者解决了5000万个消费需求。 另一个则是平台推荐的商品越

  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • OpenAI发布GPT-5.1:情商大涨 本周开始推送

    OpenAI正式推出GPT-5.1模型,以“智商与情商深度融合”为核心亮点。新模型优化推理能力,强化情绪价值与个性化交互,包含Instant与Thinking两大核心版本:Instant首次引入自适应推理功能,针对复杂任务延长思考时间,简单问题保持极速响应;Thinking版本智能分配思考时长,提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型,支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度,防范拟人化风险。付费用户可保留旧版三个月过渡期。

今日大家都在搜的词: