首页 > 业界 > 关键词  > 谷歌AI最新资讯  > 正文

谷歌AI联合佛罗里达高校发布开源虚拟人物库“VALID” 含210个全套虚拟人物

2023-12-14 14:28 · 稿源:站长之家

🌐**划重点:**

1. 🤖 谷歌AR&VR与佛罗里达中央大学联合发布虚拟人物库“VALID”,包含210个经过验证的全套虚拟人物,代表七种不同种族。

2. 👥 研究涉及全球参与者,通过数据驱动的面部平均值,以及与志愿代表合作,创建了42个基础虚拟人物,以平衡不同种族和性别的参与者。

3. 📚 研究结果显示对亚洲、黑人和白人虚拟人物的一致认知,但美洲印第安和阿拉斯加原住民、西班牙裔、中东、北非、夏威夷和太平洋岛民等种族的虚拟人物在认知上存在歧义,强调了参与者种族对虚拟人物研究的影响。

站长之家(ChinaZ.com)12月14日 消息:谷歌AR&VR与佛罗里达中央大学的研究团队合作,发布了一项名为“VALID”的虚拟人物库,旨在促进多样性和包容。该库包含210个经过验证的、完全配备的虚拟人物,代表七个不同的种族,其中包括亚洲、黑人和白人等。研究采用了全球参与者,并通过数据驱动的面部平均值以及与志愿代表合作的方式,创造了42个基础虚拟人物,以确保在研究中平衡了不同种族和性别的视角。

image.png

为了验证虚拟人物的认知,研究团队采用了主成分分析(PCA)和K均值聚类等方法。在全球范围内选择了132名来自33个不同国家的参与者,以获取每个虚拟人物的认知种族和性别的验证标签和元数据。研究结果显示,亚洲、黑人和白人虚拟人物在各种族参与者中有一致的认知,但代表美洲印第安和阿拉斯加原住民、西班牙裔、中东、北非、夏威夷和太平洋岛民等种族的虚拟人物存在认知上的歧义,且受参与者种族的影响。

image.png

研究团队强调,亚洲、黑人和白人虚拟人物在所有参与者中都取得了超过95%的一致认知率,挑战了对于认知与自身种族不同的面孔的准确性较低的观念。他们将这归因于对多样性种族群的感知专业知识或熟悉,可能受全球媒体呈现的影响。

研究还观察到了同族偏见的影响,即同一种族的参与者更容易正确辨认一些虚拟人物。例如,西班牙裔虚拟人物在不同参与者中获得了不同的评分,但在仅由西班牙裔参与者中更准确地被感知。研究强调在虚拟人物研究中考虑参与者的种族对于确保准确代表是至关重要的。

由于认知上的不明确,一些虚拟人物被标记为模糊,而发型等因素影响了认知。对夏威夷和太平洋岛民虚拟人物的验证面临限制,突显了在代表性方面的挑战和需要更广泛招募的问题。

研究团队讨论了虚拟人物应用的影响,强调了在虚拟现实中可能导致陈规和社会判断的内外群体分类的潜在性。他们建议制定规定,以改善虚拟现实中的种族间互动。

作为对研究社区的贡献,团队提供了对“VALID”虚拟人物库的开放访问,为研究人员和开发人员提供了适用于各种场景的多样性虚拟人物。该库包括具有65个面部混合形状的虚拟人物,可用于动态表情,并与Unity和Unreal等流行游戏引擎兼容。研究团队承认了一些限制,如关注年轻和健康的成年人,计划在未来的更新中引入不同的区域类别、体型、年龄和性别,以扩大多样性。

研究团队成功创建和验证了一个多样性的虚拟人物库,挑战了刻板印象,促进了包容。该研究强调了同族偏见对虚拟人物认知的影响,并为在各个领域开发和应用虚拟人物提供了有价值的见解。这一开放访问的“VALID”库被定位为研究人员和开发。

项目网址:https://github.com/google/valid-avatar-library

论文:https://www.frontiersin.org/articles/10.3389/frvir.2023.1248915/full

谷歌博客:https://blog.research.google/2023/12/valid-perceptually-validated-virtual.html

举报

  • 相关推荐
  • AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

    本期AI日报聚焦多领域突破:OpenAI视频应用Sora登陆安卓平台并引入付费角色功能;网易云音乐推出AI调音大师实现智能音效适配;字节跳动高薪布局人形机器人赛道;谷歌Gemini平台将升级图像生成技术;llama.cpp实现多模态革命;特斯拉秘密实验室通过行为数据训练机器人;上海首例AI著作权案宣判保护原创;微软推出自研图像生成器MAI-Image-1,在创意效率与质量间取得平衡。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 平安云原生AI算力资源调度平台,荣获IDC “AI-就绪数字基础设施领军者优秀奖”

    近日,IDC公布2025年中国未来企业大奖获奖名单,平安科技打造的《云原生AI算力资源调度平台》创新项目荣获“AI就绪数字基础设施领军者优秀奖”。该平台通过统一资源池化管理、动态调度及GPU虚拟化等技术,显著提升资源利用率约30%,降低运营成本,并支持金融级高可用与弹性伸缩,助力企业高效应对AI推理与训练场景需求,体现了平安在AI基础设施构建与产业赋能方面的技术实力与国际认可。

  • 脑机接口商业化资本涌动,Neuralink/微美全息强化系统规划谋发展全局

    马斯克旗下Neuralink公司展示渐冻症患者通过脑机接口控制机械臂进食,这是其获批临床研究项目的重要进展。脑机接口技术正推动医疗设备从辅助工具升级为神经替代系统,吸引全球上万患者参与试验。该技术绕开传统神经肌肉交互路径,在思维与机器间建立直接通信,不仅应用于医疗康复,还延伸至教育、工业等领域。随着政策支持与技术融合,脑机接口产业加速壮大,预计2028年中国市场规模将达614亿元,未来十年有望迎来爆发式增长。

  • 菁彩Vivid搭载车量超百万,携手车企迎来车载应用新里程碑!

    2025年11月5日,世界超高清视频产业联盟在深圳举办UWA+峰会,宣布中国自主三维音频标准“菁彩声”(Audio Vivid)车载应用装机量突破100万台。该标准基于AI技术,支持7阶HOA渲染与128轨实时处理,解码延迟低于80ms,实现三维空间精准定位与“黄金听音位”个性化体验。已覆盖鸿蒙智行、奇瑞等十余家车企29款车型,获IEC国际标准认证,与Dolby AC-4等并列全球四大三维音频标准。通过构建“标准-内容-终端”生态,推动中国音频产业从技术领先迈向市场引领。

  • 以算力为基,优刻得与IDEA共建低空经济新格局

    10月24日,粤港澳大湾区数字经济研究院低空经济院长李世鹏一行访问优刻得上海总部,与董事长季昕华、副总裁韩畅交流。双方围绕低空经济发展趋势、技术攻关及生态共建等达成多项合作意向,将共同推动低空经济产业创新与落地。此前中共二十届四中全会提出加快低空经济等新兴产业发展。双方团队将在技术产品创新、生态共建与全球化布局等领域深化合作,整合云计算与产业资源优势,促进低空经济全链条发展,把握战略机遇,引领产业健康、智能、可持续发展新阶段。

  • 1.3亿美元!LiblibAI拿下国内最大AI应用融资

    2025年AI应用公司LiblibAI完成1.3亿美元B轮融资,由红杉中国等机构领投,创国内AI应用赛道最大单笔融资。该公司通过“工具集成+社区生态”模式,整合图像、视频、3D等多模态能力,覆盖从灵感到成片的完整AI工作流,已孵化超2000万创作者。平台将加速全球化布局,打造多模态内容生态,标志着AI投资正从底层模型转向应用层落地。

  • 信锐助力TCL获 “2025中国IDC未来企业大奖联接领军者”优秀奖!

    10月17日,TCL空调办公网络智能连接与体验升级项目在IDC中国CIO峰会获“2025未来企业连接领军者”优秀奖。该项目依托信锐“AI+网络自动驾驶”理念,通过全网智能2.0与小信GPT方案重构企业网络管理模式,实现从感知、分析到决策的智能闭环,助力TCL实现20+维度数据采集、7*24小时AI调优及自然语言交互运维,推动企业数字化转型升级。

  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

今日大家都在搜的词: