首页 > 业界 > 关键词  > 谷歌AI最新资讯  > 正文

谷歌AI联合佛罗里达高校发布开源虚拟人物库“VALID” 含210个全套虚拟人物

2023-12-14 14:28 · 稿源:站长之家

🌐**划重点:**

1. 🤖 谷歌AR&VR与佛罗里达中央大学联合发布虚拟人物库“VALID”,包含210个经过验证的全套虚拟人物,代表七种不同种族。

2. 👥 研究涉及全球参与者,通过数据驱动的面部平均值,以及与志愿代表合作,创建了42个基础虚拟人物,以平衡不同种族和性别的参与者。

3. 📚 研究结果显示对亚洲、黑人和白人虚拟人物的一致认知,但美洲印第安和阿拉斯加原住民、西班牙裔、中东、北非、夏威夷和太平洋岛民等种族的虚拟人物在认知上存在歧义,强调了参与者种族对虚拟人物研究的影响。

站长之家(ChinaZ.com)12月14日 消息:谷歌AR&VR与佛罗里达中央大学的研究团队合作,发布了一项名为“VALID”的虚拟人物库,旨在促进多样性和包容。该库包含210个经过验证的、完全配备的虚拟人物,代表七个不同的种族,其中包括亚洲、黑人和白人等。研究采用了全球参与者,并通过数据驱动的面部平均值以及与志愿代表合作的方式,创造了42个基础虚拟人物,以确保在研究中平衡了不同种族和性别的视角。

image.png

为了验证虚拟人物的认知,研究团队采用了主成分分析(PCA)和K均值聚类等方法。在全球范围内选择了132名来自33个不同国家的参与者,以获取每个虚拟人物的认知种族和性别的验证标签和元数据。研究结果显示,亚洲、黑人和白人虚拟人物在各种族参与者中有一致的认知,但代表美洲印第安和阿拉斯加原住民、西班牙裔、中东、北非、夏威夷和太平洋岛民等种族的虚拟人物存在认知上的歧义,且受参与者种族的影响。

image.png

研究团队强调,亚洲、黑人和白人虚拟人物在所有参与者中都取得了超过95%的一致认知率,挑战了对于认知与自身种族不同的面孔的准确性较低的观念。他们将这归因于对多样性种族群的感知专业知识或熟悉,可能受全球媒体呈现的影响。

研究还观察到了同族偏见的影响,即同一种族的参与者更容易正确辨认一些虚拟人物。例如,西班牙裔虚拟人物在不同参与者中获得了不同的评分,但在仅由西班牙裔参与者中更准确地被感知。研究强调在虚拟人物研究中考虑参与者的种族对于确保准确代表是至关重要的。

由于认知上的不明确,一些虚拟人物被标记为模糊,而发型等因素影响了认知。对夏威夷和太平洋岛民虚拟人物的验证面临限制,突显了在代表性方面的挑战和需要更广泛招募的问题。

研究团队讨论了虚拟人物应用的影响,强调了在虚拟现实中可能导致陈规和社会判断的内外群体分类的潜在性。他们建议制定规定,以改善虚拟现实中的种族间互动。

作为对研究社区的贡献,团队提供了对“VALID”虚拟人物库的开放访问,为研究人员和开发人员提供了适用于各种场景的多样性虚拟人物。该库包括具有65个面部混合形状的虚拟人物,可用于动态表情,并与Unity和Unreal等流行游戏引擎兼容。研究团队承认了一些限制,如关注年轻和健康的成年人,计划在未来的更新中引入不同的区域类别、体型、年龄和性别,以扩大多样性。

研究团队成功创建和验证了一个多样性的虚拟人物库,挑战了刻板印象,促进了包容。该研究强调了同族偏见对虚拟人物认知的影响,并为在各个领域开发和应用虚拟人物提供了有价值的见解。这一开放访问的“VALID”库被定位为研究人员和开发。

项目网址:https://github.com/google/valid-avatar-library

论文:https://www.frontiersin.org/articles/10.3389/frvir.2023.1248915/full

谷歌博客:https://blog.research.google/2023/12/valid-perceptually-validated-virtual.html

举报

  • 相关推荐
  • 腾讯AI数字人AvaMo落地商用,百度/微美全息加速虚拟人生态闭环构建

    腾讯与Offshore公司达成战略合作,推出面向日本市场的AI数字人视频生成服务"AvaMo"。该服务基于腾讯云智能数字人技术,仅需1-3分钟视频样本即可创建高保真数字人,支持实时交互,能将30秒视频制作时间从传统的12小时压缩至15分钟。同时,百度也在数字人领域发力,展示手语数字人、直播数字人等应用案例。我国数字人产业生态日益完善,相关企业已达114.4万家。微美全息等企业通过整合AI、计算机视觉等技术,显著降低商业化门槛,推动数字人在社交、娱乐等场景的个性化应用。随着生成式AI技术发展,数字人制作效率和多样性显著提升,用户可打造更具个性化的数字产品。

  • 高校科研实验室集体“退烧”?亿万克液冷攻克散热难题

    随着高校科研对高性能计算(HPC)、人工智能(AI)和大数据分析需求的激增,传统风冷散热面临四大挑战:1)散热效率接近物理极限;2)空间利用率低;3)噪音污染严重;4)温控精度不足。液冷技术尤其是冷板式液冷方案凭借高效、节能、静音等优势成为新选择。某公司推出的冷板式液冷解决方案包含冷块模组、循环系统等核心组件,支持从单台设备到整个机房的灵活配置。该方案可提升计算性能8-15%,机架功率密度达30kW以上,PUE降至1.2以下,年省电费数十万元,噪音从70dB降至45dB以下,并释放25%以上机架空间。该技术不仅解决当前散热难题,更为未来设备升级预留空间。

  • 日本5公斤装大米均价超210元 盗米案频发 民众在米袋放GPS防偷

    日本大米价格持续17周创新高,5公斤装大米均价突破4200日元(约210元人民币),是去年同期的两倍多。由于米价长期走高,民众难以承受,近期日本频发盗米案件。5月16日一名50岁失业男子偷走76岁老人家中5公斤大米;青森县一名男子因无力购买大米,盗窃碾米厂价值2.2万日元(约1090元)的两袋糙米被捕。受害者纷纷在米袋中放入GPS定位器或苹果AirTag防盗,使得盗窃行为很快被发现。

  • 带货主播要下岗了 京东虚拟主播带货水平超80%真人 成本仅1/10

    已有超1万家商家使用京东数字人直播,成本仅为真人的1/10,带货水平却超越80%真人主播……

  • 虚拟币交易变抢劫?投资者直接以“绑架、折磨”进行勒索

    据称,这一连串令人发指的折磨行为源于一场与加密货币有关的争执,沃尔茨企图借此从受害者手中勒索数百万美元……

  • 人效提升|企业智能虚拟员工上线!尘锋AI员工赋能营销服环节,布局数智员工拥抱人机协同新趋势!

    文章介绍尘锋AI员工如何帮助企业解决营销、销售和服务环节的效率问题。该产品基于DeepSeek、豆包、文心一言等AI大模型能力,结合30+行业服务经验,可7*24小时在线响应客户咨询,精准识别客户意图并完成商品推荐、线索获取等售前关键动作。在销售转化环节,AI员工能快速挖掘意向客户并盘活沉默客户,提升线索利用率与转化率。售后环节则通过学习企业私有知识库解答专业问题,提升服务效率。尘锋作为SCRM行业领军企业,已服务30+行业超10,000家企业,提出未来"人+AI"工作新模式:1个优秀员工+N个AI协作,帮助企业降本增效,实现业务增长。

  • 小鹏汽车联合华为发布“追光全景”AR-HUD 解决三大痛点

    针对很多人因使用HUD尤其是AR-HUD时需要频繁切换焦段,导致眼部疲劳、容易晕眩的问题,小鹏汽车的这套系统在“不犯晕”上做出了突破。该系统拥有小于1%的行业最低静态畸变,虚像显示距离为10米远,配合行业领先的100ms低延时,能够让驾驶员告别眩晕不适,享受更加平稳、舒适的驾驶过程。 在“不遮挡”问题上,小鹏汽车同样表现出色。当前市面上HUD产品众多,但部分产

  • 2025国内五大AI测试供应商(含产品)深度盘点

    本文介绍了2025年国内AI测试领域的五大领先供应商及其创新实践。Testin云测作为行业开创者,其AI测试平台XAgent实现全流程智能化管理,测试用例采纳率达60%;腾讯优测依托大厂生态,推出新一代AI测试引擎,融合大模型技术重构质量体系;霍格沃兹测试开发学社通过培训赋能行业,其爱测平台支持跨终端测试;携宁科技专注金融领域,SiniCube平台降低测试门槛;同盾科技以决策智能技术延伸测试边界,Data4Test平台解决复杂测试痛点。这些企业通过差异化技术路径,勾勒出国内AI测试多元生态:从全栈智能化、大模型重构到垂直场景方案。未来随着多模态交互等技术融合,AI测试将向"全生命周期自动化"方向演进,推动行业质量体系智能化升级。企业可借鉴这些实践,加速测试效能提升,构建数字化转型核心竞争力。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • OpenAI发布云端AI编程智能体Codex:代码准确率高达90%

    OpenAI于5月19日正式推出基于Codex-1模型的云端AI编程智能体Codex。该工具具备强大的代码生成与理解能力,支持Python、JavaScript、C等主流语言,覆盖前后端开发、算法实现等多个领域。测试显示其处理常规编程任务的速度远超人工,代码准确率达90%以上,能显著提升开发效率。Codex深度集成GitHub,支持智能代码补全和结构化代码自动生成,使开发者平均编码时间缩短30%。目前该服务已面向ChatGPT+Pro等高级用户开放,未来有望成为软件开发领域的标配工具,推动AI辅助编程进入新阶段。