首页 > 业界 > 关键词  > 谷歌AI最新资讯  > 正文

谷歌AI联合佛罗里达高校发布开源虚拟人物库“VALID” 含210个全套虚拟人物

2023-12-14 14:28 · 稿源:站长之家

🌐**划重点:**

1. 🤖 谷歌AR&VR与佛罗里达中央大学联合发布虚拟人物库“VALID”,包含210个经过验证的全套虚拟人物,代表七种不同种族。

2. 👥 研究涉及全球参与者,通过数据驱动的面部平均值,以及与志愿代表合作,创建了42个基础虚拟人物,以平衡不同种族和性别的参与者。

3. 📚 研究结果显示对亚洲、黑人和白人虚拟人物的一致认知,但美洲印第安和阿拉斯加原住民、西班牙裔、中东、北非、夏威夷和太平洋岛民等种族的虚拟人物在认知上存在歧义,强调了参与者种族对虚拟人物研究的影响。

站长之家(ChinaZ.com)12月14日 消息:谷歌AR&VR与佛罗里达中央大学的研究团队合作,发布了一项名为“VALID”的虚拟人物库,旨在促进多样性和包容。该库包含210个经过验证的、完全配备的虚拟人物,代表七个不同的种族,其中包括亚洲、黑人和白人等。研究采用了全球参与者,并通过数据驱动的面部平均值以及与志愿代表合作的方式,创造了42个基础虚拟人物,以确保在研究中平衡了不同种族和性别的视角。

image.png

为了验证虚拟人物的认知,研究团队采用了主成分分析(PCA)和K均值聚类等方法。在全球范围内选择了132名来自33个不同国家的参与者,以获取每个虚拟人物的认知种族和性别的验证标签和元数据。研究结果显示,亚洲、黑人和白人虚拟人物在各种族参与者中有一致的认知,但代表美洲印第安和阿拉斯加原住民、西班牙裔、中东、北非、夏威夷和太平洋岛民等种族的虚拟人物存在认知上的歧义,且受参与者种族的影响。

image.png

研究团队强调,亚洲、黑人和白人虚拟人物在所有参与者中都取得了超过95%的一致认知率,挑战了对于认知与自身种族不同的面孔的准确性较低的观念。他们将这归因于对多样性种族群的感知专业知识或熟悉,可能受全球媒体呈现的影响。

研究还观察到了同族偏见的影响,即同一种族的参与者更容易正确辨认一些虚拟人物。例如,西班牙裔虚拟人物在不同参与者中获得了不同的评分,但在仅由西班牙裔参与者中更准确地被感知。研究强调在虚拟人物研究中考虑参与者的种族对于确保准确代表是至关重要的。

由于认知上的不明确,一些虚拟人物被标记为模糊,而发型等因素影响了认知。对夏威夷和太平洋岛民虚拟人物的验证面临限制,突显了在代表性方面的挑战和需要更广泛招募的问题。

研究团队讨论了虚拟人物应用的影响,强调了在虚拟现实中可能导致陈规和社会判断的内外群体分类的潜在性。他们建议制定规定,以改善虚拟现实中的种族间互动。

作为对研究社区的贡献,团队提供了对“VALID”虚拟人物库的开放访问,为研究人员和开发人员提供了适用于各种场景的多样性虚拟人物。该库包括具有65个面部混合形状的虚拟人物,可用于动态表情,并与Unity和Unreal等流行游戏引擎兼容。研究团队承认了一些限制,如关注年轻和健康的成年人,计划在未来的更新中引入不同的区域类别、体型、年龄和性别,以扩大多样性。

研究团队成功创建和验证了一个多样性的虚拟人物库,挑战了刻板印象,促进了包容。该研究强调了同族偏见对虚拟人物认知的影响,并为在各个领域开发和应用虚拟人物提供了有价值的见解。这一开放访问的“VALID”库被定位为研究人员和开发。

项目网址:https://github.com/google/valid-avatar-library

论文:https://www.frontiersin.org/articles/10.3389/frvir.2023.1248915/full

谷歌博客:https://blog.research.google/2023/12/valid-perceptually-validated-virtual.html

举报

  • 相关推荐
  • 格创东智ALIOTH系列S800F自动目检仪,实现半导体硅片0.3μm级缺陷检测

    国内某半导体硅片企业专注研发生产4-12英寸硅片产品,覆盖酸腐片、抛光片、外延片等关键材料。针对传统人工检测效率低、成本高、精度不足等问题,企业采用格创东智ALIOTH S800F自动目检仪,通过CV+AI算法实现0.3μm级缺陷检测,准确率达99%。设备支持20+种缺陷自动分类(准确率95%),30秒/片检测速度,年减少不良损失超千万元。系统建立百万级硅片缺陷数据库,为工艺优化�

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • AI赋能三星新一代折叠屏旗舰Galaxy Z Fold7 | Z Flip7,重塑折叠屏体验

    三星新一代折叠屏旗舰Galaxy Z Fold7和Z Flip7于2025年7月25日上市,搭载基于One UI 8系统深度优化的Galaxy AI,实现多模态智能助手与折叠形态的深度融合。通过与火山引擎、百度智能云等国内伙伴合作,打造更贴心的本地化AI体验,覆盖即时搜索、实时翻译、智能创作等功能,显著提升办公、娱乐及日常使用效率,标志着折叠屏手机正式进入“AI深度融合”新阶段。

  • 苹果被贴脸开大:AI跳票后被谷歌公开嘲讽

    今天谷歌发布一则广告片,谷歌在这则广告中就苹果AI跳票进行了嘲讽,喊话苹果用户应该购买Pixel 10系列智能手机。 谷歌在广告片中表示,如果你因为某个即将推出”的功能去购买一部新手机,如今这个即将推出”的时间已经持续了一整年,要么你需要重新定义即将推出”,要么你直接换一部手机。 此前在2024年苹果全球开发者大会上,苹果展示了由Apple Intelligenc驱动的个性

  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 报价345亿美元!AI新贵公司计划收购谷歌旗下Chrome浏览器

    美国AI搜索新贵Perplexity正考虑以高达345亿美元的全现金方式,收购谷歌旗下拥有逾30亿用户的Chrome浏览器。 成立仅三年、总部位于旧金山的Perplexity(由阿拉温德斯里尼瓦斯等人创立),专注于生成式AI搜索引擎,直接挑战谷歌和微软必应。 截至2024年4月,其月活跃用户约1500万,主要依靠付费订阅盈利。这家初创公司已从英伟达、软银集团等巨头筹集约10亿美元融资,最新估值

  • AI日报:可灵2.1推出全新首尾帧功能;昆仑万维上线AI音乐模型Mureka V7.5;腾讯云推出AI开发工具CloudBase AI CLI

    本文介绍了AI领域最新动态:1)快手可灵2.1推出首尾帧功能,提升视频生成效果;2)昆仑万维发布Mureka V7.5音乐模型,优化人声表现;3)腾讯云推出AI开发工具CloudBase AI CLI,可减少80%编码量;4)海外新品MuleRun通过虚拟机和AI Agent带来创新游戏体验;5)Meta开源DINOv3视觉模型,无需标注即可实现卓越性能;6)宇树科技人形机器人H1获1500米赛跑金牌;7)谷歌Gemini新增记忆功能和隐私聊天模式;8)香港大学开源OpenCUA框架,打造个性化电脑助手;9)OpenAI考虑在ChatGPT引入广告;10)谷歌发布超小型开源模型Gemma 3 270M,支持手机端运行。

  • 微算法科技(NASDAQ:MLGO)利用集成学习方法,实现更低成本、更稳健的区块链虚拟货币交易价格预测

    微算科技(NASDAQ:MLGO)利用集成学习方法开发了区块链虚拟货币价格预测模型。该模型结合随机森林、梯度提升树(GBDT)和长短期记忆网络(LSTM)等多种算法,采用Stacking集成策略,显著提高了预测准确性。通过数据收集、清洗、特征工程等步骤构建高质量数据集,并持续优化模型参数。该技术可应用于虚拟货币交易平台的风险管理、投资决策等领域,帮助投资者降低风险、提高收益,促进虚拟货币市场健康发展。未来将进一步拓展跨区块链数据整合应用。

  • 谷歌透露Gemini每次回答消耗能量:相当于微波炉运行1秒钟

    近日,谷歌发布了一份技术报告,详细说明了其Gemini大模型在每次查询中消耗的能源量。 据谷歌介绍,这是迄今为止大型人工智能公司发布的最透明估算,也是研究人员期待已久的报告。 报告称,Gemini应用的文字回答平均每次消耗0.24瓦特小时(Wh)的能量,大约相当于运行微波炉一秒钟,并排放0.03克二氧化碳当量。 据此前媒体报道,谷歌近日发布Gemini系列最轻量版本Gemma 3

今日大家都在搜的词: