首页 > 业界 > 关键词  > SANPO最新资讯  > 正文

Google AI推出SANPO:多属性视频数据集助力视觉场景理解

2023-10-16 10:39 · 稿源:站长之家

划重点:

- Google AI推出了SANPO数据集,用于户外人类主观场景理解。

- SANPO包括真实世界和合成数据,具有丰富的注释和多属性特征。

- 这个数据集将有助于研究人员开发视觉导航系统,支持视障人士,并拓展先进的视觉场景理解。

站长之家(ChinaZ.com)10月16日 消息:Google AI最近推出了名为SANPO的数据集,旨在帮助AI模型更好地理解户外人类主观场景。这一数据集的重要性在于,它不仅包括真实世界的数据,还包括合成数据,以及丰富的注释和多属性特征。这个数据集的推出将有助于解决自动驾驶领域之外的人类主观场景理解的问题。

SANPO数据集的名称来源于其功能,包括“场景理解、可访问性、导航、路径规划和障碍物避免”。它由真实世界数据和合成数据组成,其中真实世界数据包括来自两个立体摄像头的视频,支持多视角方法。这个数据集还包括了11.4小时的视频,以每秒15帧的速度捕获,并具有密集的注释。

image.png

为了保护隐私,Google的研究人员在数据采集过程中遵循了当地、城市和州级的法律,并在发送数据进行注释之前,确保删除了任何个人信息,如人脸和车辆牌照。

为了克服捕捉视频时的不完美,比如运动模糊和人工评分错误,研究人员引入了SANPO-Synthetic,这是一个高质量的合成数据集,旨在与真实世界的条件相匹配。SANPO-Synthetic包括1961个会话,使用虚拟化的Zed相机录制,头部和胸部位置均衡分布。

SANPO数据集的另一个特点是对一部分真实世界数据和合成数据进行了全景实例掩模的注释,为每个像素分配了类别和ID。与真实世界数据不同,SANPO-Synthetic每帧包含更多实例。此外,SANPO是唯一一个同时具有全景分割和深度图像数据的数据集。

研究人员使用SANPO数据集训练了两个最先进的模型,分别用于深度估计和全景分割。他们发现,这一数据集对于密集预测任务来说非常具有挑战性,而合成数据的准确性要高于真实数据,这主要是因为真实世界的环境相对复杂,而合成数据的分割注释更加精确。

SANPO数据集的推出填补了人类主观场景理解领域缺乏数据集的空白,它包括真实世界和合成数据,具有丰富的注释和多属性特征,以及全景分割和深度信息的独特组合。此外,研究人员的隐私承诺使这一数据集能够支持其他研究人员开发面向视障人士的视觉导航系统,并推动先进的视觉场景理解领域的发展。

SANPO博客介绍:https://blog.research.google/2023/10/sanpo-scene-understanding-accessibility.html

举报

  • 相关推荐
  • 小渔夫20周年荣膺Google双料大奖,共筑品牌出海新生态

    2025年8月14日,小渔夫在Google中国总部举办的B2B代理商高层研讨会上,凭借出海营销领域的突出贡献,成为全国唯一同时获得谷歌“百万会员俱乐部战略合作伙伴”与“星火Plus优秀客户成长合作伙伴”双项认证的企业。这标志着谷歌对其技术实力和重塑B2B出海营销模式的战略认可。双方将携手推动B2B客户从效果营销向全方位海外营销转型,打造行业标杆案例,助力更多中国B2B企业在国际舞台绽放光芒。

  • Google Gemini vs Deepseek:谁更适合你的业务场景?AI大模型选型终极对比指南

    企业在选择大模型时面临两难:国际大厂的Gemini技术先进,但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出:1)跨境电商客服场景中,Gemini多语言识别准确率提升12%,但需注意API延迟问题;2)金融研报分析场景下,DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键:抛开参数迷雾,聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具,3分钟生成专属选型报告,让技术决策不再玄学。

  • 重磅!标贝科技推出「十万音色·自然语音数据集」 重构AI语音训练基础设施

    标贝科技发布"十万音色·自然语音数据集",覆盖中英双语,包含10万种音色样本(中文5万、英文5万),基于近百万小时原始数据经智能生产线精细打磨。该数据集在规模、真实性和准确性三大核心指标实现突破,支持多情感表达和跨场景应用,涵盖基础情绪到特定风格,话题涉及多个领域。通过音频质量筛选、文本转写校正、说话人分离等技术,从海量数据中甄选出高质量样本,为语音识别、合成等AI模型训练提供坚实基础,助力实现更自然、真实的语音交互体验。

  • 领星ERP:筑牢数据安全防线,契合数据合规标准,为跨境企业发展保驾护航!

    在数字化浪潮下,跨境企业运营愈发依赖数据支撑。数据安全与合规对跨境企业至关重要,尤其对计划上市的企业,数据泄露或违规操作可能面临高额罚款、损害声誉,影响上市进程。领星ERP作为跨境电商ERP市场领先的管理系统,构建了九大安全防护体系,从物理环境、网络硬件到数据管理、权限控制等多维度保障数据安全。同时,其业财一体化方案确保业务与财务数据无缝集成,符合不同国家财税法规,助力企业实现数据合规,为稳健发展提供坚实支撑。

  • AI火花集|AI火花先锋添新力,拆解保险、客服、物联网AI落地实战

    AI正加速渗透产业,2025年全球AI投资预计达2000亿美元,年增长近翻倍。保险、电商客服、智能家居成为落地先锋。暖哇科技、云起未来、蜂助手分别聚焦保险理赔自动化、电商智能客服、5G+AI物联网,通过实战方案推动AI从概念验证走向规模化应用。面临数据价值陷阱、流通壁垒等挑战,企业需构建专业知识库并优化人机协同。未来AI将深入产业毛细血管,汇聚零散创新火花,�

  • 看了这些数据,就能明白Mistplay为何总是“最懂玩家”

    8月4日,第22届ChinaJoy在上海圆满落幕。游戏激励平台Mistplay成为BTOB展区热门展台,吸引了众多业内人士探讨中国游戏出海新方向。Mistplay通过分析玩家游戏习惯,精准匹配游戏产品,突破传统买量模式,实现玩家、平台、开发商三方共赢。其最新报告显示:解谜类游戏留存率最高;41%玩家希望获得登录奖励;67%玩家偏好实质性奖励。平台建议开发商采用个性化促销策略,如生日优惠、进度奖励等,并预测2025年激励系统将成为手游重要战略。Mistplay的数据分析为手游发行商提供了宝贵的市场洞察。

  • OPPO Find X9九月开始预热:首批搭载天玑9500

    OPPO Find系列产品负责人周意保与网友互动时暗示,OPPO Find X9系列会在9月开启预热。 博主数码闲聊站此前爆料,OPPO Find X9系列会在10月份正式发布,按照惯例,本次发布会将会推出Find X9和Find X9 Pro两款机型。

  • 警惕金融“暗礁”!KOO钱包以实际行动筑牢用户财产安全

    金融科技发展背景下,非法金融活动如“财富黑洞”威胁公众财产安全。KOO钱包通过剖析常见骗局,警示公众识别陷阱。非法金融活动包括非法集资、证券期货交易及网络借贷等,常以高收益零风险为诱饵。典型案例有老年人投资陷阱、校园贷危机和虚拟币骗局,提醒公众理性投资,选择正规平台,多方合力提升防范能力,守护财富安全。

  • VivienneWestwood饰品真假识别有保障,得物App专业鉴别体系护航正品消费

    Vivienne Westwood"土星"项链因满钻和珍珠设计走红网络,但随之出现大量高仿品。得物App通过专业鉴别体系帮助消费者识别真伪:1)资深鉴别师从绳结、土星标志等细节辨别,正品绳结紧密为多股线,仿品松散;2)科研实验室借助3D超景深显微镜放大101倍观察,正品十字顶部平直、金属珠自然融合,仿品呈弧形且做工生硬;3)依托超10万件正品样本库(含近500件Vivienne Westwood单品)建立鉴别标准。平台采用"先鉴别,后发货"模式,确保消费者购买到正品。

  • OPPO Find X9 Ultra影像曝光:全新2亿主摄加持

    博主数码闲聊站爆料,OPPO Find X9 Ultra配备全新2亿像素超大底主摄以及超大底潜望长焦,同时测试了多分区光谱摄像头,可以同时识别并处理场景中不同区域里的多种环境色温,修正画面色彩表现,让照片色彩精准还原。 该博主还爆料,OPPO Find X9 Ultra的2亿像素主摄尺寸是1/1.1英寸,这是OPPO第一次在Ultra机型上使用2亿像素摄像头。

今日大家都在搜的词: