首页 > 传媒 > 关键词  > 具身智能最新资讯  > 正文

它石智航 WIYH 数据集正式开源:全球首个具身 VLTA 多模态数据,加速具身智能真实世界落地

2025-12-27 13:37 · 稿源: 站长之家用户

引语:在具身智能领域,数据是智能的最重要燃料,它石智航正成为“为众人抱薪者”。

12月26日,它石智航重磅开源了全球首个大规模真实世界具身 VLTA(Vision-Language-Tactile-Action)多模态数据集 ——World In Your Hands(简称 “WIYH 数据集”):https://wiyh.tars-ai.com/。该数据集首次亮相于今年10月,并在刚刚结束的它石智航技术首秀发布上,作为「超级算法」中的核心成果之一得到行业广泛认可。首秀现场展示的世界首台可人工刺绣机器人等成果,其丝滑动作背后的核心正是基于 WIYH 数据集训练的AWE2.0模型。

WIYH 数据集通过首创 “Human-centric”(以人为中心)的数据采集新范式,破解了遥操作数据采集规模化成本高、仿真数据在 sim2real 时存在 GAP,难以丝滑迁移到现实世界的痛点,填补了具身智能所需的高质量、可泛化、大规模真实世界数据的空白,为具身基座模型实现 Scaling Law 提供了关键语料。要知道,当前具身智能所需数据量与现有储备之间至少相差两个数量级,WIYH的开源正为填补这一鸿沟提供了核心解法,加速了具身智能落地真实世界的进程。

在 Human-centric 采集范式下形成的 WIYH 数据集,具备了真实可靠、丰富多元、全面多模态、规模化等特征,并拥有海量数据:包含超过10万条以上的真实人类操作视频、40余种任务类型、100多种人类技能,覆盖了含520 余种真实物品,真实还原商超、酒店、餐饮、工业、办公、家居等多行业的10种核心场景全链路任务,数据将分批次释放。WIYH是业内最大的Human-centric数据集,且仍在不断扩展和丰富中。

场景和任务分布

各场景技能分布

物体和技能词云

采集了丰富的数据之后,行业还面临数据迁移这另一核心难题,为此它石构建了 TARS Datacore 具身数据引擎。作为云端大模型,它实现了全流程的自动化标注,将原始视频转化为机器人能理解的“教科书”。这套标注体系不仅涵盖了标定、深度、动作、指令、思维链 (COT)、掩码(Mask)和触觉(Tactile)等基础信息,更通过以下三类精准标注,形成了从感知到动作的全链路闭环:

  • 原子任务标注:理解“做什么”。将复杂动作拆解为“抓取、移动、放置”等不可再细分的逻辑单元,并配以自然语言指令,让机器人明白长流程任务的操作顺序与步骤内涵;

  • 图像感知标注:看清“在哪里”。通过云端语义模型给每个物体打上清晰的边界标签(掩码),并利用3D 视觉技术计算画面中物与人的深度距离,赋予机器人精准的空间感,使其能理解物体的边界与远近;

  • 视觉语言标注:思考“为什么”。这是最关键的“大脑训练”,它通过空间明确指代操作对象,防止机器人在杂乱环境中错认目标。同时,让模型预测下一步任务,并设置逻辑陷阱来校验机器人的判断力。

它石首席科学家丁文超博士表示,“Human-centric数据采集范式配合TARS Datacore数据引擎,可以记录和生产最高质量、最丰富的具身智能数据,真正使得scaling law成为可能。”

强大的数据采集与迁移能力,共同打磨出 WIYH 数据集在空间推理、世界模型、跨本体迁移等方面的独特优势。目前,多项基准测试结果已印证了 WIYH 数据集的核心价值:

  • 在视言大模型(VLM)的空间推理评测中,通过对 GPT-4o、Qwen-VL-Plus 等主流模型在空间推理(SR)和空间感知(SP)等维度的对比发现,虽然各模型在通用视觉任务上表现出色,但在处理复杂的以人为中心的空间逻辑时仍存在显著差异。这一基准测试直观地揭示了当前大模型在感知操作空间时的局限,也凸显了 WIYH 数据集在训练更高阶空间感知能力方面的独特价值。

  • 在世界模型(World Model)的物理一致性验证上,WIYH 数据集展现了强大的“物理引擎”属性。评测结果显示,在加入 WIYH 数据后,COGVIDEO 和 DYNAMICRAFTER 等视频生成模型在一致性、流畅度、动态性和质量等四大关键指标上均实现了全面跨越,其中动态性(Dynamic)指标得分提升了15.6分。配合4D 重建技术,通过对“倒酒”、“叠衣服”等任务进行精确的几何重建,为模型理解真实世界的物理动态提供了高真值的监督信号,确保生成的动作既流畅又符合物理常识。

  • 在机器人跨本体迁移实验(Cross-embodiment Experiments)层面,WIYH 数据集真正实现了“从人到机器”的能力迁移。通过将人类演示视频与机器人操作数据进行协同训练(Co-training),机器人在复杂场景下的泛化能力得到了质的提升。实验数据表明,在极其杂乱的场景中,仅机器人操作数据只能达到8% 成功率的任务,在引入 WIYH 人类视频辅助后,成功率暴涨至60%。这一显著的性能增益证明了 WIYH 数据集不仅是视觉语料,更是提升机器人实战能力、解决真实世界非结构化环境操作难题的核心“养料”。

它石创始人兼 CEO 陈亦伦博士认为,“在 AI 领域,最极致的开放不是开源模型,而是开源数据集,因为所有的 AI 模型本质上都可以通过数据和合适的训练方法‘生长’出来。” 它石WIYH的此番开源,正是以开放的态度,为行业通用具身基座模型训练提供关键语料和基础设施,助力具身智能迈向通用智能的新高峰。

它石WIYH数据集于今日起(12.26)可正式访问。该网站构建了从认知到实践的全方位支撑:用户既能通过结构化的数据集全景展示、基准测试结果与典型用例,快速完成对数据集性能与场景的初步了解,又能配合快速入门指南与自动化 SDK,直接进入深度的落地实践与开发部署。网站公布了标准化的 off-the-shelf (OTS) 开源可复现方案,也放出了 TARS商用级Human-centric数据解决方案TARS SenseHub的相关信息。 TARS SenseHub 是由它石自研的超轻量数据采集套件,包含 “眼睛” TARS-Vision 与 “双手” TARS-Glove 两大关键组件。其核心理念是让人类和机器共享同一套感知体系,即机器人通过数据“能看人之所看,感人之所感”。

未来,它石智航将继续坚持以人为中心的具身数据与模型新范式,持续挖掘真实世界的数据价值,让面向万物、赋能万业的具身智能真正从实验室走进千家万户。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 一库尽收,融合智胜:金仓数据库以“一体替代”重塑企业数据基座

    在数字化浪潮中,企业面临数据模型爆炸式增长的“甜蜜烦恼”。传统“一事一库”方案导致技术栈复杂、成本高昂、数据孤岛林立。金仓数据库(KingbaseES)提出“一体替代”方案,通过多模融合架构,在一个数据库内核中原生支持并优化时序、GIS、文档、向量等多种数据模型,实现跨模型联合查询。金仓不仅深度兼容Oracle、MySQL等主流数据库语法与协议,实现平滑迁移,更通过时序+融合、GIS+融合、文档+融合、向量+融合等能力,释放全场景数据价值。其企业级高可用、高安全、高性能及易运维特性,已助力金融、能源、政府等多行业完成数据基座升级与智能化转型,为企业应对复杂数据挑战、布局未来创新提供了更可靠、高效、经济的一站式数据底座选择。

  • 华为云TaurusDB以“存算分离”实现数据库架构跃迁

    在数字化转型浪潮中,数据成为企业核心资产,数据库选择直接关系系统稳定性、扩展性与成本效率。华为云推出云原生数据库TaurusDB,完全兼容MySQL生态,支持计算存储分离架构,显著提升性能并降低成本。其具备极致弹性、Serverless架构及HTAP混合负载能力,有效应对高并发与动态业务需求。结合企业级GaussDB,华为以“双引擎”战略为企业提供数据库现代化升级的确定选择。

  • 《中国经济活力数据之夜》以数据见证中国经济韧性与活力

    1月29日,中央广播电视总台财经节目中心主办的《中国经济活力数据之夜》通过大数据发布、专家解读、AR呈现等方式,串联消费、流通、外贸、企业、人才等核心领域数据,邀请十位经济学家共话经济脉动。活动展现2025年中国经济顶压前行、向新向优的发展态势,为“十五五”开局注入信心与奋进力量。

  • 李明江与数据中心的节能进化之路

    在算力需求持续攀升的当下,数据中心正成为数字经济的核心基础设施。随着“双碳”与ESG要求从政策走向刚性约束,行业挑战已从“是否要绿色”转向“能否在长期运行中真正实现绿色”。这一变化重塑了数据中心的价值评估标准,促使行业重新审视运维技术的关键作用。传统认知中,节能被视为建设阶段的结果,但实践表明,高密度算力带来的持续热负荷、绿电波动等复杂因素,使节能与安全间的平衡变得脆弱。运维技术正从幕后走向前台,成为决定数据中心能否在绿色目标下稳定运行的核心能力。以运维结果为导向,通过制冷协同、能源调度、废热回收等系统化方案,推动数据中心从能源消耗体转变为区域能源循环节点,实现绿色、稳定、高效的长期运行。

  • 如何将数据传输到电脑?掌握这5招,传输毫不费力

    本文针对电脑间数据传输的常见困扰,提供了实用解决方案。文章首先指出选择传输方法前需考虑传输速度、数据量大小、系统兼容性、硬件/网络条件及数据安全等关键维度。接着提出三大核心原则:安全优先、适配优先和高效优先。最后,文章详细介绍了五种核心传输方法:使用专业软件(如EaseUS Todo PCTrans Pro)、外部存储设备、局域网传输、Windows“就近共享”以及云存储同步,并分别说明了其适用场景与操作要点,旨在帮助用户根据具体需求高效、安全地完成数据传输任务。

  • Xavvi品牌赞助《数据资产运营师》专项培训晚宴

    2026年1月28日,Xavvi品牌在北京举办《数据资产运营师》专项培训晚宴,近60位行业嘉宾出席。活动聚焦全球可信数据空间战略,旨在赋能企业出海。Xavvi联合全球影响力AI经济联合会(GIAEA),提出构建开放、公平、可信的数据基础设施,通过打造创作者数据主权平台、中国企业出海加速器、AI教育公益基础设施及“影响力经济+教育公益”双驱动生态四大核心举措,助力企业降低出海成本与合规风险,同时推动技术普惠与价值共享,缩小数字鸿沟,促进数字经济高质量发展。

  • 奥维睿沃2025数据公布,海信百吋电视全球出货量份额第一

    近年来,海信通过“Big Plan百吋风暴”计划,推动百吋电视从高端小众走向主流市场,成为家庭电视升级首选。2025年,海信在全球百吋电视出货量中占比近半,其成功源于对RGB-Mini LED等核心显示技术的持续创新。该技术通过“玲珑4芯真彩背光”架构和自研AI画质芯片,实现了画质突破。随着日韩品牌收缩战线,海信引领“中企进、日韩退”的行业变局,巩固了全球市场领先地位。

  • 每日互动大数据:女性更多、爱播客、重品质——这届“攒金青年”的真实画像

    近两年金价波动加剧,“攒金”在年轻人中流行。从“攒金豆”到囤金条,黄金等贵金属既满足消费欲,也被视为相对稳健的资产配置方式。数据显示,18-34岁“攒金青年”中女性占比更高,偏好更集中;整体消费水平高于同龄人,多分布在一线城市。他们既关注资产保值,也乐于投入生活品质与精神消费,在理性与热爱间寻找更稳妥的生活节奏。

  • 华为云Flexus OBS:中小企业数据上云的“更优解”

    在数字化浪潮中,数据成为企业核心资产,但存储成本高、安全威胁复杂、运维困难等挑战让中小企业对“上云”犹豫不决。华为云Flexus+OBS以成本最优、安全可靠、管理简单三大优势,成为中小企业数据上云首选。其创新计费机制与灵活资源包组合,可降低综合成本20%;通过防泄漏、防丢失、防篡改三重防护体系,保障数据安全;预置场景化功能,实现一键归档、网站托管、内容分发,大幅降低使用门槛。Flexus+OBS适用于互联网、医疗、制造等多行业,助力企业轻松应对存储挑战,开启数字化进阶之旅。

  • u盘删除的文件怎么找回?专业工具实操,u盘数据恢复全场景覆盖

    U盘文件误删后,多数情况下可通过专业软件恢复。文章介绍了数据丢失的常见原因,如误格式化、文件系统损坏、病毒攻击等,并解释了文件删除后数据未被立即覆盖的恢复原理。关键操作包括立即停止使用U盘、选择可靠恢复工具(如易我数据恢复软件),并区分故障类型处理。同时强调预防措施的重要性,如多重备份、安全移除设备和定期维护,以全方位守护数据安全。

今日大家都在搜的词: