首页 > 传媒 > 关键词  > 正文

灵初智能双模型亮相,全球人类手部数据集正式开源

2026-04-11 17:45 · 稿源: 站长之家用户

4月10日,灵初智能正式发布新一代具身大模型Psi-R2与Psi-W0,并宣布开源首批1000小时人类手部操作全模态数据集。该数据集总储备达10万小时,为当前行业最大的开源人类手部操作数据集,标志着具身智能从实验室走向产业化的关键一步。

Psi-R2是首个使用10万小时量级人类数据预训练的World Action Model,输入图片和语言即可输出预测的未来视频和机器人动作。基于"The Bitter Lesson"理念,模型直接通过运动学将人类关节与机器人对齐,让模型从海量数据中自主学习。实验表明,仅需不到100条轨迹的真机数据微调,即可完成手机装配、工业包装、叠纸盒等长程精细操作,大幅降低企业部署成本与落地周期。        Psi-W0作为Action-Conditioned World Model,核心功能是对Policy进行评估与提升,并通过强化学习将人类数据的dynamic迁移至机器人dynamic,与Psi-R2形成数据飞轮:在Psi-W0中微调生成机器人数据,筛选高质量数据重新加入训练,实现能力持续迭代提升,完成从人类经验到机器人能力的快速转化。

此次开源的数据集具备三大亮点:全模态覆盖视觉、语言、关节角度、触觉四类信息;通过自研外骨骼手套采集,3D轨迹精度达亚毫米级;涵盖工业装配、生活操作、物体抓取等多场景任务。该数据集可广泛应用于智能制造、物流仓储、商业服务等商业化场景,加速具身智能在千行百业的落地应用。

目前,灵初智能正与北京石景山区共建数采基地,与腾讯云达成深度合作,并携手觅蜂科技、智域基石等头部数据服务商构建产业生态。灵初智能以"数据+模型"双轮驱动,推动具身智能从Demo走向规模化商用,助力产业智能化升级。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 啃最硬的骨头:灵初智能如何正面破解具身智能”不可达三角”

    具身智能行业存在“不可达三角”——高泛化性、高灵巧性、高成功率三者难以兼得。灵初智能从成立起便正面挑战这一难题,其Psi-R2模型率先攻入L3级长程灵巧操作区,基于10万小时人类数据预训练,覆盖4821种任务、1382种物体,仅需少量真机轨迹微调即可完成手机装配、纸盒折叠等复杂操作。从R0到R2的模型演进,通过双模型架构形成正反馈循环,使三个维度从“此消彼长”变为“协同增长”。商业化主战场选择泛物流与泛零售的“半结构化”场景,如服装仓储,验证L3级能力优势。

  • 真实世界数据飞轮:灵初智能正在构建具身智能的新护城河

    具身智能行业共识:缺乏真实世界数据难以训练出可落地的机器人。不同于语言模型和自动驾驶,机器人需学习复杂物理交互,涉及视觉、语言、空间、触觉等多模态融合。摩根士丹利指出,机器人“大脑”技术未定型,真实世界数据正成为核心壁垒。灵初智能通过自研数据采集方案ψ-SynEngine,大幅降低成本并积累10万小时人类手部操作数据,开源首批1000小时数据集。其核心在于构建“数据—模型—执行—反馈—再训练”闭环,让每次场景落地转化为数据积累,推动模型持续进化。未来竞争将聚焦于稀缺、有效、可持续的真实世界数据掌控能力。

  • 每日互动携个知·智能工作站亮相2026全球数据周 融入全球数字生态

    2026全球数字合作交流会在上海成功举办,主题聚焦“数据产业化、产业数字化、数据国际化”。大会汇聚全球政企学研精英,共商数据要素国际合作。每日互动总裁刘宇受邀在“AI Agent全球产业生态论坛”发表演讲,强调AI应“用得起、用起来”,并展示其“个知·智能工作站”系列产品,以“云边端库”架构兼顾数据安全与智能普惠。此外,公司“发数站”助力数据流通,已在杭州等地落地应用,吸引30多个国家近百家企业参展,推动AI从概念走向规模化。

  • 普渡机器人正式发布具身智能大模型PuduFM 1.0

    2026年5月11日,普渡机器人发布具身智能大模型PuduFM1.0,构建三维空间深度感知、物理状态预测和持续进化学习三大技术维度,实现从“简单执行”向“物理认知”的跨越。该模型通过分层架构和虚实双数据闭环,解决行业在协作、操作和异构数据复用上的困境,支持超长程任务和异构机器统一运行,推动具身智能规模化落地。

  • sora正式停服,国内版天空AI视频生成模型发布

    Sora宣布停服后,国内“天空AI”视频生成大模型正式发布。该模型由温州专帮信息科技推出,支持文本、图片生成逼真视频,核心亮点是用户无需GPU服务器,用家庭或办公电脑即可完成算力,成本几乎为零。目前发布三个版本:手机版、单机版和多用户商用版,并支持OEM贴牌、私有化部署等技术服务,实现低成本、高效率的视频创作。

  • 可灵AI携中美韩三国导演亮相戛纳,打造AI影视工业化全球样本

    在戛纳电影节上,可灵AI举办论坛,聚焦AI在影视工业中的应用。中、美、韩导演分享了三条路径:混合制作模式(如《大卫王朝》成本仅为传统三分之一,观看人数超5000万)、纯AI院线电影(如《RAPHAEL》仅7人团队完成)和AI赋能传统动画(如《镖家风云》制作周期缩短三分之一)。可灵AI的原生4K功能成为工业级交付关键,导演们强调AI降低了成本与周期,让创作更聚焦于想象力与故事本身。

  • 小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线

    今日,小米正式发布并开源Xiaomi OneVL自动驾驶模型。 该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一,在具备XLA模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案。 其在精度上超越显式CoT、在速度上对齐仅答案”预测的潜空间CoT方案。过去,VLA和世界模型是自动驾驶领域两条相对独立的技术路线:VLA专注于理解�

  • 格创东智亮相深圳国际人工智能展览会:“章鱼智脑”+智能体集群,解锁工业智造新路径

    5月14日,2026全球人工智能终端展暨第七届深圳国际人工智能展以“端启未来·万物新生”为主题开幕,汇聚TCL、荣耀等超400家展商。TCL展示AI创新产品矩阵,格创东智则凭“章鱼大脑”智能决策中枢及智能体集群成为焦点,其以“打造AI自主决策的超级工厂”为核心,通过章鱼大脑、品质管理等四大板块,呈现工业智能决策实践路径。章鱼大脑采用“决策+执行Agent”架构,实现数据闭环,已落地多家半导体工厂,达成分钟级异常处置、良率实时监控等成效。未来,格创东智将持续迭代,推动从AI辅助向自主决策转型,助力中国智造高质量发展。

  • 百度文心大模型5.1正式发布

    百度正式发布了新一代基础大模型——文心大模型5.1。该模型采用了自主研发的“多维弹性预训练”技术,仅以业界同规模模型约6%的预训练成本,便达到了基础效果领先的水平,并登上LMArena搜索榜国内第一的位置。 在多项行业权威基准测试中,文心5.1在智能体、知识理解、逻辑推理以及深度搜索等核心能力上表现突出。其中,智能体能力提升显著,已超越DeepSeek-V4-Pro;创意�

  • 在人类命运的十字路口握手---著名人类学家胡家奇会见诺奖得主巴里·巴里什

    2026年4月,人类会理事长胡家奇在北京会见诺贝尔物理学奖得主、“引力波之父”巴里·巴里什教授,展开两小时跨学科对话。胡家奇提出“科技失控必将导致人类灭绝”的五步逻辑论证,包括工具杀伤力指数级跃升、接近灭绝能力、手段不可控趋势、防御窗口期消失及爆发不可避免性。巴里什高度认同其核心论断,称赞其构建“和平、友好、均富的非竞争社会”的理想,并亲笔寄语支持。这场对话标志着自然科学与人文社科的深度碰撞,为全球科技治理共识注入新动力。

今日大家都在搜的词: