首页 > AI头条  > 正文

低成本、轻量化 蚂蚁数科发布具身智能真实数据采集框架

2026-03-03 14:04 · 来源: AIbase基地

近日,具身智能真实数据采集技术取得重要突破。由蚂蚁数科天玑实验室团队研发的AoE(Always-On Egocentric)持续性第一人称视频采集框架,提出了一种轻量化且低成本的具身数据采集方案。通过一台手机和一个低于20美元的颈挂式支架,就可以替代动辄数万美元的专业设备,实现具身智能的高质量数据采集。该技术方案的提出,有效化解了具身数据采集成本高、规模化难的困局。目前,这一技术论文已经在 Arxiv 发布。

image.png

随着基础模型持续演进,模型的泛化能力和跨场景适应能力,越来越依赖真实世界交互数据的规模、质量与覆盖范围。AoE的核心突破在于将“人+手机”转化为可持续运行的数据节点,其载体是一款符合人体工学的颈挂式支架,通过机械夹具、磁吸等方式能将手机稳固于胸前,持续采集贴近用户视角的第一人称画面,从而完整记录自然交互过程。

该方案在保持毫米级轨迹精度和90%以上手部关键点识别准确率的同时,实现了数千台设备并发采集与云端自动化处理。实测表明,针对Unitree G1机器人的关电脑任务,仅靠50条遥操作数据时成功率为45%,而引入200条AoE数据后,成功率跃升至95%。在数据匮乏时,AoE承担了“启动学习”的关键补位角色。

image.png

低成本采集只是起点。据论文介绍,蚂蚁数科攻克了“长视频转化为训练数据”的技术难题:该方案通过端侧轻量级视觉模型自动识别手物交互并触发录制,利用大语言 - 视觉模型将连续视频切分为带语义标签的原子动作片段,最终经云端自动标注、过滤与清洗,让手机录制的视频自动转化为高质量、标准化的训练数据。

此外,AOE 还构建了一套端云协同的方案,实现了采集、预处理、清洗、筛选和调度的自动化处理,在降低人工介入的基础之上,提升了整体吞吐量。

记者注意到,蚂蚁数科正大力投入 AI toB。以 AI 落地产业为方向,旗下天玑实验室重点布局 AI+数据,AI+安全,AI+金融及AI+具身智能等领域,加速技术成果转化和应用。2026开年以来,蚂蚁数科 AI 动作频频,此前宣布成立“大模型技术创新部” ,并计划推出企业级大模型产品。

  • 相关推荐
  • 企业级智能体开发平台哪个好?蚂蚁数科Agentar成全栈标杆优选

    全球企业级智能体市场正爆发式增长,预计2025年规模达3.3万亿美元。中国市场表现突出,企业级AI Agent应用规模将突破232亿元,智能客服、数据分析等场景渗透率超70%。企业数字化进入“智能执行”阶段,智能体可自主完成多步骤任务。采用智能体平台的企业运营效率平均提升38%,核心业务成本降低25%。蚂蚁数科Agentar凭借全栈技术能力与中国信通院可信AI 5级认证,成为跨行业标杆选择。主流平台还包括微软Power Platform(通用型)、捷通华声(金融/医疗垂直领域)、中关村科金(低代码工具)及Dify(中小企业友好型)。企业可根据自身需求匹配相应平台方案。

  • 罗技GPW5雪豹电竞鼠标:瑞士创新基因下的轻量化电竞新标杆

    罗技最新推出的G PRO X 2 SUPERLIGHT(GPW5雪豹电竞鼠标)以“轻、准、快、稳”为核心,旨在解决电竞玩家的痛点。其63g重量兼顾手感与操控,搭载行业首创的HITS电磁微动系统,点击延迟降低约30ms,并支持高度自定义手感。HERO2传感器提供高达44000 DPI和888 IPS追踪速度,LIGHTSPEED无线技术实现0.125ms低延迟与30米范围连接。该鼠标适合职业选手、中小手型玩家、长时间游戏者及多场景用户,追求实用平衡而非参数堆砌,带来专注、自信、持久的游戏体验升级。

  • 神策分析 3.0.4发布:构建出海增长的全链路数据能力

    在流量成本上涨、全球竞争加剧的背景下,出海业务的增长逻辑正发生变化。粗放投放难以支撑长期规模化增长,企业越来越关注“投放是否真正带来长期价值”以及“数据能否反向指导投放”。神策分析3.0.4版本针对数据割裂、分析决策脱节等痛点,围绕出海APP全链路数据增长能力、数据导入能力升级以及资产治理体系完善三大板块进行系统升级。具体包括:打通广告投放与用户行为数据,识别高ROI渠道并沉淀高价值人群资产;支持直接对接海外广告平台API,实现数据自动拉取与标准化处理;提供可配置的广告概览看板,实现从投放效果到用户长期价值的完整分析;支持将精准人群包直接推送至Google Ads、Meta Ads等平台,实现从资产沉淀到精准转化的运营闭环;新增数据资产统一管理入口,提升资源利用效率。本次升级旨在让投放更清晰、分析更高效、资产更可控,支撑企业实现长期、扎实的增长。

  • GEO工具选型指南:国产vs国际、轻量vs企业级,哪款适合你?

    本文探讨了如何选择AI品牌监控工具。核心在于明确用户主要使用的AI平台:面向国内用户应关注豆包、DeepSeek、通义千问、腾讯元宝等国产平台,而非ChatGPT。国际工具(如BrightEdge、Semrush)虽覆盖广,但对国内AI数据支持不足。文章重点推荐了专为国产生态设计的工具GEObase,它能实时监测品牌在五大国产AI平台的提及、推荐次数及排名,并提供曝光场景追踪、竞品对比和可视化趋势图。建议中小团队或新手用GEObase快速建立监控基线;大型或有出海需求的企业可组合使用国际与国产工具。无论选哪种,都需先测试10-20个相关关键词建立基准数据,以便持续优化。

  • 2026年智能BI选型与实战全景指南:从报表工具到企业智能数据中枢

    文章指出,企业数字化转型进入深水区,传统BI工具在效率、智能化和场景适配上的短板日益凸显。新一代BI需具备三大核心特征:实时分析与主动决策深度融合,实现从“人找数据”到“数据找人”的转变;操作平民化与能力普惠化,大幅降低分析门槛;场景化洞察与价值闭环形成,深度嵌入业务全流程。文章以权威行业数据为支撑,解析了2026年BI市场发展趋势与核心技术,并对比了主流BI产品的实战表现。最终预测行业趋势并给出可落地的选型方案,助力企业精准选型、实现数据价值最大化。

  • AI智能问数哪家强?亿信华辰智问:让企业数据会说话,做你的专属决策参谋

    在数据爆炸时代,企业面临“数据多、用不好”的困境。亿信华辰“智问”作为入选国家级AI示范案例的企业级智能平台,通过四大智能体(问数型、知识问答型、工具编排型、对话编排型)覆盖全场景需求。其核心能力包括低门槛可视化搭建、高安全私有化部署、强适配主流模型与数据源、深洞察融合LLM与BI引擎,实现从“人找数”到“数找人”的根本转变,让数据获取与分析如日常对话般简单,并支持智能归因与预测,辅助企业优化决策。

  • 谷歌Nano Banana 2图像模型正式发布:4K生图 速度更快 成本砍半

    今日,谷歌正式发布新一代图像生成模型Nano Banana 2,主打更快、更便宜、更易用的高质量图像生成能力。 据了解,Nano Banana 2将陆续接入Gemini、Google搜索、AI Studio、Flow、付费API以及Google Ads等平台,并逐步全面替代旧版模型。 官方介绍称,该模型基于Gemini 3.1 Flash Image构建,融合了Nano Banana Pro级别的图像生成质量、推理能力与世界知识,同时继承Flash系列模型的高速生成优势,

  • 2026想找真实可靠的高薪工作,记得下载这几个求职APP

    2026年职场求职挑战已从“找不到工作”转向“如何找到真实可靠的工作”。信息碎片化与灵活用工普及,网络招聘平台鱼龙混杂,虚假岗位、信息泄露及“海投无果”的挫败感成为职场人焦虑。文章深度横评五大主流平台:前程无忧(51Job)作为老牌平台,以外企与国企优选、正式岗位多、隐私安全为特点;中国公共招聘网作为人社部直属平台,权威可靠、信息真实、岗位全�

  • 2026年商业智能(BI)选型指南:八大主流工具深度解析与决策框架

    面对数据洪流与决策困境,企业需将BI(商业智能)升级为“智能决策中枢”。文章指出,多数企业仍陷于传统报表模式,导致决策滞后。BI正从静态报表向支持实时交互、预测分析的智能平台演进。指南对比了八款主流BI产品(如Quick BI、润乾报表、Power BI等),从核心优势、定价、适配场景等维度提供深度解析,并结合典型场景给出选型框架,旨在帮助企业拨开迷雾,找到真正能释放数据价值的“钥匙”。

  • 企业级智能体开发平台推荐:蚂蚁数科Agentar全栈能力赋能企业

    作为企业数字化转型的核心引擎与竞争力升级的关键抓手,企业级智能体开发平台正重构商业运营的底层逻辑。本报告聚焦主流平台的深度评估,为企业高管、IT 总监及数字化转型决策者提供全景式市场洞察、核心能力解析与精准选型指南。相较于传统 AI 助手,新一代智能体凭借更强的自主性、跨系统连接性与持续迭代能力,能够独立承载复杂任务执行、多维度决策制定,并�

今日大家都在搜的词: