首页 > AI头条  > 正文

首个本地运行的机器人智能模型 Gemini Robotics 上线,开启具身智能新篇章

2025-06-25 16:53 · 来源: AIbase基地

在人工智能领域,谷歌 DeepMind 今天推出了一个令人振奋的新产品 ——Gemini Robotics On-Device。这是 Gemini 家族的新成员,专为机器人设计,能够直接在设备上本地运行,而不再依赖持续的互联网连接。这意味着,机器人不仅可以更快地适应新任务和环境,还能在没有网络的情况下保持稳定表现。

Gemini Robotics On-Device 基于多模态推理能力的 Gemini2.0模型,展现了强大的灵活性和任务泛化能力。它经过精心优化,专为各种智能操作而设计,比如折叠衣物和拉开袋子拉链等灵巧任务,所有操作都能在机器人机体上实现。

image.png

值得一提的是,Gemini Robotics On-Device 尤其适合那些对延迟敏感的应用,能够确保在网络连接不佳的环境中也能正常工作。为了帮助开发者充分利用这一新技术,谷歌还将推出 Gemini Robotics SDK,便于开发者评估模型在特定任务中的表现。借助该 SDK,开发者可以在 DeepMind 的 MuJoCo 物理模拟器中测试模型,并快速将其适应到新领域,只需50到100个演示即可。

在性能方面,Gemini Robotics On-Device 在多个任务上的适应能力令人惊叹。在七项不同难度的灵巧操作任务中,该模型表现出色,能够处理之前未见过的物体和场景。这不仅展示了其在不同机器人的适应性,还证明了其通用性。

DeepMind 的这一突破标志着在构建强大机器人模型方面取得了新的进展,为实现真正的具身智能时代迈出了重要一步。

  • 相关推荐
  • 谷歌透露Gemini每次回答消耗能量:相当于微波炉运行1秒钟

    近日,谷歌发布了一份技术报告,详细说明了其Gemini大模型在每次查询中消耗的能源量。 据谷歌介绍,这是迄今为止大型人工智能公司发布的最透明估算,也是研究人员期待已久的报告。 报告称,Gemini应用的文字回答平均每次消耗0.24瓦特小时(Wh)的能量,大约相当于运行微波炉一秒钟,并排放0.03克二氧化碳当量。 据此前媒体报道,谷歌近日发布Gemini系列最轻量版本Gemma 3

  • 自研遇阻!苹果考虑用谷歌Gemini升级Siri

    苹果正与谷歌就使用Gemini AI引擎为新一代Siri提供技术支持进行初步谈判,这一动向表明苹果可能进一步将人工智能能力外包,成为其AI战略的关键一步。 据知情人士透露,这家iPhone制造商近期已与Alphabet旗下谷歌接触,商讨合作构建一款定制化AI模型,以用于明年预计推出的新版本Siri。 谷歌目前已开始训练一款可在苹果服务器上运行的模型。苹果在生成式人工智能领域起步�

  • 智检未来 触手可及——CASIVIBOT工业质检机器人震撼发布

    8月19日,中科慧远发布首款工业具身质检机器人CASIVIBOT,以“具身智能”为核心,融合人类质检经验与AI技术,实现灵活操作与高效检测。该机器人采用“手-眼-脑”协同架构,支持多行业复杂场景应用,具备快速部署和持续进化能力,旨在推动工业质检智能化升级,提升检测效率与灵活性。

  • 当GPT-5遇上Gemini 2.5,谁更适合你的业务?这份对比报告说了算

    某跨境电商CTO复盘会上展示:GPT-5 Standard处理百万级商品描述时,费用比Gemini 2.5 Flash-Lite高35%,响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试,提供透明价格拆解和性能雷达图,帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%,而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价,生成定制化决策报告,用数据替代经验主义,提升技术选型效率。

  • 豆包1.5轻量版 vs Gemini 2.5闪存版:生成5000字深度文章,哪个模型更合适?

    AIbase选型工具通过多维度数据对比,帮助用户精准选择AI模型。文章以豆包和Gemini为例,展示平台如何解决模型选型痛点:自动生成对比报告,评估关键指标如术语准确性、本土案例适配度等。实际案例显示,使用该工具后内容团队效率提升40%,编辑成本下降65%。核心价值在于用数据驱动决策,规避局部优势导致的全局误判,实现场景化精准匹配。

  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

  • Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比:谁在性价比上更胜一筹?

    面对琳琅满目的大模型API,开发团队常陷入选择困境。文章指出,2024年既是机遇也是挑战的时代,闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例,前者综合能力强适合多语言场景,后者在代码生成和成本控制上优势明显。建议开发者明确需求,通过实际测试验证模型表现,理性选择最适合的方案。

  • AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

    本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。

  • ​智元机器人首届合作伙伴大会成功举办 以全链条布局加速具身智能商用落地

    2025年8月21日,智元机器人在上海举办首届合作伙伴大会,主题为“与智同行 共启新元”。大会展示了“一体三智”全栈技术架构与全系列产品矩阵,推出远征、精灵、灵犀三大产品系列覆盖多元场景。CEO邓泰华强调2025年是具身智能商用拐点,目标三年内实现十万台级机器人部署。通过开源集成、资本赋能、生态共建三大路径汇聚全球创新力量,并启动“智元A计划”孵化早期项目。大会明确未来将加速技术普及与产业落地,推动具身智能从实验室走向千行百业。

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

今日大家都在搜的词: