首页 > 业界 > 关键词  > 机器最新资讯  > 正文

谷歌PaLM-SayCan模型可让机器人更好地理解自然语言并执行复杂任务

2022-08-17 20:14 · 稿源: cnbeta

长期使用 Alexa、Siri、Google Assistant 等数字助理的朋友,或许已留意到这项技术正在变得愈加智能。与此同时,近年来的机器人技术也在突飞猛进。以谷歌为例,该公司有在演示一款乒乓球机器人,旨在训练其应对快速、自适应、且精确的任务挑战。Google 研究员接触科学家兼机器人技术负责人 Vincent Vanhoucke 表示:“在一鸣惊人之前,你必须勤学苦练”。

在速度和精度之外,Google 还希望通过实验,攻克人类语言和机器人技术的交叉点。截至目前,这家科技巨头已在自然语言水平上取得了让人印象深刻的飞跃。

举个例子,你可能会对一个人说 ——“有空帮我从柜台拿一杯饮料吗?”

尽管对于人类来说,这句话的语境相当简洁。但是对于一台机器人来说,其中包含的信息量很可能将其绊倒。

因为‘有空’这词语可能不包含任何意义,也可能是趁着机器人正在干另一件时与之通过自然语言交互。

如果机器人过度理解了字面含义,它可能会回答一句‘当然可以’—— 即便用户并未明确要求它这么做。

若机器人更加钻牛角尖,它可能又会陷入该帮你拿哪一种饮料的纠结。

好消息是,Google 正在使用该公司的 NLP 系统拉解决一些问题。在 Pathways 语言模型(PaLM)的帮助下,机器人有望更准确地接收并理解人类的真实所想。

下一阶段的挑战,则是审视机器人能够切实做到哪些事情。比如让你让机器人拾取冰箱顶部的一瓶清洁剂时,它是否会小心安全地摆放到儿童不易接触到的地方。

不过在此之前,Google 还是会着眼于更加普适性的任务。简单的有‘向前移动一米’,稍微高级点的可以是‘去厨房拿一罐可乐’。

然后才是复杂多步任务的拆解执行,比如 ——‘啊哦,我不小心将可乐撒地板上了!能帮忙清理干净、并再给我拿一杯吗?’

对此,Google 选择的方案是利用语言“讲述”(Say)模型中所包含的知识,来帮助机器人确定并评估哪些高级指令“可否”(Can)派上用场。

在融汇了 PaLM 语言模型之后,Google 已将它重命名为 PaLM-SayCan,且正在自家实验室使用来自 Everyday Robots 的一些机器人(上图展示其已学会何时去充电休息)。

当然,在投入实际商用之前,这项技术显然还有相当多需要完善的地方,尤其是需要事先收集极其庞大的知识与技能数据集。

举报

  • 相关推荐
  • 聚焦AI新赛道,elexcon深圳国际电子展暨嵌入式展设 AI 机器人专区

    2025年深圳国际电子展暨嵌入式展(ELEXCON)将于8月26-28日举办,聚焦"All for AI, All for GREEN"主题。展会特设AI机器人专区,汇聚越疆、大疆等400+产业链企业,展示从芯片到整机的全产业链技术。同期举办第七届中国嵌入式技术大会,探讨具身机器人嵌入式系统等前沿议题。预计吸引600+机器人领域决策者参与,覆盖AI芯片、汽车电子等热点领域。依托深圳电子产业集群优势,展会将成为行业技术交流与资源对接的重要平台。

  • 从“形态自由”到场景适配智元灵犀X2-N重塑机器人移动边界

    上海智元公司7月7日发布灵犀X2-N人形机器人,创新采用轮足双形态自由切换技术,突破传统机器人移动方式局限。该机器人能在1秒内完成形态转换:足式状态下可稳定负重12公斤上下台阶;轮式模式下能高效穿越复杂地形。六自由度机械腿结构配合平滑步态控制,确保切换快速稳定。产品线覆盖办公、展览等多场景需求,价格从十几万至三四十万元不等。这一突破性设计推动人形机器人从"能移动"向"会适应"跨越,为行业发展提供新技术范式。

  • 中科新松推人形机器人双机,自主移动+柔顺控制赋能智造升级

    2025年机器人赛道持续升温,中科新松推出两款人形机器人"睿可MR73A"和"睿可MR73B"。MR73A侧重交互与灵巧操作,具备27个自由度的双臂系统,支持语音交互和AI视觉技术;MR73B聚焦高效物流搬运,具备智能升降和自主导航能力。两款产品突破传统工业机器人局限,强调移动性、环境感知与人机协作,瞄准工业4.0柔性制造和商业服务场景。中科新松通过核心技术平台实�

  • 李想:理想汽车是自己最后一次创业 目标是成为机器人企业

    在参加央视《对话》节目录制后,理想汽车CEO李想在网络社交平台谈到,未来我们就盯着一件事:AI硬件终端做出像iPhone那样颠覆性的产品。” 李想坦言,理想汽车是自己的最后一次创业,我们最终一定不是个标准的汽车企业,如果按照我的定义,我们会是个空间机器人企业。” 他表示,创业不是紧绷着硬熬,而是越做越知道怎么抓重点。

  • 智元发布新款人形机器人产品灵犀X2-N

    智元机器人发布灵犀X2-N机器人,实现科幻电影中的"变形"功能。该机器人可在轮式与足式间无缝切换:足式模式下稳健行走,能应对复杂地形并负重12斤;轮式模式下快速移动,轻松通过狭窄空间。这种"无痕变形"技术不仅是技术突破,更为机器人应用场景开辟新可能,堪称机器人界的"变形大师"。

  • 苹果自研AI模型难产:改用第三方大语言模型

    苹果可能会跟OpenAI或Anthropic合作,双方正在谈判讨论一项潜在交易,苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。 据悉,OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型,苹果也在进行测试,目前苹果发现Anthropic的AI模型最适合Siri,且与Anthropic初步讨论了一些财务条款,消息称Anthropic要求苹果每年支付数十亿美元的费用,且该费用会随时间�

  • AI日报:B站或将推“代号H” AI创作工具;智元发布哪吒机器人灵犀X2-N;宇树科技冲刺科创板IPO

    【AI日报】今日AI领域重要动态:1)B站将推出"代号H"AI创作工具,助力视频博主提升效率;2)智元发布双形态机器人"灵犀X2-N",展现强大适应性;3)宇树科技冲刺科创板IPO,获阿里腾讯投资,估值达120亿;4)开源多模态大模型EarthMind发布,革新地球观测数据分析;5)Gemini CLI更新,新增音视频处理与隐私保护功能;6)开源AI助手Glass上线,智能记录生活点滴;7)Claude将发布Neptune v3模型,数学能力突出;8)OpenAI宣布GPT-5将整合多种模型,实现全新突破。

  • 国内首个!高德地图正式上线多语言地图:新增14种语言

    日前,高德地图正式上线多语言地图,在原有的中英文基础上,新增多达14种语言。 这14种语言包括西班牙语、葡萄牙语、法语、德语、泰语、日语、韩语、土耳其语、意大利语、俄语、阿拉伯语、马来语、印尼语、越南语。 此次多语言版的推出,使更多非英语国家的用户也能享受高德地图提供的优质出行服务。 高德地图多语言版实现了产品界面与地理信息的多语种适配,�

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�

  • 苹果开启2025返校季教育优惠:买Mac、iPad送AirPods等

    今日,苹果中国正式拉开了一年一度返校季教育优惠活动的帷幕,该活动将持续至 9 月 30 日,为符合条件的师生及教职员工带来诸多福利。 此次活动参与群体广泛,高校在读生、刚被高校录取的新生、代表子女购买的高校学生家长,以及教师与教职工均可参与其中。 在优惠内容方面,活动期间购买指定款Mac或iPad将有丰厚赠品。具体来看,购买iPad Air、iPad Pro的用户,可获赠A