谷歌DeepMind新语言模型SayTap 让机器狗听从人类指令

2023-09-06 11:08 · 稿源：站长之家

文章概要:

1. 谷歌DeepMind设计语言模型SayTap，可将人类指令转为机器狗可理解格式

2. SayTap可处理复杂、模糊指令，让机器狗做出适当反应

3. SayTap可将自然语言转为机器可理解格式，未来可让机器人听从人类语言指令

站长之家（ChinaZ.com）9月6日消息:谷歌DeepMind的研究人员开发了一个大型语言模型SayTap，可将人类各种指令转换为四足机器狗可以理解的格式。

这个模型让机器狗不仅可以理解基本的前进、后退等指令，还可以理解一些情况性的复杂概念，比如抓住松鼠或快速跑等。

研究人员为四足机器狗设计了期望的“足接触模式”，其中1表示脚接触地面，0表示脚离开地面。他们根据这些输入的不同组合来教会机器狗如何行走、小跑或原地跳跃。

研究人员表示，这些足接触模式组合构成了一种“自然语言用户指令与底层控制器之间的新接口”。例如，在一个测试中，研究人员让狗“缓慢地向前小跑”，SayTap就会将这句英语指令转换为对应的二进制代码，传递给机器狗执行。

研究人员表示，SayTap最有趣的地方在于它可以“处理非结构化和模糊的指令”。仅提供简短的提示，它就可以成功地指挥机器狗在被告知“我们要野餐”时跳上跳下，或在被告知“假装地面很热”时快速奔跑。它甚至可以在被要求远离松鼠时缓缓后退。

研究人员在博文中写道，SayTap作为一种可以传递到真实机器人硬件的控制器，为自然语言与底层控制器之间架起桥梁，这可让人类仅通过像对待另一个人类一样对机器人说话来指挥它们。尽管该技术还处在早期阶段，但未来可能让人类通过自然语言指令来控制机器人。

（举报）

相关推荐

关键词：

谷歌DeepMind发布Genie 3世界模型：支持实时生成交互式3D环境

据媒体报道，谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。该模型能够根据用户的文本提示，快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界，更创新性地引入了可提示世界事件” 功能。用户通过简单文本指令，即可实时修改虚拟环境，显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能（AGI）的�

Genie 3 通用世界模型
荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

AI日报栏目聚焦人工智能领域最新动态：1)Claude Opus4.1发布，编程能力提升74.5%；2)OpenAI开源GPT-OSS-120B和20B模型；3)谷歌DeepMind推出革命性3D世界模型Genie3；4)谷歌Gemini新增AI故事书生成功能；5)ElevenLabs推出商用AI音乐生成器；6)百度智能云发布首批AI数字员工；7)OpenAI估值或达5000亿美元；8)00后创业者推出云端AI协作开发工具Vinsoo；9)腾讯启动2026校园招聘，重点培养AI人才；10)马斯克宣�

人工智能编程能力数据分析
智能“机器狗”亮相广博会视源股份四足机器人提供展会、赛事安保新思路

广州博览会上，本土企业视源股份自主研发的四足机器人MAXHUB+X7引发关注。该机器人具备全地形适应能力，可稳定穿越35°斜坡、台阶及沙石路面，支持自主导航、自动执行任务。搭载双摄像头、气体传感器等模块，能替代人工在复杂环境中执行巡检、灭火等任务，适用于展会安保、救援等多场景。其核心价值在于动态风险预测与人机协同响应，已在北京等地的实战中验证能力。产品未来将在广州多个城市管理场景部署，提升生产效率。

机器狗广州博览会四足机器人
别再猜了！手把手教你用数据选择AI模型，我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

开发者分享模型选择心路历程：从盲目试错到数据驱动。曾因追求低价模型导致成本飙升，后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3，基于价格、上下文长度和代码能力等数据，最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型，只有“最适合”的模型，建议开发者善用专业工具进行数据驱动决策，避免隐性成本。
INDEMIND：高需求和低渗透之间，服务机器人为何规模化落地难？

在全球经济面临劳动力短缺的背景下，加之疫情的进一步催化，服务机器人取得了蓬勃发展，预计 2022 年，全球服务机器人市场规模将达到 217 亿美元，然而尽管如此，在高速发展之下，机器人的行业渗透率却并未明显提高，究其原因在于红利之后，机器人的规模化商业落地过程走的并不顺利...作为国内领先的机器人关键AI技术供应商，INDEMIND在机器人的导航、避障、决策、AI交

INDEMIND
Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比：谁在性价比上更胜一筹？

面对琳琅满目的大模型API，开发团队常陷入选择困境。文章指出，2024年既是机遇也是挑战的时代，闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例，前者综合能力强适合多语言场景，后者在代码生成和成本控制上优势明显。建议开发者明确需求，通过实际测试验证模型表现，理性选择最适合的方案。

大模型API 模型选型 AI开发
免费使用！腾讯地图已接入DeepSeek-V3.1

DeepSeek V3.1于2025年8月21日发布并开源，腾讯地图率先完成接入。新版AI助手“AI叮当”在三大核心能力显著提升：思考效率更高，响应更快；上下文理解更强，支持多轮连贯对话；智能体调用更精准，尤其在中文网页理解和跨领域搜索方面表现突出。依托升级，AI叮当可提供个性化行程规划、周边推荐及景点知识问答等智能出行服务，让导航升级为全程智能生活陪伴。

DeepSeek V3.1 腾讯地图
AI大模型选型决策指南：10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

本文探讨大模型选型困境与解决方案。2025年全球可调用大模型超300个，但选型面临三大难题：单位混乱、定价波动快、87%团队无法量化模型价值。提出三层漏斗筛选法：1)场景刚需筛选80%选项；2)验证核心性能；3)评估边际效益。以Gemini和DeepSeek为例，前者适合常规FAQ场景年省$16,000，后者适用于金融计算场景可降低15%人工复核。建议建立动态评估体系，将3小时选型会议压缩至18分钟，错误率下降40%。核心观点：选型应从参数争论转向场景验证，通过自动化工具为工程师节省时间，聚焦提示词优化而非参数对比。

文章搜索核心标签模型适配
Google Gemini vs Deepseek：谁更适合你的业务场景？AI大模型选型终极对比指南

企业在选择大模型时面临两难：国际大厂的Gemini技术先进，但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出：1）跨境电商客服场景中，Gemini多语言识别准确率提升12%，但需注意API延迟问题；2）金融研报分析场景下，DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键：抛开参数迷雾，聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具，3分钟生成专属选型报告，让技术决策不再玄学。

大模型选型 Gemini对比DeepSeek LLM评测
2025年大模型选型核心指南：Beyond GPT-4，如何理性评估Qwen、DeepSeek等强者？

大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架，强调需超越单一指标崇拜，基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析，展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程，采用专业工具进行多维度评估，通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型，而非盲目追求流行模型。

今日大家都在搜的词：

热文

3 天
7天

谷歌DeepMind新语言模型SayTap 让机器狗听从人类指令

谷歌DeepMind发布Genie 3世界模型：支持实时生成交互式3D环境

荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

智能“机器狗”亮相广博会视源股份四足机器人提供展会、赛事安保新思路

别再猜了！手把手教你用数据选择AI模型，我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

INDEMIND：高需求和低渗透之间，服务机器人为何规模化落地难？

Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比：谁在性价比上更胜一筹？

免费使用！腾讯地图已接入DeepSeek-V3.1

AI大模型选型决策指南：10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

Google Gemini vs Deepseek：谁更适合你的业务场景？AI大模型选型终极对比指南

2025年大模型选型核心指南：Beyond GPT-4，如何理性评估Qwen、DeepSeek等强者？

今日大家都在搜的词：

热文

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

24. 98 万起标配华为ADS 4！鸿蒙智行智界 R7 车型上市

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

字节跳动回应即将发布AI眼镜：早期探索阶段没有发布计划

vivo Y500定档9月1日发布配备8200mAh巨无霸电池

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

美团回应网友质疑退款未到账：已修复信息滞后每笔退款可追溯

何小鹏回应小鹏命名：称有人说小鹏改名销量翻倍

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

李国庆婚礼收到11万余元善款受助学生寄来祝福

24. 98 万起标配华为ADS 4！鸿蒙智行智界 R7 车型上市

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

REDMI Note 15标准版发布：售价999元起

字节跳动回应即将发布AI眼镜：早期探索阶段没有发布计划

站长商机