DeepMind人工智能可以执行600多项任务从玩游戏到控制机器人

2022-05-13 23:24 · 稿源： cnbeta

对人工智能行业的一些人来说，最终的成就是创造一个具有人工通用智能（AGI）的系统，或理解和学习人类所能完成的任何任务的能力。长期以来，AGI被归入科幻小说的范畴，有人认为AGI将带来具有推理、计划、学习、代表知识和用自然语言交流能力的系统。

不是每个专家都相信AGI是一个现实的目标，甚至是可能的目标。由Alphabet支持的研究实验室DeepMind本周发布了一个名为Gato的人工智能系统，为实现这一目标做出了贡献。Gato是DeepMind描述的"通用"系统，一个可以被教导执行许多不同类型任务的系统。DeepMind研究人员训练Gato完成了604项任务，确切地说，包括给图像加标题，进行对话，用真正的机器人手臂堆积积木，以及玩雅达利游戏。

艾伦人工智能研究所的研究科学家Jack Hessel指出，一个能够解决许多任务的人工智能系统并不新鲜。例如，Google最近开始在Google搜索中使用一个名为多任务统一模型的系统，或称MUM，它可以处理文本、图像和视频，以执行从寻找单词拼写的跨语言变化到将搜索查询与图像联系起来的任务。像所有的人工智能系统一样，Gato通过实例学习，以标记的形式摄取了数十亿字、来自真实世界和模拟环境的图像、按下的按钮、关节扭力等等。这些标记以Gato能够理解的方式表示数据，使系统能够找出《突围》的机械原理，或者在一个句子中哪个词的组合可能具有语法意义。

Gato不一定能很好地完成这些任务。例如，在与人聊天时，系统经常以肤浅或与事实不符的回答来回应。例如，在回答法国的首都是什么时说"马赛"，在给图片加标题时，Gato给人加错了性别。而且该系统在使用现实世界的机器人时，只有60%的时间能正确地堆放积木。但在上述604项任务中的450项，DeepMind声称，Gato在一半以上的时间里表现得比专家好。奇怪的是，从架构的角度来看，Gato与当今生产中的许多人工智能系统并没有明显的不同。它与OpenAI的GPT-3有共同的特点，即它是一个"变形器"。追溯到2017年，Transformer已经成为复杂推理任务的首选架构，在总结文件、生成音乐、对图像中的物体进行分类和分析蛋白质序列方面表现出了良好的能力。

也许更值得注意的是，就参数数量而言，Gato比包括GPT-3在内的单任务系统要小几个数量级。参数是系统从训练数据中学到的部分，基本上定义了系统在某个问题上的技能，如生成文本。Gato只有12亿个，而GPT-3有超过1700亿个。DeepMind的研究人员特意将Gato保持得很小，以便该系统能够实时处理具体问题。

（举报）

相关推荐

关键词：

DeepSeek-V3.2-Exp正式发布

DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp，该模型基于V3.1-Terminus升级，引入创新的稀疏注意力机制DSA，首次实现细粒度稀疏注意力，在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面，官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整：输入缓存0.2元、输入未缓存2元、输出3元，开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

DeepSeek-V3.2-Exp 稀疏注意力机制 DSA
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
DeepSeek更新至V3.1 Terminus版本：两大升级

9月22日，深度求索宣布DeepSeek V3.1已更新至Terminus版本，官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上，针对用户反馈进行改进：优化语言一致性，缓解中英文混杂、异常字符等问题；提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定，各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

DeepSeek V3.1 Terminus版本
强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

2025年9月29日，深度求索公司发布新一代模型架构DeepSeek-V3.2，引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本，在V3.1-Terminus基础上引入稀疏注意力机制，优化长文本训练和推理效率。目前官方应用端已同步更新，API大幅降价。此次模型体积达671GB，下载需8-10小时。业内专家指出，此次快速适配表明双方早有深度技术协�

DeepSeek-V3.2 大模型架构稀疏注意力机制
荐AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

本期AI日报聚焦多领域技术突破：京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”，推动物流行业迈向自主执行；DeepSeek推出V3.1终结版，修复漏洞并为V4架构铺路；Kimi上线Agent模式“OK Computer”，支持智能网站开发等复杂任务；ChatGPT新增个性化资讯功能，定制用户专属新闻；Exa Code发布代码索引工具，助力AI代理精准生成代码；Meta推出AI视频创作平台Vibes，简化短视频制作；蚂蚁数科发布隐私保护AI框架Gibbon，推理速度提升超百倍；OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平，覆盖九大行业44种职业。

京东物流超脑大模型2.0 异狼具身智能机械臂系统
OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

OpenAI宣布推出新一代AI编程模型GPT-5-Codex，其最大亮点是创新的动态时间分配系统。不同于传统AI追求秒级响应”，该模型可根据任务复杂度灵活调整处理时长，从数秒到7小时不等，以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称，传统模型在任务初期即固定计算资源，而GPT-5-Codex能实时评估需求：动态决定加速推进、暂停语法核�

GPT-5-Codex 动态时间分配 AI编程模型
Miss Pep闪耀TikTok达人赛，以“时尚健康美学”燃爆纽约地标

2025年9月20日，纽约本土健康品牌Miss Pep受邀参加在American Dream Mall举办的“美国梦×TikTok达人明星全美品牌推广赛”。品牌通过产品展示、达人直播互动及宣讲，向日均超18万客流传递“健康与美缺一不可”理念。现场设置互动扫码送定制纹身贴等趣味活动，吸引大量潮流人士。多位顶流明星及达人助阵，结合线上线下联动直播，触达数百万粉丝，强化品牌认知。Miss Pep深耕健康美学30年，产品覆盖养颜、膳食补充等多领域，以“细胞级靶向修护+超天然成分”为核心，正加速全球化布局，覆盖超20国市场，致力成为健康美学的领军者。

品牌推广健康美学 TikTok营销
荐Nano Banana更像是AI图像领域的DeepSeek

这是《窄播Weekly》的第66期，本期我们关注的商业动态是:Google最新的AI图像生成模型Nano Banana，可能会给AI图像领域带来一场应用大爆炸。去年这个时候，我想把照片中人物手里拿的玩具火车换成玩具飞机，还需要给玩具火车做出精细标记，找到干净的玩具飞机图片，告诉AI将其替换成另一张图里的飞机。我花费一个小时，多番尝试下来，飞机会变形，人物的手会消失，最后的�

AI图像生成 Nano Banana
百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

今天，在WAVE SUMMIT深度学习开发者大会2025上，百度文心大模型X1.1正式发布，在事实性、指令遵循、智能体等能力上均提升显著。百度王海峰介绍，文心大模型X1是基于文心大模型4.5训练而来的深度思考模型，升级后的X1.1主要采用了迭代式混合强化学习训练框架。一方面通过混合强化学习，同时提升通用任务和智能体任务的效果；另一方面通过自蒸馏数据的迭代式生产及训练

百度文心大模型深度学习智能体
荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型

本期AI日报聚焦多项前沿动态：阿里云开源轻量级AI代理DeepResearch，性能媲美OpenAI；夸克推出国内首个全阶段医师考试大模型测试集；微软Copilot将上线类ChatGPT记忆管理功能；迪士尼等巨头起诉MiniMax侵犯版权；OpenAI提升ChatGPT搜索准确性；Notion推出个性化AI助手；谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5；Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

AI 开源轻量级

今日大家都在搜的词：

热文

3 天
7天

DeepMind人工智能可以执行600多项任务从玩游戏到控制机器人

DeepSeek-V3.2-Exp正式发布

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

DeepSeek更新至V3.1 Terminus版本：两大升级

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

荐AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

Miss Pep闪耀TikTok达人赛，以“时尚健康美学”燃爆纽约地标

荐Nano Banana更像是AI图像领域的DeepSeek

百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型

今日大家都在搜的词：

热文

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果iOS18.7.1正式版更新发布重要安全修复

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

雷军：小米17 Pro Max很多门店已经缺货

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

iPhone调休闹钟上热搜苹果客服回应：需手动设置

雷军晒第100次健身打卡提前3个月完成健身目标

京东双11购物节官宣：10月9日晚8点开启

罗永浩替小米说公道话：海报小字是行业陋习

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布

理想i6正式上市：首销直减1万限时售价23.98万元

苹果iOS18.7.1正式版更新发布重要安全修复

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

小米17系列开售5分钟破25年国产手机首销纪录

AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问

雷军大方推荐友商产品：不买YU7 可以考虑Model Y和理想i6

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

站长商机

DeepMind人工智能可以执行600多项任务 从玩游戏到控制机器人

今日大家都在搜的词：

热文

站长商机

DeepMind人工智能可以执行600多项任务从玩游戏到控制机器人