首页 > 业界 > 关键词  > DeepMind最新资讯  > 正文

DeepMind新人工智能可直接向人类学习任务

2023-12-05 09:50 · 稿源:站长之家

站长之家(ChinaZ.com) 12月5日 消息:谷歌子公司DeepMind推出了一款突破性的人工智能代理系统,能够直接从人类教师那里学习任务。该系统通过观察和模仿行动来模拟人类任务执行,展示了一种被称为“文化传递”的新型模仿学习形式。

在《自然》杂志上发表的研究详细介绍了文化传递的过程,使得人工智能模型能够在不依赖预先收集的人类数据的情况下学习。这种类似观看视频教程的方法不仅使人工智能代理能够复制人类行为,还能随着时间的推移记忆观察到的行为。

人工智能 人机交互

图源备注:图片由AI生成,图片授权服务商Midjourney

这种少次模仿过程发生在一个名为GoalCycle3D的模拟环境中,人工智能代理在其中从未与人类互动过的情况下从人类示范者那里学到了东西。值得注意的是,该代理成功执行了任务并保留了在“专家离开后”记忆示范的能力。

这一创新方法在培训机器人系统方面具有重要意义,简化了自动化任务的流程,如搬运和放置箱子。此外,其应用范围还可以扩展到客户服务系统,通过交互式学习提供更个性化和适应性的支持。

DeepMind研究的一个显著方面是其解决了与昂贵的人类数据收集和任务固有变化相关的挑战。该论文强调了这种新的培训方法不仅消除了大型数据集的需求,而且还解决了隐私问题,因为人工智能通过实时观察学习,而无需存储大量数据。

以前在以模仿为重点的人工智能培训方面的研究主要集中在单个任务上,缺乏适应多个任务的少次学习器的能力。相比之下,DeepMind的方法涉及一个由神经网络驱动的基于代理的系统,其权重使用深度强化学习进行训练。

尽管这一开创性概念为文化演化在人工智能通用智能发展中发挥作用铺平了道路,但它确实存在一些局限性。人工智能代理可能会错误地概括观察到的行为,而且尽管训练场景取得了成功,但需要更广泛的场景来确定该技术在各种任务中的有效性。

总之,DeepMind的新人工智能代理系统在模仿学习领域取得了重大进展,具有在机器人、客户服务等领域的潜在应用。随着技术的进步,它为更有效且注重隐私的人工智能培训开辟了道路,标志着人工通用智能追求中的一个显著进步。

举报

  • 相关推荐
  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • AI日报:京东物流推出超脑大模型2.0;DeepSeek V3.1终结版发布;Kimi 推出全新 Agent 模式

    本期AI日报聚焦多领域技术突破:京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”,推动物流行业迈向自主执行;DeepSeek推出V3.1终结版,修复漏洞并为V4架构铺路;Kimi上线Agent模式“OK Computer”,支持智能网站开发等复杂任务;ChatGPT新增个性化资讯功能,定制用户专属新闻;Exa Code发布代码索引工具,助力AI代理精准生成代码;Meta推出AI视频创作平台Vibes,简化短视频制作;蚂蚁数科发布隐私保护AI框架Gibbon,推理速度提升超百倍;OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平,覆盖九大行业44种职业。

  • 既能读懂情绪,还能多模态交互!INDEMIND用空间智能重新定义陪伴机器人

    TCL与INDEMIND合作推出的陪伴机器人“Ai Me”通过空间智能技术实现突破,从传统2D感知升级为3D语义感知,赋予机器人动态语义建图、实时环境适应及多模态交互能力。该平台借助立体视觉与多传感器融合,让机器人精准构建三维地图,识别家居属性,实现主动避障与个性化服务。同时,结合低算力混合模型与情感交互功能,机器人可感知用户情绪、提供安全防护,并支持宠物看护等场景拓展,从“工具”升级为有温度的“家庭伙伴”,真正满足复杂家庭需求。

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • REDMI K90 Pro参数出炉 产品经理:影像大升级

    REDMI很快就会推出年度旗舰REDMI K90 Pro,该机对应的海外版本命名为POCO F8 Ultra。 据悉,REDMI K90 Pro将会配备一颗5000万像素1/1.3英寸超大底主摄,对比上代K80 Pro的1/1.55英寸主摄,K90 Pro搭载了REDMI史上规格最强的主摄,并且支持OIS光学防抖。 除此之外,REDMI K90 Pro还将配备潜望长焦镜头,这是REDMI K系列第一款拥有潜望镜头的旗舰,相较直立长焦,潜望长焦能够放下更大底更高质量�

  • 破解 AI “安全与性能” 难题!DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

    9月18日,华为全联接大会2025在上海开幕。会上,华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出,对有害言论、敏感内容等14个维度的防御成功率近100%,同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作,推动AI安全技术与产业生态协同发展,为我国人工智能高质量发展提供支撑。

  • 谷歌合并DeepMind部门 为医生打造AI助理

    作为整合旗下健康业务的一部分措施,谷歌宣布正在合并其伦敦人工智能实验室DeepMind的一部分业务DeepMind Health。DeepMind的创立者在博客中表示这是公司的重要转折点,并将其用于帮助英国公立医疗系

今日大家都在搜的词: