首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

科技巨头狂卷“智能体”,大模型上终于长出了“大家伙”?

2024-08-31 09:24 · 稿源: 雷科技

AI从技术卷向场景。

这两天,备受瞩目的 OpenAI项目又有了新消息。

The Information 援引内部消息报道称,OpenAI 计划最快将在今年秋天推出代号「草莓(Strawberry)」的全新 AI,其拥有前所未有的「推理」能力,可以处理复杂的数学和编程任务,甚至还能体现在日常生活中的非技术问题上。

此外,报道还指出这项技术对未来 AI 产品,特别是旨在解决多步骤任务的「智能体(Agent)」具有重要意义。

又是智能体。

在2022年年底 ChatGPT 大火之后,「智能体」很快就从故纸堆中一跃而出,引起整个行业的广泛关注。而从开源项目 AutoGPT 到 OpenAI 官方推出的 GPTs 和 GPT 商店,作为「雏形」,也都在一定程度上展现了 AI 智能体的潜力与必要。

但如果说在2023年,人工智能行业的发展和竞争更多还是聚焦在大模型本身,关于智能体探索才刚刚迈出第一步。那到了2024年,从 Google 到百度,从阿里巴巴、字节跳动到 OpenAI,国内外都在明显加快了智能体落地的步伐。

都在说「智能体」,但它到底什么?

如果平常关注 AI 领域,我相信读者们一定不少看到或者听到「智能体」这个词。但智能体到底是什么?可能很难讲清楚。

事实上,在1995年出版的《未来之路》一书中,微软公司创始人比尔·盖茨就提到了「智能体」的概念。但近三十年间,「智能体」的概念显然发生了不小的变化,尤其是在 ChatGPT 之后基于大模型的「智能体」。

而时至今日,学术界对于「智能体」也没有一个比较统一的定义。不过一般认为,「智能体」是能够自主感知环境、做出规划、执行任务的智能实体,不是「副驾驶」,而是主驾驶。

也可以用一个比较直观的公式来表示:

Agent(智能体)= LLM(大模型)+Planning(规划)+Feedback(反馈)+Tool use(工具使用)

以人类借助 ChatGPT 写一篇文章为例,如果想要确保文章的质量,我们通常需要先确定一个选题,然后让 AI 辅助生成文章大纲,再通过 AI 的搜索能力进行分析、调研,然后再让 AI 生成第一版,最后则是通过不断地反馈优化内容,并得到最终的版本。

accesswximg-1.png

而 AI 智能体在大模型基础上,通过自主的规划、反馈和工具使用能力,进一步减少了人工介入的操作。更具体来说,AI 智能体能够自主使用资料搜索、阅读理解、数值计算等工具,再通过规划「大纲——搜索、分析、调研——初稿——反馈再优化」多步骤任务,实现「人类一句话,AI 跑断腿」的效果。

简言之,AI 智能体通过迭代和对话式的模式工作,不再是简单的指令执行者,而是能够进行自我反思、规划和修正的参与者。

智能体是大模型上长出的“大家伙”

「智能体不仅会改变每个人与计算机交互的方式。它们还将颠覆软件行业,带来自我们从键入命令到点击图标以来最大的计算革命。」

去年11月,比尔·盖茨在其个人网站发布了一篇题为《AI 将彻底改变计算机使用方式》的博文,认为 AI 智能体(AI Agent)将在未来五年颠覆人们使用计算机的方式。

坚定看好 AI 智能体的人当然不只是比尔·盖茨。

今年3月,斯坦福大学教授吴恩达指出,他们在研究中基于 GPT-3.5构建的智能体工作流在应用中表现可以比 GPT-4要好,基于 GPT-4构建的智能体工作流效果当然还可以更好。由此他还表示,AI 智能体将在今年(2024年)推动 AI 的大规模进步:

甚至可能超过下一代基础模型所带来的影响。

到7月举办的世界人工智能大会上,基于大模型的智能体已经成为了绝对的焦点。蚂蚁集团董事长兼 CEO 井贤栋在演讲中表示,从实践来看,专业智能体是大模型落地严谨产业的有效路径。百度创始人李彦宏更是明确表示,智能体是百度最看好的人工智能应用发展方向。

同期,谷歌还推出了 AI 智能体平台 Oscar,让开发者可以通过一定的配置就能生成各种的 AI 智能体。但类似的 AI 智能体平台不只是谷歌一家:

百度文心有 AgentBuilder,字节跳动有扣子(Coze)以及 HiAgent,阿里巴巴有百炼智能体和钉钉智能体,腾讯微信有云开发 AI 智能体……智能体平台逐渐开始成为大模型厂商的一种「标配」。百度甚至还喊出了「人人都是开发者」的口号。

SCR-20240829-sdve.jpeg

图/扣子

可以说,在经历2023年的思考和探索之后,AI 智能体在2024年已经成为了人工智能行业的新共识。

智能体让AI从技术卷向场景

去年年底,OpenAI 推出了 GPTs 和 GPT 商店,允许用户无需编码就可创建自己版本的 GPT。但 GPTs 依然是充当「副驾驶」的角色,只是多了更多个性化定制的可能,并不能将任务拆解,并且一步步推算和执行。

事实上,今天很多标榜为 AI Agent 的「智能体」,其实更多还是 ChatBot(聊天机器人),反倒是钉钉的 AI 助理(英文名为 AI Agent)更接近实质上的智能体。

如何判断并不困难,核心在于在任务过程中人工的介入程度,以及大模型在规划、决策上的参与程度,由此可以判断一个名义上的「智能体」到底是更接近真的智能体,还是接近常规的 AI 聊天机器人。

lwVE9WskhZ3BKl1TIsfm.png

图/钉钉

但必须要指出,从「副驾驶」到「主驾驶」,当下的智能体在技术上还有很大的进步空间,并未能带来颠覆性的体验。不过更重要的是未来,比起以聊天为交互形式的聊天机器人,AI 如果想要更深入生活、改变生活,就需要让 AI 拥有更强的自主性。

理想情况下,AI 智能体能够根据各种条件智能地作出决策和规划。比如在制定旅游规划的时候,可以自主搜索旅游的交通住宿以及各种旅游信息,并且充分考虑用户的历史偏好和习惯,查漏补缺进行多次补充和修改。

又比如用户在下班后夏夜里,即将拖着疲累的身心到家,AI 应该可以根据汽车或者手机位置提前感知到,并根据位置和时间在不断阶段智能地打开空调、扫地机器人、灯光等设备。

就如同在盖茨的构想中,未来我们不再需要为不同的任务切换到不同的应用中,需要用平常的语言告诉电脑和手机想做什么,而后根据用户愿意分享的数据,智能体将个性化地作出反应。

写在最后

本质上,智能体其实是在 AI 的基础上借鉴人类的思考方式,构建更加专业的推理和决策能力,以此提供更加智能化的用户体验。所以在一定程度上,AI 智能体相比 ChatGPT 更进了一步。

但可想而知的是,单一智能体无法满足无数人的无数种需求,所以井贤栋认为未来智能化的用户体验需要很多的专业智能体共同参与、各司其职,李彦宏认为未来将出现数百万量级的智能体。

下一个平台的竞争,势不可挡。

而正如移动时代的 App Store,伴随智能体的兴起,AI Agent Store 也在成为新的竞争焦点。所以除了场景上的角力,对拥有基础大模型的大厂来说,生态更是智能体发展过程中核心之一,也是兵家必争之地。

举报

  • 相关推荐
  • 腾讯大模型战略首次全景亮相!智能体平台重磅上线,从“落地可用”到“智能协同”

    ​智能体的开发门槛,又又又被打下来了! 昨天,腾讯云在他们的AI产业应用峰会上,正式上线了全新的智能体开发平台,率先在行业内实现零代码配置多智能体协同构建。 除了上线智能体开发平台,腾讯云也对从AI Infra到模型到应用的整个体系来了波全面升级。 包括混元系列大模型,也迎来了重磅更新。 腾讯云副总裁吴永坚对量子位表示:“腾讯云在智能体领域的产品布局

  • 百度心响上线iOS版,多智能体协作应用终于对地方了

    今年的4月26日,我们测评了百度新发布的多智能体协作应用心响APP。当时只上线了安卓版,很多网友在线求苹果版链接。 就在这几天,iOS版也终于上线了,只需要在苹果的APP Store搜索关键词即可下载。 现在,苹果安卓用户全部免费用,完全不限量! 在第一时间体验了iOS版心响APP,我们基本上可以下一个判断:智能体应用,终于卷对地方了。

  • 网易数智发布CoreAgent智能体开发平台及多款行业智能体

    5月23日,网易在杭州举办"万象新生"2025创新企业大会。网易数智宣布品牌升级,LOGO颜色从"科技蓝"变为"网易红",展现拥抱AI时代的决心。会上发布一站式智能体开发平台CoreAgent,整合知识库、运行沙箱等功能,助力企业智能化转型。同时成立AI生态联盟,首批成员包括英特尔、人民中科等上下游企业。网易数智还推出导购数字员工、智能外呼数字员工等多款行业智能体产品,加速企业数字化进程。

  • 微软张祺:智能体将成为广告行业的变革引擎

    微软在北京举办"MSA Accelerate营销峰会2025",聚焦AI与智能体对广告行业的变革。微软全球资深副总裁张祺博士指出,AI时代已至,推理能力和记忆机制的突破让模型更强大高效。峰会发布多项创新产品,包括海外市场"品牌智能体",可执行复杂任务、实时响应并自主决策,显著提升品牌与消费者互动效率。微软广告业务中国区副总裁黄秀兰强调将持续深化本土生态合作,通过技术赋能助力中国品牌拓展国际市场。核心亮点包括:Copilot在广告个性化体验的重大突破,相关搜索广告效果提升25%;沉浸式展厅广告打造线上品牌旗舰店;动态筛选器通过对话交互实现精准投放。微软承诺坚持"信任优先"原则,确保数据安全可控。

  • 联想Lecoo战者G1智能体AI眼镜首发1999元:搭载天禧个人超级智能体

    据悉,这款产品搭载天禧个人超级智能体,天禧的突破在于,它首次将感知、认知、决策与自主演进能力深度融合,形成了一套完整的人工智能双胞胎”逻辑。支持AI翻译/AI对话/AI识图,通过Hi小天”启动多模态AI助手。

  • AIbase解锁AI无限可能!MCP 圈疯传的神器,让AI智能体直接原地起飞

    AI时代来临,MCP资源宝库网站(https://mcp.aibase.cn)横空出世,一站式整合12万+AI开发资源。该平台提供网页搜索、数据库交互、图像视频处理等全方位服务,包含DuckDuckGo搜索API、百度地图MCP协议等热门工具。精选服务如Figma设计数据转换、EdgeOne网页快速部署等,大幅提升开发效率。网站还提供详细教程,新手也能轻松上手。紧跟AI发展前沿,这个功能强大、资源丰富的平台为开发者搭建了通往无限可能的桥梁,助力打造更智能的AI应用。

  • 智能体生态圈破茧,联想与ISV编织千行百业 AI 落地未来

    5月9日,联想在上海举办2025智能体解决方案生态论坛,发布面向AI生态伙伴的私有化部署与行业场景落地合作战略。联想将通过品牌力、方案力、营销力与销售力四大核心方向,为AI解决方案提供商(ISV)提供全栈支持,加速智能体在垂直行业落地。联想集团副总裁王立平指出,每个场景背后都是真实行业问题,需要多方合作解决。联想推出"擎天AI适配中心"提供软硬件全栈适配支持,并发布"擎天智能体集市"平台,汇集超百家ISV产品,实现"线上体验+线下部署"闭环。针对不同发展阶段ISV,联想推出三种合作模式:品牌代销、联合品牌和方案整合,助力ISV跨越技术验证与商业转化鸿沟。联想ThinkStation智能体工作站系列成为硬件载体,其中PX型号支持4张RTX 5880 Ada GPU,兼顾高性能与便捷部署。天士力、蜜度等合作伙伴现场分享了与联想共同打造的医疗、政务行业智能体落地案例。

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • 李未可AI眼镜新品发布会:零级智能体开启人机交互新纪元

    李未可科技发布2025年度新品,推出三款AI智能眼镜及专属大模型"WAKE-AI任务式交流系统"。核心亮点是"零级智能体ZeroAgent",通过多智能体协同实现任务分发与动态决策,打破传统硬件依赖单一AI功能的局限。新品包括轻量化设计的LAWK City系列(续航14小时,仅重23-27克)和旅拍版LAWK View(支持20种语言翻译)。公司联合米奥兰特国际会展瞄准跨境商务场景,并与博士眼镜达成战略合作,推动AI眼镜线下体验。创始人茹忆强调"AI定义硬件"理念,预测未来十年传统眼镜将全面智能化,轻量化、长时佩戴与场景适配是竞争核心。

  • 618抢先剧透!AI数字人分身系统重磅升级:自定义装修+智能体

    该文章介绍了一个智能装修系统的五大核心功能更新:1.新增可视化自定义装修功能,无需编程即可自由设计前端页面;2.接入AI智能体系统,自动生成精准营销文案;3.新增API接口分销功能,支持批零差价盈利;4.全面接入DeepSeek技术,实现多平台高质量文案生成;5.新增VIP会员模式,严格绑定功能权限与有效期。系统通过智能化升级,显著提升了装修设计、内容创作和商业变现的效率。