首页 > 业界 > 关键词  > 智能体最新资讯  > 正文

大厂Agent混战:复刻Manus的野心与困局

2025-05-08 08:58 · 稿源: 光锥智能公众号

声明:本文来自微信公众号“光锥智能”(ID:guangzhui-tech),作者:魏琳华,编辑:王一粟,授权站长之家转载发布。

当Manus创始人肖弘直言“产品没有秘密”时,大厂们正陷入技术复刻与流量争夺的双重焦虑。据光锥智能了解,目前多家大厂均在内部开设对标Manus的产品团队。据悉,以擅长内部赛马的字节,内部至少有5个不同团队正在开发智能体产品。

在Manus发布的一个月后,大厂们先后交出了智能体的答卷:字节跳动“扣子空间”以裂变式邀请码席卷职场、阿里“心流”用超长耗时任务塑造研究深度、百度“心响”则带着医疗法律垂类场景突袭移动端。

但在这场看似繁荣的通用Agent发布潮背后,却暗藏着一个尴尬现实—— 所有产品仍未突破已有Agent的能力边界。

从去年开设Agent平台的无人问津,到今年交出60分答卷。可以确定的是,Agent已经通过规划和工具能力跨越了通用Agent的1.0阶段,进入自主Agent的2.0阶段。

当下,扎堆发布的Agent已经能够初步担任起“实习生”的任务,解决那些在人类日常生活中耗时且难度低的任务:比如,根据用户的需求完成一部分资料的收集,并通过大量的信息分析并给出一些可供用户筛选的观点。再比如帮助用户完成基础操作,筛选岗位发简历、给目标发邮件等等。

这场围绕Agent展开的流量入口争夺战,只是2025Agent爆发之年的一个注脚。除了大模型公司和应用公司,更多玩家正在参与其中:

就在今天,联想也发布了面向个人用户的“天禧”智能体和面向企业的“乐享”智能体。其中,个人智能体“天禧”将自主操作和记忆交互作为卖点,并在旗下4款产品中搭载。除了自主完成点单、攻略等操作,它还能根据用户的偏好和习惯,给出匹配的预算和喜好推荐。

在大厂倾尽资源的进攻下,智能体之战现在走到了什么阶段?

批量复刻Manus,

谁能抢占流量入口?

4月,通用Agent成为了大厂们发布会和产品更新的关键角色。

先是字节在4月18日发布了通用Agent产品“扣子空间”,上线免费测试,以每人5个邀请码的裂变方式,先行抢占市场;4月22日,阿里旗下AI助手“心流”上线高级研究功能,主打类似OpenAI的智能体DeepResearch式的报告研究;再到百度4月25日正式在开发者大会上官宣智能体“心响”,侧重医疗、法律、绘本等多个适配生活场景的任务体验。

在前有DeepSeek的冲击过后,如何借助成熟产品引流,也成为了智能体接下来上线需要考虑的问题。

目前,大厂多处于内部团体自研的模式,比如字节和百度。但阿里早在Manus点燃市场热情的时候,就已经洽谈了和Manus的合作。目前,阿里除了有自研产品心流的发布以外,其旗下大模型团队通义千问也早在3月就敲定成为Manus中文版的专属模型支持方,先在模型合作上分到一杯羹。

图片

但对于百度、字节和阿里这三家强调AI自研,并且从大模型研发到应用产品均亲力亲为的大厂来说,借自己的力量开发智能体也是非常必要。

扎堆发布的Agent们,各自的产品思路并不相同。

字节的“扣子空间”定位为“精通各项技能的实习生”,给出的各种案例更像是工作上的助手,比如生成行业报告、用户调研分析等。

光锥智能测试后,感觉扣子空间是一个更加面面俱到的及格产品,它不仅接入了高德等MCP,借助工具提升使用能力,在报告输出上也做到了图文并茂,多模态能力突出。但在输出报告的内容深度上,还有进一步优化的空间。

图片

对比来看,阿里旗下的AI助手“心流”上线的高级研究功能,更加接近于深度研究的应用场景。在多次测试过程中,心流显著的特点就是消耗的Token资源更多,耗时长。比如,在“智能体研究”任务上,心流的处理时长超过1个小时,浏览网页的数量也显著超过其他两个产品。

大量资源和牺牲效率的方式,换来了更具深度的生成内容,而这也是心流只能通过审核制申请测试的原因,大规模的开放,对算力消耗和成本来说,都是当前难以平衡的问题。但在对象选取准度上,心流的表现一般,比如在智能体报告中,它选择的产品多为大模型AI助手类,且把Manus融资7500万的信息误放在了扣子空间的分析中。

图片

相比于字节和阿里的通用Agent选择在PC端上线,百度的心响则把首发选在了手机App端,后续才会上线PC端。

不同的智能硬件端,决定了两者面对的受众差异:电脑端面对的多为有工作、学习需求的用户,集中在报告研究、内容分析的领域;而手机端用户则更希望体验AI在实际生活场景中落地的各项功能。

结合百度在医疗、法律等行业的优势,再加上百度过往在AI虚拟社交等方向的探索成果,心响最终的上线形式就变成了主推垂类场景的模样。

目前,心响App的主界面推荐了包括AI相亲、旅游规划、医疗/法律咨询等场景的体验推荐。实际测试下来,心响在医疗、法律等问题上的准确度较高。比如在回答酒驾撞人逃逸问题时,心响调用了多个Agent,最终给出量刑7年的结果,这也和现实中律师意见一致。

图片

但在脱离垂类知识积累的其他业务上,心响的准确度还需要继续优化。比如在要求出一份旅游地点建议的任务执行中,心响明明已经判断出地点不属于朝阳区范围,但依然推荐了不满足用户设定条件的景点。

综合三个通用Agent的测评结果,大厂梯队的AI智能体,目前多数只能用来完成一些基础水平的工作,能力上还没有达到类似Manus般惊艳的效果。

但短期内,大厂们交出的答卷,已经让市场用户开始逐渐对智能体的概念感到兴奋和好奇。

无论是字节还是360的Agent,近期都在大批量开放测试的过程中出现过服务器崩溃的情况,可以说,即使是拥有充足算力的大厂,其消耗程度也远远超出了发布的预期。

而智能体这条赛道,参与的选手不只有互联网大厂和创业公司,凭借硬件优势,有智能手机和电脑的公司也盯上了智能体的前景。

今天,联想就在发布会上发布了面向个人的智能体“天禧”和“乐享”企业超级智能体,针对个人来说,其智能体已经能够完成提供旅游建议、制定行程和下单等各种自主操作。

面对“智能体”这块肥肉,各家虎视眈眈。

Manus还没被超越,

但技术红利还能吃多久?

被称作“Agent之年”的2025,大厂和创业公司,都在自己的能力范围内交出答卷。

但三家大厂目前上线的产品,折射出一个残酷现实:大厂们即便坐拥生态与算力,复刻Manus并不是一个能够在短期内完成的事情。

在Manus发布之初,其创始人肖弘就已经给出了自己的观点:Manus没有秘密。

“从产品经理的角度出发,要用就要用最好的大模型,用最好的东西能产生多大的商业价值,产品经理关心的是这个。”肖弘说。

Manus的核心能力建立在模型能力溢出上,但在最早建立市场认知的时刻,Manus在模型能力调用和产品思路两个方面做到了极致:

首先,Agent需要同时处理多模态理解、复杂推理、代码生成等多样化任务,这对底层模型的综合调用能力提出了极高要求。现在市面上能够看到的多数通用Agent,都是采用不只一个大模型,而是多个模型按照不同需求调用,比如需要理解图片内容,就调用多模态能力更强的大模型。

以字节为例,据晚点LatePost报道,扣子团队开发扣子空间时,他们曾考虑优先使用 DeepSeek-R1,测试后发现其调用工具的能力不足。最后,基于能力表现和成本原因考虑。使用了豆包1.5Pro 为主的多款模型。

而在拥有更好的模型能力基础上,如何将技术转化为用户体验也是一个挑战。

不过,在各家公司交出的Agent上,均已经有不同的思路展现。比如,在搜索体验上,百度的Agent产品采用“多组关键词+搜索引擎”策略,用多组关键词尝试搜索,而智谱则让自家AutoGLM沉思在小红书、知乎等不同平台搜索,打破了不用应用数据固化的边界。

在短期时间内,当前的技术格局呈现出一个有趣现象:以Manus、GensPark为代表的创业公司,仍在关键指标上保持领先优势。比如,GensPark在GAIA基准测试中的表现已超过Manus。

相比之下,大厂现阶段推出的Agent产品更多是“60分解决方案”,但和Manus的目标相同,大厂们需要在通用Agent相对空白的阶段,率先抢夺一部分市场。

技术路线的差异直接影响了商业化策略的选择,两类玩家正走向截然不同的道路:

目前主流大厂仍以免费策略为主导目标,试图撬走一部分用户,字节、阿里和百度的产品都采取了免费供应的方式。

而成本压力迫使创业公司更早启动商业化。目前,GensPark已积累1万付费用户,其ARR(年度经常性收入)达到2200万美元。而Manus更是在海外市场开出单月39美元的基础版和单月199美元的高级版两种收费模式,定价比肩OpenAI的会员。

不过,从基础大模型到应用产品来看,目前技术优势的窗口期正在缩短,留给创业公司们的时间不多。

现在的大厂们用不到一个月的时间,交出了60分的答卷,当新的通用Agent提升到70分、80分,加上免费策略,势必会对创业公司们造成进一步的冲击。

这场竞赛的终局还处于起始阶段,而在通用Agent能力再跃升之前的一切交锋,只是2025Agent爆发之年的序章。

举报

  • 相关推荐
  • 接替Manus,字节的Agent王牌能打多久?

    字节跳动旗下智能体平台"扣子空间"推出首款由大厂发布的Agent爆款产品,自4月18日上线后引发用户疯抢邀请码。该产品具备规划、工具调用和记忆等关键能力,支持游戏攻略撰写、市场调研等复杂需求,并首创"探索模式"和"规划模式"双交互设计。虽然底层模型能力较DeepResearch和Manus仍有差距,但凭借产品设计优化和量大价优的优势,成功填补了Manus留下的市场空白。字节同步推出企业版HiAgent解决私有化部署问题,半年内智能体业务订单量增长超330%。当前行业正迎来Agent爆发期,但企业落地仍面临系统接入、数据安全等挑战。

  • 多模态和Agent成为大厂AI的新赛 点

    这是《窄播Weekly》的第52期,本期我们关注的商业动态是:当大厂的AI竞争策略开始倾斜向应用场景,多模态能力和代理执行成为两个焦点。大模型落地C端场景的核心,就是让大模型的能力越来越接近人。沿着这个主旋律,可以划分出两个进化方向:一个是持续降低用户与大模型进行有效沟通的难度;另一个则是让大模型具备执行更复杂任务的能力。前者的实现,需要给到大模型多

  • 多模态和Agent成为大厂AI的新赛点

    本期《窄播Weekly》聚焦AI大厂竞争策略向应用场景倾斜的趋势,重点分析了多模态能力和代理执行两大发展方向。文章指出,大模型落地的核心在于让人机交互更自然,具体表现为:1)通过多模态技术降低用户使用门槛,如阿里夸克新推出的"拍照问夸克"功能;2)通过代理执行提升复杂任务处理能力,如字节、百度等推出的通用Agent产品。国内外厂商路径差异明显:国�

  • 谷歌A2A协议是什么? MCP 和 Agent2Agent 有什么区别?

    4月10日,在GoogleCloudNext大会上,谷歌宣布开源Agent2Agent协议,这一协议被业界视为智能体交互领域的“通用语言”,旨在突破跨平台、多模态协作及安全保障等核心技术瓶颈,并联合全球50余家科技企业共同构建新一代智能生态。本文从技术实现与行业变革两个维度,深度解析A2A协议的核心价值。这一协议的推出,标志着智能体协作模式从封闭系统向开放生态的范式转变,为产业数字化转型注入新动能。

  • 谷歌开源发布A2A协议 Agent2Agent智能体交互协议详细介绍

    在GoogleCloudNext25大会上,谷歌宣布开源了首个标准智能体交互协议——Agent2AgentProtocol,这一举措有望彻底改变智能体之间的交互方式,打破系统孤岛,对智能体的能力、跨平台协作以及执行效率产生质的飞跃。A2A协议是一种开放标准,旨在为智能体提供一种通用的交互方式,使它们能够在不同的底层框架和供应商之间无缝协作。每个部分都有指定的内容类型,这使得客户端和远程智能体能够协商所需的正确格式,并且明确包括用户界面能力的协商,比如iframe、视频、网络表单等,从根据用户的需求和设备的能力,提供最佳的用户体验。

  • 「扣子空间」内测上线,和 Agent 一起开始你的工作

    “摘星空间”平台正式推出,集生产、专业领域支持及双模系统协作能力,通过多类型AI智能体实现高效办公,具备生产提升、专家深度支持、双模协同等四大核心功能,未来将持续扩展Agent能力边界。

  • 醒醒,只靠MCP和A2A还带不来AI Agent的大繁荣

    文章探讨了AI Agents发展需要类似HTTPS的安全协议保障。回顾互联网发展历程,TCP/IP协议统一了网络通信标准,HTTP协议实现了全球互联,而HTTPS通过SSL加密解决了安全问题。类比互联网发展,当前AI Agents产业面临类似挑战:Anthropic推出的MCP协议解决智能体与工具连接问题,Google的A2A协议实现智能体间协作,但缺乏安全标准。IIFAA联盟正致力于构建AI Agents安全生态,推出ASL中间件保障数据隐私和身份认证。文章指出,正如HTTPS推动电商繁荣,AI Agents的安全标准化将加速商业化进程,蚂蚁集团等企业已开始实践MCP应用。未来AI Agents可能通过统一入口调用工具池,改变现有交互模式。

  • 挤爆字节服务器的Agent到底啥水平?一手实测来了

    字节推出"量子位"智能协作系统"扣子空间",具备信息整理、任务执行、工具调用等多项能力。测试显示其自主任务规划和资料搜集表现惊艳,已具备解决实际任务的潜力。系统分为探索和规划两种模式,前者重效率,后者可详细拆解任务。实测中能自动整理信息生成报告,并直接制作包含丰富内容的网页或PPT。在虚拟沙盒环境中还能操作电脑、浏览网页、订票�

  • “谷歌版MCP”来了,开源A2A,不同厂商Agent也能协作

    “谷歌版MCP”来了!谷歌推出A2A协议,即Agent2Agent,能让AIAgent在不同生态系统间安全协作无需考虑框架或供应商。不同平台构建的AIAgent之间可以进行通信、发现彼此的能力、协商任务并开展协作,企业可通过专业Agent团队处理复杂工作流。从各大厂最近动作来看,芜湖,不愧是Agent元年。

  • ChatGPT终于发布长期记忆功能,开启个人Agent时代

    今天凌晨1点,OpenAI对ChatGPT功能进行了大更新,新增长期记忆功能,可以记住你过去所有的聊天记录,会根据你的兴趣、偏好提供更个性化的回答。这对于写小说、金融分析、教育等领域帮助巨大。Team、Enterprise和Edu用户将在几周后获得使用权限。