首页 > 业界 > 关键词  > 数字生命最新资讯  > 正文

Agent真的卷疯了,AI办公Agent也来了。

2025-05-22 13:56 · 稿源: 数字生命卡兹克公众号

声明:本文来自于微信公众号 数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。

我一直说,每个行业,都一定会有专门优化的垂直领域的Agent。

你看,通用Agent的王座上有Manus,研究类的有DeepResearch,旅游有飞猪问一问,设计类有Lovart。

那现在,办公领域的Agent也来了。

专为办公打造。

这玩意就是昆仑万维Skywork Super Agents

图片

我在五天前受到昆仑万维邀请,深度体验了一把。

虽然在体验过程中,还有点小小的插曲,因为单独给我开的测试服务器,所以其实是晚上限时开放的,结果有天晚上提前关了,我测的正High。。。

图片

给我一下子干慌了,第一次见到这么真诚的品牌方,那一瞬间觉得我要是不好好体验测试,那我真是千古罪人= =

不过抛开这些情感因素不谈,在我体验了5天之后,我觉得,还是值得写一写这个产品。

因为作为一个Agent产品的第一代,做的功能确实完整,产品体验也很棒,而且它对大家的办公场景,是真的还有点用。分为海外版和国内版。

海外版网址在此:https://skywork.ai/

国内版网址:https://www.tiangong.cn/

他们的首页是这样的。

图片

从首页上能看出来跟其他的不一样的点,就是把办公场景单独抽离了出来,直接就标了3个专家级场景,文档、PPT、表格,后面还有网页、播客。

图片

这三个专家级场景,大概率就是3个特训的不同的Agent,以能在每一个场景上,都达到最好的效果。

甚至前面三个智能体,在点击上面的小标签之后,还能选择细分场景,比如这个文档的。

图片

还有PPT。

图片

这个还是蛮有意思的,在用户体验层面,做了降维,同时也可以做一些针对性的优化。

给大家看一个实际的例子,就先用PPT入手吧。

比如说,马上终于又要端午节了,但是最近忙成狗,基本时间都快被切割成1小时为维度了,端午节出远门是不可能了,顶多当个溜达鸡,在北京附近转一转透透气。

同时考虑到随时可能要写稿,露营似乎成为最好的选择,因为随时能坐下来办公,毕竟面对好山好水,赶稿的心情也许会好一些。。。

于是,我就想让Skywork,生成一份北京周边露营的PPT,来给我宣传宣传北京周边区域的景点。

图片

当你把你的要求发过去之后,有趣的事情来了。

之前不管是DeepResearch还是Manus,现在都有一个我觉得超棒的环节,就是需要你确认。

图片

图片

我自己超级喜欢这种方式,因为它能帮你查缺补漏。

而这次,Skywork做了一个小创新,虽然是交互设计和产品层面的,但是我依然觉得,眼前一亮。

他们把对话式的回复,变成了选择式。

图片

这个点真的挺棒的,因为打字这个事,其实一直都是成本比较高的行为,你会看到,在移动互联网的交互设计思路里,一定都是能选择就不会让你输入的,这样用户体验最佳

而Skywork,这波把需要你补充的信息,也从问答输入式,变成了选择式,这点我真的很喜欢,懒逼狂喜。

在你选完以后,点击确认,在嘟嘟的跑了一会后。就会继续让你确认,待办清单。

图片

之前很多Agent其实都是直接生成完步骤直接运行了,不会让你确认。

但是在办公场景下,坦率的讲,我自己还是希望确认或者修改一下的,因为我们需要的不是很随机的东西,而是精准,以及可控。

你觉得没问题的话,就可以点确认,如果觉得不满意,就直接在补充内容那块,直接用嘴修改就行。

确认之后,它就会就直接开始干活了。

先非常常规的搜集信息后,就是各种搜网页抓取信息。

图片

每做完一步,修改自己的To do list,同时,有一个点,就是在最终PPT的大纲生成的时候,这个PPT大纲也是需要你确认的。

图片

我在测试过程中,之前不知道这个地方也要确认,于是在确认完待办事项后,就把网页关了直接去拉屎了,想着一会打一把游戏回来一会就可以直接收菜了。

结果回来再打开网页以后,发现,卧槽怎么停在这一步了?

就,那一瞬间,感觉天塌了。。。

如果你觉得这个大纲可以,你就点继续,如果你觉得一般,你想改,那就直接点接管,你可以进入一个新页面,直接可以手调,只要有字的地方,都可以编辑。

图片

最后,整体上大概等10分钟左右,你就会收到,生成好的PPT了。

比较骚的一点是,Skywork是在用代码来画PPT。。。

图片

PPT的效果,我觉得还是蛮好看的。

整体风格非常统一,最搞笑的是,在这十几页PPT里,我也不知道它为啥,给情侣这一页,单独来了个浪漫的紫色。。。对,唯独就这一页不一样。。。

图片

如果担心PPT内容不可信,还可以点击右下角“查看信息来源”,确认PPT内容的真实性。

如果你觉得,这里面的文字你希望调整,你可以点击,右上角的编辑。

这个,是我觉得,相比于其他Agent最爽的一点,就是,他是真的,能直接在上面改文字的。。

你能看出来,它想好好做办公的心,这玩意,就是正儿八经的,打通了最后一公里。

唯独可惜的是,还是没有PPT或者Canva那种自由度,比如你没法移动文字的位置,没法改图等等。不过还是那句话,路对了,后续迭代就好了,这毕竟才第一版。

最后,你什么都确认了,想下载的时候,你可以点击右上角,把它下载成PPT或者是PDF文件。

图片

就这样,全程我就说了两句话,点了三下确认。一份我觉得很好看的PPT,就完成了。

而且中间的过程,自主可控,一些产品的交互细节做的,也蛮不错的,完整度很高。

然后,我又做了一个影视策划书。

这个PPT不仅要有独特的视觉风格,还要把故事和人物都介绍的很吸引人,制片层面的主创码盘子、制作周期规划、市场分析也少不了。

最关键的是,这玩意得跟我的参考PPT和原著小说做结合。

于是,我就上传了一个这两个文件,先扔到了知识库里。

图片

让它再看一下生成的效果。

图片

PPT的怀旧风格是有的。

图片

故事大纲也有点想让人往下看。

图片

人物介绍,emm,可以更吸引人,但好歹把人介绍清楚了,还是得我们徒手在上面修就成。

图片

改编方向、视觉风格、主创团队、目标受众,想的还挺详细的,能当半个制片人了。

图片

单就PPT这个Agent的体验上,非常完整了,很好的诠释了什么是办公场景的全链路。

我其实一直觉得在这个阶段,还是做垂一点的Agent产品,更可用,你把一个聚焦的场景做好,可能比一个究极通用,但是每个点都一般的产品,更有用。

表格模式,跟PPT类似。

我们可以直接让AI,来帮我们处理表格数据。

图片

也可以直接,说出你的要求,让他基于全网的信息给你做筛选,最后屯到表格里。

图片

图片

它甚至会单独帮你开几个sheet,给你准备好,视觉的可视化。

图片

不过有个问题就是,excel没有办法直接在线上编辑,需要下载下来才能修改,坐等他们迭代了下一版。

文档层面,其实整体上比较通用。

很酷的点就是基于文档这个大场景,还分了很多小场景。

图片

比如前几天,爱死机4上线了,就咋说呢,看的我还是挺失望的,有点像这几年的漫威,技术力上来了,故事越讲越烂了。

我就可以让Skywork写一段吐槽的。

图片

图片

图片

最后出来的效果,非常的不错。输出了一份超长的文档。

图片

真得尖锐刻薄加杀人诛心。。。

当然,后面还有其他的模式。

比如我们可以直接,生成一个网页。

我就用它搓了个甄嬛传版狼人杀。

图片

再播客模式下,我们也能用文件或者Prompt,生成一段播客。

图片

通用模式下,其实就相当于Manus那种了,我甚至让它给我写了一首歌。

我让它模仿泰勒斯威夫特的风格创作一段音乐。

图片

emmm,顶锅盖说,其实我觉得比霉霉的新专辑更有记忆点一些......

music_20250520_192217,数字生命卡兹克,1分钟

这个模型应该就是昆仑万维自己的音乐模型Mureka,冷知识,昆仑万维其实,是一家有深厚音乐基因的公司。。。

他们的音乐推理大模型Mureka O1,之前压了Suno,然后了SOTA了。。

最后,说说价格。

Skywork是积分制,实际跑的过程中,你才能知道,消耗多少积分。

图片

一个项目,小的可能就几十,最多的我见过5000积分的,但是大部分,都在几百到一千左右。

价格上,海外版价格在大部分的同类型Agent产品中,价格算中档。

图片

但是坦诚的讲,相比于大家日常用的非Agent的AI产品,会贵一些,毕竟整体Agent算力消耗在这。

不过每天会送1200,还是能白嫖一些的。

图片

目前,无需邀请码,对所有人开放。

但是,但是来了。

国内版,则就便宜的多了,而且是便宜的我有点不敢相信。

图片

价格只有海外版的1/3,PPT还是三折?。。属于便宜到离谱的那一档。。。

这个定价策略,让我想起了曾经的拼多多,挣海外的钱,补贴国内,泪目了。。。

海外网址:https://skywork.ai

中国网址:https://tiangong.cn

最后,我还是想聊聊昆仑万维。

其实坦率的讲,我之前对昆仑万维的产品,是没有啥太深的印象的。

但是这一次,我是有一点意外的。

不止是产品的完整度。

更是另外1个非常有趣的操作,就是刚刚,他们,把DeepResearch Agent框架直接开源了。。。

主要是他们这个框架跑分(5月10号的数据),还挺高的。

图片

deep research agent框架开源:https://github.com/SkyworkAI/DeepResearchAgent

图片

还把文档、表格、PPT的生成能力,做成了MCP,供所有开发者调用。

MCP地址:https://mcp.so/server/skywork-super-agents/Skywork-ai

图片

就,我还是想说句佩服的。

我一贯的态度就是,你开源,你开放,你就牛逼,我就要夸你。

你能从每一个细节中感受到,这还是一群真心想让AI好用的人,在用工程师的方式,尝试解决我们每天办公里的小痛点。

昨天,Google已经手起刀落,开始在重构自己的搜索引擎。

那其实像笨重的Office套件。

为什么不会有,重构的可能呢?

这个方式,也许。

Agent,会更优雅。

举报

  • 相关推荐
  • 多模态和Agent成为大厂AI的新赛 点

    这是《窄播Weekly》的第52期,本期我们关注的商业动态是:当大厂的AI竞争策略开始倾斜向应用场景,多模态能力和代理执行成为两个焦点。大模型落地C端场景的核心,就是让大模型的能力越来越接近人。沿着这个主旋律,可以划分出两个进化方向:一个是持续降低用户与大模型进行有效沟通的难度;另一个则是让大模型具备执行更复杂任务的能力。前者的实现,需要给到大模型多

  • 多模态和Agent成为大厂AI的新赛点

    本期《窄播Weekly》聚焦AI大厂竞争策略向应用场景倾斜的趋势,重点分析了多模态能力和代理执行两大发展方向。文章指出,大模型落地的核心在于让人机交互更自然,具体表现为:1)通过多模态技术降低用户使用门槛,如阿里夸克新推出的"拍照问夸克"功能;2)通过代理执行提升复杂任务处理能力,如字节、百度等推出的通用Agent产品。国内外厂商路径差异明显:国�

  • 醒醒,只靠MCP和A2A还带不来AI Agent的大繁荣

    文章探讨了AI Agents发展需要类似HTTPS的安全协议保障。回顾互联网发展历程,TCP/IP协议统一了网络通信标准,HTTP协议实现了全球互联,而HTTPS通过SSL加密解决了安全问题。类比互联网发展,当前AI Agents产业面临类似挑战:Anthropic推出的MCP协议解决智能体与工具连接问题,Google的A2A协议实现智能体间协作,但缺乏安全标准。IIFAA联盟正致力于构建AI Agents安全生态,推出ASL中间件保障数据隐私和身份认证。文章指出,正如HTTPS推动电商繁荣,AI Agents的安全标准化将加速商业化进程,蚂蚁集团等企业已开始实践MCP应用。未来AI Agents可能通过统一入口调用工具池,改变现有交互模式。

  • 接替Manus,字节的Agent王牌能打多久?

    字节跳动旗下智能体平台"扣子空间"推出首款由大厂发布的Agent爆款产品,自4月18日上线后引发用户疯抢邀请码。该产品具备规划、工具调用和记忆等关键能力,支持游戏攻略撰写、市场调研等复杂需求,并首创"探索模式"和"规划模式"双交互设计。虽然底层模型能力较DeepResearch和Manus仍有差距,但凭借产品设计优化和量大价优的优势,成功填补了Manus留下的市场空白。字节同步推出企业版HiAgent解决私有化部署问题,半年内智能体业务订单量增长超330%。当前行业正迎来Agent爆发期,但企业落地仍面临系统接入、数据安全等挑战。

  • 大厂Agent混战:复刻Manus的野心与困局

    国内AI智能体市场竞争激烈,字节、阿里、百度等大厂纷纷推出对标Manus的产品。字节"扣子空间"定位职场助手,阿里"心流"侧重深度研究,百度"心响"聚焦医疗法律等垂直场景。尽管产品形态各异,但都面临技术复制与流量争夺的双重挑战。当前智能体仅能完成基础任务,与Manus仍有差距。大厂通过免费策略抢占市场,而创业公司如GensPark已开始商业化探索。技术窗口期正在缩短,2025年被视为"智能体爆发年",这场围绕下一代AI入口的竞赛才刚刚开始。

  • 挤爆字节服务器的Agent到底啥水平?一手实测来了

    字节推出"量子位"智能协作系统"扣子空间",具备信息整理、任务执行、工具调用等多项能力。测试显示其自主任务规划和资料搜集表现惊艳,已具备解决实际任务的潜力。系统分为探索和规划两种模式,前者重效率,后者可详细拆解任务。实测中能自动整理信息生成报告,并直接制作包含丰富内容的网页或PPT。在虚拟沙盒环境中还能操作电脑、浏览网页、订票�

  • IBM高管详解如何加速企业AI应用:Agent是路径,不是噱头

    IBM在2025 Think大会上提出,企业AI竞争已从实验阶段转向实际应用阶段,关键在于定制化AI解决方案和可量化的业务成果。IBM强调企业级AI Agent需具备"动手能力",能嵌入业务流程、完成任务并监控维护,而非仅是对话助手。其watsonx平台构建了模型、数据、任务执行的完整技术栈,并通过三层架构(交互层、任务分解层、系统连接层)实现闭环运行。IBM还推出"AgentOps"体系,将智能体模块化、服务化,建立能力目录和监控机制,解决企业部署AI Agent时的系统对接、价值评估和管理难题。实践案例显示,制造业设备巡检Agent可节省70%人力成本。IBM认为AI Agent是企业数字化能力的延伸,需与业务流程深度融合,而非追赶技术潮流。

  • 微软发布2025工作趋势:每位员工将是Agent老板

    微软发布《2025年工作趋势指数报告》,揭示"前沿公司"这一新型组织形态正在兴起。报告基于全球31个国家/地区的31,000家企业数据,结合LinkedIn劳动力市场趋势分析,指出"智能体+人类"的人机协作模式正在重塑企业架构。前沿公司以AI智能体为核心,通过动态任务协作图(WorkChart)取代传统职能架构,实现高效人机协作。报告显示:67%的领导者已熟悉智能体概念,79%认为AI将加速职业发展;员工需从"工具使用"转向"协作共创",掌握AI管理技能;组织需重构职能,建立"智能资源部门"统筹人力与数字劳动力分配。人机协作的关键在于科学管理框架,最优状态是AI处理标准化任务,人类专注战略指导与复杂决策。

  • Aloudata Agent公测开启:NoETL+大模型=好数据驱动真智能,让“万数皆可问”

    4月22日,Aloudata大应科技推出自研的Aloudata Agent,这是一款基于NoETL明细语义层的分析决策智能体,旨在通过自然语言实现数据查询、归因诊断、报告生成等功能。该产品解决了企业数据分析面临的五大挑战:语义鸿沟、口径一致性、场景覆盖度、性能优化和数据权限管控。Aloudata Agent采用NL2MQL2SQL技术路径,通过指标语义层实现业务语言与数据语言的精准对齐,显著提升查询准�

  • AI日报:Manus面向所有人开放注册;全球首款设计Agent Lovart内测;教育部划清AI使用边界

    【AI日报】今日AI领域重要动态:1)国产AI平台Manus开放注册,无需邀请码即可使用;2)Lovart推出全球首款设计Agent,支持全链路自动化设计;3)教育部发布AI教育指南,禁止学生直接复制AI生成内容;4)昆仑万维开源Matrix-Game大模型,专注交互式世界生成;5)Google Gemma模型下载量突破1.5亿次;6)OpenAI新增一键导出PDF功能;7)字节跳动推出图像编辑框架DreamO;8)Kimi智能助手界面升级;9)阿里MNN更新支持通义千问2.5;10)ChatGPT新增SharePoint连接器;11)OpenVision视觉编码器发布;12)福布斯中国AI企业TOP50榜单发布;13)腾讯"元宝"工具上线,基于混元T1-Vision模型实现图片深度理解。

热文

  • 3 天
  • 7天