声明:本文来自于微信公众号 数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。
我一直说,每个行业,都一定会有专门优化的垂直领域的Agent。
你看,通用Agent的王座上有Manus,研究类的有DeepResearch,旅游有飞猪问一问,设计类有Lovart。
那现在,办公领域的Agent也来了。
专为办公打造。
这玩意就是昆仑万维的Skywork Super Agents。
我在五天前受到昆仑万维邀请,深度体验了一把。
虽然在体验过程中,还有点小小的插曲,因为单独给我开的测试服务器,所以其实是晚上限时开放的,结果有天晚上提前关了,我测的正High。。。
给我一下子干慌了,第一次见到这么真诚的品牌方,那一瞬间觉得我要是不好好体验测试,那我真是千古罪人= =
不过抛开这些情感因素不谈,在我体验了5天之后,我觉得,还是值得写一写这个产品。
因为作为一个Agent产品的第一代,做的功能确实完整,产品体验也很棒,而且它对大家的办公场景,是真的还有点用。分为海外版和国内版。
海外版网址在此:https://skywork.ai/
国内版网址:https://www.tiangong.cn/
他们的首页是这样的。
从首页上能看出来跟其他的不一样的点,就是把办公场景单独抽离了出来,直接就标了3个专家级场景,文档、PPT、表格,后面还有网页、播客。
这三个专家级场景,大概率就是3个特训的不同的Agent,以能在每一个场景上,都达到最好的效果。
甚至前面三个智能体,在点击上面的小标签之后,还能选择细分场景,比如这个文档的。
还有PPT。
这个还是蛮有意思的,在用户体验层面,做了降维,同时也可以做一些针对性的优化。
给大家看一个实际的例子,就先用PPT入手吧。
比如说,马上终于又要端午节了,但是最近忙成狗,基本时间都快被切割成1小时为维度了,端午节出远门是不可能了,顶多当个溜达鸡,在北京附近转一转透透气。
同时考虑到随时可能要写稿,露营似乎成为最好的选择,因为随时能坐下来办公,毕竟面对好山好水,赶稿的心情也许会好一些。。。
于是,我就想让Skywork,生成一份北京周边露营的PPT,来给我宣传宣传北京周边区域的景点。
当你把你的要求发过去之后,有趣的事情来了。
之前不管是DeepResearch还是Manus,现在都有一个我觉得超棒的环节,就是需要你确认。
我自己超级喜欢这种方式,因为它能帮你查缺补漏。
而这次,Skywork做了一个小创新,虽然是交互设计和产品层面的,但是我依然觉得,眼前一亮。
他们把对话式的回复,变成了选择式。
这个点真的挺棒的,因为打字这个事,其实一直都是成本比较高的行为,你会看到,在移动互联网的交互设计思路里,一定都是能选择就不会让你输入的,这样用户体验最佳。
而Skywork,这波把需要你补充的信息,也从问答输入式,变成了选择式,这点我真的很喜欢,懒逼狂喜。
在你选完以后,点击确认,在嘟嘟的跑了一会后。就会继续让你确认,待办清单。
之前很多Agent其实都是直接生成完步骤直接运行了,不会让你确认。
但是在办公场景下,坦率的讲,我自己还是希望确认或者修改一下的,因为我们需要的不是很随机的东西,而是精准,以及可控。
你觉得没问题的话,就可以点确认,如果觉得不满意,就直接在补充内容那块,直接用嘴修改就行。
确认之后,它就会就直接开始干活了。
先非常常规的搜集信息后,就是各种搜网页抓取信息。
每做完一步,修改自己的To do list,同时,有一个点,就是在最终PPT的大纲生成的时候,这个PPT大纲也是需要你确认的。
我在测试过程中,之前不知道这个地方也要确认,于是在确认完待办事项后,就把网页关了直接去拉屎了,想着一会打一把游戏回来一会就可以直接收菜了。
结果回来再打开网页以后,发现,卧槽怎么停在这一步了?
就,那一瞬间,感觉天塌了。。。
如果你觉得这个大纲可以,你就点继续,如果你觉得一般,你想改,那就直接点接管,你可以进入一个新页面,直接可以手调,只要有字的地方,都可以编辑。
最后,整体上大概等10分钟左右,你就会收到,生成好的PPT了。
比较骚的一点是,Skywork是在用代码来画PPT。。。
PPT的效果,我觉得还是蛮好看的。
整体风格非常统一,最搞笑的是,在这十几页PPT里,我也不知道它为啥,给情侣这一页,单独来了个浪漫的紫色。。。对,唯独就这一页不一样。。。
如果担心PPT内容不可信,还可以点击右下角“查看信息来源”,确认PPT内容的真实性。
如果你觉得,这里面的文字你希望调整,你可以点击,右上角的编辑。
这个,是我觉得,相比于其他Agent最爽的一点,就是,他是真的,能直接在上面改文字的。。
你能看出来,它想好好做办公的心,这玩意,就是正儿八经的,打通了最后一公里。
唯独可惜的是,还是没有PPT或者Canva那种自由度,比如你没法移动文字的位置,没法改图等等。不过还是那句话,路对了,后续迭代就好了,这毕竟才第一版。
最后,你什么都确认了,想下载的时候,你可以点击右上角,把它下载成PPT或者是PDF文件。
就这样,全程我就说了两句话,点了三下确认。一份我觉得很好看的PPT,就完成了。
而且中间的过程,自主可控,一些产品的交互细节做的,也蛮不错的,完整度很高。
然后,我又做了一个影视策划书。
这个PPT不仅要有独特的视觉风格,还要把故事和人物都介绍的很吸引人,制片层面的主创码盘子、制作周期规划、市场分析也少不了。
最关键的是,这玩意得跟我的参考PPT和原著小说做结合。
于是,我就上传了一个这两个文件,先扔到了知识库里。
让它再看一下生成的效果。
PPT的怀旧风格是有的。
故事大纲也有点想让人往下看。
人物介绍,emm,可以更吸引人,但好歹把人介绍清楚了,还是得我们徒手在上面修就成。
改编方向、视觉风格、主创团队、目标受众,想的还挺详细的,能当半个制片人了。
单就PPT这个Agent的体验上,非常完整了,很好的诠释了什么是办公场景的全链路。
我其实一直觉得在这个阶段,还是做垂一点的Agent产品,更可用,你把一个聚焦的场景做好,可能比一个究极通用,但是每个点都一般的产品,更有用。
表格模式,跟PPT类似。
我们可以直接让AI,来帮我们处理表格数据。
也可以直接,说出你的要求,让他基于全网的信息给你做筛选,最后屯到表格里。
它甚至会单独帮你开几个sheet,给你准备好,视觉的可视化。
不过有个问题就是,excel没有办法直接在线上编辑,需要下载下来才能修改,坐等他们迭代了下一版。
文档层面,其实整体上比较通用。
很酷的点就是基于文档这个大场景,还分了很多小场景。
比如前几天,爱死机4上线了,就咋说呢,看的我还是挺失望的,有点像这几年的漫威,技术力上来了,故事越讲越烂了。
我就可以让Skywork写一段吐槽的。
最后出来的效果,非常的不错。输出了一份超长的文档。
真得尖锐刻薄加杀人诛心。。。
当然,后面还有其他的模式。
比如我们可以直接,生成一个网页。
我就用它搓了个甄嬛传版狼人杀。
再播客模式下,我们也能用文件或者Prompt,生成一段播客。
通用模式下,其实就相当于Manus那种了,我甚至让它给我写了一首歌。
我让它模仿泰勒斯威夫特的风格创作一段音乐。
emmm,顶锅盖说,其实我觉得比霉霉的新专辑更有记忆点一些......
music_20250520_192217,数字生命卡兹克,1分钟
这个模型应该就是昆仑万维自己的音乐模型Mureka,冷知识,昆仑万维其实,是一家有深厚音乐基因的公司。。。
他们的音乐推理大模型Mureka O1,之前压了Suno,然后了SOTA了。。
最后,说说价格。
Skywork是积分制,实际跑的过程中,你才能知道,消耗多少积分。
一个项目,小的可能就几十,最多的我见过5000积分的,但是大部分,都在几百到一千左右。
价格上,海外版价格在大部分的同类型Agent产品中,价格算中档。
但是坦诚的讲,相比于大家日常用的非Agent的AI产品,会贵一些,毕竟整体Agent算力消耗在这。
不过每天会送1200,还是能白嫖一些的。
目前,无需邀请码,对所有人开放。
但是,但是来了。
国内版,则就便宜的多了,而且是便宜的我有点不敢相信。
价格只有海外版的1/3,PPT还是三折?。。属于便宜到离谱的那一档。。。
这个定价策略,让我想起了曾经的拼多多,挣海外的钱,补贴国内,泪目了。。。
海外网址:https://skywork.ai
中国网址:https://tiangong.cn
最后,我还是想聊聊昆仑万维。
其实坦率的讲,我之前对昆仑万维的产品,是没有啥太深的印象的。
但是这一次,我是有一点意外的。
不止是产品的完整度。
更是另外1个非常有趣的操作,就是刚刚,他们,把DeepResearch Agent框架直接开源了。。。
主要是他们这个框架跑分(5月10号的数据),还挺高的。
deep research agent框架开源:https://github.com/SkyworkAI/DeepResearchAgent
还把文档、表格、PPT的生成能力,做成了MCP,供所有开发者调用。
MCP地址:https://mcp.so/server/skywork-super-agents/Skywork-ai
就,我还是想说句佩服的。
我一贯的态度就是,你开源,你开放,你就牛逼,我就要夸你。
你能从每一个细节中感受到,这还是一群真心想让AI好用的人,在用工程师的方式,尝试解决我们每天办公里的小痛点。
昨天,Google已经手起刀落,开始在重构自己的搜索引擎。
那其实像笨重的Office套件。
为什么不会有,重构的可能呢?
这个方式,也许。
Agent,会更优雅。
(举报)