首页 > 业界 > 关键词  > 工作流程最新资讯  > 正文

安利一个11万Star的必装插件,能让你的Agent体验直接质变。

2026-04-08 15:36 · 稿源: 数字生命卡兹克公众号

声明:本文来自于微信公众号 数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。

最近一直在聊Agent、聊Vibe Coding。

但是在给越来越多的朋友安利的时候,发现其实,一直有一个问题被忽略了。

就是,真正卡住大多数人的,是自己没有一个标准的工作流程

特别在创造一个你想要的软件或者程序的时候,没有标准流程,其实是一件非常可怕的事情。

所以,我想给大家分享一个我自己在vibe coding的时候,一直在用的一个超好用的帮我提高Coding体验的一个插件,也基本上是我推荐所有人都必装的一个,基本上Claude Code、Codex、OpenCode、Cursor啥的全都适配,都可以装的。

它在Github上,已经有11万的star数了。

名字叫,Superpowers。

图片

GitHub 链接在此:

https://github.com/obra/superpowers

也是Claude官方的认证插件,上架了Anthropic的官方插件市场,安装量冲到了23万,排名第二。

图片

第一名就是那个大名鼎鼎的让你的设计变得更有品味的超牛逼的Skill,Frontend Design。

Superpowers其实不太能算一个传统意义上的工具,我觉得他更应该被定义为一套指导Agent如何完成任务的系统。

因为坦诚的讲,绝大数的Agent,在进行任务的时候,天然都倾向于拿到任务就开始写代码,会跳过设计、跳过测试、跳过 review,然后产出一坨不可维护的东西。

而Superpowers会强行在Agent的链路里面插入一套结构化的工作流,再结合着14个skills的组合,能让你最终的任务产出质量,上升几个档次。

图片

我做了一张图,可以简单的让大家看看这些Skills,每个有啥用,以及是怎么组合的,不用细看,大概知道原理就行。

图片

所以其实可以看出来,Superpowers本质上,是一个由14个Skills组成的工作流系统,而且,这个系统,并不止可以用在开发上,因为创造一个东西的本质上都是类似的。

都是规划 - 拆解 - 执行 - 审查 - 复盘。

所以,你也完全可以拿来做营销方案、做PPT、做数据分析等等,基本都是相通的。

非常的好用。

我觉得可以先给大家看看,如果不用Superpowers的时候,我们拿Claude Code或者Codex开发产品的原生流程会是什么样子的。

一般流程,其实都非常的简单,都是要先写需求文档,也就是做规划再开发。

我们拿Claude Code举例子,在这里面,规划就是Plan模式。

比如说,团队有个小伙伴跟老罗一样,有ADHD,经常看文章就很容易容易分心,最近我们就在说,是不是可以做个阅读辅助的小东西。

就这个需求,我们打开Claude code,在对话框里面敲个/plan,进入到规划模式。

把需求简单的描述一下,帮我做一个面向 ADHD 用户的中文网页阅读器应用。

让他来开始去做一个计划。

图片

然后,他会先调研一轮,一口气甩出好几个问题让你回答,这些问题其实你会发现,他们是并行的,之间没有前后因果关系。

图片

比如它问我使用场景、技术栈偏好,还有要加哪些ADHD友好特性,这块我选了仿生阅读,就是加粗每个单词前几个字母,一个比较经典的缓解ADHD的方法。

我回答了一下,然后它就直接开干了。

图片

几分钟之后,就直接做出来了,给了你一个东西,也没有审查啥的。

我们现在看的话,是不是好像没啥问题?

图片

但,其实有大问题。。。

因为这个仿生阅读,其实是为英语设计的。

Bionic Reading, A New Reading Method That Stresses Letters Within Words to  Let the Brain Fill in the Rest

英文阅读这么做没问题,但是你中文,是完全不行的话,阅读起来直接乱套了。

原因很简单,英文单词之间有空格,能找到边界,中文字和字之间没有空格,根本找不到词的边界,效果就会很别扭。

除了样式它不太行,它对国内用户的适配也很差。

我们读中文,用得最多的是公众号、知乎这些平台,结果这个插件根本没法正常读取。

跟我想要的阅读器差了十万八千里。

不过坦诚的讲,这确实也怪不到Claude Code头上。

因为ADHD阅读辅助本身就是个专业领域,需要做针对性的调研,还得考虑中文场景的适配、国内平台的兼容。

它问我的那几个简单的不痛不痒的问题,就肯定覆盖不了全部需求,那也很难做出你心中想要的答案。

而大多数的用户呢,心里也就是只有一个模糊的想法,他知道他要解决一个具体的问题,但是具体要做成啥样、该用什么路径去实现、边界在哪,大多数人,是真的想不清楚的。

所以在非Agent的时代,我写过一篇文章,叫分享6个平时我最常用的Prompt心法。

其中有一个Prompt心法,就是叫做苏格拉底式提问法,用一段Prompt,让AI在动手之前,先一个问题一个问题地拷打和追问你,直到把需求聊透了再开始。

    【你的问题/需求】请你在回答前,先问我问题。要求:一次只问一个问题。根据我的回答,继续追问。直到你有95%的信心理解我的真实需求和目标。然后才给出方案

    在Agent时代,其实也差不多,只不过从一个Prompt,升级到了流程中的一个Skill。

    我们再用Superpowers这个东西,再来开发试一下。

    首先自然是安装这个插件了。

    你直接跟你的Agent说一句话就行了:

      帮我下载并安装这个插件:https://github.com/obra/superpowers

      安装完以后,记得要重启一下才能生效,不是热加载。

      图片

      还是那个ADHD阅读器,我们再试试。

      一模一样的Prompt发过去。

      图片

      你就能看到,开始调用Superpowers和工作流了。

      它做的第一件事,是先问我用户会怎么用,这一步就直接解决了那些抓取不到的墙的问题。

      图片

      但跟刚才Plan模式的并行提问完全不一样,Superpowers一次只问一个问题,你答完这个,它才决定下一个问什么,就是刚才说的苏格拉底式提问,这样才能保证这些问题真的能够非常深入而不是浮于表面。

      我选了浏览器扩展,然后它又问了核心功能,到这一步的时候,我看着这些选项愣了一下,因为我自己也没那么熟,所以我说直接我都不是很了解,你去给我查一查吧。

      图片

      它就真的去查了,回来给了我一份调研结果。

      图片

      然后给了我一个建议,整理出了核心功能优先级的清单。

      图片

      比如仿生阅读,就是上次加粗前几个字母的方案,它直接标了弱但用户喜欢,还引用了研究说这玩意对ADHD用户中文阅读并没有显著的改善。

      我就继续让它帮我选了几个功能。

      之后他就继续往下拷打我,逼着我想清楚,比如目标浏览器是哪个?中文分词库有没有偏好?UI语言和风格?

      图片

      也就是逼着你想清楚。

      这个演示的项目其实不是很复杂,但是当你开发一个大型的项目的时候,你就会真正的发现,那种被拷打的汗流浃背的感觉了。

      在问题你都回答完之后,AI它也大概知道了你的需求。

      这时候,它跟Plan模式不一样的点,就是它会提出三个架构方案,每个方案的优缺点、适用场景列得清清楚楚。

      图片

      让你来挑一个,当然你也可以直接用它推荐的。

      我直接选了B,我不想要混合方案。

      然后它又让我挨个确认不同的细节。

      图片

      图片

      整体架构、功能模块的详细设计、控制面板、数据流与存储等等等等。。。。

      图片

      图片

      又一次确认的我汗流浃背,感觉到了自己在AI面前的菜鸡与渺小。

      等所有东西都确认完以后,他才终于,把整份的设计文档给写好,放在了本地。

      巨长巨详细的一份。

      图片

      所以很多朋友在开发的时候,感觉最后开发的东西不是你想要的,其实真的不是AI菜逼,是你的需求并没有说清楚。

      规划2小时,执行10分钟,我现在越来越觉得,执行真的没有那么重要,前期的规划想清楚,才是最最最最最重要的。

      我们自己做AIFUT的票务小程序的时候,其实就是因为盲目自大以及AI辅助流程不规范,很多用户需求前期没有考虑清楚就直接上线了,边界风险考虑的也不清楚,这其实就是前期的规划问题。

      图片

      所以现在我的感受是,AI来开发已经够快了,真正该花时间的地方是动手之前。

      你需要不断的被拷打,不断的跟团队分析所有的边界情况,还必须有老师傅坐镇和把关,最后才能出来一个能真正向用户交付的东西。

      说回Superpowers,第一步的规划其实就全部OK了,上面的所有的东西,其实都还只是,Superpowers流程中的第一个Skill。

      也就是brainstorming(头脑风暴)。

      对,第一个。

      设计文档确认之后,你是不是以为,它应该开始直接写代码了?

      但这个时候,第二个skill开始接入,用using-git-worktrees这个Skill,创建了一个隔离的工作区。

      就是从主分支拉出一个新分支,所有后续的开发都在这个新分支上进行。主分支的代码不受影响,新分支上不管怎么折腾都不会波及原有的东西。做完了觉得没问题,再合并回去。

      这就是做隔离,很多人都是直接就在之前的项目上改,然后没有版本隔离,就直接全部改炸了,那其实是个很不好的坏习惯。

      图片

      再接下来,第三个Skill,writing-plans skill登场了。

      注意啊,这一步依旧还是没有写代码。

      它干的事情是,把刚才那份设计文档拆解成一步一步的开发任务的清单,而且是拆成2~5分钟就能完成的开发任务清单计划。

      这个特别有意思,因为他们的目标,原话是:“让一个没有品味、没有判断力、没有项目上下文、而且厌恶测试的热情初级工程师也能照着做。”

      当时看到给我笑乐了。

      所以啊,你用了Superpowers,其实并不是只能用Claude Opus4.6,其实越是能力一般的模型,反而得到的加持会越大,这就是这个Skill发挥的作用。

      图片

      而且拆细了还有一个好处,就是每完成一个小任务就能验证一次,出了问题马上能发现,不用等整个项目写完了才发现直接爆炸了。

      这一点,到了执行阶段体现得更明显。

      这一步完事了以后,终于,要到了写代码的执行阶段。

      这时候,它会调用subagent-driven-development这个Skill。

      直接开了好几个子Agent,去做上面所有的事情。

      图片

      每个任务开发完,也不是直接就扔给你了,而是会过两道检查。

      第一轮派一个独立的审查Agent,看这个任务到底有没有按需求来,该做的有没有做到,不该做的有没有瞎加,有没有神经病一样整出一堆毫无意义的过度设计。

      第二轮再派一个审查Agent,查的是代码质量,这一轮主要就看代码写得规不规范,好不好维护。

      两道审查都不通过就打回修改,改完再审,然后如此循环,直到都通过为止。

      图片

      这10个小任务,终于开发完了,审查还没完,下一个环节,requesting-code-review这个skill会派一个最终审查Agent出来,把所有代码从头到尾通看一遍。

      之前每个任务的审查,盯的是局部,这一轮盯的是全局,看模块之间能不能集成、有没有遗漏、整体一不一致。

      图片

      最后收尾,跑一遍验证,确认所有测试通过,没有残留问题,然后把代码合并回主分支,清理工作区。

      图片

      最后,终于,做完了。

      图片

      我们看下这个阅读器的效果。

      它有两种很实用的阅读模式。

      一种是词性着色,会把名词、动词、形容词用不同颜色标出来,句子结构会清楚很多。

      图片

      还有一种模式是段落聚焦,正在阅读的这一段会被高亮,其他段落会压暗,适合读长段落,能明显减少周围文字带来的干扰,避免跑神。

      图片

      对ADHD用户来说,最大的敌人就是注意力被周围的文字分散。

      这个阅读器,就是把阅读重点变得更清楚,让该看的内容更容易被看见,周围干扰少一点,整篇读下来就不会那么累了。

      而且这次,因为用的插件方案,所以公众号、知乎这些页面全都能正常读取了。

      真的是一遍过,让我省心太多太多了。。。

      这样充分的说明了一个AI时代,正确的工作流程应该是啥样的。

      规划2小时,执行10分钟,审查1小时。

      大概就是这样。

      除了上面我提到的一些触发了的Skills,还有一些其他的我没提到的Skills,我就不详细提了,大家用的时候到时候可以自己去试一下。

      这个插件,是我推荐大家的,必装插件。

      在我心中,可能是跟skill-creator平级的必装插件了。

      相信我,绝对能大大提升你的工作质量。

      还有工作效率。

      举报

      • 相关推荐
      • AI日报:智谱发布GLM-5V-Turbo多模态Coding大模型;Seedance 2.0 API正式全量开放;美团 LongCat-AudioDiT 开源

        本期AI日报聚焦多领域进展:智谱发布GLM-5V-Turbo多模态编程模型,实现视觉与编程深度融合;字节跳动火山引擎开放Seedance 2.0视频生成API;美团开源LongCat-AudioDiT,刷新语音克隆SOTA;字节豆包大模型日消耗Token破120万亿,国产模型调用量持续增长;蚂蚁数科推出专业级AI智能体DTClaw;Anthropic测试常驻代理Conway,支持独立UI与Webhook;谷歌即将开源120B参数Gemma 4模型;通义实验室发布Qwen3.6-Plus,提升编程智能体稳定性。

      • 搜狗输入法 Kuikly AI 工程化:Spec coding 的探索与落地

        本文分享了搜狗输入法团队在跨端开发框架Kuikly项目中探索AI工程化的实践经验。团队从实际需求出发,逐步沉淀出一套AI工程化方案,旨在实现需求自动关联、代码生成与效果测试的一站式AI愿景。文章指出,单纯依赖Vibe Coding模式存在需求模糊、代码质量波动等问题。为实现真正的工程化,团队从几个关键层面推进:首先,构建高质量、结构化的AI上下文文档系统,通过生成器与评估器的多轮对抗迭代,为AI提供精准的项目理解。其次,采用Spec-Kit标准化需求流程,将产品需求、设计稿转化为结构化工程文档,并由AI主导实施,使开发从“提示词即兴发挥”变为“基于明确规格的稳定执行”。实践表明,在新页面开发场景中,该模式能大幅提升效率,生成代码在架构分层、状态管理等方面符合项目要求,代码Review阶段基本无需架构返工。最后,文章展望了未来在打通D2C工具链、构建自动化验证机制以及扩展更多开发场景等方面的持续探索方向。

      • 三星Music Studio画境艺术音响新品开售,双系共筑环绕声场与精致格调体验

        随着“耳朵经济”升级,消费者在追求高品质音效的同时,也注重音响设备与家居美学、情感体验的融合。三星Music+Studio画境艺术音响系列新品于4月13日开售,旨在为家庭带来沉浸式听觉享受与空间表达。其中,7系搭载3.1.1声道架构,支持高解析音频,配合Q交响乐技术,实现电视与音响协同发声,打造影院级环绕声场;5系设计简约,支持无线连接,适合多场景使用,提供便捷的高品质音乐体验。该系列重新定义了音响在家庭中的角色,融合声学科技与艺术设计,满足用户对声音、美学与情感的全方位追求。

      • 智微智能联合英特尔发布Gaudi2E四卡液冷工作站,赋能企业私有化AI算力

        英特尔与智微智能联合发布Gaudi2E四卡液冷工作站,为企业AI工作负载提供一站式私有化算力方案。该方案基于Xeon-W平台与四张Gaudi2E加速卡,支持三大“AI工厂”级应用场景:Token工厂实现每日5-10亿级Token生成能力;视频工厂支持电影级视频批量生产;代码工厂提供安全高效的本地化AI编程支持。产品通过一体化液冷设计实现高效散热与静音,适配办公环境,助力企业构建自主可控的AI算力基础设施。

      • Colorwalk怎么火了?年轻人用色彩漫步治愈生活

        最近啊,一种名为“Colorwalk(色彩漫步)”的新型活动在年轻人当中那是火得一塌糊涂!以前大家出门散步就是随便走走,现在可不一样了,这“Colorwalk”给散步整出了新花样。 啥是“Colorwalk”呢?简单来说,就是出门前先在心里选好一种颜色,然后带着这个目标走上街头。在走路的过程中,眼睛可得放亮了,专门去寻找和捕捉所有带有这个颜色的事物,不管是街边的小花、路�

      • 京东开源图像模型JoyAI-Image-Edit:达到世界一流水平

        京东探索研究院近日开源了自研的JoyAI-Image-Edit图像模型,其核心突破在于能理解图像的三维空间结构,解决了传统AI修图空间逻辑混乱的问题。该模型具备三大空间编辑能力:视角变换、空间漫游和物体空间关系操控,并兼容15类通用编辑功能。应用场景广泛,尤其在具身智能领域,可为机器人理解世界提供关键底层能力。京东近期在AI领域动作频频,持续推动AI与产业深度融合。

      • 聚焦AI+视听!itc保伦股份邀您相约2026北京InfoComm China展,共赴行业视听盛会

        北京InfoComm China 2026展会将于4月15日至17日在北京国家会议中心举行,标志着该品牌迎来二十周年里程碑。本届展会将汇聚全球400家参展企业,吸引超26,000名专业观众,集中展示AI技术应用、沉浸式体验、专业音视频与显示创新等前沿领域的最新成果。国内音视频系统解决方案服务商itc保伦股份将携六大场景展区及超15款明星产品亮相E3馆01展位,聚焦指挥中心、会议室等核心场景,呈现AI指挥调度、视频分析、智慧安防等一体化解决方案,并展示一系列行业前沿的音视频系统矩阵。展会还将提供详细的交通指南、周边酒店推荐及北京旅游攻略,方便参展观众规划行程。

      • OPPO K15 Pro系列首发磁吸镜头模组:支持3D打印DIY

        4月1日,OPPO K15 Pro系列正式发布,主打可更换磁吸镜头模组与个性化DIY。该系列镜头采用磁吸快拆结构,支持来电、通知等提醒,并可实现音乐律动与游戏联动。核心亮点在于与拓竹科技合作,在MakerWorld社区开源镜头模组3D文件,用户可下载模型自行3D打印专属镜头盖,实现外观个性化。硬件方面分大杯、中杯两款,分别搭载天玑9500s和天玑8500芯片,均配备1.5K直屏。全系内置主动散热风扇,升级低阻风道与散热鳍片,散热更高效。整机通过IP69防尘防水测试,进风口微凸不足1mm,体积精巧,支持智能自启动与转速自调节,50%转速下噪音仅19dB,更静音。

      • 从 RTX 到 Spark:NVIDIA 为本地代理式 AI 加速 Gemma 4

        Google推出小巧、快速且具备多模态能力的Gemma4模型家族,与NVIDIA合作优化,可在各类设备上高效本地运行。该系列涵盖E2B至31B多种变体,专为从边缘设备到高性能GPU的高效部署设计。Gemma4支持推理、编码、智能体及多模态交互等丰富任务,并兼容OpenClaw等应用,实现任务自动化。用户可通过Ollama或llama.cpp在NVIDIA RTX GPU和DGX Spark上免费运行。

      • 荣耀600 Pro国际版真机亮相:横向Deco+橙色机身 果味十足

        日前,荣耀新一代数字系列荣耀600系列在荣耀马来西亚官网公布,将带来荣耀600和荣耀600 Pro两款机型。 今日,荣耀600 Pro国际版真机亮相,其采用横向大矩阵Deco设计,整体视觉风格与iPhone 17 Pro颇为相似,辨识度十足。 从外观来看,Deco内配备三颗镜头,呈三角形排列,其中一颗采用椭圆形造型设计,显得格外独特,也进一步强化了整机的视觉层次感。 配色方面,新机提供橙

      今日大家都在搜的词: