首页 > 业界 > 关键词  > WAIC最新资讯  > 正文

在AI工具间来回切换了1年后,可灵用一张画布终结了它。

2025-07-29 09:18 · 稿源: 数字生命卡兹克公众号

声明:本文来自于微信公众号 数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。

这次去WAIC,论坛、探展直播、活动等等,硬生生干了个周末,几乎累麻了。

我自己这两天印象最深的,也是我觉得对我最有用的。

还是可灵的更新。

他们首发了1个全新的功能,灵动画布,还把之前的多图参考做了巨幅升级。

这两都挺酷的。

我当时在现场,录了一下灵动画布的发布,真的,发完以后底下掌声雷动。

这个形态我当时看完以后,眼前一亮,确实非常的有意思。

特别是对于AI创作者来说。

当时论坛结束以后,我问他们啥时候能用,他们说一会闭馆了我们晚上回去让产品给你开,但是你要是急的话,可以去楼上的可灵展区先试试看。

然后我就去楼上了。

给我看懵逼了。

我拍了一下当时的展区的盛况。

根本就特么挤不进去,我说我还是等你们晚上给我开吧,就掉头回酒店了。

晚上的时候,他们给我发了一句,可以用了。

果然,我登上去,发现已经开好了。

灵动画布在工具栏的最左边。

图片

点进来之后的界面,是这样的。

图片

其实你能看到,最大的三个功能,就是以模态为划分的,图片生成、视频生成、音效生成。

这个界面你可以先不用管,我们随便点开一个,比如图片生成。

图片

进去以后,你会发现,自己来来到画布界面,出现了节点。

左边是Prompt输入框,右边是可以选择的参数,比如模型、比例、多少张之类的。

中间用一个线给链接起来。

你只需要点一下立即生成。

他就会拉出一条新的线,链接到一块新的卡片上,而这些卡片,就是图片的生成结果。

图片

大概几十秒以后,四张图生成出来了。

图片

接下来,就是灵动画布这种画板式的产品,最棒的一点了。

在传统的可灵的UI界面里,如果我们想把可灵生成的图,用图生视频的方式生成AI视频的话。

需要点击这个生成视频。

图片

然后带着这张图,跳到了视频生成的界面。

图片

在对着一堆的按钮和参数,调完以后,生成视频。

但是我们都知道,做一个AI视频的片子,可能需要几百张图,几百个视频。

就这么来回跳来跳出,人会跳成智障,感觉自己是个跳跳虎,你很容易就迷失了,忘了自己的素材在哪里。

特别是所有的生成结果都堆在右边的结果栏里,图和视频混着排,我不知道你们,我自己是真的经常干着就找不到我之前的内容在哪了。

而在灵动画布里,就天然的适合做这种任务。

同样的,你可以把鼠标放在视频生成上,然后单击,就会出来两个关联的节点,这时候,这张图片自己本身和文本就作为素材节点,再加上参数节点,点击生成以后就可以直接生成视频。

图片

在这里面,你就可以切换模型,切换生成类型,还有一些几条、几秒等参数。

而新升级的多图参考,也在这个里面。

图片

素材节点+参数节点,就可以得到我们的视频生成结果。

同时,这个视频生成结果本身也是一个素材节点,后续可以用文本输入+视频参考的形式,给这个视频去加音效。

我们需要用到的,主要就是节点之间的排列组合。

比如文本输入+参数节点生成图片,比如图片&文本输入+参数节点生成视频,或者文本输入+参数节点直接生成视频。

其实底层逻辑和可灵之前的用法都是一样的,但是不同的是,它把每一个工作的节点拎了出来,让你在这个画布上就能够实时查看你的每一步工作。

我们还可以,微调Prompt,并行的开跑好几个任务,之前我经常这么干,就是为了要一个最好的效果,而现在,在画板上,并行会比传统的UI直观非常多。

图片

这个并发的感觉,究极壮观,强迫症患者表示爽飞了。

2分钟左右,视频跑完了,你还可以,给他们加音效。

最后,从文字到图片到带有音效的视频,就成了一个流。

图片

而且这个画布是无限的,也就是说,你在上面铺开一整个短片分镜也没关系。

如果画布太大,在画布上迷路了咋办?没关系,右下角可以缩放,随时会随时提示你正在什么地方。

图片

如果你的画布被弄得特别乱怎么办?也没关系,它有一个功能叫做整理画布。

图片

点击一下,咻的一下,页面又整洁了。

对于创作者来说,非常直观、方便、快捷,而且还极度可控。

我相信很多朋友其实都感觉到了,这玩意很像ComfyUI。

其实这种节点画布式产品,越来越成为一种主流的交互形态了,比如ComfyUI、扣子、百度的自由画布、Flowith等等。

这种形态,我觉得解决了一个我一直认为的AI工具生态化的核心难题。

产品间的孤岛化。

过去几年,其实AI工具发展得非常迅猛,但用户的体验却越来越破碎。

还记得2024年,我们生图用Midjourney、生视频用可灵、TTS用hailuo,生成完音频以后再扔回可灵做口型驱动,实在是太操蛋了。

标签上永远开着十几个网页。

也是后来我是在忍不了来回切换,搞了一个49寸的巨长无比的显示器,直接人工把所有的工具变成了节点式显示器画布,5、6个网页并排排列。

这边生成的素材我下载下来,然后传到另一个产品里面,然后生成完再下载下来上传到另一个地方,效率有提高,但还是难受。

节点式画布直接打通了这种孤岛,把多个不同工具和功能真正整合成了一个平台级的生态。

而且因为我自己是UI设计师出身,在很久以前就在用画布式的工具,比如Sketch、Figma、AI(Adobe那个AI)等等,其他大家也有一个很棒的点。

就是,我们真正在创作的时候,其实不是线性的。

创作一直是一种非线性、网状的拓扑结构。

我们的灵感并不是顺序产生的,而是随机、并发、发散出现的。

而这种产品形态,本身就非常的契合创作本身。

而可灵本身有生态级优势,图片、视频做的很棒,做这种进一步的创作工具,本身就是水到渠成的。

灵动画布上,还有一些小细节。

比如底下这个对话框,我在对话框里写一句提示词,点右边这只小笔,它就可以给我优化提示词。

图片

我在这个框里写了一句生成一只金毛犬,这是它刷刷刷给我写的,还直接给出了任务节点:

图片

生成好的结果那一栏,也会有添加到对话框的选项。比如我生成了一张图片,就可以添加到对话框里,让它再做参考。

说实话,这比我之前用可灵要省事太多了,不用翻历史创作天荒地老,要什么东西直接一拖画布,就拿到了。

还有首尾帧,你把两张图直接拖进去,一框选,就可以直接生成首尾帧视频,或者直接多图参考生视频,也行。

图片

而且这个灵动画布,还可以多人协作,点击右上角的分享,就可以把自己的画布分享给别人。

也可以输入协作者的ID来添加协作者。

图片

目前最多能加五个协作者,对于一个短片来说,已经很够用了。

可以看到,可灵AI现在越来越想往生态、专业上去做出一些定义了。

并且因为内测中,所以还有很多功能不全,我整理罗列了一下。

图片

除了灵动画布之外,还有一个新升级的就是多图参考。

可灵的多图参考生视频是今年一月份出的,现在又来了一波更新,也可以直接在画布中使用。

图片

这次多图参考的升级,主要就是人物和角色更自然、一致性也更强了。

同时支持4张图。

并且,可以参考部分区域。

图片

可以参考主体,可以只参考面部、服饰等等。

让参考更加的精准。

我们用这个功能,玩很多的花活。

比如,肌肉男在麦当劳中举着卡皮巴拉深蹲。

图片

比如,让大卫和女孩一起在花园里散步,画风保持的非常完美。

图片

比如,两只猫一起玩毛球。

图片

非常的有意思。

用多图参考,保证一致性,我觉得才是用AI来做故事的起点。

除了多图生视频之外,多图生图也有很多花活。

在图片生成一栏,点参考生图——多图参考,就能看到主体、场景和风格三个生图维度了。

图片

这个界面,有点眼熟之前Google的whisk,都是依据主体 - 场景 - 风格来出图,不过可灵的自由度还要更高。

whisk每个维度只能放一张图,但可灵的主体这栏足足可以放四张图。

我直接用它生成了一个拼好饭的升级版,拼好购。

图片

还有喜闻乐见的邪门cp修罗场大乱炖。

图片

贼好玩。

做几个case我觉得也不是特别有意思,于是,有了一点小想法,我就花了一下午和一晚上的时间,用灵动画布和多图参考,做了一个小片子。

一个模特女孩的一天。

在多图参考生的模式下,一致性会强到非常离谱。

数字生命卡兹克,赞8

我写完这篇文章的时候,已经凌晨两点了。

我看了眼屏幕上的灵动画布,满满当当的节点里堆满了我这一晚上的奇思妙想,突然有种莫名的满足感。

或许,我们距离真正的无限创作时代。

又更近了一步。

举报

  • 相关推荐
  • 全球用户超4500万!可灵AI发布灵动画布等全新功能

    在2025世界人工智能大会(WAIC)的生成式AI应用元年”论坛上,快手可灵AI发布了全新创意工作台灵动画布”并对其多图参考”功能进行了重磅升级。 灵动画布”集无限可视化空间、智能创作辅助与多人实时协作为一体,为创作者提供一站式创作体验。 升级后的多图参考”功能在角色/主体/场景一致性、动态质量和画风保持方面显著提升,并新增了局部内容或特定区域参考能�

  • AI日报:可灵发布灵动画布创意工作台;Coze Studio和Loop正式开源;WPS AI 3.0灵犀版本发布

    【AI日报】汇总了近期AI领域重要动态:1)字节跳动开源Coze两大核心项目,降低AI开发门槛;2)可灵AI发布"灵动画布"创意工作台,创作者突破4500万;3)Runway推出视频编辑模型Aleph,支持自然语言指令操作;4)金山办公发布WPS AI 3.0,实现智能文档创作;5)京东升级大模型品牌JoyAI;6)浦东设立20亿AI种子基金;7)阿里开源WebSailor框架提升信息检索效率;8)我国大模型数量突破1500个,居全球领先;9)蚂蚁数科联合发布金融大模型评测基准;10)腾讯开源混元3D世界模型,支持360°场景生成。

  • 徐志胜回应一家人共用一张脸 爸爸出门被指“像志胜”引爆笑

    ​近日,脱口秀演员徐志胜在综艺节目中,对网友热议的“全家共用一张脸”这一调侃话题作出了幽默回应。 事情的起因是今年1月底,徐志胜回山东济宁老家过年时,一段家族视频在网络上曝光。视频中,徐志胜与爷爷、爸爸、哥哥的长相极为相似,网友们纷纷戏称“全家共用一张脸”,甚至调侃“一屋子徐志胜”。这一热梗迅速在网络上发酵,引发了广泛关注和讨论。

  • 芬尼能源总经理张靖:以【世界1号能】超级星品打造百亿芬尼

    在全球能源变革背景下,中国空气能企业芬尼以"世界1号能"超级星品战略实现突破。通过持续技术创新,芬尼开发出适应南北气候差异的差异化产品,并凭借"技术硬实力+口碑软实力"形成竞争优势。文章重点介绍了芬尼总经理张靖提出的百亿目标蓝图,以及企业如何通过产品升级、市场拓展、资源整合和品牌强化四个维度协同发力。目前芬尼产品已出口全球100多个国家,未来将以"世界1号能"为核心引擎,重塑高端品牌形象,加速实现从中国制造到全球能源领域领导者的跨越。

  • 外卖袋里偷偷藏2万张宝贝寻亲卡 老板打印2万张寻亲卡随外卖送出

    ​近日,福建泉州一家餐饮店因一项充满爱心的举动引发网友广泛关注与点赞。多位网友在网络平台分享,自己在该店点的外卖里收到了走失儿童信息卡,纷纷称赞“点外卖收到寻亲卡!老板很有爱心啊”“活该让老板挣钱!”相关话题#外卖袋里偷偷藏2万张宝贝寻亲卡#也迅速在网络上传播开来。 据该餐饮店店主季蓝天介绍,他是受朋友“车贴寻亲卡”的启发,从去年开始自掏�

  • ZEGO AI Agent:支持一张图生成数字人

    即构科技推出AI Agent2.4,用户只需上传一张正面照即可生成1080P高清数字人,支持实时互动对话。该技术具备400ms超低延迟、2秒内完成自然交互响应,唇形同步准确,支持文本/音频/语音流驱动。适用于教育、客服等场景,提供API灵活定制,实现低成本批量生成。核心技术融合照片驱动与实时AI交互引擎,在生成效率、拟真度方面显著提升,带来低门槛、高沉浸的数字人互动体验。

  • vivo X300影像旗舰规格首曝:2亿大底主摄、潜望长焦也换了

    影像配置是其最大亮点,主摄采用 2亿像素的1/1.4英寸大底高像素方案,支持ISZ 35mm/50mm 裁切变焦,成像质量被曝 非常高”。 长焦方面,配备1/2英寸新3X光焦棱镜潜望镜,采用传统的单次折射潜望镜,并非舰式设计,但确定支持长焦微距,支持3倍光学变焦能力。 硬件上,vivo X300将搭载联发科天玑9500芯片,基于台积电第三代3nm制程打造,传承了采用全大核架构,由1*Travis 3*Alto 4

  • 直播间人气暴涨百倍,品牌商家恋上团播带货

    ​宇宙的尽头是带货,红得发热的团播也不例外? 近期,无忧传媒、OST等头部公会旗下的偶像化团播直播间,密集跨界品牌方,以歌舞才艺为产品注入娱乐基因—— 无忧男团“宇宙009”手举麻辣王子辣条热舞,OST男团“Moon以动之名”与绝味鸭脖打造沉浸式美食剧场...... 娱乐直播+带货的模式,早几年曾火极一时,但很快沉寂。

  • 国乙婚卡从「假结婚」到「真誓约」 玩家想要的从来不是一张卡

    「我和秦彻结婚了。」 7月3日更新4.0版本「于深空见证的」的《恋与深空》成功吸引了大量玩家的目光,一跃攀升至畅销榜总榜第三。同时,在 2025年6月30日 -7月6日的小红书涨粉榜中,《恋与深空》位列第四位,一周涨粉超13万。 这次成绩的取得,很大程度上或许要归功于新版本中的混池主题。 尽管官方将其命名为「誓约卡」,但玩家们更习惯称它为「婚卡」。

  • 经典游戏《糖果传奇》开发商上百人被裁!被亲手研发的AI工具取代了

    《糖果传奇》(Candy Crush)开发商King近日传出了裁员的消息,涉及约200多名员工,约占公司总人数的10%。 其中不少被裁员工来自关卡设计部门,而这些员工被裁的原因之一,竟是他们亲手研发的AI工具取代了他们的工作。 报道称,此次裁员涵盖了关卡设计员、品质测试以及用户体验等岗位,有离职员工透露,关卡设计团队曾开发出AI工具来协助制作游戏内容,然而这些工具现