媲美Sora？快手文生视频模型可灵开放测试更懂物理，最长可生成2分钟视频

2024-06-07 09:20 · 稿源：站长之家

站长之家(ChinaZ.com) 6月7日消息:昨天，快手公司推出了一款名为「可灵」的全新视频生成大模型，该模型采用了与Sora相似的技术路线，并结合了快手自研的多项技术创新。这款模型不仅能够生成长达2分钟、30fps、1080p分辨率的超长视频，支持多种宽高比，还能模拟物理世界的特性，精准建模复杂运动。

QQ截图20240607094153.jpg

亮点:

1、生成能力强大:

支持长达2分钟的30fps高清视频生成，分辨率高达1080p。

支持多种宽高比，包括竖版视频，非常适合快手的短视频生态。

2、运动和物理模拟:

准确刻画复杂、大幅度的运动，如公路上奔跑的老虎、宇航员在月球上行走等。

能够模拟物理特性，如重力、液体流动和光学反射等，生成的画面更符合真实物理规律。

3、应用场景广泛:

从娱乐到教育，可灵的应用场景广泛。

支持文本转视频、多种控制信息输入、以及丰富的内容控制能力。

「可灵」大模型够准确刻画复杂、大幅度的时空运动，如公路上高速奔跑的老虎，画面连贯，动作协调，甚至奔跑过程中躯干的抖动也得到了细致展现。它还能模拟真实物理世界的特性，比如倒牛奶时的重力规律和液面上升，以及光学上的反射规律。此外，「可灵」还能真实反映与真实物理世界的交互，如小男孩吃汉堡时齿印的变化等。

以下是官方发布的视频案例及提示词：

prompt:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

prompt:一名宇航员在月球表面奔跑，低角度镜头展现了月球的广阔背景，动作流畅且显得轻盈

一只戴着眼镜的兔子在看报纸

厨师正在切菜

一只蓝色的鹦鹉

技术特点

1、原生视频生成技术:

采用类似Sora的DiT结构，用Transformer代替传统的卷积网络U-Net。

3D VAE网络用于时空同步压缩，提高重建质量和训练性能。

3D Attention机制用于时空建模，提升复杂时空运动的建模能力。

2、高质量数据支持:

构建了完备的标签体系，对训练数据进行精细化筛选和分布调整。

专用的视频描述模型生成精确、详尽的结构化视频描述，提升模型的文本指令响应能力。

3、高效训练策略:

使用分布式训练集群和优化策略提高运算效率。

分阶段训练策略:初期低分辨率阶段侧重数量，后期高分辨率阶段侧重质量，确保模型在各阶段的优化。

实际应用

1、快影APP:

可灵大模型已在快影APP中开启邀测，当前版本支持生成720P视频，竖版视频生成能力即将开放。

2、其他应用:

“AI舞王”:上传全身照，生成人物跟随音乐跳舞的视频。

“AI唱跳”:生成跳舞并唱歌的视频。

未来还将推出图生视频功能。

快手在大模型技术方面动作迅速，与多个高校或科研机构合作发布了多项关键技术，为「可灵」大模型积累了深厚的技术沉淀。现在，快手的文生视频功能已正式亮相，期待其在短视频场景中的应用落地。

对AI视频创作感兴趣的用户，可以在快影APP中体验「可灵」大模型的功能。

体验方法：快影 APP-AI 玩法-AI 视频生成中申请。

官网地址：https://top.aibase.com/tool/kelingdamoxing

（举报）

相关推荐

关键词：

品牌在AI时代“隐形”？用GEO指数破解AI搜索曝光密码

文章探讨AI搜索时代品牌曝光新指标GEO指数，指出其通过可见度（品牌在AI回答中的出现概率）和曝光度（被提及总次数）衡量品牌在豆包、文心一言等主流AI模型中的存在感。以徕芬为例，其GEO得分仅33分，反映在AI搜索中存在感薄弱。随着超60%消费者决策参考AI推荐，GEO指数直接影响品牌流量获取。文章建议通过AIBase工具分三步优化：绑定品牌信息锚定监控范围、分析关键词关联度与竞品表现、针对性补充官网内容强化核心词布局，将AI搜索流量转化为品牌增长新引擎。

文章搜索核心标签 AI模型
AI时代，你的品牌不懂AI搜索监控，营销预算一半在打水漂

文章指出，AI搜索正重塑营销格局，品牌AI搜索监控成为决定品牌存亡的关键。它通过追踪品牌在各大AI模型中的提及、评价和推荐情况，帮助应对用户搜索习惯从关键词到对话式提问的转变。AIBase平台提供三步简易操作：设置监控目标、AI全域扫描、生成智能报告，助品牌快速掌握在AI世界的表现，抓住增长新机遇。

AI搜索监控品牌营销 SEO优化
AI搜索时代的品牌新战场:为什么你需要关注GEO指数和品牌AI搜索监控?

AI搜索时代催生全新品牌曝光指标GEO指数，用于衡量品牌在ChatGPT等AI问答中的提及率。该指数反映AI对品牌的认知度，需通过建立稳定、正向的内容矩阵来提升。AIBase平台可监控品牌在主流AI模型中的曝光表现，对比竞品数据，并智能分析用户高频问题类型，帮助品牌优化内容策略。高GEO指数不仅提升曝光，更积累品牌权威感与信任度，成为AI时代的"推荐力"量化指标。

GEO指数 AI搜索品牌曝光
荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

国家广电总局宣布自2026年3月起全面整治AI生成内容，要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》，提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro，集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX，实现文本化语音编辑。Grok新增纯文本生成视频功能，17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠，并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型，优化开发者体验。

AI动画广电总局 AIGC审核
首个AI“全面落地”的双11，有什么不一样？

2025年双11来到了它的17岁，以人来类比，过了蛇年就告别了青少年，进入它的青年时代。大多数人认为今年双11会在平淡中度过，但星图数据显示，仅截至10月31日，双11大促全网累计销售额就达到10026亿元人民币。天猫仍居综合电商平台榜首位置，京东紧随其后，抖音位列第三。以这个快速上扬的曲线推演，今年双11大促对消费的拉动，将远超其他时间节点。它在步入青年时�

双11 电商平台消费拉动
有AI就有无限可能，灰豚AI发布新一代GEO系统

11月1日，灰豚AI发布新一代GEO系统，突破传统仅支持文本内容优化的局限，全面支持国内短视频平台作品优化，实现近乎零算力成本。该技术被视作行业重大创新，是当前国内GEO源头厂商的重要突破。系统通过AI训练提升企业在生成式搜索中的品牌影响力，助力企业获得竞争优势。未来电商将从平台化转向AI化，灰豚GEO系统支持多种合作模式，让企业以业务增长为导向，抢占AI市场先机。

灰豚AI GEO系统短视频优化
荐双11“换芯” 阿里妈妈AI按下加速键

今年双11的不同，在平台对外披露的商家案例中得以一窥究竟。 AI智能选品、AI智能出价、AI智能调控投放节奏..... 这些营销策略的表述来自音箱品牌Marshall，双11第一波段10天活动期内，Marshall在影音电器行业品牌和店铺排名均位居第一;成交转化率提升67%，爆款成交同比增长30%。这波爆发式增长的背后，反复被CUE到的AI可以说是深藏功与名。绝非只是平台意志的表达，

AI智能选品 AI智能出价 AI智能调控
荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

AI视频翻译唇形同步跨语言本地化
从识别到修复，联想想帮帮AI服务智能体打造你的AI智能维修管家

AI时代重塑陪伴形式，联想“想帮帮AI服务智能体”以公益之心推出，通过五大功能（智玩、智验、智检、智修、智换）构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统，一键解决电脑卡顿等问题，让用户省时省心。该服务强调责任与长期守护，结合北京领养日公益理念，传递科技向善、服务有爱的智能温度，重新定义AI陪伴的全部意义。

AI陪伴领养代替购买智能服务
荐人类的心声，被AI听见了

过去一年里，一个看似无意义的Labubu，成为了颇具情绪号召力的符号。这只表情夸张、眼神狡黠的小兽，从逼仄的盲盒一路爬上潮流顶峰。它既不代表功能，也不传达身份，却让无数年轻人愿意为之排队、抽签。而这，离不开更大的消费变迁。事后诸葛来看，Labubu的走红并非偶然，而是精准踩中了一个趋势——在这个时代，人们似乎越来越愿意为“情绪价值”付费。与此�

文章搜索核心标签情绪价值

今日大家都在搜的词：

热文

3 天
7天

媲美Sora？快手文生视频模型可灵开放测试更懂物理，最长可生成2分钟视频

品牌在AI时代“隐形”？用GEO指数破解AI搜索曝光密码

AI时代，你的品牌不懂AI搜索监控，营销预算一半在打水漂

AI搜索时代的品牌新战场:为什么你需要关注GEO指数和品牌AI搜索监控?

荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

首个AI“全面落地”的双11，有什么不一样？

有AI就有无限可能，灰豚AI发布新一代GEO系统

荐双11“换芯” 阿里妈妈AI按下加速键

荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

从识别到修复，联想想帮帮AI服务智能体打造你的AI智能维修管家

荐人类的心声，被AI听见了

今日大家都在搜的词：

热文

OPPO Reno15系列定档11月17日发布

焕新享界S9开卖72小时预订突破8000台

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

鸿蒙智行：智界R7累计交付量破10万台

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

特斯拉Model Y L上线外放电功能最高可输出2200瓦功率

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

华为Mate70 Air官宣今日开启预售

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

何小鹏回应机器人IRON里是真人质疑：感谢认可

iPhone Air 2或新增1颗镜头：继续沿用6.5英寸高刷中屏

俞敏洪发文确认孙东旭离职：保持着良好的沟通

站长商机

媲美Sora？快手文生视频模型可灵开放测试 更懂物理，最长可生成2分钟视频

今日大家都在搜的词：

热文

站长商机

媲美Sora？快手文生视频模型可灵开放测试更懂物理，最长可生成2分钟视频