首页 > 业界 > 关键词  > 可灵最新资讯  > 正文

媲美Sora?快手文生视频模型可灵开放测试 更懂物理,最长可生成2分钟视频

2024-06-07 09:20 · 稿源:站长之家

站长之家(ChinaZ.com) 6月7日 消息:昨天,快手公司推出了一款名为「可灵」的全新视频生成大模型,该模型采用了与Sora相似的技术路线,并结合了快手自研的多项技术创新。这款模型不仅能够生成长达2分钟、30fps、1080p分辨率的超长视频,支持多种宽高比,还能模拟物理世界的特性,精准建模复杂运动。

QQ截图20240607094153.jpg

亮点:

1、生成能力强大:

支持长达2分钟的30fps高清视频生成,分辨率高达1080p。

支持多种宽高比,包括竖版视频,非常适合快手的短视频生态。

2、运动和物理模拟:

准确刻画复杂、大幅度的运动,如公路上奔跑的老虎、宇航员在月球上行走等。

能够模拟物理特性,如重力、液体流动和光学反射等,生成的画面更符合真实物理规律。

3、应用场景广泛:

从娱乐到教育,可灵的应用场景广泛。

支持文本转视频、多种控制信息输入、以及丰富的内容控制能力。

「可灵」大模型够准确刻画复杂、大幅度的时空运动,如公路上高速奔跑的老虎,画面连贯,动作协调,甚至奔跑过程中躯干的抖动也得到了细致展现。它还能模拟真实物理世界的特性,比如倒牛奶时的重力规律和液面上升,以及光学上的反射规律。此外,「可灵」还能真实反映与真实物理世界的交互,如小男孩吃汉堡时齿印的变化等。

以下是官方发布的视频案例及提示词:

prompt:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

prompt:一名宇航员在月球表面奔跑,低角度镜头展现了月球的广阔背景,动作流畅且显得轻盈

一只戴着眼镜的兔子在看报纸

厨师正在切菜

一只蓝色的鹦鹉

技术特点

1、原生视频生成技术:

采用类似Sora的DiT结构,用Transformer代替传统的卷积网络U-Net。

3D VAE网络用于时空同步压缩,提高重建质量和训练性能。

3D Attention机制用于时空建模,提升复杂时空运动的建模能力。

2、高质量数据支持:

构建了完备的标签体系,对训练数据进行精细化筛选和分布调整。

专用的视频描述模型生成精确、详尽的结构化视频描述,提升模型的文本指令响应能力。

3、高效训练策略:

使用分布式训练集群和优化策略提高运算效率。

分阶段训练策略:初期低分辨率阶段侧重数量,后期高分辨率阶段侧重质量,确保模型在各阶段的优化。

实际应用

1、快影APP:

可灵大模型已在快影APP中开启邀测,当前版本支持生成720P视频,竖版视频生成能力即将开放。

2、其他应用:

“AI舞王”:上传全身照,生成人物跟随音乐跳舞的视频。

“AI唱跳”:生成跳舞并唱歌的视频。

未来还将推出图生视频功能。

快手在大模型技术方面动作迅速,与多个高校或科研机构合作发布了多项关键技术,为「可灵」大模型积累了深厚的技术沉淀。现在,快手的文生视频功能已正式亮相,期待其在短视频场景中的应用落地。

对AI视频创作感兴趣的用户,可以在快影APP中体验「可灵」大模型的功能。

体验方法:快影 APP-AI 玩法-AI 视频生成中申请。

官网地址:https://top.aibase.com/tool/kelingdamoxing

举报

  • 相关推荐
  • 品牌在AI时代“隐形”?用GEO指数破解AI搜索曝光密码

    文章探讨AI搜索时代品牌曝光新指标GEO指数,指出其通过可见度(品牌在AI回答中的出现概率)和曝光度(被提及总次数)衡量品牌在豆包、文心一言等主流AI模型中的存在感。以徕芬为例,其GEO得分仅33分,反映在AI搜索中存在感薄弱。随着超60%消费者决策参考AI推荐,GEO指数直接影响品牌流量获取。文章建议通过AIBase工具分三步优化:绑定品牌信息锚定监控范围、分析关键词关联度与竞品表现、针对性补充官网内容强化核心词布局,将AI搜索流量转化为品牌增长新引擎。

  • ​AI时代,你的品牌不懂AI搜索监控,营销预算一半在打水漂

    文章指出,AI搜索正重塑营销格局,品牌AI搜索监控成为决定品牌存亡的关键。它通过追踪品牌在各大AI模型中的提及、评价和推荐情况,帮助应对用户搜索习惯从关键词到对话式提问的转变。AIBase平台提供三步简易操作:设置监控目标、AI全域扫描、生成智能报告,助品牌快速掌握在AI世界的表现,抓住增长新机遇。

  • ​AI搜索时代的品牌新战场:为什么你需要关注GEO指数和品牌AI搜索监控?

    AI搜索时代催生全新品牌曝光指标GEO指数,用于衡量品牌在ChatGPT等AI问答中的提及率。该指数反映AI对品牌的认知度,需通过建立稳定、正向的内容矩阵来提升。AIBase平台可监控品牌在主流AI模型中的曝光表现,对比竞品数据,并智能分析用户高频问题类型,帮助品牌优化内容策略。高GEO指数不仅提升曝光,更积累品牌权威感与信任度,成为AI时代的"推荐力"量化指标。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • 首个AI“全面落地”的双11,有什么不一样?

    2025年双11来到了它的17岁,以人来类比,过了蛇年就告别了青少年,进入它的青年时代。大多数人认为今年双11会在平淡中度过,但星图数据显示,仅截至10月31日,双11大促全网累计销售额就达到10026亿元人民币。 天猫仍居综合电商平台榜首位置,京东紧随其后,抖音位列第三。以这个快速上扬的曲线推演,今年双11大促对消费的拉动,将远超其他时间节点。 它在步入青年时�

  • 有AI就有无限可能,灰豚AI发布新一代GEO系统

    11月1日,灰豚AI发布新一代GEO系统,突破传统仅支持文本内容优化的局限,全面支持国内短视频平台作品优化,实现近乎零算力成本。该技术被视作行业重大创新,是当前国内GEO源头厂商的重要突破。系统通过AI训练提升企业在生成式搜索中的品牌影响力,助力企业获得竞争优势。未来电商将从平台化转向AI化,灰豚GEO系统支持多种合作模式,让企业以业务增长为导向,抢占AI市场先机。

  • 双11“换芯” 阿里妈妈AI按下加速键

    ​今年双11的不同,在平台对外披露的商家案例中得以一窥究竟。 AI智能选品、AI智能出价、AI智能调控投放节奏..... 这些营销策略的表述来自音箱品牌Marshall,双11第一波段10天活动期内,Marshall在影音电器行业品牌和店铺排名均位居第一;成交转化率提升67%,爆款成交同比增长30%。这波爆发式增长的背后,反复被CUE到的AI可以说是深藏功与名。 绝非只是平台意志的表达,

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • 从识别到修复,联想想帮帮AI服务智能体打造你的AI智能维修管家

    AI时代重塑陪伴形式,联想“想帮帮AI服务智能体”以公益之心推出,通过五大功能(智玩、智验、智检、智修、智换)构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统,一键解决电脑卡顿等问题,让用户省时省心。该服务强调责任与长期守护,结合北京领养日公益理念,传递科技向善、服务有爱的智能温度,重新定义AI陪伴的全部意义。

  • 人类的心声,被AI听见了

    过去一年里,一个看似无意义的Labubu,成为了颇具情绪号召力的符号。 这只表情夸张、眼神狡黠的小兽,从逼仄的盲盒一路爬上潮流顶峰。它既不代表功能,也不传达身份,却让无数年轻人愿意为之排队、抽签。 而这,离不开更大的消费变迁。事后诸葛来看,Labubu的走红并非偶然,而是精准踩中了一个趋势——在这个时代,人们似乎越来越愿意为“情绪价值”付费。 与此�

今日大家都在搜的词: