首页 > 业界 > 关键词  > 可灵最新资讯  > 正文

媲美Sora?快手文生视频模型可灵开放测试 更懂物理,最长可生成2分钟视频

2024-06-07 09:20 · 稿源:站长之家

站长之家(ChinaZ.com) 6月7日 消息:昨天,快手公司推出了一款名为「可灵」的全新视频生成大模型,该模型采用了与Sora相似的技术路线,并结合了快手自研的多项技术创新。这款模型不仅能够生成长达2分钟、30fps、1080p分辨率的超长视频,支持多种宽高比,还能模拟物理世界的特性,精准建模复杂运动。

QQ截图20240607094153.jpg

亮点:

1、生成能力强大:

支持长达2分钟的30fps高清视频生成,分辨率高达1080p。

支持多种宽高比,包括竖版视频,非常适合快手的短视频生态。

2、运动和物理模拟:

准确刻画复杂、大幅度的运动,如公路上奔跑的老虎、宇航员在月球上行走等。

能够模拟物理特性,如重力、液体流动和光学反射等,生成的画面更符合真实物理规律。

3、应用场景广泛:

从娱乐到教育,可灵的应用场景广泛。

支持文本转视频、多种控制信息输入、以及丰富的内容控制能力。

「可灵」大模型够准确刻画复杂、大幅度的时空运动,如公路上高速奔跑的老虎,画面连贯,动作协调,甚至奔跑过程中躯干的抖动也得到了细致展现。它还能模拟真实物理世界的特性,比如倒牛奶时的重力规律和液面上升,以及光学上的反射规律。此外,「可灵」还能真实反映与真实物理世界的交互,如小男孩吃汉堡时齿印的变化等。

以下是官方发布的视频案例及提示词:

prompt:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

prompt:一名宇航员在月球表面奔跑,低角度镜头展现了月球的广阔背景,动作流畅且显得轻盈

一只戴着眼镜的兔子在看报纸

厨师正在切菜

一只蓝色的鹦鹉

技术特点

1、原生视频生成技术:

采用类似Sora的DiT结构,用Transformer代替传统的卷积网络U-Net。

3D VAE网络用于时空同步压缩,提高重建质量和训练性能。

3D Attention机制用于时空建模,提升复杂时空运动的建模能力。

2、高质量数据支持:

构建了完备的标签体系,对训练数据进行精细化筛选和分布调整。

专用的视频描述模型生成精确、详尽的结构化视频描述,提升模型的文本指令响应能力。

3、高效训练策略:

使用分布式训练集群和优化策略提高运算效率。

分阶段训练策略:初期低分辨率阶段侧重数量,后期高分辨率阶段侧重质量,确保模型在各阶段的优化。

实际应用

1、快影APP:

可灵大模型已在快影APP中开启邀测,当前版本支持生成720P视频,竖版视频生成能力即将开放。

2、其他应用:

“AI舞王”:上传全身照,生成人物跟随音乐跳舞的视频。

“AI唱跳”:生成跳舞并唱歌的视频。

未来还将推出图生视频功能。

快手在大模型技术方面动作迅速,与多个高校或科研机构合作发布了多项关键技术,为「可灵」大模型积累了深厚的技术沉淀。现在,快手的文生视频功能已正式亮相,期待其在短视频场景中的应用落地。

对AI视频创作感兴趣的用户,可以在快影APP中体验「可灵」大模型的功能。

体验方法:快影 APP-AI 玩法-AI 视频生成中申请。

官网地址:https://top.aibase.com/tool/kelingdamoxing

举报

  • 相关推荐
  • 快手科技副总裁蔡雄山:“想象力”变“生产力”,可灵AI深度赋能千行百业

    2025年南亚东南亚数字合作大会在泰国曼谷举行,聚焦区域数字合作与数字国家建设。快手科技分享AIGC赋能各行业的创新实践,其自研视频生成大模型可灵AI已实现规模化应用,显著降低内容创作成本。AIGC在电商、直播、文化传承等领域广泛应用,推动产业数字化变革。未来AI技术将深度赋能新兴领域,降低创作门槛,实现人人皆可创作,并助力传统行业数字化转型。

  • 央视网首场AI晚会七夕“AI心动夜”即将开启 联合可灵AI打造视听盛宴

    8月28日晚8点,央视频与快手可灵AI联合打造的七夕晚会“AI心动夜”正式开启。晚会以“AI视频叙事+传统文化”为核心,通过AI技术融合文化传承、艺术创作与情感表达,呈现跨越虚拟与现实、科技与文化交融的七夕盛典。节目包括《星河告白》《千年婚服秀》等,展现不同时代的爱情故事与中华婚服之美,同时通过《与妻书》《许愿吧》等作品探讨革命年代的深情与当代浪漫。晚会将在央视频、快手等平台同步直播,带领观众体验科技与文化的精彩碰撞。

  • AI投资,走到哪了?

    AI赛道,从不缺少追梦人。 多年来,创业者的名单持续刷新。从“AI四小龙”时代的汤晓鸥、印奇、朱珑、周曦,到大模型爆发后的王慧文、李开复、王小川、杨植麟、闫俊杰、唐杰,再到眼下炙手可热的90后王兴兴、彭志辉、肖弘、郭文景.....众多或熟悉或陌生的名字,纷纷涌入这场AI的浪潮。 推动这股浪潮加速前进的,还有另一股力量——资本。红杉、高瓴、英诺天使、毅

  • 阿里妈妈发布万相台AI无界:新流量新节奏之下的双11,AI是经营唯一解

    电商生态持续演化。 闪购业务的爆发,为淘宝带来了大量新增用户和更高的下单频次;超级88购物节激活了更加轻量、日常的“小促”形式,消费者从一年一度的“囤货式购买”,转变为高频次的“循环式购买”;“红猫计划”则支持用户从小红书笔记直达淘宝货品链接,显著缩短转化链路。 这一系列变化揭示了:淘系在走向全域大消费平台的路上,新的流量场景正在涌现,新�

  • AI副业高大上,宇宙尽头是卖课

    这年头,任何职业似乎只要沾上AI的光就会“升价百倍”——就连副业也不例外。 基础一点的,是“普通人都能干”的AI写作,号称1小时小赚200+不成问题;技术含量稍微高一点的,像AI设计、AI方案撰写,月入过万不是梦;更高阶一点的如AI视频生产、AI玩偶吃播,爆款内容点赞数动辄10万+,被宣传成自媒体快速起号秘籍、号称零经验也能入行当博主,AI店铺自主经营更是躺着赚钱

  • AI闯入文娱:创作者的“荒蛮故事”

    在世界电影史中,每一股颠覆性的力量都被冠以“浪潮”之名,描摹着时代审美与表达范式的剧烈变迁。如今,AI技术正冲击着这个产业的每一个角落,速度之快、程度之深,超乎想象。 最直观的体现,是文娱企业业绩的结构性变化,尤其体现在广告业务和内容制作上。 B站财报显示,二季度广告业务同比增长20%,已有30%的广告封面由AIGC工具生成;爱奇艺CEO龚宇在最新的财报�

  • 淘宝悄悄上线了AI导购,懒人购物原来可以这么爽。

    ​这场战,真的打起来了。 最近这些超级APP,真的快卷疯了。 我发现淘宝,也上了一个非常有趣的新的AI功能。 故事是这样的。 我最近因为搬了新家,买东西是格外的多。 然后,我就在昨天买家里用品的时候,看到了一个淘宝的全新的AI功能,这玩意之前绝对是没有出现过的。 而且给的权重非常的高,所有的商品列表页都能看到。。。 这玩意叫淘宝AI助手,在商品列表

  • 小米和阿里下场,正在改变AI百镜大战的局面

    AI眼镜正从极客玩具发展为AI大模型落地的重要载体。2024年上半年,市场发布超10款新品,包括雷鸟、雷神等创业品牌及华为、创维等大厂产品。全球出货量激增,预计2025年中国市场将达290.7万台,同比增长121.1%。小米、阿里等巨头入局推动竞争升级,但行业仍面临芯片成本高、续航短、生态不足等挑战。未来大厂凭借供应链和生态优势或主导市场,而创业公司需在细分场景寻�

  • 腾讯会议宣布上AI托管功能:AI帮你参会 帮写完整会议纪要

    腾讯会议联合元宝推出AI托管功能,可提前或会中一键开启,由AI代为参会并实时记录内容,生成智能纪要。用户可随时切换会议状态,离场时AI持续记录,会后提供完整摘要,支持浏览会议小结或详细内容,还可一键导出至元宝拓展发问。该功能旨在解决突发状况,确保不错过重要信息。

  • 企业选择雇佣AI员工,都有哪些优势价值?尘锋AI员工在哪些工作上表现优秀?

    AI在业务环境中的应用本质上是效率革命,能替代重复性工作,释放人力从事更高价值任务。AI员工可提升业务效率、降低用工成本、赋能人类创新,并需具备技术专业性、高开放性和数据安全性。选择AI员工应关注其业务理解能力、系统集成性及合规性,经过实践验证的AI方案能有效推动企业数字化转型,创造增长优势。

今日大家都在搜的词: