首页 > 热点 > 关键词  > 可灵AI最新资讯  > 正文

可灵AI全系模型上线“视频音效”功能 可同步生成高质量立体声音效

2025-06-30 09:17 · 稿源:站长之家用户

6月27日,可灵AI宣布全系列视频模型上线“视频音效”功能,用户在使用可灵AI进行视频创作时,不仅能获得高质量的视频画面,更能体验到与视频准确匹配、富有空间感的立体声音效,真正实现“所见即所听”的沉浸式体验。目前,该功能已无缝集成至文生视频、图生视频、多模态编辑等多种创作模式中,并限时免费开放。

与此同时,平台原有的“音效生成”也进一步升级,新增“视频生音效”功能。用户现在不仅可以通过文本生成音效,更可以直接上传本地视频,或选用在可灵平台创作的历史视频,一键为无声的画面匹配上语义契合、节奏同步的音效,自动适配动作、环境、氛围等多种场景,极大地提升了视频内容的表现力和沉浸感,有效降低了创作者在音频后期制作上的时间与技术成本。

从实际效果来看,可灵AI的音效功能在多个典型案例中展现了很高的音画同步精度和较好的空间听感。例如,在生成“婴儿在活泼地笑”的视频片段中,模型不仅还原了婴儿清亮的笑声,甚至连婴儿笑容间隙短促的吸气声都美好捕捉,与画面中肉嘟嘟脸颊的起伏动作准确匹配,其富有空间感的立体声效果,让整个画面的温馨感与生命力扑面而来。在另一段山体滑坡导致巨石砸中汽车的视频中,系统自动生成了金属扭曲断裂声、石块飞溅与尘土扬起的细节音效,声音定位清晰、动态层次丰富,提升了整体灾难场景的视觉冲击力与沉浸感。

据悉,上述功能的实现,依托于可灵AI自主研发的多模态视频生音效模型——Kling-Foley。Kling-Foley支持基于视频内容与可选文本提示自动生成与视频画面语义相关、时间同步的高质量立体声音频,涵盖音效、背景音乐等多种类型声音内容。它支持生成任意时长的音频内容,还具备立体声渲染的能力,支持空间定向的声源建模和渲染。今年3月,可灵AI初次推出AI音效功能,用户可通过输入文本生成相应的环境音或动作音,并可进一步结合平台生成的视频进行语义理解与自动匹配。随后,在可灵2.1模型中正式加入了视频音效功能,在生成视频的同时,系统也会自动生成与之匹配的音效,增强了整体视听体验。随着视频音效生成技术的成熟落地,将进一步释放可灵AI在广告创意、影视、短视频、游戏等内容等领域的发展潜力。

举报

  • 相关推荐
  • 《新世界加载中》收官,可灵AI拓宽影像边界

    “AI是人类文明进步的产物,也是我们跨越未来的重要助力。”通用人工智能时代,著名人工智能研究学家肖博士,在某项目出现重大突破后,向全世界发布了含有上述内容的AGI时代宣言。 “您觉得在大势所趋的当下,这个世界还有人工智能尚未普及的地区吗?”面对记者的这一疑问,肖博士开了一个玩笑,“也许,银河系之外”。 可在他脑海中出现的画面,却是破败的村庄�

  • AI日报:可灵2.1推出全新首尾帧功能;昆仑万维上线AI音乐模型Mureka V7.5;腾讯云推出AI开发工具CloudBase AI CLI

    本文介绍了AI领域最新动态:1)快手可灵2.1推出首尾帧功能,提升视频生成效果;2)昆仑万维发布Mureka V7.5音乐模型,优化人声表现;3)腾讯云推出AI开发工具CloudBase AI CLI,可减少80%编码量;4)海外新品MuleRun通过虚拟机和AI Agent带来创新游戏体验;5)Meta开源DINOv3视觉模型,无需标注即可实现卓越性能;6)宇树科技人形机器人H1获1500米赛跑金牌;7)谷歌Gemini新增记忆功能和隐私聊天模式;8)香港大学开源OpenCUA框架,打造个性化电脑助手;9)OpenAI考虑在ChatGPT引入广告;10)谷歌发布超小型开源模型Gemma 3 270M,支持手机端运行。

  • 国产AI视频平台最全比价:万兴天幕2.0超高性价比,可灵PixVerse瞄准高价高品质

    2025年第三季度,中国AI视频生成赛道迎来定价体系的分水岭时刻。国际巨头谷歌Veo以每秒0.75美元(约5.4元人民币)的"好莱坞级定价"筑高技术壁垒,而国内市场呈现双轨制格局:万兴科技旗下万兴天幕2.0以"0.25元/条"的颠覆性价格突入大众市场,可灵与PixVerse则以1.56-1.79元/条的价格坚守品质溢价路线。国产玩家根据技术禀赋与市场定位分化出两条路径:普惠下沉派通过错峰无限权益降低算力成本;专业精耕派依托影视级运镜模板支撑高价策略。当技术参数差距收窄至毫厘之间,这场围绕"毛票"与"元角"的定价博弈,正在重划内容生产工具的普及边界。

  • 可赶上这波了!iOS用户“一键补课”了Mistplay的新功能

    在2023 ChinaJoy展会上,Mistplay凭借其独特的"玩赚"模式成为BTOB展区热门平台。该平台通过游戏时长激励玩家,同时为开发者提供高质量用户,已覆盖全球九大应用市场,累计安装超3500万次。Mistplay近期推出iOS版本,新增锦标赛、益智问答等功能,并创新推出LoyaltyPlay功能,为非游戏应用搭建激励桥梁。其核心AI引擎"Helios"能精准匹配用户与游戏,提升用户留存率和LTV。中国区负责人彭超楠在展会上分享了"忠诚度营销"理念,为游戏出海提供新思路。双平台布局使Mistplay优势更加突出,成为开发者提升用户留存的重要合作伙伴。

  • 腾讯旗下AI工作台ima上线新功能:支持上传文件生成AI播客

    腾讯旗下AI工作台ima迎来重大升级,以活知识库 大模型的深度耦合重构知识管理体系。 此次更新突破性地实现了多模态知识转化用户上传文件即可生成AI播客,Xmind思维导图经智能解析后自动沉淀为结构化知识库,共享知识库更支持关键信息置顶功能。 这些创新使得碎片化知识如同被注入生命力,通过动态重组转化为驱动组织进化的智能中枢。

  • ChatGPT语音模式增添新功能:可调语速 支持0.5到2.0倍速

    OpenAI为其ChatGPT网页应用的语音模式推出新功能,加入语音速度”调节与自定义指令前缀”,同时配合此前升级的模型选择器,进一步提升用户体验。 新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速,范围从0.5倍速到2.0倍速,不过该功能目前仍处于隐藏状态,尚未正式开放。 自定义指令前缀”功能则允许语音模式记住用户的特定要求,避免重复输入。系统明确�

  • 豆包悄悄上线的这个新功能,也能用眼睛推理全世界了。

    ​上周我写过一篇AI产品自用分享,当时我说,AI知识问答方面,我会选择openai o3和豆包。 PC场景下,o3比较多,而手机场景下,我用的比较多的还是豆包。 虽然ChatGPT也有app,但一旦手机开了魔法,微信啥的还有一些其他的应用,就很容易卡,非常的不方便。 所以我前两天在上海逛ChinaJoy的时候,看到一些忘了的图,或者是我不懂的梗,我都是随时随地问豆包。 比如这个暴�

  • 做大蛋糕的快手短剧,让观众和品牌都吃上好的

    暑期档的竞争不光属于电影和长剧,短剧市场同样火热。 作为首个在业内开启「档期化运营」的快手星芒短剧,今年暑期档将陆续上线20余部作品,覆盖校园、二次元、恋爱、古风、魔幻等多样题材。其中国民级笑星潘长江主演的《进击的潘叔》已成为这个暑期的头部爆款作品,上线至今播放量已破3亿。 星芒短剧暑期档的火热,可以看出以快手为代表的行业头部平台,已经�

  • 《2025快手短剧白皮书》发布:快手短剧日活用户突破3亿,发力“短剧+AI”

    2025年暑期短剧市场持续爆发,快手星芒短剧率先开启"档期化运营",计划推出20余部精品短剧,包括《黑桃四姐妹》《进击的潘叔》《她不是敌人》等爆款作品。数据显示,潘长江主演的《进击的潘叔》播放量破3亿,其他多部作品播放量也突破亿级。快手短剧日活跃用户超3亿,2024年7月重度用户规模达1.46亿,同比增长55.3%。AI技术赋能创作突破题材局限,《山海奇镜之劈波斩浪》《新世界加载中》等AIGC剧集表现亮眼,全球播放量分别达4.3亿和13.7亿。平台商业化成效显著,2024年合作剧目从29部跃升至135部,增长率达365%,第四季度商业化消费额同比增长300%。付费与广告变现规模持续扩大,25家品牌客户单日消费峰值突破百万元,2025年春节档广告消费峰值突破3000万元。快手短剧通过"技术驱动+生态共建"模式,激活3亿用户消费势能,实现内容品质与商业模式全方位升级。

  • 明星达人组队闯关竞技,「快手向前冲夏日派对」高燃来袭

    快手与安徽卫视合作推出《男生女生向前冲》快手专场"快手向前冲夏日派对",8月15日至17日期间,48位明星和快手达人将组队参与水上闯关竞技。节目通过户外挑战展现青春活力,结合趣味竞技推广全民健身热潮。活动设置线上投票预测、话题挑战等互动玩法,观众可参与预测闯关结果并赢取奖品。这是快手与这档已播出15年的经典综艺达成长期合作的首个系列专场,后续还将输送更多特色达人参与日常节目。

今日大家都在搜的词: