首页 > 热点 > 关键词  > 可灵AI最新资讯  > 正文

可灵AI全系模型上线“视频音效”功能 可同步生成高质量立体声音效

2025-06-30 09:17 · 稿源:站长之家用户

6月27日,可灵AI宣布全系列视频模型上线“视频音效”功能,用户在使用可灵AI进行视频创作时,不仅能获得高质量的视频画面,更能体验到与视频准确匹配、富有空间感的立体声音效,真正实现“所见即所听”的沉浸式体验。目前,该功能已无缝集成至文生视频、图生视频、多模态编辑等多种创作模式中,并限时免费开放。

与此同时,平台原有的“音效生成”也进一步升级,新增“视频生音效”功能。用户现在不仅可以通过文本生成音效,更可以直接上传本地视频,或选用在可灵平台创作的历史视频,一键为无声的画面匹配上语义契合、节奏同步的音效,自动适配动作、环境、氛围等多种场景,极大地提升了视频内容的表现力和沉浸感,有效降低了创作者在音频后期制作上的时间与技术成本。

从实际效果来看,可灵AI的音效功能在多个典型案例中展现了很高的音画同步精度和较好的空间听感。例如,在生成“婴儿在活泼地笑”的视频片段中,模型不仅还原了婴儿清亮的笑声,甚至连婴儿笑容间隙短促的吸气声都美好捕捉,与画面中肉嘟嘟脸颊的起伏动作准确匹配,其富有空间感的立体声效果,让整个画面的温馨感与生命力扑面而来。在另一段山体滑坡导致巨石砸中汽车的视频中,系统自动生成了金属扭曲断裂声、石块飞溅与尘土扬起的细节音效,声音定位清晰、动态层次丰富,提升了整体灾难场景的视觉冲击力与沉浸感。

据悉,上述功能的实现,依托于可灵AI自主研发的多模态视频生音效模型——Kling-Foley。Kling-Foley支持基于视频内容与可选文本提示自动生成与视频画面语义相关、时间同步的高质量立体声音频,涵盖音效、背景音乐等多种类型声音内容。它支持生成任意时长的音频内容,还具备立体声渲染的能力,支持空间定向的声源建模和渲染。今年3月,可灵AI初次推出AI音效功能,用户可通过输入文本生成相应的环境音或动作音,并可进一步结合平台生成的视频进行语义理解与自动匹配。随后,在可灵2.1模型中正式加入了视频音效功能,在生成视频的同时,系统也会自动生成与之匹配的音效,增强了整体视听体验。随着视频音效生成技术的成熟落地,将进一步释放可灵AI在广告创意、影视、短视频、游戏等内容等领域的发展潜力。

举报

  • 相关推荐
  • 「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

    AI日报主要内容: 1. 腾讯开源混元A13B模型,采用MoE架构,总参数量800亿,激活参数130亿,支持低端GPU部署 2. 可灵AI推出"视频音效"功能,实现所见即所听的沉浸体验 3. Black Forest开源图像编辑模型FLUX.1Kontext,支持消费级硬件运行 4. OpenAI发布Deep Research API新模型o3/o4-mini,支持自动化网页搜索和数据分析 5. 小米推出1999元起AI眼镜,集成拍摄、支付、音乐等功能 6. 迅雷推出下载MCP服务,一句话指令让AI自动完成下载任务 7. HeyGen推出AI视频Agent,几分钟内生成专业级视频内容 8. 谷歌开源端侧多模态大模型Gemma3n,手机也能运行云端AI性能

  • 可灵AI离营收单月破亿,还有多远?

    虽然嘴上没明说,但快手显然也不想在AI时代仍甘当短视频老二。 因此,如今快手的财报会议上,AI占据了越来越多的篇幅,当然关键还是可灵AI的确争气。 根据快手2025年一季度财报显示,可灵AI营收超过1.5亿元人民币。从2024年9月的单月千万流水,到2025年第一季度的季度1.5亿营收,换言之,7个月时间里可灵AI实现15倍的营收增长。

  • 如何用DeepSeek生成高质量的竞品SWOT分析报告

    本教程介绍如何利用DeepSeek AI工具快速生成电商平台供应链SWOT分析报告。以京东vs拼多多为例,通过输入指定指令,AI可自动生成包含优势、劣势、机会和威胁四个维度的结构化分析报告,重点突出两者供应链能力差异。操作流程包括:1)登录DeepSeek官网进入对话界面;2)输入SWOT分析指令;3)获取AI生成结果。该方法能显著提升商业分析效率,建议结合最新行业数据对报告进�

  • 可灵AI与《逆水寒》手游达成深度合作 AI技术赋能游戏内容创新

    可灵多款视频生成模型已占据了约30%的使用者份额,领先于Runway和谷歌的Veo2。

  • 小赢卡贷:数字金融赋能实体经济高质量发展

    小赢卡贷深耕湾区沃土,通过"科技+金融"创新模式服务小微企业。其自主研发智能风控系统,构建多维风险评估模型,解决小微企业信用评估难题;开发差异化信贷产品,实现全流程数字化服务;通过科技降本增效,提供普惠利率。目前累计服务超百万湾区小微企业和个体工商户,成为区域经济重要推手。未来将持续加强AI、区块链等前沿技术研发,探索跨境金融、绿色金融等创新业务,深化产学研合作培育数字人才,助力大湾区金融科技高地建设,以科技赋能实体经济高质量发展。

  • 如何用DeepSeek快速起草高质量商务合作邮件

    本文介绍如何利用DeepSeek AI快速生成专业商务合作邀约邮件。传统邮件撰写耗时费力,而通过该工具只需四步:1)登录官网输入指令;2)提供合作对象、内容等关键信息;3)AI自动生成结构清晰、措辞专业的邮件草稿;4)复制到邮箱发送或下载存档。该工具能显著提升商务沟通效率,特别适合需要频繁进行业务往来的职场人士,支持个性化调整并保留专业度,是现代化办公的高效解决方案。(139字)

  • 每日互动:进一步开发数据要素价值 推动城市交通高质量发展

    浙江省数据局于2025年6月4日公告,浙江云通达数达科技成为省内首批省级公共数据授权运营单位,将开展"数智绿波"场景应用。该公司自2022年进入智慧交通领域,已在34个地区落地645条数智绿波带,使道路通行效率提升超20%。此次授权将推动其在规划建设、优化管理等方面持续发力,并通过数据API与科研单位等开展二次创新,赋能智能网联汽车"车路云一体化"项目建设。该授权是对公司在数据安全、技术能力等方面的认可,未来将继续深化数据融合与场景探索,助力城市交通高质量发展。(140字)

  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • CVPR2025:快手可灵四大技术方向布局视频生成及世界模型

    面向用户意图理解,可灵团队提出的Any2Caption按照一种统一的方式理解多模态用户输入信息,进而生成语义丰富的结构化描述,可显著提升视频生成的成功率……

  • 苹果迎劲敌!小米平板全系对标iPad 入门到高端全都有

    在今晚的小米人车家全生态新品先导发布直播中,小米集团总裁卢伟冰、REDMI品牌总经理王腾曝光了多款即将发布的新品。 其中包括小米平板7S Pro和REDMI K Pad两款平板产品。 随后,数码博主数码闲聊站”发文表示,小米正式全系全面对标苹果iPad。 根据产品规划,小米平板7 Ultra将对标iPad Pro系列,主打旗舰性能与生产力;小米平板7S Pro对标iPad Air系列,定位中高端市场,小米�