首页 > 热点 > 关键词  > 可灵AI最新资讯  > 正文

可灵AI全系模型上线“视频音效”功能 可同步生成高质量立体声音效

2025-06-30 09:17 · 稿源:站长之家用户

6月27日,可灵AI宣布全系列视频模型上线“视频音效”功能,用户在使用可灵AI进行视频创作时,不仅能获得高质量的视频画面,更能体验到与视频准确匹配、富有空间感的立体声音效,真正实现“所见即所听”的沉浸式体验。目前,该功能已无缝集成至文生视频、图生视频、多模态编辑等多种创作模式中,并限时免费开放。

与此同时,平台原有的“音效生成”也进一步升级,新增“视频生音效”功能。用户现在不仅可以通过文本生成音效,更可以直接上传本地视频,或选用在可灵平台创作的历史视频,一键为无声的画面匹配上语义契合、节奏同步的音效,自动适配动作、环境、氛围等多种场景,极大地提升了视频内容的表现力和沉浸感,有效降低了创作者在音频后期制作上的时间与技术成本。

从实际效果来看,可灵AI的音效功能在多个典型案例中展现了很高的音画同步精度和较好的空间听感。例如,在生成“婴儿在活泼地笑”的视频片段中,模型不仅还原了婴儿清亮的笑声,甚至连婴儿笑容间隙短促的吸气声都美好捕捉,与画面中肉嘟嘟脸颊的起伏动作准确匹配,其富有空间感的立体声效果,让整个画面的温馨感与生命力扑面而来。在另一段山体滑坡导致巨石砸中汽车的视频中,系统自动生成了金属扭曲断裂声、石块飞溅与尘土扬起的细节音效,声音定位清晰、动态层次丰富,提升了整体灾难场景的视觉冲击力与沉浸感。

据悉,上述功能的实现,依托于可灵AI自主研发的多模态视频生音效模型——Kling-Foley。Kling-Foley支持基于视频内容与可选文本提示自动生成与视频画面语义相关、时间同步的高质量立体声音频,涵盖音效、背景音乐等多种类型声音内容。它支持生成任意时长的音频内容,还具备立体声渲染的能力,支持空间定向的声源建模和渲染。今年3月,可灵AI初次推出AI音效功能,用户可通过输入文本生成相应的环境音或动作音,并可进一步结合平台生成的视频进行语义理解与自动匹配。随后,在可灵2.1模型中正式加入了视频音效功能,在生成视频的同时,系统也会自动生成与之匹配的音效,增强了整体视听体验。随着视频音效生成技术的成熟落地,将进一步释放可灵AI在广告创意、影视、短视频、游戏等内容等领域的发展潜力。

举报

  • 相关推荐
  • 「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

    AI日报主要内容: 1. 腾讯开源混元A13B模型,采用MoE架构,总参数量800亿,激活参数130亿,支持低端GPU部署 2. 可灵AI推出"视频音效"功能,实现所见即所听的沉浸体验 3. Black Forest开源图像编辑模型FLUX.1Kontext,支持消费级硬件运行 4. OpenAI发布Deep Research API新模型o3/o4-mini,支持自动化网页搜索和数据分析 5. 小米推出1999元起AI眼镜,集成拍摄、支付、音乐等功能 6. 迅雷推出下载MCP服务,一句话指令让AI自动完成下载任务 7. HeyGen推出AI视频Agent,几分钟内生成专业级视频内容 8. 谷歌开源端侧多模态大模型Gemma3n,手机也能运行云端AI性能

  • 高德地图上线AR打卡功能:实现3D立体打卡 生成专属打卡视频

    阿里巴巴旗下高德地图正式上线创新AR打卡功能,通过深度整合AI技术与地图服务,为用户带来虚实融合的沉浸式打卡体验,无缝连接现实世界。 该功能依托前沿AI空间融合技术,突破传统二维地图限制,首创3D立体打卡。用户打开最新版高德地图App,点击右上角 ”号即可轻松开启AR之旅。 支持图片、视频、趣味AR道具及虚拟形象等多种打卡形式,完成打卡后系统将自动生成并

  • 小赢卡贷:数字金融赋能实体经济高质量发展

    小赢卡贷深耕湾区沃土,通过"科技+金融"创新模式服务小微企业。其自主研发智能风控系统,构建多维风险评估模型,解决小微企业信用评估难题;开发差异化信贷产品,实现全流程数字化服务;通过科技降本增效,提供普惠利率。目前累计服务超百万湾区小微企业和个体工商户,成为区域经济重要推手。未来将持续加强AI、区块链等前沿技术研发,探索跨境金融、绿色金融等创新业务,深化产学研合作培育数字人才,助力大湾区金融科技高地建设,以科技赋能实体经济高质量发展。

  • 每日互动:进一步开发数据要素价值 推动城市交通高质量发展

    浙江省数据局于2025年6月4日公告,浙江云通达数达科技成为省内首批省级公共数据授权运营单位,将开展"数智绿波"场景应用。该公司自2022年进入智慧交通领域,已在34个地区落地645条数智绿波带,使道路通行效率提升超20%。此次授权将推动其在规划建设、优化管理等方面持续发力,并通过数据API与科研单位等开展二次创新,赋能智能网联汽车"车路云一体化"项目建设。该授权是对公司在数据安全、技术能力等方面的认可,未来将继续深化数据融合与场景探索,助力城市交通高质量发展。(140字)

  • CVPR2025:快手可灵四大技术方向布局视频生成及世界模型

    面向用户意图理解,可灵团队提出的Any2Caption按照一种统一的方式理解多模态用户输入信息,进而生成语义丰富的结构化描述,可显著提升视频生成的成功率……

  • 苹果迎劲敌!小米平板全系对标iPad 入门到高端全都有

    在今晚的小米人车家全生态新品先导发布直播中,小米集团总裁卢伟冰、REDMI品牌总经理王腾曝光了多款即将发布的新品。 其中包括小米平板7S Pro和REDMI K Pad两款平板产品。 随后,数码博主数码闲聊站”发文表示,小米正式全系全面对标苹果iPad。 根据产品规划,小米平板7 Ultra将对标iPad Pro系列,主打旗舰性能与生产力;小米平板7S Pro对标iPad Air系列,定位中高端市场,小米�

  • Meta AI新增生成式AI视频编辑功能:秒换服装、场景

    Meta 宣布,将在Meta AI应用、Meta.AI网站和Edits应用上推出一项生成式AI视频编辑功能。 用户可通过50多种预设AI提示词,一键实现视频中服装、场景、光影等元素的智能变换。 Meta称,全新的AI视频编辑功能直观易用,用户无需任何视频编辑专业知识即可制作高质量的视频。首先,用户可将视频上传到Meta AI应用、Meta.AI网站或

  • 豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频

    字节跳动旗下豆包大模型正式升级为1.6版,在推理、数学、指令遵循、Agent等方面的能力均有较大提升,同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。 豆包大模型1.6包括三部分,分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。 其中,豆包1.6支持on/off/auto三种思考模式,豆包1.6-thinking强化了思考能力,支持多模态,在多个权威测评集上达到了全球第一梯队�

  • 苹果终于良心一次!iPhone 17确认全系高刷

    据博主数码闲聊站最新爆料,iPhone 17已经确认全系配备高刷屏。 这是苹果历史上第一次为标准版引入高刷,对于标准版来说堪称史诗级提升,日常体验大大提升。

  • 王腾分享冷知识:iPad全系没有搭载马达

    REDMI总经理王腾发文表示,K Pad定位豪华性能小平板,自然要带来无短板的豪华体验,为保证强劲振感,K Pad搭载了超大尺寸双X轴线性马达,一定给大家带来更优秀的使用体验。 王腾还和大家分享了一个冷知识:iPad全系没有搭载马达,如果对振感有强需求的同学,尤其是热爱游戏的性能玩家,一定要去体验一下K Pad。据了解,线性马达的启停非常迅速,振感跟手,而且改变频�