首页 > 传媒 > 关键词  > 视频生成模型最新资讯  > 正文

可灵2.6模型上线!语音、音效与画面一键直出 重构AI视频创作工作流

2025-12-05 17:38 · 稿源: 站长之家用户

12月3日,可灵推出视频生成2.6模型,该模型提供了里程碑式的“音画同出”能力,彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程。它能够在单次生成中,输出包含自然语言、动作音效以及环境氛围音的完整视频,重构了AI视频创作工作流,极大提升创作效率。

可灵2.6功能界面

重构AI视频创作工作流 中文语音生成效果全球领先

可灵2.6模型升级了文生音画、图生音画两大功能,输入文本或是输入图片结合提示词文本,均可直接生成带有语音、音效及环境音的视频。语音当前支持生成中文以及英文,生成视频长度最长支持10秒。

该升级重构了传统AI视频创作“先生成无声的视频,再结合其他软件完成后期声音制作”的工作流,创作者使用可灵2.6模型,能够直接生成包含人声、环境与效果音效的视频,极大提升了创作者的工作效率。

▲ 可灵2.6能够生成包含人声、环境与效果音效的完整视频

通过对物理世界声音与动态画面的深度语义对齐,可灵2.6模型在音画协同、音频质量和语义理解上表现亮眼。

音画协同上,可灵2.6模型生成的视频,在语音节奏、环境音与画面动作上紧密呼应,实现了对画面动态与声音节奏的深度对齐,避免了传统工作流可能产生的“画面一套、声音一套”的割裂体验。

音频质量上,在支持人声、音效、环境声等多类型声音生成的基础上,生成的音频音质更干净、层次更丰富,整体听感更接近真实的混音效果,满足专业级创作对声音细节的高要求。

语义理解上,该模型对多种场景下的文本描述、口语表达和复杂剧情有较强的语义理解能力,能够更准确地把握创作者意图,从而输出逻辑更严密、更贴合用户需求的音画内容。同时,可灵2.6模型在中文语音生成效果上保持全球领先。

一键“音画同出” 广告营销、自媒体、电商等创作场景迎来效率革命

可灵2.6模型支持的声音类型包括说话、对话、旁白、唱歌、Rap、环境音效、混合音效等多种声音的单独或混合生成,能够广泛地应用于广告营销、自媒体、电商等行业视频内容创作中,极大提升创作效率。

例如在广告营销行业,可灵2.6模型可一键生成含有旁白介绍、演员对白、商品展示音效等综合声音效果的广告短片,极大降低广告片拍摄的成本,提升效率。

在自媒体领域,可灵2.6模型的应用则更加广泛。通过多人对白能力,创作者可以创作包含访谈节目、剧情演绎、搞笑短剧等多类型的内容创作,还可以借助模型的音乐表演能力,进行唱歌、说唱表演、乐器演奏等类型的内容创作。运用可灵2.6模型,可大幅度降低自媒体创作者的创作成本与难度。

▲ 可灵2.6生成短片故事

在电商领域,通过单人独白、旁白解说等能力,能够完成商品展示、产品讲解等电商领域的视频内容创作,提升商家的经营效率。

可灵2.6模型的推出,进一步降低了内容创意行业视频创作的成本与难度,未来可灵AI也会持续开发更多实用功能,为创作者提供更优质、方便的AI视频创作工具。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • NVIDIA RTX 加速 PC 端 4K AI 视频生成,LTX-2 与 ComfyUI全面升级

    2025年是PC端AI发展的突破之年,小语言模型(SLM)准确率相比2024年提升近2倍,显著缩小了与云端大语言模型(LLM)的差距。NVIDIA在CES上宣布了一系列针对RTX设备的AI升级,以解锁PC上的生成式AI性能。通过优化ComfyUI、开源LTX-2视频生成模型、加速Ollama和llama.cpp等工具,实现了视频/图像生成性能最高提升3倍、显存占用最多降低60%,以及SLM推理性能最高提升35%。这些改进让用户能在本地RTX AI PC上无缝运行先进的工作流,同时享受隐私、安全和低延迟优势。全新的视频生成工作流和由Nexa.ai推出的Hyperlink本地智能搜索工具,将进一步推动生成式AI在2026年全面走向大众创作者、游戏玩家和生产力用户。

  • 腾讯视频首发AI打电话功能!看剧时能直接给主角打电话

    腾讯视频近日上线了重磅功能,让观众在追剧的时候可以直接给主角打电话,一边追剧一边聊天,目前已经在《骄阳似我》上线。 基于混元大模型的技术能力,平台将主角林屿森”聂曦光”两位主角以AI分身形式常态化呈现:分身熟读剧本、复刻名场面、以角色视角与观众对话。 技术层面,混元角色扮演大模型被用于构建

  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

  • AI日报:实时世界模型 PixVerse R1发布;Vidu发布AI一键生成MV功能;可灵AI ARR达2.4亿美元

    本期AI日报聚焦多项AI领域突破:爱诗科技发布全球首个通用实时世界模型PixVerse R1,实现虚拟世界实时交互;Vidu推出AI一键生成MV功能,打造“虚拟制片厂”;MiniMax发布编程智能体基准测试OctoCodingBench;快手可灵AI年化收入达2.4亿美元;智谱联合华为开源多模态模型GLM-Image,全链路跑通国产芯片;百川智能发布医疗大模型Baichuan-M3;谷歌重构电商未来,推出Agentic AI购物系统;谷歌开源医疗AI模型MedGemma 1.5与语音识别模型MedASR。

  • 即构推出AI音视频能力矩阵 助力应用突围增长

    如今,移动应用市场竞争进入了存量博弈新阶段,应用内的新玩法复制成本低,单靠独创模式难以吸引用户留存。Sensor Tower数据显示,全球应用商店双寡头垄断格局稳固,头部应用占据超60%用户时长,中小应用突围愈发艰难。行业增长逻辑已转向内容质量与优质体验,音视频质量低下可能导致用户留存与转化显著下滑。尤其是在直播语聊、网课、电商、音视频创作工具等高频�

  • 短视频刷多了会脑雾:记不住事

    你是否遇到过这种情况,正准备说话,突然忘了刚才想要说什么?明明是一个比较熟悉的人,却怎么也想不起对方的名字?这就好比人的大脑被蒙上了一层雾”,不够清醒、敏锐,被称之为脑雾”。 医学专家指出,脑雾”并非医学诊断,而是患者对自身注意力涣散、精神难以集中、伴随疲惫感的生动客观描述,就像大脑中笼罩着一团雾气,清晰的思维通路被堵塞。 这种状态�

  • 10个年度剧综赞助案例背后,2026长视频商业化该怎么玩?

    如果以长视频商业化的发展轴线来看,2025年算得上某种意义的回落期。 剧集方面,尽管不少流量主演剧集屡屡被各方号称刷新平台招商纪录,40+、50+合作品牌数整齐罗列,化作开播前和播后总结的耀眼成绩单,但是,一方面开播剧集的单集赞助数量明显在减少、满档登场的情况近乎消失,另一方面,曾经被市场认为进入商业化成熟期标志性事件的剧集冠名、综艺式赞助体系�

  • 持续服务创新!华为视频服务启动试点 可视化沟通打破空间壁垒

    华为于2026年1月启动“华为视频服务”试点,旨在通过线上实时可视化沟通模式,高效解决用户设备复杂故障、操作指引等问题。该服务聚焦路由器组网、网络调试等高频场景,以及新用户上手鸿蒙电脑、长辈群体使用智能设备等需求,突破传统远程协助的局限,提供更精准、直观的服务体验。这是华为以消费者为中心的服务创新,将进一步丰富其全渠道服务能力。

  • 带80岁爷爷搞抽象,“隔辈整活”成短视频新赛道?

    ​穿着夸张战袍的八旬姥爷变身“大力水手”,喊着“风鹰铠甲”合体成铠甲勇士,戴着假发cos拳皇八神庵……临近春节,社交平台上出现大批“隔代整活”视频。 年轻人返乡后,拉着家中老人拍摄各种抽象、搞怪内容,播放量动辄百万,甚至火到海外。

  • 关于长视频忠粉养成记,优酷SVIP亮出一套「多很多」秘籍

    12月底,一波剧粉涌进了上海豫园。 有人兴致勃勃与所追剧集的剧集场景、角色立牌合照;有人一袭古风造型,主打一个沉浸式游园;有人在社交平台再次安利一下自己的心头好;也有人遗憾未能到场,只好在评论区询问是否有人能帮忙购买周边…… 当一批批如《藏海传》《凡人修仙传》《暗河传》等年度爆款剧集近距离走进用户,优酷SVIP超酷会员日(以下简称超酷会员日)举�

今日大家都在搜的词: