首页 > AI头条  > 正文

核能级进化!可灵AI迈入2.0时代 新增多模态编辑和图片编辑功能

2025-04-15 14:45 · 来源: AIbase基地

刚刚,国内AI生成创作平台可灵AI正式发布了全面革新的2.0版本,此次升级不仅涵盖了多个核心模型的彻底更新,还带来了一系列突破性的新功能,标志着该平台正式迈入多模态AI创作的新阶段。

本次更新的核心是两大基础模型的全面革新:可灵2.0(大师版)和可图2.0。可灵2.0(大师版)专注于视频生成,在语义响应、动态质量和画面美感三方面实现了质的飞跃。

该模型现在能够精确响应更复杂的时序描述,例如"女孩从静坐到慢慢离开,伴随着从晨光到暮色的天空变化"等高度复杂的场景描述。同时,角色动作幅度更大,速度更流畅,即使是恐龙冲向镜头或滑板少年的运动轨迹等复杂动作,也能呈现出专业级的自然感和合理性。

可灵1.jpg

可图2.0则在静态图像生成方面取得重大突破。新模型对复杂指令的遵循能力显著提升,能够准确响应多种元素、颜色位置等细节要求。尤为引人注目的是,可图2.0支持超过60种艺术风格,从特殊材质到数字艺术再到各类绘画技法,使普通用户也能轻松创作出具有高级电影质感和独特美学调性的图像。

此次更新最大的亮点在于全新推出的多模态编辑功能体系。在视频编辑方面,用户可以上传1-5秒的短视频,通过文字或图片指令对视频进行元素替换、增加或删除操作,例如将视频中的人物替换为熊猫、在纸盒中添加玩偶,或删除画面中不需要的物体。这种精细化的视频编辑能力在国内AI平台中处于领先地位。

QQ20250415-145022.jpg

同时,图片编辑功能也迎来重大更新,支持局部重绘和自由扩图。用户可以指定图片中的特定区域进行修改,如为人物添加墨镜;或者调整图片尺寸和构图,自由扩充图片内容。系统生成的内容与原图融合度高,大大提升了创作效率和成品质量。

QQ20250415-145037.jpg

另一个引人注目的新功能是"风格转绘",只需上传一张图片并输入风格描述,即可将图片转换为复古美少女风格或3D卡通风格等多种艺术风格,为创作者提供了更丰富的表达可能。

这次可灵AI2.0版本的发布,不仅体现了国产AI技术在多模态内容生成领域的快速进步,也代表着AI创作工具向更加精细化、专业化和个性化方向的发展趋势。随着这些新技术的普及,AI辅助创作有望在更广泛的领域释放创意潜能,为内容创作行业带来新一轮变革。

官方详细介绍:https://app.klingai.com/cn/release-notes

  • 相关推荐
  • 可灵AI发布全新2.0模型:上线多模态视频编辑功能

    快科技4月16日消息,据报道,可灵AI在北京举行灵感成真”2.0模型发布会,正式发布可灵2.0视频生成模型及可图2.0图像生成模型。据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日,全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模

  • 多模态和Agent成为大厂AI的新赛 点

    这是《窄播Weekly》的第52期,本期我们关注的商业动态是:当大厂的AI竞争策略开始倾斜向应用场景,多模态能力和代理执行成为两个焦点。大模型落地C端场景的核心,就是让大模型的能力越来越接近人。沿着这个主旋律,可以划分出两个进化方向:一个是持续降低用户与大模型进行有效沟通的难度;另一个则是让大模型具备执行更复杂任务的能力。前者的实现,需要给到大模型多

  • 多模态和Agent成为大厂AI的新赛点

    本期《窄播Weekly》聚焦AI大厂竞争策略向应用场景倾斜的趋势,重点分析了多模态能力和代理执行两大发展方向。文章指出,大模型落地的核心在于让人机交互更自然,具体表现为:1)通过多模态技术降低用户使用门槛,如阿里夸克新推出的"拍照问夸克"功能;2)通过代理执行提升复杂任务处理能力,如字节、百度等推出的通用Agent产品。国内外厂商路径差异明显:国�

  • 腾讯回应朋友圈是否上线编辑功能:目前无法修改

    4月20日,微博词条 #为什么微信还不推出编辑功能# 引发了广泛讨论。据媒体报道,对于朋友圈是否上线编辑功能的问题,腾讯客服回应称,目前已经发布的朋友圈无法再次编辑修改,并表示对此带来的不便表示歉意,同时承诺后续会不断优化。2020年,微信曾上线朋友圈删除后可重新编辑的功能。当用户删除一条朋友圈时,系统会提醒“你删除

  • 可灵AI开启视频生成2.0时代!全球用户数已突破2200万

    4 月 15 日,快手可灵AI在北京中关村国际创新中心举行“灵感成真”2. 0 模型发布会,宣布基座模型再次升级,面向全球正式发布可灵2. 0 视频生成模型及可图2. 0 图像生成模型。

  • 可灵2.0大师版首发爆火!排队半小时实测,视频编辑能力再升级

    “可灵持续领先!”4月15日下午,快手宣布可灵AI全系模型进入2.0时代。自从上一次可灵1.6更新已过去近3个月,这次基座模型升级,快手高级副总裁、社区科学线负责人盖坤在发布会上自信表示:“可图2.0现在是行业领先的图像模型……可灵2.0,特别在图生视频上持续全球大幅领先!”现场响起了一阵阵欢呼声和掌声。“AI新榜”现场拍摄升级后,可灵2.0视频生成模型(大师版)具

  • UniToken:多模态AI的“全能选手”,一次编码搞定文理解与像生成

    复旦大学与美团研究者提出UniToken框架,首次在统一模型中实现图文理解与生成任务的"双优表现"。该方案融合连续和离散视觉编码,有效解决了传统多模态建模中的"任务干扰"和"表示割裂"问题。通过三阶段训练策略(视觉语义对齐、多任务联合训练、指令强化微调),UniToken在多个基准测试中性能超越专用模型。其创新性体现在:1)统一的双边视觉编码

  • 紫东太初多模态RAG全新发布:端到端问答准确率提升33%

    在产业智能化进程中,如何高效融合企业专有知识资产,构建领域专属认知引擎,是企业迈向智能决策与高效运营的关键。然而,传统检索增强生成(RAG)技术受限于语言单模态处理能力,仅能实现文本知识库与文本查询之间的浅层理解,难以满足复杂业务场景的需求,在实际应用中暴露出两大缺陷:信息表征缺失:忽略知识库中多模态富文档的视觉语义信息,如版面结构、图表关�

  • 1000万上下文!新开源多模态大模型,单个GPU就能运行

    今年2月初,谷歌发布的Gemini2.0Pro支持200万上下文,震惊了整个大模型领域。仅过了2个月,Meta最新开源的Llama4Scout就将上下文扩展至1000万,整整提升了5倍开启千万级时代。根据实验数据显示,Llama4Behemoth在MMLUPro、GPQA、MATH-500等测试的数据比GPT-4.5、ClaudeSonnet3.7、Gemini2.0Pro更好。

  • ChatGPT上线图库功能:可管理AI生成图片

    快科技4月16日消息,据报道,OpenAI近日宣布将为ChatGPT推出全新的Image Library图库功能,该功能将帮助用户更高效地管理和查看AI生成的图像。这项创新功能将逐步向所有用户开放,包括移动端和网页端的免费版、Plus版及Pro版用户。新功能的设计充分考虑了用户体验的便捷性。用户只需点击ChatGPT侧边栏的Library入口,就能进入一个直观的图像网格界面。在这个界面中,用户可以轻�

今日大家都在搜的词: