首页 > 传媒 > 关键词  > AI技术最新资讯  > 正文

昆仑万维技术周启幕:SkyReels模型重塑内容创作基建

2025-08-11 11:52 · 稿源: 站长之家用户

2025年8月11日,昆仑万维宣布启动一场覆盖五大技术领域的SkyWork AI技术发布周,8月11日至8月15日,每天将发布一款新模型,从视频生成模型(Skyreels)、世界模型,到生图一体化模型、智能体(Agent)模型,再到AI音乐创作模型(Mureka),连续五天发布覆盖多模态AI核心场景的前沿模型,集中展示技术突破的最新成果。

这标志着昆仑万维AI技术全面迈入商业化应用阶段。前期重投入的研发成果加速转化为产品矩阵,技术变现飞轮高效运转。

技术周首日,全球首个支持分钟级长视频生成的音频驱动模型Skyreels-A3正式亮相。该模型通过四大技术创新锚定直播电商万亿市场痛点,可实现长视频连贯生成、影视级运镜控制与自然动作交互,为全球内容创作产业提供新一代技术基石。

技术突破:构建多模态协同的生成范式

传统视频生成技术受限于误差累积效应,面临长视频画面崩坏与动作僵硬的行业瓶颈。模型Skyreels-A3的创新在于构建了多模态协同的生成范式,保证了画面的一致性,基于DiT视频扩散模型框架构建,通过三路输入处理系统实现文本、图像与音频的深度融合,突破了误差控制机制,创新采用分段插帧策略,通过确定起始帧和终止帧生成视频片段,并取用尾帧作为插帧监督信号,成功将180秒长视频的画面稳定度控制在较高值,彻底解决行业顽疾。

在艺术创作的高阶美感表达维度,模型首创基于ControlNet的镜头控制模块,支持固定镜头、推镜、拉镜、左摇、右摇、抬升、下降、手持镜头等8种运镜参数,且强度可自由连续调节。该技术使非专业用户也能精准控制镜头语言,这种能力源自对影视镜头物理轨迹的数学建模,显著提升直播带货场景的真实性,同时也可以提升音乐MV、电影片段的艺术表现力。

针对直播带货等交互场景中,效果不够逼真的痛点,模型通过DPO算法优化手部动作自然度,驱动生成效果逼近真人表现,该技术通过分析大量真实交互数据,建立动作-商品-语音的跨模态关联。

效率突破同样令人瞩目。模型Skyreels通过Step蒸馏技术,将推理步数从40步压缩至4步,画面质量保持率超98%,使视频生成时间缩短至80秒,大幅降低创作者硬件门槛。人工盲测进一步验证其优势:在带货场景中,在观众盲测中,89%的人认为模型Skyreels呈现的动作效果比竞品更真实自然,动作自然性和面部稳定性评分这两项关键指标均居行业首位。

商业化潜力:撬动万亿市场的创作革命

2023年以来,昆仑万维“All in AGI与AIGC”战略全面落地,实现了从技术研发到产品商业化的转变,并获得了用户广泛的认可。

据悉,昆仑万维推出的短剧平台DramaWave年化流水达1.2亿美元,AI音乐产品模型Mureka年化流水1200万美元,AI社交产品Linky单月收入突破100万美元。与此同时,Linky社交平台300万月活用户形成创作者孵化池,Opera广告系统实现精准投放,这种“创作-分发-变现”闭环推动毛利率维持在73.6%高位,为昆仑万维AI技术持续创新提供动能。

昆仑万维2025年Q1财报数据显示,经营性现金流净额增长58.3%,显然,2024年15.4亿元的研发投入正持续转化为营收增长动能。这验证了AI技术商业化的可持续性,使昆仑万维成为国内首个跑通“研发投入——产品变现——现金流反哺”闭环的AI企业。

当模型SkyReels赋能锚定直播电商领域电影制作、虚拟直播、游戏开发与教育内容创作,显著降低多角色视频制作门槛,让个性化、交互式内容的创作前所未有的高效与便捷。,昆仑万维技术周未来几日发布的其他模型也将各自开辟多元战场,五大模型正编织一张覆盖全球市场的商业化网络。

从单点突破到生态赋能,昆仑万维以可验证的商业化效率与全球化布局能力,宣告中国AI企业首次跑通规模化盈利路径。技术周的五大模型,恰是这场变革的序章——当技术飞轮与商业飞轮同频转动,昆仑万维的营收增长故事,才刚刚开始。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • 小度发布多模态智能摄像机,AI大模型重塑家庭看护体验

    小度科技推出首款多模态智能摄像机C800,搭载800万像素4K超清摄像头,支持AI大模型技术。该产品不仅能实现高清监控,还具备智能行为识别、语音交互等功能,可自定义看护提醒。结合视觉与语音交互,支持复杂语义查询和家庭设备联动,扩展智能家居应用场景。目前产品已全网发售,年底还将推出三摄版本,持续探索AI硬件创新。

  • 天网杯纳米AI视频创作赛圆满落幕,ISC.AI学苑推动“教育AI+”新范式

    9月23日,第三届“天网杯”网络安全大赛在天津落幕,吸引全国顶尖战队角逐,同期举办纳米AI视频创作赛。赛事聚焦个人信息保护、防诈 骗等网络安全议题,通过“以赛促学”模式提升学生防护意识与AI应用能力。ISC.AI学苑作为平台支持,依托“纳米AI”技术降低创作门槛,推动“安全+AI”人才培养。大赛评选出24个奖项,并联合多所高校深化合作,促进AI技术在教育场景的落

  • 爱诗科技,一家AI视频创业公司的生存哲学

    “你还是回去吧,大模型在中国没有机会。” 2023年刚创业,爱诗科技创始人兼CEO王长虎收到了天使投资人朱啸虎的“劝退”。 但两年时间过去,两个节点颠覆了投资人对AI视频生成赛道的固有印象。先是

  • 模型即服务,应用即未来:阿里云助力中小企业AI应用规模化落地

    阿里云针对中小企业AI落地“不会用、用不起、用不好”痛点,提出全链路解决方案。数据显示,77%全球中小企业已定期使用AI工具,中国市场需求增长强劲。阿里云通过通义大模型技术迭代、AIStack一体化底座及4R服务框架,降低使用门槛与成本。典型案例如万小智AI员工实现“分钟级交付”,博登智能提升数据处理效率7倍。方案覆盖制造、医疗等12大行业,助力企业从“有算力”到“能落地”,推动AI应用成为行业常态。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 免费生成10秒高清视频!通义App接入通义万相2.5

    在2025云栖大会上,阿里发布通义万相Wan2.5 Preview系列模型,覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步,可生成匹配画面的人声、音效和BGM,时长从5秒提升至10秒,支持24帧/秒的1080P高清输出,降低影视级创作门槛。模型指令遵循能力增强,支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频,每日免费使用15次,支持导出无水印视频。同时,图像生成能力全面升级,可生成中英文字符和图表,支持图像编辑功能,一句话即可完成P图。

  • AI排名查询工具如何助力GEO优化?生成引擎优化中的关键词竞争力分析

    在AI搜索时代,传统SEO正被生成引擎优化(GEO)重塑。内容能否被AI“理解”并引用成为流量关键,而GEO策略需依赖专门的AI排名查询工具。文章指出,AI助手直接生成摘要而非链接列表,评估维度与SEO完全不同,需关注语义相关性、权威性和结构化程度。AIBase平台的GEO排名查询工具能模拟主流AI提问,检测内容曝光频率与上下文位置,支持竞品对比和中文场景优化。优化建议包�

  • 既能读懂情绪,还能多模态交互!INDEMIND用空间智能重新定义陪伴机器人

    TCL与INDEMIND合作推出的陪伴机器人“Ai Me”通过空间智能技术实现突破,从传统2D感知升级为3D语义感知,赋予机器人动态语义建图、实时环境适应及多模态交互能力。该平台借助立体视觉与多传感器融合,让机器人精准构建三维地图,识别家居属性,实现主动避障与个性化服务。同时,结合低算力混合模型与情感交互功能,机器人可感知用户情绪、提供安全防护,并支持宠物看护等场景拓展,从“工具”升级为有温度的“家庭伙伴”,真正满足复杂家庭需求。

今日大家都在搜的词: