昆仑万维正式发布SkyReels-A3模型：照片可根据语音对口型

2025-08-11 09:28 · 来源： AIbase基地

昆仑万维集团宣布推出其最新技术成果SkyReels-A3模型，这是一款基于DiT（Diffusion Transformer）视频扩散模型的音频驱动数字人创作工具。SkyReels-A3的发布标志着数字内容创作领域的一大进步，它能够实现任意时长的全模态音频驱动数字人创作，为用户带来全新的体验。

SkyReels-A3模型的核心功能是让静态图像或视频“活”起来，通过上传人像图片和相应的语音，即可使图片中的人物按照语音内容开口说话或唱歌。此外，该模型还支持创作新的视频内容，用户只需提供人像图片、语音和文字提示，即可生成按照要求状态进行表演的视频。SkyReels-A3还能够为现有视频“改台词”，自动匹配新的口型、表情和表演，保持画面连贯。

微信截图_20250811092633.png

该模型在文本提示词输入、动作交互自然度、运镜控制以及视频输出时长等方面都进行了优化和提升。SkyReels-A3支持长达60秒的单分镜视频输出，多分镜支持无限时长，满足不同创作需求。昆仑万维还针对线上直播等实际应用场景进行了特定优化，提高了视频生成的一致性和特定交互动作的自然度和清晰度。

SkyReels-A3的推出，不仅为广告、直播带货等商业应用提供了强有力的技术支持，也为音乐MV、电影片段或演讲视频等艺术创作提供了更多可能性。昆仑万维通过引入基于ControlNet结构的镜头控制模块，实现了帧级别精准运镜控制，预设了8种常见的运镜参数，用户可以根据需要选择相应运镜，并且每个运镜的强度可0–100%连续调节，生成专业的运镜效果。

SkyReels-A3模型的发布，预示着数字内容创作将变得更加高效和便捷。昆仑万维集团通过这一创新技术，为电影制作、虚拟直播、游戏开发与教育内容创作等领域提供了低门槛、低成本、高保真的AI技术制作方案。SkyReels-A3的推出，代表了声音即影像的可能性，为个性化、交互式内容的创作提供了前所未有的高效与便捷，也许下一个刷屏的爆款视频就来自你的灵感。

SkyReels-A3项目主页:

https://skyworkai.github.io/skyreels-a3.github.io/

SkyReels 官网地址:

https://www.skyreels.ai/home

SkyReels系列开源模型地址:

https://huggingface.co/Skywork

相关推荐

DeepSeek-V3.2-Exp正式发布

DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp，该模型基于V3.1-Terminus升级，引入创新的稀疏注意力机制DSA，首次实现细粒度稀疏注意力，在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面，官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整：输入缓存0.2元、输入未缓存2元、输出3元，开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

DeepSeek-V3.2-Exp 稀疏注意力机制 DSA
荐AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功能；阿里Qoder推出付费订阅服务

AI日报汇总最新行业动态：腾讯发布混元3D+3.0模型，建模精度提升3倍；昆仑万维Mureka上线音乐创作功能；阿里Qoder推出付费订阅服务；VEED Fabric 1.0实现图片转视频；OpenAI发布GPT-5-Codex革新编程；全国发布AI安全治理框架2.0；Mini-o3实现超长视觉推理；上海AI Lab推出多模态模型Lumina-DiMOO；腾讯微调技术提升图像美感300%；Meta推出轻量级MobileLLM-R1；腾讯启动AI应用繁荣计划；谷歌DeepMind�

AI日报腾讯混元3D 3D建模
破解 AI “安全与性能” 难题！DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

9月18日，华为全联接大会2025在上海开幕。会上，华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出，对有害言论、敏感内容等14个维度的防御成功率近100%，同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作，推动AI安全技术与产业生态协同发展，为我国人工智能高质量发展提供支撑。

华为全联接大会 DeepSeek-R1-Safe 昇腾千卡算力平台
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
技术经理人慕课课程正式发布

为加快培育高水平技术经理人队伍，推动科技成果转化和产业化，技术经理人慕课课程近日正式发布。该课程由中国科协科学技术创新部委托、科技部科技评估中心统筹制作，基于我国首套初、中、高级技术经理人培训教材精心打造，为技术转移从业者及相关人员提供科学、系统、便捷的在线学习资源。课程紧扣《职业分类大典》中技术经理人的职业要求及能力评价规范，与教材紧密适配，形成“教材+慕课”协同互补的梯度式学习体系，助力学员循序渐进提升专业水平。授课师资汇聚权威专家和行业精英，通过动画演示、案例模拟等多样化手段，将知识产权证券化、技术并购重组等复杂业务流程可视化，增强学习效果。课程内容聚焦传统产业转型升级、战略性新兴产业培育等方向，深度剖析真实案例，帮助学员精准把握技术发展趋势，提升解决实际问题的能力。目前课程已在“科创中国”和“技术经理人公共服务平台”同步上线，未来还将持续推出实训案例课程，全方位助力技术经理人成长。

技术经理人科技成果转化慕课课程
强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

2025年9月29日，深度求索公司发布新一代模型架构DeepSeek-V3.2，引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本，在V3.1-Terminus基础上引入稀疏注意力机制，优化长文本训练和推理效率。目前官方应用端已同步更新，API大幅降价。此次模型体积达671GB，下载需8-10小时。业内专家指出，此次快速适配表明双方早有深度技术协�

DeepSeek-V3.2 大模型架构稀疏注意力机制
国内首家AI回答监测判断系统“玄鸟AI监测1.0版本”正式发布

9月21日，“玄鸟AI监测系统”正式上线，这是国内首个专注于用户端AI交互数据采集与分析的企业级解决方案。该系统通过“数据采集-智能分析-闭环反馈”三层架构，能有效识别行业“AI幻觉”监控难题，实现跨平台实时数据抓取与智能分析。系统依托自然语言处理与机器学习技术，建立双重验证机制，精准识别AI生成内容中的事实偏差，并通过自动化报告生成功能帮助企业快速定位风险。该系统的上线标志着国内在AI内容监测领域实现关键技术突破，为构建可信AI生态提供重要支撑。

AI监测系统数据采集智能分析
荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

AI日报今日聚焦多项技术突破：小米开源首个端到端语音大模型Xiaomi-MiMo-Audio；通义万相推出全新动作生成模型Wan2.2-Animate；Suno即将发布革命性音乐模型v5；生数科技获数亿融资，视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞，谷歌将Gemini集成至Chrome浏览器，Luma AI发布支持16位色的Ray3视频生成模型，法国Mistral推出开源推理模型Magistral Small 1.2，Notion发布AI智能体，腾讯混元3D Studio提升3D创作效率。

AI 语音大模型小米开源
定了！WIKO Hi MateBook 14明日正式发布，圆键盘+旗舰屏这次全齐了

WIKO Hi MateBook 14将于9月26日发布，核心亮点包括：配备2.8K OLED高刷触控屏，搭载英特尔酷睿Ultra 7处理器，性能强劲。键盘采用独特的“波点艺术”设计，兼具复古美感与辨识度。官方强调其定价将远低于万元级别，主打高性价比。结合跨端互联、多屏协同等智慧生态功能，这款轻薄本有望成为下半年市场的黑马。

WIKO Hi MateBook14
荐AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

本期AI日报聚焦多领域技术突破：京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”，推动物流行业迈向自主执行；DeepSeek推出V3.1终结版，修复漏洞并为V4架构铺路；Kimi上线Agent模式“OK Computer”，支持智能网站开发等复杂任务；ChatGPT新增个性化资讯功能，定制用户专属新闻；Exa Code发布代码索引工具，助力AI代理精准生成代码；Meta推出AI视频创作平台Vibes，简化短视频制作；蚂蚁数科发布隐私保护AI框架Gibbon，推理速度提升超百倍；OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平，覆盖九大行业44种职业。

京东物流超脑大模型2.0 异狼具身智能机械臂系统

今日大家都在搜的词：

热文

3 天
7天

昆仑万维正式发布SkyReels-A3模型：照片可根据语音对口型

DeepSeek-V3.2-Exp正式发布

荐AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功能；阿里Qoder推出付费订阅服务

破解 AI “安全与性能” 难题！DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

技术经理人慕课课程正式发布

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

国内首家AI回答监测判断系统“玄鸟AI监测1.0版本”正式发布

荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

定了！WIKO Hi MateBook 14明日正式发布，圆键盘+旗舰屏这次全齐了

荐AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

今日大家都在搜的词：

热文

苹果iOS18.7.1正式版更新发布重要安全修复

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

罗永浩替小米说公道话：海报小字是行业陋习

腾讯QQ闪传功能上线支持单文件最大10GB传输

苹果iOS 26.0.1正式版发布：修复iPhone 17系列Wi-Fi、拍照等Bu

OPPO Find X9系列定档：10月16日发布

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

鸿蒙智行享界S9T上市13天大定破 15000 台

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果iOS18.7.1正式版更新发布重要安全修复

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

小米17系列开售5分钟破25年国产手机首销纪录

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

罗永浩替小米说公道话：海报小字是行业陋习

iPhone调休闹钟上热搜苹果客服回应：需手动设置

站长商机