首页 > 业界 > 关键词  > 腾讯最新资讯  > 正文

腾讯混元发布并开源图生视频模型:让照片开口说话唱歌AI神器

2025-03-06 17:05 · 稿源: 快科技

快科技3月6日消息,今日,腾讯混元宣布发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。

企业和开发者可在腾讯云申请使用API接口,用户通过混元AI视频官网即可体验。

开源内容包含权重、推理代码和LoRA训练代码,支持开发者基于混元训练专属LoRA等衍生模型,目前在Github、HuggingFace等主流开发者社区均可下载体验。

据介绍,基于图生视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,混元即可按要求让图片动起来,变成5秒的短视频,还能自动配上背景音效。

腾讯混元发布并开源图生视频模型:让照片开口说话唱歌AI神器

此外,上传一张人物图片,并输入希望对口型”的文字或音频,图片中的人物即可说话”或唱歌”;使用动作驱动”能力,还能一键生成同款跳舞视频。

腾讯混元发布并开源图生视频模型:让照片开口说话唱歌AI神器

腾讯混元发布并开源图生视频模型:让照片开口说话唱歌AI神器

腾讯混元表示,此次开源的图生视频模型,是混元文生视频模型开源工作的延续,模型总参数量保持 130 亿,模型适用于多种类型的角色和场景,包括写实视频制作、动漫角色甚至CGI角色制作的生成。

举报

  • 相关推荐
  • 进博会“全勤生”三星的AI全景图:AI Home中国首秀

    三星在进博会上首次展出AI+Home智能家庭解决方案,通过Bespoke AI、Vision AI和Galaxy AI三大模块,实现全场景智慧生活。AI正从"会语言"向"会行动"演进,软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势,打破端侧AI的性能、算力与存储"不可能三角",构建起覆盖手机、电视、家电的生态闭环。未来,AI将全面接管生活,让科技真正服务于人。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • 爱诗科技下注的AI视频,正在比它预期的更「快」落地

    「我们决定全力投入视频生成领域,因为我们坚信视频生成一旦能够落地,其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中,这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。 短短两年后,视频大模型的产品化和商业化潜力已经如王长虎判断的那样,在快速落地,形成自己的创作生�

  • 小米超级小爱AI大模型推出随心修图功能

    小米宣布超级小爱AI大模型推出随心修图功能,用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式:在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求:超级小爱需v7.8.50及以上,相册编辑功能需v2.1及以上,相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级,支持全局多模态交互和自然语音搜索,提升使用体验。

  • 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛

    10月30日,2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力,从全国89家机构的280个项目中脱颖而出,双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势,获专家团高度认可。大赛自2021年启动,已成为金融科技领域极具影响力的赛事平台。

  • 一句话能出试卷,错题自动整理!腾讯元宝上线 AI 出卷、错题本

    11月14日,腾讯元宝上线AI出卷和错题本功能。AI出卷利用海量免费资源与个性化出题优势,解决线下买卷成本高、针对性不足的痛点;错题本则简化整理流程,助力高效复习。两项功能通过降低优质资源获取门槛、简化学习管理,为个性化学习提供高效解决方案,是AI技术在教育场景的重要实践。未来元宝将持续深耕教育领域,探索更多贴合教学需求的创新功能。

  • VMware替代与升级选型必看!腾讯专有云TCE成企业升级首选

    根据Omdia调查,VMware过去20年主导软件虚拟化市场,但2023年被博通收购后引发连锁反应。博通调整定价策略、产品组合及合作伙伴网络,导致客户成本上升、服务目录不全等问题。73%的VMware客户正考虑三年内寻找替代方案,转向全栈能力、生态构建与智能运维的综合考量。腾讯专有云TCE作为企业级全栈私有云平台,成为替代首选,支持无缝迁移、显著降低TCO至少20%,并具备高扩展性和面向AI与云原生的升级能力。

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 长视频,要MCN化?

    过去十多年,长视频平台习惯用头部综艺与大剧撬动增长:内容够强,自然破圈,声量带动会员与广告。 这套“内容中心逻辑”曾行之有效。 但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事,三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩,哪怕是重金制作,也可能上线当周见顶、难以延展。 在这种环境下,平台不得不寻找新的增长方式。�

  • 腾讯智慧出行助力朗逸Pro升级智能座舱体验 推动微信等腾讯生态产品上车

    上汽大众11月17日发布朗逸Pro,起售价8.88万元。作为亮点,该车型率先搭载车载微信,支持语音播报消息、接听电话,确保驾驶安全;集成腾讯地图车机版,提供实时精准导航,并实现手机车机信息无缝流转。腾讯智慧出行基于云、AI及生态优势,推动微信等产品上车,助力打造差异化智能座舱体验。未来双方将持续合作,拓展更多服务场景,结合AI能力优化用户出行。

今日大家都在搜的词: