首页 > AI头条  > 正文

即梦AI全量上线数字人-大师模式(OmniHuman-1) 可根据音频生成生动数字人

2025-03-06 16:47 · 来源: AIbase基地

字节的OmniHuman- 1 功能你可以在即梦中使用了。刚刚,即梦AI宣布全量上线数字人-大师模式。只需输入一张照片+一段音频,就能自动生成动作,表情都逼真的高阶数字人。无需输入提示词,让数字人的创作门槛更低了。

QQ20250306-164207.png

创作门槛瞬间“骨折”,自由度却直线飙升!更让人惊艳的是,新一代数字人动效逼真到令人咋舌,彻底甩开了以往那些“僵硬”模型的几条街!

彻底告别“照片说话”的尴尬! 

“大师模式”最令人兴奋的革新,在于它突破了传统数字人仅能驱动头部动作的局限,实现了全身动作的自然生成! 

这意味着,你的数字人不再是“大头娃娃”,而是拥有了完整的肢体语言! 从目前社区用户的火爆反馈来看,这项功能在演讲、唱歌,甚至是跳舞等复杂场景中,都展现出了惊人的实力! 

小编测试上传了一张生成的哪吒照片,然后加了一段音频。效果如下:

整体来看,动作非常流畅自然,表情也很鲜活,用来制作对口型动画或数字讲师什么的都很合适。目前,该模式最长仅支持上传15s长的音频。

这个功能,无疑将为短视频创作者、虚拟主播以及广告制作者们,插上效率飞升的翅膀! 大幅降低制作成本的同时,又能产出更具表现力、更吸睛的内容! 

不仅如此, “大师模式”的潜力远不止于此,它很可能将成为AI数字人技术进军影视、游戏等更广阔领域的强劲引擎, 

未来,我们或许将看到由AI数字人主演的电影,畅玩由数字人NPC主导的沉浸式游戏世界, 一切,都变得令人无比期待!

  • 相关推荐
  • AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

    本文汇总了AI领域最新动态:1)阿里开源MNN+TaoAvatar技术,实现手机端3D数字人实时交互;2)MiniMax升级AI工具Agent,新增智能图像搜索和多语言支持;3)罗永浩数字人将登陆百度电商直播;4)OpenAI员工套现近30亿美元,软银成最大接盘方;5)ChatGPT推出深度研究和语音模式升级;6)Meta发布V-JEPA2模型,提升机器人环境适应能力;7)AMD与OpenAI合作推出新一代AI芯片;8)Google Gemini集成Imagen4图像生成模型;9)谷歌AI实现10公里级精准天气预报;10)Gartner预测到2028年80%的AI应用开发时间将缩短50%。

  • 数字人老罗也要交个朋友!“罗永浩数字人”将于15日亮相百度电商

    罗永浩今日在微博宣布自己的数字人”将在6月15日亮相百度电商直播。 罗永浩称这次直播就两件事儿:人虽然是我的数字人,但货还是老罗严选的好货;价格还是实惠厚道,数字人老罗也要交个朋友。 罗永浩解释:最近自己发现头部带货主播基本没做过数字人,于是就让百度给自己做一个,本周日晚17:00就开始带货。” 他表示:虽然相信百度的技术底子,但他还是不放心,

  • PK本尊,百度电商新解数字人

    6月15日晚,罗永浩数字人在百度电商完成首场直播,该场直播GMV突破5500万元,数据超过了5月23日罗永浩本人在百度电商直播时的GMV。 进一步对比两场直播,可以看到很多有趣的细节。 “先本尊,后替身”的两场直播带货说明百度电商在过去两年时间内已完成基础建设。百度优选在接受采访时提到,“我们在GMV上没有压力,百度优选作为电商行业的新玩家,历史包袱并不多,

  • 罗永浩数字人直播首秀:AI讲解近10万字 效果把老罗都吓一跳

    罗永浩数字人昨日在百度直播首秀、完美收官。 罗永浩今天分享了最新感受,直呼这数字人效果把自己都吓一跳。 我和萧木的两个数字人在那儿眉来眼去,讲着跟我一样风格的段子,有点恍惚但这就是现实。” 百度方面透露,这场直播中,由AI生成的剧本式产品讲解高达9.7万字,由AI驱动的数字人动作高达8300个。 罗永浩感慨:如果没有数字人,这得把我累成啥样!”

  • 618抢先剧透!AI数字人分身系统重磅升级:自定义装修+智能体

    该文章介绍了一个智能装修系统的五大核心功能更新:1.新增可视化自定义装修功能,无需编程即可自由设计前端页面;2.接入AI智能体系统,自动生成精准营销文案;3.新增API接口分销功能,支持批零差价盈利;4.全面接入DeepSeek技术,实现多平台高质量文案生成;5.新增VIP会员模式,严格绑定功能权限与有效期。系统通过智能化升级,显著提升了装修设计、内容创作和商业变现的效率。

  • 蝉镜推出国内首个数字人内容生产MCP

    2025年5月20日,国内首个垂直领域数字人内容生产协议蝉镜MCP正式发布,标志着AI行业进入"技术普惠化"新阶段。该协议通过打通大语言模型与营销工具的全链路协同,实现"输入需求,AI自主完成全流程创作"的突破性创新。核心价值在于构建开放智能协同网络,支持不同AI模型自由组合,无需复杂API开发即可实现功能调用。企业只需输入简单指令,系统就能自动完成文案生成、素材匹配、视频剪辑等全流程,将运营效率提升300%以上,开发成本降低90%。蝉镜MCP独创"三无模式"(无模特、无场地、无拍摄),仅需上传短视频即可零成本生成数字人IP,单条视频成本降至个位数。目前已有企业通过该平台打造专业形象,单条视频播放量破百万。作为战略级产品,蝉镜MCP精准识别行业爆款标签,将AI创作与营销科学深度融合,推动营销行业进入"智能体协作"时代。数据显示采用该协议的企业客户留存率高达92%,远超行业均值。

  • 腾讯AI数字人AvaMo落地商用,百度/微美全息加速虚拟人生态闭环构建

    腾讯与Offshore公司达成战略合作,推出面向日本市场的AI数字人视频生成服务"AvaMo"。该服务基于腾讯云智能数字人技术,仅需1-3分钟视频样本即可创建高保真数字人,支持实时交互,能将30秒视频制作时间从传统的12小时压缩至15分钟。同时,百度也在数字人领域发力,展示手语数字人、直播数字人等应用案例。我国数字人产业生态日益完善,相关企业已达114.4万家。微美全息等企业通过整合AI、计算机视觉等技术,显著降低商业化门槛,推动数字人在社交、娱乐等场景的个性化应用。随着生成式AI技术发展,数字人制作效率和多样性显著提升,用户可打造更具个性化的数字产品。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 微信“问一问主持人”全量上线,对创作者来说有什么用?

    再次发力“问一问”,微信能做好问答社区吗? 上周,“问一问主持人”功能正式全量开放,这几天已有不少创作者在后台收到邀请。新榜编辑部了解到,该功能从去年开始就在小范围邀请创作者参与灰测,直到如今正式上线。

  • 百度任罗永浩为“慧播星”首席体验官 将再造10万数字人主播

    近日,罗永浩数字人”在百度电商开启直播首秀。 据百度提供的数据显示,数字人直播间开播仅26分钟,GMV便超过罗永浩真人直播1小时的成交额,最终以7小时5500万元的战绩收官。 据统计,90%的网络用户在观看直播后评价都非常正向,且纷纷表示数字人直播与真人直播已真假难辨”。 不过,也有网友评论:还是不能完全替代罗老师”。 为验证AI主播 真人IP”混合模式的商�

今日大家都在搜的词: