11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
Soul AI Lab推出轻量化实时数字人生成模型SoulX-FlashHead,仅1.3B参数,在消费级显卡RTX 4090上实现96FPS高帧率,同时画质达SOTA水平。模型通过“先验”训练机制和时序音频上下文缓存技术,解决了小模型画质差和长视频身份漂移问题,支持电商直播、游戏NPC等广泛场景,权重与代码已全面开源。
Soul AI Lab开源实时数字人生成模型SoulX-FlashTalk,实现0.87秒亚秒级超低延迟、32fps高帧率,支持超长视频稳定生成。该模型具备“零延迟”即时反馈、高精细度全身动作合成、超长视频稳定生成等亮点,通过双向蒸馏与多步回溯自校正机制解决传统方案延迟高、画面不一致等问题。在电商直播、短视频制作、AI客服等场景提供高质量、可落地的解决方案,推动大参数量实时生成式数字人迈入具体商用阶段。
HeyGen发布了其全新的5.0版本,这一版本整合了所有功能,为用户带来了更加便捷的体验。新版本在用户界面、视频编辑、实时聊天等方面都进行了全面的升级,以满足用户对于高效、智能的需求。这一升级将进一步巩固HeyGen在相关领域的领先地位,为用户提供更加优质的服务。
百度在线网络技术有限公司最近公布了一项关于“数字人生成方法和装置”的专利申请。这项专利涉及人工智能技术领域,具体包括计算机视觉、自然语言处理、深度学习等技术领域,可应用于元宇宙、数字人等场景。通过该方式生成的数字人,能够被赋予不同人格,使其能够像人类一样表达自己的意识和情感,更自然地与人类进行交流和互动。
AIGC大爆发,科技革新不断,数字人在各种场景中崭露头角,如数字人主播、数字人解说员、数字人导购等。根据真人AI生成数字人分身,这项技术已经从未来走进现实。思必驰将基于DFM-2大模型,综合全链路语音交互技术,为用户带来更具特色的数字人形象,加速推进AI技术的应用落地。
StabilityAI发布开源大语言模型StableBelugaStabilityAI发布开源大语言模型StableBeluga,并基于它开发StableChat聊天机器人,采用解释微调技术进行优化,允许用户通过网页界面使用并反馈,以改进模型性能。体验地址:https://research.stability.ai/chat美图推出AI数字人生成工具DreamAvatar美图公司旗下AI数字人生成工具DreamAvatar上线“AI演员”数字人服务,可将拍摄的真人视频素材中的人物替换成数
美图公司宣布,旗下AI数字人生成工具DreamAvatar上线,首期推出“AI演员”数字人服务,服务于视频内容创作、影视处理与剪辑等生产力场景。DreamAvatar“AI演员”数字人的生成,不需要专业设备,一台手机就能轻松搞定。DreamAvatar的另一场景“AI主播”功能已先行落地在美图矩阵开拍App,除了视频创作者,不同的品牌客户,也可以通过接入API和SDK接口的方式,打造品牌专属的数字人。
在人工智能的加持下,每个人有望实现数字人”自由。据《科创板日报》,在今日举行的华为云数字文娱AI创新峰会2023上,华为云全球Marketing与销售服务总裁石冀琳表示,在人工智能的加持下,每个人有望实现数字人”自由。张平安却称,盘古大模型不作诗只做事”,聚焦价值场景,致力于深耕政务、金融、制造、煤矿、铁路、制药、气象等行业。
在2023年华为云数字文娱AI创新峰会上,华为云全球Marketing与销售服务总裁石冀琳表示,在人工智能的推动下,每个人都可以实现“数字人”自由。华为云计划推出盘古数字人大模型,帮助用户在12小时内完成数字人的生成。华为云盘古大模型3.0已在煤矿、铁路、气象、金融、代码开发、数字内容生成等领域发挥作用。
企查查APP显示,6月9日,北京百度网讯科技有限公司申请的“生成数字人的方法、模型的训练方法、装置、设备和介质”专利获授权。专利摘要显示,本公开提供了一种生成数字人的方法、模型的训练方法、装置、设备和介质,涉及人工智能领域,具体涉及自然语言处理、深度学习、计算机视觉、图像处理、增强现实和虚拟现实等技术领域,可应用于元宇宙等场景。实现方案为:获取素材内容;基于预训练的场景划分模型,从素材内容中确定多个场景,其中,多个场景中的每个场景分别对应于素材内容中的一个具有完整语义信息的内容片段;以及对于多个场景中的每个场景,基于对应的内容片段,确定该场景对应的目标内容;基于对应的目标内容,确定该场景的场景标签信息;以及基于场景标签信息,配置特定于该场景的数字人。