首页 > 传媒 > 关键词  > 正文

这是要颠覆数字人行业规则吗?!神马工场多模态数字人重装登场!

2023-08-07 10:00 · 稿源: 站长之家用户

目前我们知道,数字人技术已经广泛应用在短视频、带货、直播、金融、医疗和客户服务等多个领域。数字人应用的便利性也得到了很多行业的认可。但是数字人模型的建模复杂,成本高昂,视频生成的形象单一等问题却一直是行业内,特别是口播博主、短视频带货等应用不够全面的主要痛点。率先在行业内降低数字人建模和视频生成成本,将数字人进行全面普及的神马工场致力于这方面的研发,为了解决这个问题,第二代多模态数字人技术也准备就绪,即将准备投入市场。

近期有幸收到神马工场邀请,前往位于上海的市北高新产业园的神马工场总部探访,对第二代多模态数字人技术进行一个全方位的体验。

在进入神马工场总部前,我还提前做了功课,对神马工场数字人技术也做了一番了解,目前神马工场数字人采用的是自研矩阵训练算法,数字人的唇形与语音适配水平达到了行业前三,适配率更是到达了95%以上;将原本万元内的数字人建模费用直接给打到百元水平,做普通人用得起的数字人产品对神马工场来说绝非一句口号那么简单。所以这次来到总部也是满怀期待,在这里技术人员给我介绍第二代多模态数字人的特点。

首先,多重模式。目前主流的第 一代传统数字人建模是一人一个模型,每个模型的录制时间都需要在4-5分钟以上,而且录制过程中是一镜到底,录制后是不能有中间部分的剪辑处理,模特基本要保持从开始到结束基本一致的情感、语气和表现。简单的说,我如果是情感类博主,一个模型只能录制一种情感模式,比如开心,从头到尾必须表现出内容的一致性,不能出现悲伤表情的内容。否则后期数字人生成出来就会有明明是在讲欢乐的故事,数字人表现的却很悲伤的状态,这个明显就不合适了。神马工场多模态数字人很好的解决了这个问题,模特可以同时录制悲伤和开心两种或多种模式的素材,每种情感模式各录一段时间,就能在一个数字人模型中建立多种造型模式,生成的视频可以随意切换,这对于口播博主来说是非常必须的功能。

第二、造型多变。以往被带货主播抱怨的服饰单一的问题,现在也在神马工场多模态数字人系统中得到了升级。一个数字人以往只能用一种服饰妆容建模,同一人需要多个造型可能需要建立多个数字人模型,而且生成视频还需要反复用不同数字人来切换,费时费力。现在好了,神马工场第二代数字人模型可以在一个模型中植入多套服饰和妆容,生成视频时候可以任意切换服饰,简单加上转场特 效就能美好解决口播博主,乃至Vlog博主们最吐槽的一套衣服从头穿到尾的困扰,多变造型更适合短视频中场景的任意搭配。

第三、容错率高。做过数字人模型的朋友一定知道,数字人拍摄素材过程中是不能出现NG(笑场、穿帮)镜头的。传统数字人虽然可以一定范围内解决念错台词的问题,但是也是需要模特有一定表演和临场应变能力,这无疑增加了普通人完成数字人视频素材采集的难度。而第二代神马工场多模态数字人解决了这个困扰普通用户的问题,用户可以录制长时间视频,哪怕视频中出现一定的笑场、或是其他有问题的表情、语句,生成数字人模型后也可以通过多模态跳帧模式避免,让输出的数字人保持正常造型,避掉素材中有问题的部分影响数字人视频的生成,提高建模容错率,有效降低普通用户拍摄建模素材的难度。

第四、性价比高。传统数字人制作是一个造型一个模型,无法做到多造型用一个模型,神马工场第二代多模态数字人可以做到一个模型多个造型。如果以单模型多造型的方式来计算,建模成本足足降低了几倍。神马工场原来的价格已经是行业低价,第二代多模态数字人问世后,势必将数字人价格打到行业难望项背的低价,也让这项技术的普及成为可能,给更多需要数字人的用户提供更高性价比的解决方案。

通过本次实地探访神马工场数字人的过程中,深刻了解到以科技主导为理念的神马工场,对于数字人技术如何解决实际问题,解决用户痛点方面,在利用其自身技术优势上起到了关键作用。产品迭代是为了更好的为用户服务,相信神马工场本次多模态数字人的推出,不仅在行业保持了领先优势,更能促进数字人技术的更好发展。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 百度世界2025:罗永浩数字人同款慧播星高说服力技术向全球开放

    在今日盛大举行的百度世界大会上,百度公司宣布了一项重大举措——“罗永浩”同款慧播星高说服力数字人技术正式向全球开放。百度创始人李彦宏在大会上强调,数字人技术并非简单的应用工具,而是AI时代的一种基础性技术,甚至可能成为全新的通用交互界面,引领未来人机交互的新潮流。 据百度公布的数据显示,在今年双 11 购物节期间,慧播星数字人带货成绩斐然,

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 海尔智家数字化变革推动年累双第一

    海尔智家在2025年前三季度业绩超预期,实现线上线下市场份额双第一,并连续14年蝉联双11全网第一。这得益于其持续推进数字化战略转型,覆盖研发、制造、供应链、营销及服务全流程,提升效率与用户体验。通过AI科技打造多款爆品,如海尔麦浪冰箱、Leader洗衣机等,并在数字库存和服务上优化,实现商品直达用户、高效送装一体及全周期服务闭环,售前、售中、售后均获高满意度。这一成绩验证了用户导向和数字化战略的有效性。

  • 以数字引擎驱动未来——太平洋电信数字化平台E-com正式上线

    太平洋电信推出数字化服务平台E-com,通过模块化架构将复杂云网安方案拆解为标准化组件,实现可视化配置管理。该平台提供方案设计、在线采购、售后服务全流程支持,内置模板降低技术门槛,让企业用户可自主搭建专属方案。同时整合e-Go在线商城实现快速下单,推动行业从价格竞争转向服务价值竞争,构建开放服务生态。

  • “虹猫链盒”是假的!虹猫蓝兔官方发文打假数字藏品

    昨晚,虹猫蓝兔官方发布声明打假虹猫链盒”数字藏品。 虹猫蓝兔官方表示,近期有名为虹猫链盒”的平台在未获公司任何授权的情况下,擅自发售所谓公司IP数字藏品”,已导致部分粉丝受骗。 虹猫蓝兔官方声明称,虹猫链盒”平台及其数字藏品均与我司无关,并非官方授权产品,请广大粉丝切勿购买,避免财产损失。

  • 小鹅通扮演“技术合伙人”,助力创业者跨越数字化鸿沟

    当前众多拥有优质产品与服务的创业者在数字化转型中遭遇瓶颈,面临技术门槛高、运营经验缺、数据分散等共性难题。小鹅通以稳定灵活的一站式解决方案,帮助创业者突破地域限制、零技术基础搭建平台,并支持功能随业务同步升级。通过实际案例展示其如何助力教育、非遗、三农等领域实现线上转型,未来将持续迭代技术,陪伴创业者将创意转化为可持续的线上业务。

  • 荣耀Magic 8系列上新,火山引擎助力“YOYO助理”多模态升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,结合火山引擎与豆包大模型技术,支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景,提供图文、语音、视频等多种输入输出形式,实现秒级响应与沉浸式交互体验,成为用户“口袋里的万能管家”。

  • 数娱工场 | 手游收益榜前十过半来自中国!透视俄罗斯游戏市场淘金热

    俄罗斯Yandex公司推出移动应用增长平台Yandex Ads Boost,正式进入中国市场。该平台整合广告变现与数据分析功能,助力中国游戏开发者拓展俄罗斯等新兴市场。数据显示,2024年中国游戏对俄出口规模突破10亿美元,同比增长20%。俄罗斯游戏市场呈现高速增长态势,移动游戏下载量全球第五,营收达8.98亿美元。文章指出,中国游戏在俄面临语言文化、支付转化等挑战,但凭借文化

  • InBraket隐贝三大创新系统齐发布 引领舌侧数字化技术新突破

    2025年11月8日,广州启创医疗科技在长沙联合世界舌侧正畸协会(WSLO)举办活动,宣布三大创新系统同步上线:全球首款舌侧排牙软件完成收购并正式发布自研InVision设计软件;新一代智能双语病例系统优化诊疗流程;行业唯一专注舌侧的智能AI排牙系统实现从经验排牙到AI预见性排牙的范式转移。这些突破标志着舌侧正畸进入智能化新纪元,通过自动化生成托槽与弓丝、精准方案计算等功能,全面提升诊疗效率与精度,推动全球口腔医疗向高效、精准、协同方向发展。

  • 餐饮数字化转型标杆:睿食拓数智方案,助力兰湘子380+门店高效运营管理

    湘菜品牌兰湘子通过“小炒”“现炒现做”模式在正餐行业成功突围,六年扩张至380家门店。其高速发展依赖睿食拓提供的全链路数字化解决方案:前厅通过智能POS系统整合多渠道订单,小程序集成预点餐功能;后厨采用KDS系统实现无纸化操作与订单协同;总部借助数据驾驶舱实时监控全国门店运营。该方案精准破解效率、体验、管理三大核心难题,支撑品牌年均5000万用餐人次的高效运转,成为正餐业“数字化+烟火气”协同发展的标杆案例。

今日大家都在搜的词: