首页 > 业界 > 关键词  > 数字人最新资讯  > 正文

阿里推文生3D数字人项目Make-A-Character 人人皆成3D角色设计师

2024-01-08 14:45 · 稿源:站长之家

站长之家(ChinaZ.com)1月8日 消息:阿里又推“黑科技”!这次瞄准了文生3D人。Make-A-Character支持一句话生成超逼真的3D数字人。只需要通过文字描述人的脸型、五官、发型等特征,它就能在不到2分钟的时间内生成一个超逼真的3D角色。

image.png

项目及演示:https://top.aibase.com/tool/make-a-character

论文地址:https://arxiv.org/pdf/2312.15430.pdf

代码:https://github.com/Human3DAIGC/Make-A-Character

试玩地址:https://www.modelscope.cn/studios/XR-3D/InstructDynamicAvatar/summary

而且你可以自定义面部特征,例如脸型、眼睛颜色、发型、眉毛类型、嘴巴和鼻子,以及添加皱纹和雀斑等。

Make-A-Character(MACH)的主要特点:

1、可控制性:用户可以详细自定义面部特征,例如脸型、眼睛颜色、发型、眉毛类型、嘴巴和鼻子,以及添加皱纹和雀斑等。

2、高度逼真:角色基于真实人类扫描数据集生成,发型为实际发丝而非网格,使用Unreal Engine的物理基础渲染(PBR)技术渲染,以实现高质量实时渲染效果。

3、完整模型:每个角色都是完整模型,包括眼睛、舌头、牙齿、全身和服装,无需额外建模即可立即使用。

4、可动画化:角色配备复杂的骨骼装置,支持标准动画,增强其逼真外观和多样化应用。

5、行业兼容:生成的3D角色可以无缝集成到现有的计算机图形(CG)工作流程中,特别是在游戏和电影行业中常用的工作流程。

MACH支持英文和中文提示,可根据详细的文本描述快速生成3D角色,例如“圆脸胖女士”或“棕皮肤戴黑眼镜的男孩,绿色头发”等等。

工作原理:

Make-A-Character(MACH)结合了大语言模型、视觉模型和3D生成技术。

1、文本解析:首先,MACH使用大语言模型(比如GPT类模型)来理解用户输入的文本描述。这个过程中,它会识别出文本中提到的各种面部特征,例如脸型、眼睛形状、嘴巴形状、发型和颜色等。

2、视觉映射:接着,这些语义属性(如脸型、眼睛形状等)被映射到对应的视觉线索上。这意味着系统会根据文本中的描述生成一个参考的人脸图像。这个步骤通常使用像“Stable Diffusion”这样的图像生成模型来完成。

3、2D面部解析:生成的参考图像接下来会经过2D面部解析过程,这一过程涉及到对人脸的不同部分进行识别和分割。

4、3D生成:基于面部解析的结果,MACH开始生成目标角色的3D网格和纹理。这个过程包括创建角色的3D模型,并且将纹理(如皮肤、头发等)应用到模型上。

5、附加配件:如果文本描述中提到了其他配件(如眼镜、帽子等),这些也会在这一步骤中添加到3D角色上。

6、参数化表示和动画:最终生成的3D角色是参数化的,这意味着可以容易地对其进行动画处理,比如添加行走、说话等动作。

通过这些步骤,MACH可以快速从简单的文本描述中生成逼真的、完整的、可动画化的3D角色,适用于各种娱乐和专业场景。

举报

  • 相关推荐
  • 数字人是一场AI的具象化革命

    去年由百度慧播星提供技术支持的罗永浩的数字人带货直播让人印象深刻。 这不仅因为他幽默生动,偶尔会作出推眼镜的动作,甚至能做出接过样品的互动,更因为他能在观众抛出问题时,像罗永浩本人一样抖出调侃式包袱。观众们第一次发现数字人开始有「灵魂」了。 到了今年,数字人已经走出直播间,开始参与带货视频、广告片的创作。 百度创始人李彦宏在Create2026百�

  • 获国家发明专利授权!淘车车自研AI定价数字人重构二手车定价体系

    近日,国内专业二手车交易平台淘车车宣布,其基于深度学习的二手车价格评估模型训练方法及装置获得国家知识产权局发明专利授权。该AI定价模型针对行业“一车一况”非标属性带来的主观偏差大、运营效率低、市场适配性弱等痛点,无需人工干预即可全流程自主定价,精度对标中高级评估师水平。该技术已在业务中落地为“定价数字人”,覆盖采购与销售环节,实现标准化、规模化定价。淘车车母公司Yusheng Holdings Limited已递交招股书,拟赴港上市。未来,淘车车将持续深化AI与交易场景融合,推动行业标准化、透明化发展。

  • 百度一镜升级全场景数字人平台:沙利文认证双料冠军,服务10万+商家

    2026年百度AI开发者大会上,百度宣布数字人品牌“慧播星”升级为“百度一镜”,推出全球首个全场景多智能体数字人平台,涵盖直播、视频和实时互动三大场景,并发布海外版。百度一镜依托文心大模型,实现规模化应用,直播转化率提升29%、成本下降63.3%,视频产量提升95%,实时互动响应时间小于2秒。海外版支持12种语言,覆盖TikTok等平台,助力商家全球化,推动内容生产从“团队作业”走向“一人成团”。

  • 工匠行AI智能轮椅亮相数字中国峰会,“无感健康检测”成展区亮点

    第九届数字中国建设峰会上,一款AI智能轮椅在贵州展厅单独展示,吸引众多参会者体验。该产品以“康、养、行、伴、护、预、培”七字方针为核心,将AI大模型融入银发康养场景,实现15秒无感健康检测,同步生成报告。它整合了健康管理、智能出行、语音陪伴、安全守护等功能,并积极对接国家补贴政策,以普惠价格让更多家庭享受智慧康养服务,推动科技惠老落地。

  • 祛痘行业信任重建:数字化能否成为那把钥匙?

    生活美容行业最大痛点是信息不对称,消费者进店前不了解自身皮肤状态,服务中不知价格,离店后效果无保障。悟空祛痘通过数字化体系破解困局:AI智能测肤替代主观判断,统一电子签章锁定服务项目与价格,全程数字档案留痕确保可追溯。这套系统以数据替代话术、以合同替代承诺、以系统约束替代门店自律,让消费决策从主观转向客观。虽然数字化有明确边界,不越医疗雷池,但证明了当信息透明时,消费者安全感会随之提升。

  • 深度对话思迅商旗系统负责人:连锁超市数字化的底层

    思迅商旗定位为“连锁超市数字化经营中枢”,专注服务从单店向多店扩张的连锁超市。其核心价值在于破解多店管控、生鲜损耗、数据安全等痛点:支持断网收银保障稳定,模块化设计实现功能按需适配,实时数据同步与分级权限强化总部管控,AI私有化部署保障数据安全。2026年升级聚焦报表分析深化、商品管理灵活化、促销精细管控、会员体系完善及采购库存优化。选型�

  • 秉持算网原生路线,移动云为数字化提供坚实支撑能力

    数字经济加速发展,云原生技术成为企业提升竞争力的关键。移动云提出“算网原生”理念,通过容器化、微服务、DevOps等技术,打造全栈云原生服务体系,解决多云环境下的资源孤岛、网络互通等挑战。其容器服务CNP版实现跨域统一管理,云原生数据库如大云海山大幅提升性能,并满足信创安全需求。云原生应用安全服务覆盖全生命周期,提供事前预防、事中防控、事后隔离能力。移动云持续深化云原生技术,推动行业数字化转型。

  • 为企业出海构建AI驱动的“云、网、安”一体化的数字基座‌解决方案

    跨国集团面临全球数据安全法规差异、海量数据积累等挑战,需构建完善体系。太平洋电信总监陈明友指出,全球化数字化实践需应对技术兼容性、治理合规性、文化差异性和人才稀缺性四大挑战。成功数字底座应遵循AI驱动、云网安一体化原则,通过异构多云、智能网络、融合安全等思路,实现可靠性提升至99.99%、运维效率增超50%、成本降30%以上,并有效应对全球数据安全法规。

  • 巴西文化部长访问快手:深化中巴数字创意与技术应用合作

    近日,巴西文化部长玛格丽特·梅内塞斯与驻华大使高望率团访问快手北京总部,双方就中巴文化年框架下的数字内容、生成式AI及创意经济合作达成多项共识。快手海外版Kwai在巴西拥有超6000万月活用户,已投入超70亿雷亚尔,计划今年本地生产超200部短剧。双方将在音乐、影视、美食等领域深化合作,推动文化互鉴。巴西部长强调快手是重要数字普惠平台,未来将借助AI技术赋能青年创作,拓展中巴文化共创新空间。

  • AI仿真人不如AI仿超市

    我真没空管你们这些水果蔬菜、厨房用品、酒水饮料的事了。 谁也没想到,在经历了邪恶猫狗的叙事浪潮后,AI短片的新风口是火车上的小推车——啤酒饮料矿泉水,花生瓜子八宝粥,前面的乘客把腿收一收!

今日大家都在搜的词: