首页 > 业界 > 关键词  > 数字人最新资讯  > 正文

阿里推文生3D数字人项目Make-A-Character 人人皆成3D角色设计师

2024-01-08 14:45 · 稿源:站长之家

站长之家(ChinaZ.com)1月8日 消息:阿里又推“黑科技”!这次瞄准了文生3D人。Make-A-Character支持一句话生成超逼真的3D数字人。只需要通过文字描述人的脸型、五官、发型等特征,它就能在不到2分钟的时间内生成一个超逼真的3D角色。

image.png

项目及演示:https://top.aibase.com/tool/make-a-character

论文地址:https://arxiv.org/pdf/2312.15430.pdf

代码:https://github.com/Human3DAIGC/Make-A-Character

试玩地址:https://www.modelscope.cn/studios/XR-3D/InstructDynamicAvatar/summary

而且你可以自定义面部特征,例如脸型、眼睛颜色、发型、眉毛类型、嘴巴和鼻子,以及添加皱纹和雀斑等。

Make-A-Character(MACH)的主要特点:

1、可控制性:用户可以详细自定义面部特征,例如脸型、眼睛颜色、发型、眉毛类型、嘴巴和鼻子,以及添加皱纹和雀斑等。

2、高度逼真:角色基于真实人类扫描数据集生成,发型为实际发丝而非网格,使用Unreal Engine的物理基础渲染(PBR)技术渲染,以实现高质量实时渲染效果。

3、完整模型:每个角色都是完整模型,包括眼睛、舌头、牙齿、全身和服装,无需额外建模即可立即使用。

4、可动画化:角色配备复杂的骨骼装置,支持标准动画,增强其逼真外观和多样化应用。

5、行业兼容:生成的3D角色可以无缝集成到现有的计算机图形(CG)工作流程中,特别是在游戏和电影行业中常用的工作流程。

MACH支持英文和中文提示,可根据详细的文本描述快速生成3D角色,例如“圆脸胖女士”或“棕皮肤戴黑眼镜的男孩,绿色头发”等等。

工作原理:

Make-A-Character(MACH)结合了大语言模型、视觉模型和3D生成技术。

1、文本解析:首先,MACH使用大语言模型(比如GPT类模型)来理解用户输入的文本描述。这个过程中,它会识别出文本中提到的各种面部特征,例如脸型、眼睛形状、嘴巴形状、发型和颜色等。

2、视觉映射:接着,这些语义属性(如脸型、眼睛形状等)被映射到对应的视觉线索上。这意味着系统会根据文本中的描述生成一个参考的人脸图像。这个步骤通常使用像“Stable Diffusion”这样的图像生成模型来完成。

3、2D面部解析:生成的参考图像接下来会经过2D面部解析过程,这一过程涉及到对人脸的不同部分进行识别和分割。

4、3D生成:基于面部解析的结果,MACH开始生成目标角色的3D网格和纹理。这个过程包括创建角色的3D模型,并且将纹理(如皮肤、头发等)应用到模型上。

5、附加配件:如果文本描述中提到了其他配件(如眼镜、帽子等),这些也会在这一步骤中添加到3D角色上。

6、参数化表示和动画:最终生成的3D角色是参数化的,这意味着可以容易地对其进行动画处理,比如添加行走、说话等动作。

通过这些步骤,MACH可以快速从简单的文本描述中生成逼真的、完整的、可动画化的3D角色,适用于各种娱乐和专业场景。

举报

  • 相关推荐
  • AI日报:可灵AI发布数字人新功能;腾讯混元新技术给大模型 “去油”;抖音上线AI求真功能

    AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。

  • 罗永浩下周将加播两场数字人直播 网友调侃:预制直播

    罗永浩数字人将于下周加播两场直播,这是其预制菜风波后首次工作消息。其数字人技术由百度自研,首秀观看量达1300万,GMV突破5500万元。有网友质疑数字人直播为"预录直播",并发现其微博IP地址从上海变为香港,引发猜测。罗永浩回应称去香港是出差。

  • 陕商贸:低代码赋能数字人才培养,探索产教融合新模式

    陕西国际商贸学院位于西安西咸新区,由步长制药集团投资创办,以医药为特色学科,构建多学科交叉融合的专业体系。学校在数字化转型中引入低代码技术,与葡萄城合作开展实践探索,包括组建考察团、共建创新工作室、开设实战课程等。通过低代码平台实现快速开发与灵活迭代,推动产教融合,培养数字化人才,提升学生就业竞争力,获得企业和学生的高度评价。

  • 腾讯云TencentOS Server AI发布,为千行百业打造安全可靠的国产化数字底座

    腾讯云在2025全球数字生态大会上推出国内独家“OS+AI”解决方案TencentOS Server AI,旨在打造安全可靠的企业级服务器Linux操作系统。该系统通过AI技术优化算力调度与资源管理,显著提升大语言模型推理性能,在智能客服场景中吞吐性能提升超100%。同时支持GPU虚拟化与资源隔离,已帮助客户节约60%硬件成本。目前已在金融、政务等行业规模化应用,成为国产操作系统标杆。

  • 易鑫亮相2025数字价值年会,自研AI大模型引领汽车金融智能化变革

    易鑫入选钛媒体“2025创新场景年度AI应用TOP榜”,是汽车金融科技领域唯一登榜企业。公司坚持自研大模型路线,依托11年行业数据积累,打造自主可控的AI风控与业务决策系统。其“智鑫多维”大模型成为行业首家获生成式AI备案企业,实现全场景规模化应用。业务覆盖4.2万家经销商及上百家金融机构,科技赋能服务内蒙古牧民、新加坡企业员工等群体。未来将持续深化自研大模型+全场景应用,强化普惠金融服务与国际技术输出。

  • 人单合一模式20周年:卡奥斯打造无边界的数字经济新生态

    第九届人单合一模式引领论坛暨第二届零距离卓越奖颁奖典礼在北京举行。论坛以“组织智能:构建AI时代的智能交互生态”为主题,汇聚全球前沿组织领导者,分享人单合一20年实践成果,探索AI时代组织发展新路径,推动智能交互生态构建。海尔卡奥斯通过大规模个性化定制模式,打造无边界生态,已链接90万家企业,覆盖20大行业,探索出五类新模式,成为“人单合一2.0”在数字产业领域的最佳实践。

  • 海尔空调数字技术进行焊点检测直通率提升22%

    空调焊接质量直接影响用户体验。传统检测依赖人工经验与抽检,难以全面识别细微缺陷。海尔空调通过数字化技术,研发出基于机器视觉的焊接自调优技术,实现焊接全流程系统化检测升级,缺陷识别更灵敏、检测覆盖率更高、响应速度更快。该系统在焊前、焊中、焊后各环节实现智能检测,大幅提升直通率,降低不良率,年检测成本降低96%,有效保障产品质量,延长空调使用寿命。

  • 倡导网络安全责任,塔澳通信携手中国电信共筑数字安全屏障

    9月16日,昆明举行网络安全与数字产业投资大会暨国际通信业务进出口局跨境产业合作大会。塔澳通信董事长江志岗受邀出席,与国内外千余家企业、高校及科研机构代表共商网络安全前沿技术,助力构建安全可信的数字环境。大会聚焦网络与数字产业,通过技术分享、政策发布等环节探讨行业痛点与创新方向。会上,昆明国际通信业务进出口局贯通互联项目启动,塔澳通信与中国电信签署战略合作协议,旨在提升国际通信业务的网络安全防护能力,共建“制度规范、技术可靠、协同高效”的安全保障体系。双方将联合优化跨境通信网络架构,共筑数字安全屏障,为数字产业高质量发展护航。

  • 海尔智家启动海外客服数字化培训计划

    随着科技发展,中国家电行业智能客服体系持续升级,数字化培训成为提升服务效能的重要支撑。然而,海外市场仍依赖传统线下培训模式,面临知识更新滞后、标准不统一、服务响应慢等痛点,与国内形成明显差距。为打破全球服务壁垒,海尔客服在印度尼西亚启动全球客服数字化培训计划,通过标准化、平台化、数据化手段,实现课程、学习、数据一体化管理,显著提升海外服务响应速度与品质。未来将持续加快全球布局,强化协同服务能力,提升用户满意度。

  • 华为2025天生会画数字创作大赛正式启动

    2025年华为“天生会画”数字创作大赛于9月19日开启投稿。本届大赛以“人人都是艺术家”为理念,依托华为平板硬件与软件生态,致力于降低数字艺术创作门槛。新增逐帧动画组别,并专设少儿赛道“未来之星”奖。投稿截止至12月31日,获奖作品将获得全球展示机会。大赛邀请跨领域权威评委,鼓励全年龄段创作者参与,通过科技赋能释放艺术潜能。

今日大家都在搜的词: