首页 > 业界 > 关键词  > 3D头像最新资讯  > 正文

研究人员利用AI从文字生成3D头像 实现虚拟试衣和形状编辑

2023-09-15 10:05 · 稿源:站长之家

站长之家(ChinaZ.com)9月15日 消息:近日,研究人员公布了两项利用人工智能从文字生成三维头像的新研究成果,实现了虚拟试衣和头像形状编辑等应用。这些成果来自德国马普所等机构的研究人员,发表在 arXiv 上。

第一项研究提出了名为 DELTA 的方法,可以创建具有独立身体和衣服/头发层的三维头像。研究人员使用不同的三维表示方法分别对身体和衣服/头发进行建模,从单眼 RGB 视频中即可创建头像。这种分解方式实现了虚拟试衣和形状编辑等应用,衣服和头发可以在不同体型之间轻松转换。

QQ截图20230915100910.jpg

第二项研究利用稳定扩散和 DELTA 混合三维表示,提出了名为 TECA 的文字到头像方法。该方法可仅从文字描述生成高质量头像,并实现强大的属性编辑。系统首先用稳定扩散生成面部图像作为参考,然后依次添加头发、衣服等要素。研究人员表示,该方法生成的合成头像质量显著提高,属性转移实现了强大的编辑能力。

这两项研究为数字人生成提供了新的思路。利用人工智能算法解构数字人不同组成部分,不仅能创造逼真的三维虚拟形象,还支持线上虚拟试装等应用,对时装电商、社交平台和元宇宙都将产生深远影响。

举报

  • 相关推荐
  • Auctoria利用生成AI创建3D视频游戏模型

    波兰虚拟现实游戏开发公司CarbonStudio的联合创始人AleksanderCaban多年前观察到现代游戏设计中存在一个重要问题:手动创建视频游戏环境中的基本元素,如岩石、山丘、路径等,通常是耗时且繁琐的过程。为了解决这个问题,Caban决定开发技术来自动化这个过程。我们的团队两年前开始开发这个工具,使我们能够拥有一个可供使用的产品。

  • AI研究人员发现了主要大语言模型中关键漏洞 可低成本复制

    大型语言模型如ChatGPT和Bard在全球范围内引起了广泛的关注,众多公司投资数百万美元用于开发这些人工智能工具一些领先的AI聊天机器人的估值已达到了数十亿美元。这些LLM主要被应用于AI聊天机器人,它们通过整合互联网上的大量信息来学习和为用户提供请求的答案,这些请求通常被称为“提示”。”这项研究为我们提醒了虽然AI技术带来了巨大的机会,但也伴随着一系列潜在的威胁,因此必须谨慎行事。

  • 研究人员称,即使是最糟糕Claude AI版本也比GPT 3.5更好

    10月6日,一场引人入胜的竞争正在AI行业内悄然展开,OpenAI的ChatGPT与Anthropic的ClaudeAI模型之间展开了激烈的角逐。负责创建ChatbotArena和著名的Vicuna模型的大型模型系统组织刚刚更新了他们的ChatbotArena排行榜,展示了每个AI聊天机器人与竞争对手相比的表现。由于Claude模型在排名上超越了GPT-3.5,企业和个人用户可能会发现自己在评估哪个模型最符合其需求时面临抉择。

  • 研究人员发现使用少见语言即可绕过GPT-4的限制

    布朗大学的计算机科学研究人员发现了OpenAI的GPT-4存在的安全性问题。通过使用不常见的语言,如祖鲁语和盖尔语,他们成功绕过了GPT-4的限制性设置。尽管他们意识到这一研究可能会给网络犯罪分子提供想法,但他们仍然认为将这一漏洞公之于众是必要的,因为利用现有的翻译API轻松实施这些攻击,因此那些试图绕过安全防护的恶意行为者最终会发现这一漏洞。

  • 好莱坞演员继续罢工 抗议AI3D扫描技术

    好莱坞演员继续罢工,对抗AI技术的增长和使用,并声援“NOFAKESACT”法案。好莱坞编剧罢工已经结束,并获得了对剧本中的AI保护措施,但对于演员来说,情况却并不乐观。包括MoveAI在内的初创公司正在开发可以使用单部智能手机的AI驱动的3D运动捕捉技术,这将大大降低成本和所需资源。

  • POCO:用于3D人体姿势和形状估计的新型人工智能框架

    人体姿态和形状的三维估计是重建现实世界中的人体行为所必需的。从二维图像进行三维推断面临深度模糊、遮挡、不寻常的服装和运动模糊等挑战。如果您对此感兴趣,不妨查看相关链接以了解更多详情。

  • 创新型生成模型CityDreamer:一键生成无边界的3D城市

    关于3D自然场景生成的研究已经很多,但对于3D城市生成的研究相对较少。这是因为在城市环境中,人们对结构扭曲更加敏感生成3D城市比生成3D自然场景更为复杂。这一技术的应用前景非常广阔,将在游戏、城市规划、虚拟现实等领域发挥关键作用。

  • 3D视角洞悉矩阵乘法,这就是AI思考的样子

    如果能以3D方式展示矩阵乘法的执行过程,当年学习矩阵乘法时也就不会那么吃力了。矩阵乘法已经成为机器学习模型的构建模块,是各种强大AI技术的基础,了解其执行方式必然有助于我们更深入地理解这个AI以及这个日趋智能化的世界。下面的可视化显示了一个注意力头,其权重张量wQ、wK_t、wV、wO被低秩分解wQ_A@wQ_B等替换。

  • AI 生成的唯美头像也太好看了吧!附好说 AI 一秒出图技巧

    在注重线上社交的当下,拥有不一样的头像是提高个人辨识度的好方法。比起网上找图和人“撞头像”,如今免费的AI生图或许是更多人的“最优解”。实践才是最好的老师,欢迎大家使用好说AI的“氛围感头像”指令:先通过“一键生成”体验AI的神奇和便利,再来多多尝试DIY提示词,相信你也会Get到AI画图的乐趣。

  • MonoXiver:新AI算法将2D照片转换为3D地图

    MonoXiver是北卡罗莱纳州立大学刘贤鹏团队开发的一种利用AI从二维图片中提取三维信息的方法。它只需要一个普通的单目摄像头,就可以构建相机周围可靠的三维地图。除自动驾驶外,这种AI方法也可应用于其他领域,如机器人、环境监测、医学成像等。