首页 > 业界 > 关键词  > Make-It-Vivid最新资讯  > 正文

Make-It-Vivid:通过文字描述生成3D卡通动画角色

2024-04-03 10:25 · 稿源:站长之家

划重点:

⭐️ 该项目致力于从文本指令自动生成卡通角色的纹理设计。

⭐️ 提出了 Make-It-Vivid 方法,通过 UV 空间中的文本生成高质量的纹理贴图。

⭐️ 实验表明该方法在纹理生成方面优于当前方法,可实现高效角色着色和信实的生成。

站长之家(ChinaZ.com)4月3日 消息:在创造生动的3D动画角色时,面临着这样的挑战,除了要满足特定领域的高要求比如角色需要有独特风格和丰富细节,还缺乏高质量的数据支撑。现有方法通常无法生成具有丰富细节,和过度自然的纹理,使得角色看起来不真实,不够生动。

image.png

因此,来自上海交通大学的海AI实验室和清华大学的研究团队,研究着眼于基于输入指令为卡通角色自动生成纹理设计。为了解决领域特定需求和高质量数据不足的挑战,他们提出了 “Make-It-Vivid” 方法,这是首次尝试从文本中在 UV 空间生成高质量纹理。

这个框架能够根据文本描述自动生成高质量的3D纹理。该方法通过使用视觉问答代理生成了详细的文本 - 纹理配对数据,为3D 角色准备了数据。然后,他们定制了一个预训练的文本到图像模型,以模板结构生成纹理地图,同时保留自然的2D 图像知识。此外,为了增强细粒度细节,他们提出了一种新颖的对抗学习方案,缩短了原始数据集与真实纹理领域之间的域差。

image.png

大量实验证明,他们的方法优于当前的纹理生成方法,实现了高效的角色纹理处理和根据提示生成忠实的结果。此外,他们展示了各种应用,如域外生成和纹理风格化。他们还提供了一个高效的生成系统,用于自动文本引导的纹理角色生成和动画。

这一方法接受一对数据作为输入,包括一个纹理地图、相应的文本描述 P 和网格模型 M。他们对预训练的文本到图像扩散模型的低秩适配器∆θ 进行微调,以生成高质量 UV 纹理。为了提高合成纹理的质量和感知保真度,他们引入了对抗训练来增强纹理细节。他们利用由 ControlNet 生成的渲染深度条件的合成可信图像作为指导,引导这种对抗性训练。

image.png

该项目的代码即将发布,项目入口:https://top.aibase.com/tool/make-it-vivid

举报

  • 相关推荐
  • 普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max,重塑智能清洁新高度

    普渡机器人于2025年8月20日发布3D感知AI扫地机器人PUDU MT1Max。该产品在MT1基础上大幅升级,搭载3D雷达与多传感器融合系统,显著增强复杂场景感知与避障能力。通过AI技术实现自适应清洁、垃圾识别、巡检清洁等功能,支持10万平方米以上大场景作业。具备自动振尘过滤和智能避雨机制,提升安全性与运维效率,重塑智能清洁行业新标准。

  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

  • 跨越四大洲的美丽探索:Vida Glow 十年创新,定义口服美容新范式

    Vida Glow是源自澳大利亚的口服美容品牌,2014年由Anna Lahey创立,以天然水解海洋胶原蛋白粉为核心产品。品牌通过法国专利水解技术提升吸收率,产品覆盖全球高端百货及医美机构,平均每4秒售出一罐,被誉为全球胶原蛋白领先品牌。目前产品线已扩展至日常护理、高级修护和女性健康系列,致力于以科技推动口服美容行业发展。

  • 飞腾D3000M笔电达成9秒开机新纪录!

    国产CPU电脑开机速度再创新纪录。搭载飞腾腾锐D3000M芯片的联想开天X1 Carbon笔记本,在银河麒麟V11操作系统上实现9秒开机+2秒唤醒的极致体验。通过软硬件协同优化,覆盖BIOS加载、电源管理等多个环节,大幅缩短启动时间。这标志着国产信创产品从“可用”迈向“好用”,展现出国产软硬件一体化协同能力与系统优化效率的新高度。

  • 史上最大Mate!华为智慧屏MateTV将于9月4日发布

    华为终端官方微博近日宣布,备受瞩目的首款华为智慧屏MateTV将于9月4日14:30正式亮相,这款被誉为“华为史上最大Mate”的新品,无疑将再次引领智慧屏领域的创新潮流。 早在8月20日,华为便举办了2025华为智慧屏MateTV新品技术发布会,提前揭秘了MateTV的多项创新技术,引发了业界和消费者的广泛关注。此次发布的MateTV,首次将手机端成熟的界面交互引入大屏场景,其“鸿蒙追

  • VT Markets独家分析:鲍威尔松口降息 市场将如何波动?

    美联储主席鲍威尔在杰克逊霍尔年会上释放降息信号,表示风险平衡变化可能调整货币政策立场。VT Markets分析认为,尽管劳动力市场和通胀数据推升降息预期,但市场仍存疑虑。关税对通胀影响尚未完全显现,进口商吸收成本上涨,转嫁消费者需更长时间。9月降息或成今年唯一窗口,非农与CPI数据成关键。市场展望:若数据支持降息,美元走弱、美债收益率下滑、美股上涨;反之则美元走强、美债殖利率上行、美股回调。建议关注黄金和加密货币走势。

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • 再次定义行业创新范式 跃然创新推出全球首款端到端 AI 玩具 CocoMate

    8月26日,跃然创新推出全球首款搭载端到端语音模型的AI玩具CocoMate系列。该产品采用可拆卸设计,配备3000mAh电池,支持4G和WiFi网络。依托端到端技术,具备丰富交互表现和拟人化情感能力,支持多重唤醒、主题游戏及聊天室等功能。新品将于8月27日开售,首发包含奥特曼及原创IP“泡泡”等角色,后续还将上线财神爷、塔罗猫等系列,目标人群从儿童延伸至成年人。

  • 同比增长17%!腾讯Q2研发投入202.5亿元 混元3D大模型接连突破

    腾讯控股今日发布了截至6月30日的2025年第二季度财报。营收为1845亿元,同比增长15%,经营利润(Non-IFRS)692.5亿元,同比增18%。 财报显示,当季腾讯研发投入达202.5亿元,同比增长17%;资本开支 191.1亿元,同比增幅达119%。在持续加码AI战略的推动下,AI技术带来的效益正在加速显现。 AI高投入背景下,腾讯通过数据增强与合成技术,提升了数据的质量与多样性,并通过更有效�

  • 杨幂上手华为Mate XTs非凡大师:改文件看文件像用电脑一样

    今天华为终端官方微博发布华为Mate XTs非凡大师预热宣传片。演员杨幂介绍,华为Mate XTs非凡大师改文件、看文件就像用电脑一样。 据悉,华为Mate XTs非凡大师将出厂搭载全新鸿蒙5,在生产力方面有多项升级,用户可以直接在折叠屏上运行WPS Office、剪映专业版、万兴脑图以及中望CAD等桌面级办公应用,获得接近PC端的办公感受。 鸿蒙5还有全新升级的小艺助手,全新分屏摘要�

今日大家都在搜的词: