Make-It-Vivid：通过文字描述生成3D卡通动画角色

2024-04-03 10:25 · 稿源：站长之家

划重点:
⭐️ 该项目致力于从文本指令自动生成卡通角色的纹理设计。
⭐️ 提出了 Make-It-Vivid 方法，通过 UV 空间中的文本生成高质量的纹理贴图。
⭐️ 实验表明该方法在纹理生成方面优于当前方法，可实现高效角色着色和信实的生成。

站长之家（ChinaZ.com）4月3日消息:在创造生动的3D动画角色时，面临着这样的挑战，除了要满足特定领域的高要求比如角色需要有独特风格和丰富细节，还缺乏高质量的数据支撑。现有方法通常无法生成具有丰富细节，和过度自然的纹理，使得角色看起来不真实，不够生动。

因此，来自上海交通大学的海AI实验室和清华大学的研究团队，研究着眼于基于输入指令为卡通角色自动生成纹理设计。为了解决领域特定需求和高质量数据不足的挑战，他们提出了 “Make-It-Vivid” 方法，这是首次尝试从文本中在 UV 空间生成高质量纹理。

这个框架能够根据文本描述自动生成高质量的3D纹理。该方法通过使用视觉问答代理生成了详细的文本 - 纹理配对数据，为3D 角色准备了数据。然后，他们定制了一个预训练的文本到图像模型，以模板结构生成纹理地图，同时保留自然的2D 图像知识。此外，为了增强细粒度细节，他们提出了一种新颖的对抗学习方案，缩短了原始数据集与真实纹理领域之间的域差。

大量实验证明，他们的方法优于当前的纹理生成方法，实现了高效的角色纹理处理和根据提示生成忠实的结果。此外，他们展示了各种应用，如域外生成和纹理风格化。他们还提供了一个高效的生成系统，用于自动文本引导的纹理角色生成和动画。

这一方法接受一对数据作为输入，包括一个纹理地图、相应的文本描述 P 和网格模型 M。他们对预训练的文本到图像扩散模型的低秩适配器∆θ 进行微调，以生成高质量 UV 纹理。为了提高合成纹理的质量和感知保真度，他们引入了对抗训练来增强纹理细节。他们利用由 ControlNet 生成的渲染深度条件的合成可信图像作为指导，引导这种对抗性训练。

该项目的代码即将发布，项目入口:https://top.aibase.com/tool/make-it-vivid

（举报）

相关推荐

关键词：

菁彩Vivid搭载车量超百万，携手车企迎来车载应用新里程碑！

2025年11月5日，世界超高清视频产业联盟在深圳举办UWA+峰会，宣布中国自主三维音频标准“菁彩声”（Audio Vivid）车载应用装机量突破100万台。该标准基于AI技术，支持7阶HOA渲染与128轨实时处理，解码延迟低于80ms，实现三维空间精准定位与“黄金听音位”个性化体验。已覆盖鸿蒙智行、奇瑞等十余家车企29款车型，获IEC国际标准认证，与Dolby AC-4等并列全球四大三维音频标准。通过构建“标准-内容-终端”生态，推动中国音频产业从技术领先迈向市场引领。

菁彩声 Audio Vivid
Mate史上第一次！华为Mate 80全系支持3D人脸识别

据数码博主爆料，华为Mate 80系列有望全系标配3D人脸识别，采用国产方案，核心组件均来自国内顶级供应商。该系列将提供四款机型，搭载全新鸿蒙6系统并首发麒麟9030芯片，成为华为史上最强Mate旗舰，最快或于11月亮相。

华为Mate 80 3D人脸识别
华为官方文档确认：Mate 80全系支持3D人脸

华为Mate80系列预计11月发布，含标准版、Pro版及RS大师版四款。官方文档显示全系支持3D人脸识别，但标准版配置待确认。后摄模组采用居中圆形设计，搭载首发的麒麟9030芯片及鸿蒙OS 6系统，性能将提升。顶配RS版配备6.9英寸双层OLED屏，亮度更高功耗更低，并可能支持eSIM功能。

HarmonyOS 华为Mate80 3D人脸识别
65元一个的「卡通煎饼」为何被年轻人抢疯了？

一份卡通煎饼竟然卖到65元? 更离谱的是要排队4-5个小时才能买到，还是限量的。海绵宝宝、玲娜贝儿、Labubu等可爱的卡通煎饼出现在成都抚琴的夜市上，这个普通的煎饼摊前被年轻人围得水泄不通，成了“网红打卡地”。当煎饼到手后，许多年轻人却舍不得吃，像捧着珍宝一样的小心翼翼拍照。社交平台上，卡通煎饼从传统的街头小吃爆火变身成“顶流”，引发了网友们

卡通煎饼网红打卡新消费
京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

京东在双11期间升级直播技术，推出“立体3D技术”和“JoyAI大模型”等创新。立体3D技术实现裸眼360度商品展示，用户无需额外设备即可旋转查看产品细节；JoyAI生成虚拟偶像Aura，与真人明星跨次元互动，提升趣味性。AI工具还简化直播运营，支持智能脚本和选品。这些技术打破传统直播边界，增强沉浸感和互动效率，引领电商直播创新方向。

京东11.11 立影3D技术 JoyAI大模型
最强Mate旗舰！华为Mate 80本月下旬亮相

华为Mate 80系列会在11月25日前后发布，这将是史上最强Mate旗舰。据悉，本次发布会将会推出Mate 80、Mate 80 Pro、Mate 80 Pro 和Mate 80 RS四款旗舰，其中标准版代号Voyager，支持66W有线快充；Pro、Pro 及RS版统一采用Sagittarius代号，支持100W有线充电。

华为Mate 80 麒麟9030芯片
AI生万物，移往无前 | 第12届TMA大奖终审会成功举办

11月1日，第12届TMA大奖终审会在云南玉溪成功举办。本届赛事聚焦移动营销与AI创新，新增数智营销、AI创新等赛道，细分短剧营销、节日/事件营销等类别。60余位行业专家评审入围案例，最终获奖结果将于12月19日盛典揭晓。活动搭建了行业交流平台，推动营销与AI技术融合发展。

TMA大奖 AI 移动营销
菁彩Vivid影院技术新标准发布，国产自研影音技术再升级

在高质量观影与产业发展需求驱动下，中国电影科研所联合行业机构研发"菁彩影院技术"，制定LED影院图像发行母版与音频处理器两项技术标准。该技术融合自主创新的菁彩Vivid技术与国际标准，实现高亮度、高动态范围等优质画面效果，支持沉浸式音频处理。目前全国已部署约180块LED电影屏，相关影片正式上映，标志着我国在高格式电影技术领域取得突破，为国产技术国际化提供支撑。

电影放映技术高格式电影沉浸式音频
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech
千元卧室投影推荐：实测大眼橙C3D画质/性能/体验都能打

大眼橙C3D投影仪专为卧室场景设计，小巧机身节省空间，支持自动对焦和梯形校正，操作便捷。配备一体化云台，可360°旋转调节角度，轻松适配不同观影姿势。画质表现优秀，1080P分辨率兼容4K解码，850CVIA亮度确保开灯环境下画面清晰，MEMC运动补偿避免拖影。内置低噪音设计和卧室模式，兼顾安静与舒适观影体验，结合腾讯视频AI语音助手，实现智能操控。整体精准契合卧室娱乐需求，提升幸福感。

双11购物清单提升卧室幸福感卧室投影仪

今日大家都在搜的词：

热文

3 天
7天

Make-It-Vivid：通过文字描述生成3D卡通动画角色

菁彩Vivid搭载车量超百万，携手车企迎来车载应用新里程碑！

Mate史上第一次！华为Mate 80全系支持3D人脸识别

华为官方文档确认：Mate 80全系支持3D人脸

65元一个的「卡通煎饼」为何被年轻人抢疯了？

京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

最强Mate旗舰！华为Mate 80本月下旬亮相

AI生万物，移往无前 | 第12届TMA大奖终审会成功举办

菁彩Vivid影院技术新标准发布，国产自研影音技术再升级

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

千元卧室投影推荐：实测大眼橙C3D画质/性能/体验都能打

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

何小鹏回应机器人IRON里是真人质疑：感谢认可

站长商机