一张图生成3D模型！PartCrafter颠覆建模流程，北大+字节+CMU联手打造

2025-06-12 10:57 · 来源： AIbase基地

3D建模技术迎来重大革新!由北京大学、字节跳动和卡内基梅隆大学联合研发的PartCrafter项目正式亮相，凭借单张RGB图像即可生成高精度、结构化的3D模型，彻底颠覆传统“先分割再重建”的复杂流程。这一技术不仅提升了生成效率，还能推断不可见结构的3D几何，展现了AI在3D生成领域的巨大潜力。AIbase编辑团队整理了最新信息，为您深度解析PartCrafter的创新与影响。

PartCrafter:从单张图像到结构化3D模型

PartCrafter是一款开创性的结构化3D生成模型，能够从单张RGB图像直接生成包含多个语义部件的3D模型，实现了端到端生成。与传统方法需要先对图像进行分割再逐一重建不同，PartCrafter采用统一的生成架构，无需预分割输入即可一步生成完整的3D场景。这一特性使其在处理单一物体和复杂多物体场景时均表现出色。

AIbase了解到，PartCrafter的核心创新包括组合式潜在空间和层次化注意力机制。组合式潜在空间通过为每个3D部件分配独立的潜在token集合，确保部件间的语义清晰性和编辑灵活性。层次化注意力机制则同时处理部件内部和部件间的信息流，保证生成的3D模型在局部细节和全局一致性上的高度协调。

“透视”能力:推断不可见结构

PartCrafter最令人惊叹的功能之一是其“透视”能力。即使输入图像中某些部件被遮挡，模型依然能够通过强大的生成先验，推断并生成完整的3D几何结构。这种能力得益于其基于预训练的3D网格扩散Transformer（DiT），该模型继承了大规模3D数据集的生成能力，并通过创新的架构设计进一步优化。AIbase测试显示，PartCrafter不仅能生成高质量的3D网格，还能在不可见部件的重建上超越现有方法，展现了结构化生成先验在3D理解中的独特优势。

技术突破:超越传统两阶段方法

传统3D生成方法通常采用两阶段流程，先对图像进行语义分割，再逐一重建部件，效率低且易受分割错误影响。PartCrafter通过统一生成架构，消除了对预分割的依赖，同时在生成质量和计算效率上实现双重突破。AIbase了解到，PartCrafter能在约40秒内完成从单张图像到结构化3D模型的生成，效率远超传统方法。

实验结果显示，PartCrafter在结构化3D生成任务上达到**SOTA（State-of-the-Art）**效果，甚至在物体重建保真度上超越了其底层的3D生成模型。这一成果表明，理解物体的组合结构能够显著提升3D生成的整体质量，为未来3D建模提供了新思路。

数据集创新:整合大规模3D资源

为支持部件级生成，PartCrafter团队精心构建了一个包含13万个3D对象的大型数据集，其中10万个对象具备多部件标注。这些数据整合了Objaverse、ShapeNet、ABO等知名3D资源库，通过挖掘部件级标注，为模型训练提供了丰富的监督信息。AIbase认为，这一数据集的开放将为3D生成领域的研究提供宝贵资源，助力更多团队探索结构化建模的潜力。

行业影响:重塑3D内容创作生态

PartCrafter的发布标志着3D建模技术进入了一个新阶段。其端到端的生成能力和对复杂场景的处理能力，使其在游戏开发、虚拟现实、工业设计和数字孪生等领域具有广泛应用前景。AIbase观察到，PartCrafter不仅能生成可分解的3D网格，还支持灵活的部件编辑，为创作者提供了更高的自由度。

社交媒体上，开发者对PartCrafter的创新性反响热烈，认为其“简单而有效”的设计理念重新定义了3D生成的范式。项目团队表示，代码、预训练模型和Hugging Face演示版本即将发布，届时将进一步降低技术门槛，赋能全球开发者。

未来展望:3D建模的智能化时代

PartCrafter的出现不仅是技术上的突破，也是对3D内容创作生态的深远赋能。AIbase预测，随着PartCrafter的开源和进一步优化，3D建模将变得更加智能化和普及化。未来，这一技术可能扩展到实时3D生成、动态场景建模甚至多模态输入，为元宇宙、机器人视觉和智能制造等领域带来更多可能性。

相关推荐

一张图表看懂中国冰箱的世界地位

GfK中怡康数据显示，2025年上半年，中国冰箱市场稳健上行。线下市场零售额规模达到99.3亿元，同比增长7.4%;零售量规模约为139.2万台，同比增长3.7%。市场格局方面，TOP3品牌地位稳固，海尔系、海信系、美的系分别以46.4%、16.4%、15.5%的份额占据市场前三，截至7月，海尔系份额进一步涨至47%。那么，在世界冰箱业版图中，中国品牌的表现又如何呢?根据世界权威机构欧睿国际最新�

冰箱市场零售额品牌份额
荐AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

本文介绍了AI领域最新动态：1)腾讯开源Hunyuan-GameCraft框架，可快速生成高质量游戏视频；2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext；3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型；4)Kimi将推出PPT生成功能；5)阿里1688将上线"诚信通AI版"会员服务；6)苹果智能家居中心推迟至2026年发布；7)万兴科技接入GPT-5；8)全球AI独角兽达498家，总估值2.7万亿美元；9)谷歌为Slides和

AI 游戏视频生成腾讯混元
昇腾赋能三维生成新突破！浙大团队实现跨模态可控3D CAD建模

浙江大学与魔芯科技团队合作，基于昇腾平台NPU开发了首个三维模型生成算法Img2CAD。该技术突破性地将草图、图片等多模态输入通过Transformer结构高效转化为三维几何信息，无需可微渲染器，完整在NPU上实现训练和推理。研究成果可生成高精度3D模型，直接导入CAD软件编辑，已应用于3D打印、数字制造等领域。项目完成3篇论文，包括1篇中科院1区期刊和2篇CCF-A类会议论文，部分成果实现商业化落地。该技术标志着智能三维内容创作进入"低门槛、高效率、高质量"新阶段，未来将为工业设计、AR/VR等行业提供创新动能。

三维内容创作虚拟现实技术元宇宙发展
荐昆仑万维UniPic 2.0“小钢炮”模型炸场，一个模型搞定理解+生成+编辑

大模型又迎来新一波的迭代周期。近日，从Open AI发布GPT-5，到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周，连续5天每天发布一个新模型，而8月13日发布的，正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是，在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

大模型多模态 AI生图
普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max，重塑智能清洁新高度

普渡机器人于2025年8月20日发布3D感知AI扫地机器人PUDU MT1Max。该产品在MT1基础上大幅升级，搭载3D雷达与多传感器融合系统，显著增强复杂场景感知与避障能力。通过AI技术实现自适应清洁、垃圾识别、巡检清洁等功能，支持10万平方米以上大场景作业。具备自动振尘过滤和智能避雨机制，提升安全性与运维效率，重塑智能清洁行业新标准。

3D感知AI 扫地机器人智能清洁
微软发布AI截图工具，截图一键转PPT

微软电脑管家推出全新“智能圈选”功能，通过AI技术实现截图内容的智能识别与重构。用户只需圈选截图区域，即可一键完成文字提取、多语言翻译及PPT转换等操作，大幅提升办公和学习效率。该功能支持100多种语言，保留原始格式，并能智能修复遮挡内容，彻底改变了传统截图处理方式。

微软电脑管家智能圈选截图处理
Matrixport 旗下 Cactus Custody 与 OnChain 合作，完成招银国际美元货币市场基金化上链

新加坡Matrixport旗下合规数字资产托管商Cactus Custody与OnChain合作，将招商国际美元货币市场基金以化形式上链运营，成为全球首只港新互认基金上链案例。该合作解决市场缺乏可审计、可托管的现金类资产等痛点，通过链上净值计算、白名单管理等机制，为机构与合格投资者提供透明、合规的链上投资选项。未来双方将持续深化合作，推动RWA标准化发展。

数字资产托管 RWA上链港新互认基金
孩子脱鞋138cm补票后家长投诉退票儿童票标准引热议

8月18日，上海一女子带孩子游玩时因身高标准与游乐园产生纠纷。孩子脱鞋后身高138cm，符合1.1-1.4米儿童票标准，但穿鞋测量141cm被要求补差价。经投诉后园方退款。事件引发对儿童票仅以身高为标准的讨论，专家指出随着儿童身高普遍增长，该标准已不科学。部分景区仍简单以身高判定优惠资格，既缺乏人性化服务，也导致超高儿童无法享受优惠、身高不足成人能否优惠的两难问题。建议景区应综合考虑年龄等多元标准。

儿童票标准身高争议游乐园纠纷
WEEX亮相0xConnect线下活动，深化全球化布局与行业伙伴交流

WEEX交易所受邀出席圣彼得堡0xConnect线下活动，与全球加密品牌共同探讨行业趋势并拓展合作机会。该活动聚集了来自交易所、公链项目、钱包及投资机构的代表，通过面对面交流碰撞出新的合作火花。WEEX团队借此机会向与会者介绍了平台在合规建设、资金安全和用户体验方面的价值理念，展示了打造安全透明交易环境的品牌承诺。未来WEEX将继续参与全球行业活动，以开放姿态推动加密生态健康发展。

文章搜索核心标签行业交流
荐Anthropic天价赔款？大模型“盗版”的100000种花样

AI大模型的秘密配方是什么?答案可能很简单:海量的“盗版内容”。这几乎是行业内公开的秘密。2023年，《纽约时报》一纸诉状将OpenAI和微软告上法庭，正式拉开了这场战争的序幕。很快，战火烧遍了整个硅谷。Meta因其Llama模型涉嫌使用盗版书籍而面临集体诉讼;Anthropic同样因其模型Claude的训练数据而被告，一时间，几乎所有头部玩家都被推上了被告席。这场大模型与版权�

AI大模型版权争议训练数据

今日大家都在搜的词：

热文

3 天
7天

一张图生成3D模型！PartCrafter颠覆建模流程，北大+字节+CMU联手打造

一张图表看懂中国冰箱的世界地位

荐AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

昇腾赋能三维生成新突破！浙大团队实现跨模态可控3D CAD建模

荐昆仑万维UniPic 2.0“小钢炮”模型炸场，一个模型搞定理解+生成+编辑

普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max，重塑智能清洁新高度

微软发布AI截图工具，截图一键转PPT

Matrixport 旗下 Cactus Custody 与 OnChain 合作，完成招银国际美元货币市场基金化上链

孩子脱鞋138cm补票后家长投诉退票儿童票标准引热议

WEEX亮相0xConnect线下活动，深化全球化布局与行业伙伴交流

荐Anthropic天价赔款？大模型“盗版”的100000种花样

今日大家都在搜的词：

热文

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

vivo Y500定档9月1日发布配备8200mAh巨无霸电池

美团回应网友质疑退款未到账：已修复信息滞后每笔退款可追溯

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

黑神话官号更名系列游戏将开启宏大篇章

AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发

AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音

华为nova 14系列宣布限时降价至高优惠500元

站长商机