首页 > AI头条  > 正文

一张图生成3D模型!PartCrafter颠覆建模流程,北大+字节+CMU联手打造

2025-06-12 10:57 · 来源: AIbase基地

3D建模技术迎来重大革新!由北京大学、字节跳动和卡内基梅隆大学联合研发的PartCrafter项目正式亮相,凭借单张RGB图像即可生成高精度、结构化的3D模型,彻底颠覆传统“先分割再重建”的复杂流程。这一技术不仅提升了生成效率,还能推断不可见结构的3D几何,展现了AI在3D生成领域的巨大潜力。AIbase编辑团队整理了最新信息,为您深度解析PartCrafter的创新与影响。

PartCrafter:从单张图像到结构化3D模型

PartCrafter是一款开创性的结构化3D生成模型,能够从单张RGB图像直接生成包含多个语义部件的3D模型,实现了端到端生成。与传统方法需要先对图像进行分割再逐一重建不同,PartCrafter采用统一的生成架构,无需预分割输入即可一步生成完整的3D场景。这一特性使其在处理单一物体和复杂多物体场景时均表现出色。

image.png

AIbase了解到,PartCrafter的核心创新包括组合式潜在空间和层次化注意力机制。组合式潜在空间通过为每个3D部件分配独立的潜在token集合,确保部件间的语义清晰性和编辑灵活性。层次化注意力机制则同时处理部件内部和部件间的信息流,保证生成的3D模型在局部细节和全局一致性上的高度协调。

“透视”能力:推断不可见结构

PartCrafter最令人惊叹的功能之一是其“透视”能力。即使输入图像中某些部件被遮挡,模型依然能够通过强大的生成先验,推断并生成完整的3D几何结构。这种能力得益于其基于预训练的3D网格扩散Transformer(DiT),该模型继承了大规模3D数据集的生成能力,并通过创新的架构设计进一步优化。AIbase测试显示,PartCrafter不仅能生成高质量的3D网格,还能在不可见部件的重建上超越现有方法,展现了结构化生成先验在3D理解中的独特优势。

技术突破:超越传统两阶段方法

传统3D生成方法通常采用两阶段流程,先对图像进行语义分割,再逐一重建部件,效率低且易受分割错误影响。PartCrafter通过统一生成架构,消除了对预分割的依赖,同时在生成质量和计算效率上实现双重突破。AIbase了解到,PartCrafter能在约40秒内完成从单张图像到结构化3D模型的生成,效率远超传统方法。

实验结果显示,PartCrafter在结构化3D生成任务上达到**SOTA(State-of-the-Art)**效果,甚至在物体重建保真度上超越了其底层的3D生成模型。这一成果表明,理解物体的组合结构能够显著提升3D生成的整体质量,为未来3D建模提供了新思路。

数据集创新:整合大规模3D资源

为支持部件级生成,PartCrafter团队精心构建了一个包含13万个3D对象的大型数据集,其中10万个对象具备多部件标注。这些数据整合了Objaverse、ShapeNet、ABO等知名3D资源库,通过挖掘部件级标注,为模型训练提供了丰富的监督信息。AIbase认为,这一数据集的开放将为3D生成领域的研究提供宝贵资源,助力更多团队探索结构化建模的潜力。

行业影响:重塑3D内容创作生态

PartCrafter的发布标志着3D建模技术进入了一个新阶段。其端到端的生成能力和对复杂场景的处理能力,使其在游戏开发、虚拟现实、工业设计和数字孪生等领域具有广泛应用前景。AIbase观察到,PartCrafter不仅能生成可分解的3D网格,还支持灵活的部件编辑,为创作者提供了更高的自由度。

社交媒体上,开发者对PartCrafter的创新性反响热烈,认为其“简单而有效”的设计理念重新定义了3D生成的范式。项目团队表示,代码、预训练模型和Hugging Face演示版本即将发布,届时将进一步降低技术门槛,赋能全球开发者。

未来展望:3D建模的智能化时代

PartCrafter的出现不仅是技术上的突破,也是对3D内容创作生态的深远赋能。AIbase预测,随着PartCrafter的开源和进一步优化,3D建模将变得更加智能化和普及化。未来,这一技术可能扩展到实时3D生成、动态场景建模甚至多模态输入,为元宇宙、机器人视觉和智能制造等领域带来更多可能性。

  • 相关推荐
  • 一张图表看懂中国冰箱的世界地位

    GfK中怡康数据显示,2025年上半年,中国冰箱市场稳健上行。线下市场零售额规模达到99.3亿元,同比增长7.4%;零售量规模约为139.2万台,同比增长3.7%。市场格局方面,TOP3品牌地位稳固,海尔系、海信系、美的系分别以46.4%、16.4%、15.5%的份额占据市场前三,截至7月,海尔系份额进一步涨至47%。那么,在世界冰箱业版图中,中国品牌的表现又如何呢?根据世界权威机构欧睿国际最新�

  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • 昇腾赋能三维生成新突破!浙大团队实现跨模态可控3D CAD建模

    浙江大学与魔芯科技团队合作,基于昇腾平台NPU开发了首个三维模型生成算法Img2CAD。该技术突破性地将草图、图片等多模态输入通过Transformer结构高效转化为三维几何信息,无需可微渲染器,完整在NPU上实现训练和推理。研究成果可生成高精度3D模型,直接导入CAD软件编辑,已应用于3D打印、数字制造等领域。项目完成3篇论文,包括1篇中科院1区期刊和2篇CCF-A类会议论文,部分成果实现商业化落地。该技术标志着智能三维内容创作进入"低门槛、高效率、高质量"新阶段,未来将为工业设计、AR/VR等行业提供创新动能。

  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • 普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max,重塑智能清洁新高度

    普渡机器人于2025年8月20日发布3D感知AI扫地机器人PUDU MT1Max。该产品在MT1基础上大幅升级,搭载3D雷达与多传感器融合系统,显著增强复杂场景感知与避障能力。通过AI技术实现自适应清洁、垃圾识别、巡检清洁等功能,支持10万平方米以上大场景作业。具备自动振尘过滤和智能避雨机制,提升安全性与运维效率,重塑智能清洁行业新标准。

  • 微软发布AI截图工具,截图一键转PPT

    微软电脑管家推出全新“智能圈选”功能,通过AI技术实现截图内容的智能识别与重构。用户只需圈选截图区域,即可一键完成文字提取、多语言翻译及PPT转换等操作,大幅提升办公和学习效率。该功能支持100多种语言,保留原始格式,并能智能修复遮挡内容,彻底改变了传统截图处理方式。

  • Matrixport 旗下 Cactus Custody 与 OnChain 合作,完成招银国际美元货币市场基金化上链

    新加坡Matrixport旗下合规数字资产托管商Cactus Custody与OnChain合作,将招商国际美元货币市场基金以化形式上链运营,成为全球首只港新互认基金上链案例。该合作解决市场缺乏可审计、可托管的现金类资产等痛点,通过链上净值计算、白名单管理等机制,为机构与合格投资者提供透明、合规的链上投资选项。未来双方将持续深化合作,推动RWA标准化发展。

  • 孩子脱鞋138cm补票后家长投诉退票 儿童票标准引热议

    8月18日,上海一女子带孩子游玩时因身高标准与游乐园产生纠纷。孩子脱鞋后身高138cm,符合1.1-1.4米儿童票标准,但穿鞋测量141cm被要求补差价。经投诉后园方退款。事件引发对儿童票仅以身高为标准的讨论,专家指出随着儿童身高普遍增长,该标准已不科学。部分景区仍简单以身高判定优惠资格,既缺乏人性化服务,也导致超高儿童无法享受优惠、身高不足成人能否优惠的两难问题。建议景区应综合考虑年龄等多元标准。

  • WEEX亮相0xConnect线下活动,深化全球化布局与行业伙伴交流

    WEEX交易所受邀出席圣彼得堡0xConnect线下活动,与全球加密品牌共同探讨行业趋势并拓展合作机会。该活动聚集了来自交易所、公链项目、钱包及投资机构的代表,通过面对面交流碰撞出新的合作火花。WEEX团队借此机会向与会者介绍了平台在合规建设、资金安全和用户体验方面的价值理念,展示了打造安全透明交易环境的品牌承诺。未来WEEX将继续参与全球行业活动,以开放姿态推动加密生态健康发展。

  • Anthropic天价赔款?大模型“盗版”的100000种花样

    ​AI大模型的秘密配方是什么?答案可能很简单:海量的“盗版内容”。 这几乎是行业内公开的秘密。2023年,《纽约时报》一纸诉状将OpenAI和微软告上法庭,正式拉开了这场战争的序幕。很快,战火烧遍了整个硅谷。Meta因其Llama模型涉嫌使用盗版书籍而面临集体诉讼;Anthropic同样因其模型Claude的训练数据而被告,一时间,几乎所有头部玩家都被推上了被告席。 这场大模型与版权�

今日大家都在搜的词: