3月17日,有消息显示,苹果公司研究团队近期公布了一项在三维重建领域取得重要进展的技术。该技术能够仅依据单一平面图像,便生成完整的三维物体模型,并精细还原物体在不同视角与光照条件下的视觉效果,突破了以往技术通常需要多角度图像输入的局限。
据悉,这项技术的核心在于采用了一种创新的潜在空间表示方法。它将物体表面的几何形状与光线交互信息编码为一组紧凑的数据向量,从而在确保高精度还原的同时,显著降低了所需的计算资源。
其技术框架包含协同工作的编码与解码部分。编码部分负责从输入图像中提取物体的几何结构与视角相关的视觉特征,并将其转化为精简的潜在代码;解码部分则依据这些代码,逆向重建出三维物体,能够准确模拟包括镜面高光在内的复杂光学现象。
为开发此项技术,研究团队使用了包含数千个三维物体的数据集进行训练,并在多种预设的视角与光照条件下进行了大量学习。
通过让系统学习从部分数据中推断整体信息,最终使其获得了从单张图片预测并生成对应三维模型的能力。
根据公布的测试对比结果,该技术在处理物体方向定位上表现出更高的准确性,有效避免了同类方案中常见的朝向错误问题。在生成图像的多视角光影一致性方面,其评估指标较现有的一种先进方案提升了约37%。
(举报)
