首页 > 业界 > 关键词  > 苹果AI最新资讯  > 正文

单图秒变3D!苹果发布LiTo大模型:AI高度还原多视角光影

2026-03-17 22:42 · 稿源: 快科技

3月17日,有消息显示,苹果公司研究团队近期公布了一项在三维重建领域取得重要进展的技术。该技术能够仅依据单一平面图像,便生成完整的三维物体模型,并精细还原物体在不同视角与光照条件下的视觉效果,突破了以往技术通常需要多角度图像输入的局限。

据悉,这项技术的核心在于采用了一种创新的潜在空间表示方法。它将物体表面的几何形状与光线交互信息编码为一组紧凑的数据向量,从而在确保高精度还原的同时,显著降低了所需的计算资源。

其技术框架包含协同工作的编码与解码部分。编码部分负责从输入图像中提取物体的几何结构与视角相关的视觉特征,并将其转化为精简的潜在代码;解码部分则依据这些代码,逆向重建出三维物体,能够准确模拟包括镜面高光在内的复杂光学现象。

为开发此项技术,研究团队使用了包含数千个三维物体的数据集进行训练,并在多种预设的视角与光照条件下进行了大量学习。

通过让系统学习从部分数据中推断整体信息,最终使其获得了从单张图片预测并生成对应三维模型的能力。

根据公布的测试对比结果,该技术在处理物体方向定位上表现出更高的准确性,有效避免了同类方案中常见的朝向错误问题。在生成图像的多视角光影一致性方面,其评估指标较现有的一种先进方案提升了约37%。

举报

  • 相关推荐
  • 接入拓竹只是开始,AI 3D 赛道第一个盈利样本长什么样

    ​2026年3月17日,拓竹科技把 Meshy6接进了 MakerWorld 的 MakerLab。一张照片上传上去,两分钟后,浏览器里就能下载到一个可以直接扔进 Bambu Studio 切片的3MF 文件,颜色和耗材的对应关系已经预先配好,兼容拓竹 AMS。 这件事放在今天看像一次普通的产品更新,放在一年前还做不到。当时 AI 生成的3D 模型精度过不了3D 打印最现实的几道门槛,薄壁会塌,凹洞会坏,多色贴图也很难�

  • “深圳四小龙”,谁是3D打印第一?

    最近,一个小众赛道——消费级3D打印机火起来了。 这股热潮最直观地体现在资本市场上。3月9日,老牌厂商创想三维向港交所递交招股书,冲刺“消费级3D打印第一股”。4月20日,智能派宣布完成数亿元新一轮融资,距离上一轮融资仅过去约5个月。而成立仅一年的新玩家原子重塑也已完成了第三轮融资。头部玩家冲刺上市,初创公司密集吸金,种种迹象表明,这个产业正处�

  • iOS 27重磅更新:苹果允许用户自选第三方AI模型

    苹果计划在今年秋季推出的iOS 27、iPadOS 27、macOS 27中,开放Apple Intelligence底层AI模型选择权,允许用户自主选用第三方AI服务,覆盖Siri、写作工具、图像生成等核心功能。 此前,苹果在2024年推出Apple Intelligence平台,仅接入ChatGPT作为唯一第三方AI模型。 iOS 27将通过名为Extensions(扩展)的机制,打破这一独占格局,用户可在设置中选择已安装并适配的AI模型服务商,系统会提示�

  • AI日报:千问PC端上线AI语音输入;字节发布全模态大模型Doubao-Seed-2.0-lite;谷歌更新AI搜索功能

    本期AI日报涵盖多项重要进展:千问PC端上线AI语音输入,提升办公效率;字节跳动发布全模态大模型Doubao-Seed-2.0-lite,实现视频、图像、音频与文本统一理解;腾讯联合多所高校推出开源多模态深度搜索智能体方案OpenSearch-VL;月之暗面申请“KimiClaw”商标,或涉硬件领域;Mininglamp开源Cider和Mano-P,打造本地AI工作站;OpenAI携手硬件巨头发布MRC协议,解决GPU闲置浪费;谷歌升级AI搜索功能,整合Reddit等社交观点;xAI推出Grok Imagine API质量模式,提升图像生成写实度。

  • 能看懂、听懂!豆包Seed 2.0 Lite升级:首款全模态理解模型

    火山引擎宣布Doubao-Seed-2.0-lite升级,成为豆包大模型家族首款全模态理解模型。新版支持视频、图像、音频、文本原生统一理解,并同步升级Agent、Coding与GUI能力,增强多模态推理。在视觉理解上,该模型在物理HiPhO、医疗MedXpertQA等高阶学科推理任务中大幅超越2月发布的Doubao-Seed-2.0-pro,并在BabyVision、WorldVQA等领域达SOTA水平。升级重点融入语音理解,可同时处理多种输入模态并完成跨模态联合推理,支持19语种语音转写及中英等互译,捕捉情绪、环境声等细节。该模型还深度适配OpenClaw等框架,强化深度搜索与Skill动态调用,实现越用越聪明。

  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • 腾讯最强!混元Hy3 preview发布并开源:底层推倒重建

    腾讯正式发布并开源混元Hy3 preview大语言模型,该模型为混元基础设施重建后的首个成果,采用快慢思考融合的混合专家架构,总参数295B,激活参数21B,最大支持256K上下文长度。 模型遵循能力体系化、评测真实性、性价比追求三大实用原则,在复杂推理、指令遵循、上下文学习、代码生成与智能体(Agent)能力上实现显著提升。

  • LibTV 上线 HappyHorse 1.0:携手顶级模型打造一站式 AI 视频创作平台

    4月28日,阿里巴巴ATH事业群开发的HappyHorse1.0视频生成模型首发登陆LibTV。该模型采用音视频联合生成方案,支持15秒多镜头叙事、多画幅适配及1080P输出,在画面质感、运镜流畅度和人物真实感上显著改善。LibTV是LiblibAI推出的一站式AI视频创作平台,整合剧本、分镜、剪辑等环节,提供结构化工作流,支持调用HappyHorse1.0、Seedance2.0等顶级模型。LiblibAI已成长为国内最大多模态模型与创作社区,平台上线首日访问量突破10万。

  • AI日报:豆包披露付费订阅方案;OpenAI发布GPT-5.5Instant;苹果手机支持第三方AI模型

    今日AI领域动态:豆包推出月费68-500元三档付费订阅,推进商业化;OpenAI发布GPT-5.5 Instant,取代5.3成为ChatGPT默认模型;苹果iOS 27或支持第三方AI模型,打破封闭生态;淘宝“答题免单”上线,首次加入AI试穿玩法;魔形智能完成数亿元Pre-A轮融资,布局Token基础设施;谷歌神秘项目“Remy”曝光,打造24小时AI助教;谷歌推出Gemini Ultra Lite新订阅服务,填补中高端市场空白;ChatGPT上线广告主平台,AI商业化迎来分水岭。

  • 告别价格战,大模型共迎通胀时代

    眼下,涨价成为大模型的关键词。 迈入2026年,大模型不再是优惠缩水,而是毫不掩饰地开启了涨价模式,大大小小的厂商纷纷入局,智普甚至在短短三个月之内两次提价。 以至于,国产大模型定价首次与海外头部厂商对齐。 大模型涨价,是昙花一现还是旷日持久?降价争夺市场的打法,是否走到了尽头?价值战会成为未来竞争的核心叙事吗?

今日大家都在搜的词: