首页 > 业界 > 关键词  > 3D最新资讯  > 正文

谷歌推3D生成模型CAT3D 1分钟完成3D场景创建

2024-05-20 11:17 · 稿源:站长之家

站长之家(ChinaZ.com)5月20日 消息:谷歌推出的CAT3D模型在3D重建领域取得了显著的进展,它通过使用多视角扩散模型来创建3D场景,提供了一种快速且高效的方法来生成3D内容。

QQ截图20240520111126.png

主要特点:

  • 快速生成:CAT3D能够在最短的时间内,即一分钟内完成整个3D场景的创建,这比现有的单图像和少视图3D场景创建方法要快得多。

  • 多视图支持:该模型不仅支持单图像输入,还能够处理多图像输入,从而生成更加丰富和详细的3D场景。

  • 高质量的3D捕获:CAT3D利用多视图扩散模型,可以根据任意数量的输入图像和目标新视图生成高度一致的场景新视图。

  • 实时渲染:生成的新视图可以作为3D重建技术的输入,实现从任何视点实时渲染3D表示,这对于虚拟现实、游戏开发和建筑设计等领域非常有用。

  • 结构优势:CAT3D使用视频扩散模型的结构,但与时间嵌入不同,每个图像都嵌入了相机姿态,这有助于更准确地捕捉场景的3D结构。

  • 3D重建管道:生成的视图被传递到3D重建管道,以创建精确的3D表示,这对于后续的3D建模和可视化至关重要。

CAT3D的出现是3D重建技术的重大突破,它有潜力改变虚拟现实、游戏开发、建筑设计等多个行业,为用户提供更加真实和互动的体验。

项目页:https://top.aibase.com/tool/cat3d

论文地址:https://huggingface.co/papers/2405.10314

举报

  • 相关推荐
  • 仅用三张图像即可生成 3D 场景,苹果新 AI 模型“很惊人”

    只需三张输入图像,Matrix3D 就能生成物体、甚至整个环境的详细 3D 重建,这显然可以为 Apple Vision Pro 等沉浸式头显带来非常有趣的应用……

  • AI日报:腾讯混元3D生成模型2.5版本发布;海螺推出图像人物参考功能;百度上线移动端超级智能体心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。

  • 10倍精度升级!腾讯混元3D模型v2.5版本发布

    腾讯混元3D模型升级至v2.5版本,建模精度和贴图真实度显著提升。新版本参数体量从1B增至10B,有效面片数增加超10倍,支持1024几何分辨率。纹理系统支持4K高清贴图和凹凸细节,率先支持多视图生成PBR模型。针对动画场景优化骨骼蒙皮系统,支持非标准姿态自动绑定。新增文生/图生3D减面模型、多视图建模模板等专业工作流。混元3D v2.5已全面更新至腾讯AI创作引擎,免费生成额度提升至每日20次,并正式上线腾讯云API面向企业开放。GitHub开源版本累计Star超1.2万。

  • 聚首华南,2025下半年增材制造、3D 打印的顶尖展览与活动推荐

    2025年全球3D打印行业将迎来系列盛会。4月西安论坛成功举办后,下半年将迎来深圳Formnext Asia(8月26-28日)、东京论坛(9月25-26日)和法兰克福Formnext展会(11月18-21日)三大国际活动。这些平台将汇聚全球顶尖企业,展示航空航天、医疗健康、汽车工业等领域的最新技术成果,特别关注中国企业的快速成长。法兰克福展会预计吸引超900家展商,中国展商数量有望再创新高。系列活动将搭建全球产业交流平台,推动3D打印技术创新与商业应用深度融合。

  • 曝iPhone 18 Pro内测屏下3D人脸识别:苹果迈入单挖孔屏时代

    这意味着iPhone 18 Pro系列正式迈入单挖孔屏时代,向安卓主流屏幕形态看齐。需要注意的是,安卓阵营普遍采用单挖孔 屏幕指纹识别方案,而iPhone则是采用屏下3D人脸识别方案,不支持屏幕指纹。

  • 3199元起!华为智能门锁2 Pro/Ultra开启预售:首次掌静脉+3D人脸识别

    华为智能门锁2 Pro、华为智能门锁2 Ultra今天正式开启预售,官方定价分别是3199 元、3699元起,国补到手价是2634.15元、3059.15元。

  • 创想三维618大促火力全开:前30名半价+双补贴至高省25%,解锁3D打印普惠新体验

    3D打印技术正从"极客玩具"升级为"生产刚需",广泛应用于教育科创、文创定制、制造业打样等领域。创想三维作为全球消费级3D打印生态领创者,推出618年中大促活动,提供半价抢购、叠加补贴等优惠,覆盖从入门到专业级设备。重点产品包括:Hi Combo多彩创意打印机,支持16色打印;K系列高速智能打印机,最高600mm/s打印速度;HALOT-MAGE S光固化打印机,14K超清分辨率;以及Otter Lite和Raptor Pro两款3D扫描仪,满足不同精度需求。活动旨在降低3D打印门槛,推动技术从"专业门槛"走向"全民可及"。

  • 卖家精灵上线【筛查相关性】功能,1分钟自动批量判断关键词相关性

    亚马逊卖家常面临关键词投放效果不佳的困境:广告费烧了不少,转化率却上不去。传统人工筛选关键词费时费力且不准确,而卖家精灵插件推出的【筛查相关性】功能,通过算法计算"占有率"指标(竞品在关键词搜索结果中的占比),自动标记关键词相关性等级:高相关(≥60%)建议重点投放,中相关(20%-60%)可优化争夺,低相关(5%-20%)谨慎测试,不相关(<5%)直接放弃。实操只需3步:1.建立精准竞品库;2.搭建关键词库;3.一键筛查相关性。该功能免费支持48个ASIN+200个关键词的批量分析,能节省80%筛查时间,精准定位高转化词,降低50%无效广告费。精细化运营时代,用好工具才能锁定真正带来转化的关键词。

  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视级的视频”

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • 视频生成模型Vidu Q1怎么用?Vidu Q1官网是什么?

    国产视频生成大模型Vidu Q1在性能、价格和功能上实现重大突破。该模型由生数科技推出,在VBench评测中超越Sora等国内外顶尖模型,支持1080p高清视频生成,每秒价格低至3毛钱。其首尾帧功能仅需两张图即可实现电影级运镜效果,支持多元风格生成和48kHz高采样率混音功能。Vidu Q1已深度赋能影视、广告、动漫等行业,大幅降低创作门槛。