首页 > 业界 > 关键词  > SceneTex最新资讯  > 正文

SceneTex: 生成高质量、风格一致的室内场景纹理的新型AI方法

2023-12-04 09:36 · 稿源:站长之家

划重点:

1. 🌐 高质量3D内容合成是自动驾驶、机器人模拟、游戏、电影制作和未来虚拟/增强现实场景等多个应用领域的关键问题。

2. 🤖 SceneTex采用深度到图像扩散先验,以在室内场景网格中生成高质量且风格一致的纹理,克服了传统方法中的多个问题。

3. 🚀 研究团队使用多分辨率纹理和交叉注意力解码器,实现了全局样式一致性,提高了室内场景的纹理生成质量。

站长之家(ChinaZ.com)12月4日 消息:近日,慕尼黑工业大学和Snap Research的研究团队提出了一种名为SceneTex的全新AI方法,旨在解决室内场景纹理生成中的挑战,实现高质量、风格一致的3D内容合成。

传统上,尽管3D几何建模取得了长足进步,但创建物品外观或纹理仍然需要大量人工劳动,尤其是使用诸如Blender等3D建模程序。由于对人工技能的高需求和相关成本,自主纹理设计和增强一直未能完全实现工业化。最新的2D扩散模型在文本到3D创建中取得了进展,但将其扩展到整个场景的纹理生成仍然面临一些困难。

image.png

SceneTex通过采用深度到图像扩散先验,将纹理创建定位为RGB空间中的纹理优化挑战,与现有技术不同,后者通常是将2D视图反复映射到网格表面。研究团队引入了多分辨率纹理字段,以微妙地描绘网格外观,并使用交叉注意力解码器减少自遮挡引起的样式不一致性。他们的设计能够在低频和高频适应性地学习外观信息,通过全局引用确保每个模型内部的全局样式一致性。

在实际应用中,每个解码的RGB值通过与分布在每个对象上的预采样参考表面位置进行交叉引用而生成。通过为每个可见位置提供整个实例外观的全局引用,研究团队进一步确保了每个模型内部的全局样式一致性。SceneTex的研究团队通过对3DFRONT数据集的用户研究表明,该技术在2D指标(如CLIP和Inception得分)方面优于其他基于文本的纹理创建算法。

image.png

SceneTex通过创新性地使用深度到图像扩散先验,提出多分辨率纹理和交叉注意力解码器,成功实现了室内场景的高质量、风格一致的纹理生成。研究团队的技术贡献包括在高分辨率下生成高质量场景纹理的独特框架,通过多分辨率纹理准确捕捉丰富的纹理特征,并使用交叉注意力纹理解码器为3D-FRONT场景生成更具审美感和风格一致性的纹理。详细信息请查看论文、Github和项目。

该研究为未来实现更先进的3D内容生成和应用提供了有力支持,为行业发展开辟了新的方向。

项目网址:https://daveredrum.github.io/SceneTex/

举报

  • 相关推荐
  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • 再次定义行业创新范式 跃然创新推出全球首款端到端 AI 玩具 CocoMate

    8月26日,跃然创新推出全球首款搭载端到端语音模型的AI玩具CocoMate系列。该产品采用可拆卸设计,配备3000mAh电池,支持4G和WiFi网络。依托端到端技术,具备丰富交互表现和拟人化情感能力,支持多重唤醒、主题游戏及聊天室等功能。新品将于8月27日开售,首发包含奥特曼及原创IP“泡泡”等角色,后续还将上线财神爷、塔罗猫等系列,目标人群从儿童延伸至成年人。

  • DTCC2025丨达梦以智算多模与AI创新引领行业变革

    近日,IT168联合旗下ITPUB、ChinaUnix两大技术社区主办的第十六届中国数据库技术大会(DTCC2025)在京隆重召开。大会以“智能创新 数赢未来”为主题,汇聚超百位行业专家及上千名嘉宾,聚焦数据库领域前沿技术。达梦数据作为领军企业受邀参会,重点展示了其在多模数据处理与AI+数据库融合方面的突破,推出“智算多模”引擎,实现统一存储与智能查询,为行业智能化发展注入新动能。

  • AI与数字化变革费率3年连降,海尔智家H1再优化0.1pct

    海尔智家2025上半年业绩逆势增长,营收1564.94亿元,同比增长10.2%;净利润120.33亿元,增长15.6%。核心驱动因素为数字化转型与AI技术应用,通过全流程降本增效,销售管理费用率连续三年下降。国内聚焦明星爆品与多品牌协同,海外坚持本土化运营,实现各区域加速增长。AI驱动的产品创新打造多个行业爆款,带动高端品牌卡萨帝增长超20%。未来将持续深化数字化变革,开拓新发展空间。

  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

  • 从“手动挡”进入“AI智能挡”:亚数TrustAsia 开启证书管理「服务化」CaaS 新时代

    随着TLS/SSL证书有效期缩短至47天,企业面临信任中断风险加剧、内部系统协同困难及预警监测缺失三大挑战。亚数TrustAsia推出新一代智能证书管理体系TrustAsia CaaS,通过自动化流程实现证书全生命周期管理,提供六大核心能力:资产发现与管理、多CA自动化签发、自动化分发部署、实时监测告警、无缝集成定制及全流程自动化,有效应对加密敏捷性需求,助力企业构建安全可信�

  • 百度APP发布AI星河计划,构建AIGC创作者全方位扶持体系

    8月29日,百度AIGC未来创作联赛颁奖典礼在京举行,活动汇聚众多高质量AIGC作品与优秀创作者。百度发布“AI星河计划”,投入亿级流量和千万现金补贴,通过流量扶持、涨粉加速、分成翻倍、多元变现等手段,构建全方位创作者专属成长扶持体系。该计划根据作者AI技术与内容创作能力区分4档创作者,提供定制化支持套餐,最高可享亿级流量池和3倍分成补贴。百度APP依托月活7.35亿流量池与技术优势,已成为AIGC内容平台市场头部玩家,期待与更多优秀创作者共建未来内容生态。

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • 主论坛前瞻|「拥抱AI变革,点燃算网引擎」:ODCC邀您探索算网新世界

    2025年第十二届开放数据中心大会(ODCC)将于9月9-11日在北京举行。大会聚焦AI变革与算力发展,围绕算力、网络、能源、制冷、运维等全链路协同展开讨论。华为、三星、博通等企业将分享最新实践,探讨液冷技术、智能运维等关键议题。主论坛将于9月10日举行,发布年度成果并解读技术趋势。大会旨在推动算力产业标准化发展,为AI时代提供系统性解决方案。

今日大家都在搜的词: