首页 > 业界 > 关键词  > DreamMat最新资讯  > 正文

DreamMat:根据文字描述生成高质量基于物理渲染的材质

2024-06-05 10:24 · 稿源:站长之家

划重点:

DreamMat 是一种工具,可以根据文字描述生成高质量 PBR(基于物理渲染) 材质。

它采用几何和光照感知的扩散模型,确保生成的材质与给定的几何和光照环境匹配。

DreamMat 消除了常见的固定阴影效果,使渲染效果更真实,适用于游戏和电影制作等领域。

站长之家(ChinaZ.com)6月5日 消息:近期研究取得突破,通过2D 扩散模型在未纹理的原始网格上生成外观。然而,这些方法生成 RGB 纹理时往往包含不必要的固定阴影效果,在下游应用中导致渲染效果不真实。与其只生成 RGB 纹理,生成物理渲染(PBR)材质可能是一个更有前景的解决方案。然而,直接从2D 扩散模型提取 PBR 材质参数仍然存在材质分解不正确的问题,例如在反照率中固定的阴影效果。

效果展示视频如下:

DreamMat 应运而生,致力于解决上述问题,通过文字描述生成高质量 PBR(基于物理渲染) 材质。发现大规模2D 扩散模型只能训练生成最终着色颜色,导致在提取过程中材质分解不足的问题。

image.png

DreamMat产品入口:https://top.aibase.com/tool/dreammat

为了解决这个问题,其大致流程为,首先通过微调新的光照感知2D 扩散模型,使其根据给定光照环境条件,生成特定光照条件下的着色结果。然后,在材质提取过程中应用相同的环境光,DreamMat 可以生成高质量的 PBR (基于物理的渲染)材质,不仅与给定的几何一致,而且在反照率中不包含任何固定的阴影效果。

image.png

大量实验表明,通过这种方法生成的材质对用户更具吸引力,并在渲染质量上显著优于基准方法,适用于游戏和电影制作等下游任务。

举报

  • 相关推荐
  • 科学运动新范式:园世Gamma H1的专业运动音频进阶之道

    园世Gamma H1运动耳机专为运动爱好者设计,集心率监测、全场景听音适配与科学训练于一体。它搭载实时心率监测模块与专属APP,构建科学运动闭环;具备IPX8级防水、32G大内存及蓝牙6.0技术,适应各类运动场景;采用人体工学设计,佩戴稳固舒适。该产品以四百元档价位实现了专业运动耳机的全面功能升级,成为运动听音的新标杆。

  • 别让AI毁了四大名著 微信8000余条AI魔改视频下架

    谁能想到,在AI魔改下,关羽竟然能端起狙击枪,林黛玉也能倒拔垂杨柳。这些看起来有些抽象”甚至滑稽的画面,如今终于被清理了。 微信对此重拳出击,2026年以来已累计处置超8000条AI魔改违规视频,其中1月处置4376条,2月再处置3956条,坚决遏制经典内容被恶意篡改的乱象。 这些违规AI魔改内容乱象百出,不少创作者对《三国演义

  • 传音TECNO CAMON 50新机登场,火山引擎助力AI影像与创作体验升级

    在2026年MWC大会上,传音旗下品牌TECNO发布了CAMON 50系列新机,其AI助手Ella整合了火山引擎的AIGC技术,为全球不同肤色、语种用户提供原生、稳定且更具创造力的影像与创作体验。Ella接入豆包图像创作模型,针对多肤色、多语言和文化审美进行优化,推出图像风格化、文字涂鸦及动态壁纸等功能,满足个性化需求。传音与火山引擎合作,在人像处理、多语言理解等方面专项优化,确保影像真实自然。通过火山引擎的海外云基础设施,为全球用户提供稳定可靠的AI服务。

  • 演员王劲松遇自己AI视频直呼太可怕:完全看不出来真假

    昨日,知名演员王劲松在社交平台发文,称自己的形象被AI技术盗用生成视频,相关内容的声音、口型制作逼真,让人完全分辨不出真假。 发现自身权益受损后,王劲松第一时间进行维权,涉事视频已被删除。 但此次经历仍让王劲松心生诸多担忧,他表示:侵权者的代价可以忽略不计,不疼不痒过去了。但谁能保证,这种钻法律空子的擦边球,最后不沦为犯罪的手段? AI的�

  • 突破PCIe 5.0能效边界:忆联AM6D1以DRAMLess架构重塑性能与成本平衡

    忆联推出行业领先的DRAM-Less PCIe 5.0 SSD——AM6D1,通过创新架构与底层算法优化,兼顾性能与成本。该产品采用无独立缓存设计,支持PCIe 5.0 x4与NVMe 2.0标准,凭借主控算法优化与高速闪存的深度协同,实现媲美有缓存旗舰产品的性能表现。实测显示,AM6D1在CDM、FIO等基准测试中顺序读写速度分别达11500MB/s和10900MB/s,4K随机读取性能出色,并在PCMark 10、3DMark等真实负载测试中表现稳定。其低功耗与低发热特性,为轻薄本等空间受限设备提供了理想的存储升级方案。

  • AI日报:谷歌Nano Banana 2正式上线;可灵3.0全球视频模型第一;周鸿祎直言AI眼镜难做

    本期AI日报聚焦多领域进展:谷歌Gemini App更新,图像生成模型Nano Banana 2上线,支持2K分辨率与文字渲染;快手可灵3.0在视频生成基准测试中表现优异,彰显中国AI技术领先地位;周鸿祎指出AI眼镜硬件门槛高,未来应聚焦智能体技术;阿里巴巴推出千问AI眼镜,整合生态提供智能生活体验;xAI联合创始人离职引发核心团队变动关注;豆包手机助手回应安全争议,称未收到漏洞报�

  • AI日报:小米发布Agent产品Xiaomi miclaw;OpenAI 发布 GPT-5.4系列;微软宣布必应视频全面接入Sora2模型

    本期AI日报涵盖多项重要动态:小米发布首款移动端Agent产品Xiaomi miclaw,基于自研MiMo大模型,旨在实现智能终端自动化交互。OpenAI推出GPT-5.4系列模型,包括标准版、推理版和高性能版,上下文窗口达百万级,在金融和法律领域表现优异。微软宣布必应视频创作者全面接入Sora2模型,提供免费高质量视频生成服务。Roblox推出AI实时改写功能,将违规内容自动转为礼貌合规语言。3D生成模型公司VAST获5000万美元融资,由阿里巴巴领投,将用于构建UGC互动生态。携程下线自动调价工具,推动酒店行业转向服务竞争。陈天桥九年后首度露面,透露正投入20亿美元研发“发现式AI”。阿里巴巴澄清千问团队集体离职传闻,称团队稳定,服务正常。

  • AI日报:MiniMax发布Expert 2.0与云端助手MaxClaw;DeepSeek V4 细节曝光;肯德基AI 点餐助手接入通义千问

    本期AI日报聚焦多款AI产品动态:MiniMax发布Expert 2.0与云端助手MaxClaw,降低专业AI Agent开发门槛;DeepSeek V4细节曝光,具备万亿参数与原生多模态能力;肯德基接入通义千问推出AI点餐助手“小K”;华强北AI眼镜在美销量暴涨;Perplexity发布通用AI代理Computer,集成多模型协同工作;三星Galaxy S26系列手机AI功能全面升级;三七互娱“小七大模型”深度落地游戏出海等场景。整体呈现AI

  • 千问首款AI硬件 千问AI眼镜G1开售:首创热插拔换电 无限续航 国补1997元起

    千问AI眼镜G1今日开售,叠加国补后到手价1997元起。作为千问首款AI硬件,G1全面接入千问APP,首批点外卖、订酒店等功能预计3月底开放。产品采用轻量化设计,重约40g,配备8mm极细镜腿,佩戴体验接近普通光学眼镜。搭载最新千问大模型,支持实时对话、快问快答、拍题答疑、AI同声传译、扫码支付、行程提醒等功能。硬件方面,配备高通骁龙AR1和恒玄BES2800双旗舰芯片,内置64GB存储空间,拥有5麦克风阵列、骨传导技术以及大振膜双音圈扬声器。综合续航9小时,首创右镜腿热插拔换电技术,搭配额外2次满电续航空的MiniBag换电仓,实现换电不断电。影像上,采用行业首创Super+Raw暗光增强技术,显著提升暗光环境拍摄画质与稳定性,夜景环境下也能稳定出片。并且具备手机级影像技术,可实现0.6秒极速抓拍、3K视频录制,并通过AI超分超帧技术输出4K视频。

  • 单部播放破2亿!AI漫剧“狂飙”,大厂厮杀正酣

    ​2026年,短剧赛道迎来首个“漫剧春节档”。 《西游,错把玉帝当亲爹》《大小姐,你把恶魔执事调成啥了》等多部漫剧作品强势破圈,不仅创下惊人播放数据,更标志着漫剧从“小众赛道”正式走向大众视野,完成了从“陪跑”到“主角”的身份转变。 这场爆火并非偶然,背后是漫剧行业的持续迭代升级。 而百度、美团等大厂还在争相入场,漫剧赛道将迎来全新的竞争�

今日大家都在搜的词: