首页 > 业界 > 关键词  > DiffusionLight最新资讯  > 正文

DiffusionLight:用AI绘制铬球精准评估照片光照环境

2024-01-05 17:50 · 稿源:站长之家

划重点:

1. 🌐 **DiffusionLight方法简单而高效**:利用生成的铬球进行单张图像的照明评估,具有多种应用,包括虚拟物体逼真插入图像、增强AR和VR、建筑和室内设计中的逼真可视化、计算机游戏中更逼真的场景,以及摄影和电影中更准确的规划。

2. 📸 **SDXL扩散模型的创新运用**:与传统HDR全景数据集训练的方法不同,DiffusionLight采用了Stable Diffusion XL(SDXL)扩散模型,通过渲染铬球来间接学习HDR和广泛亮度范围。

3. 🎨 **细致处理生成的铬球**:通过迭代修补技术处理SDXL生成的初始扩散噪声图,生成一致质量的铬球,进而生成HDR铬球,提供逼真的光照评估。

站长之家(ChinaZ.com)1月5日 消息:DiffusionLight 是一种使用生成的镀铬球来估计图像中的光照的方法。

研究人员开发了一种简单但有效的技术来估计单个输入图像中的照明。他们使用在数十亿张标准图像上训练的扩散模型来渲染输入图像中的铬球并将其用作光探针。

这种方法有多种应用,包括将虚拟对象真实地插入图像中、AR和VR的增强、建筑和室内设计中的真实可视化、计算机游戏中更真实的场景以及摄影和电影中更准确的规划。

image.png

DiffusionLight 使用 Stable Diffusion XL

当前的照明估计技术基于用于训练神经网络的 HDR 全景数据集。然而,由于可用数据集的种类和大小有限,这些方法常常难以处理现实世界的图像。

相比之下,名为“DiffusionLight”的技术使用经过数十亿张图像预先训练的Stable Diffusion XL扩散模型,在输入图像中渲染铬球。该方法假设人工智能模型已经从训练集中曝光不足和曝光过度的图像示例中间接了解了 HDR 和大范围的亮度。

但是,如果没有进一步干预,SDXL 会生成不正确或不一致的对象,并且无法轻松生成 HDR 格式的图像。因此,研究人员使用了一种称为“迭代修复”的技术来找到初始扩散噪声图,然后将其用于生成质量一致的铬球。

image.png

为了创建 HDR 色球,研究人员还生成并组合了多个具有不同曝光值的 LDR 铬球,这些球用于通过 LoRA 进一步细化 SDXL。

训练后,DiffusionLight 在不同设置下提供令人信服的光线估计,并且可以处理非常不同的场景。

使用DiffusionLight进行环境光线估计后,可以将3D 对象无缝插入到现有照片中,让插入的物体光影无比真实。

image.png

项目体验网址:https://top.aibase.com/tool/diffusionlight

举报

  • 相关推荐
  • aigo 亮相 CES 2026,以科技硬实力诠释中国智造

    在CES 2026上,中国品牌aigo宣布以AI技术为核心完成战略升级,并全球首展了基于自研HOLOPTIC4D光场技术的柔性工业机器人。其产品矩阵覆盖多元场景,包括已进入全美600余家Costco的电动滑板车,以及音频设备、电脑组件、智能穿戴与个人护理等多品类消费电子产品,展现了“产业智能化+消费科技全球化”的双端实力。aigo凭借硬核创新与全品类布局,持续在国际舞台擦亮中国智造名片。

  • AI日报:阿里云推多模态交互开发套件;智谱AI港股首日上市;混元发布 HY-Motion1.0开源3D 角色动画生成模型

    阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,赋能智能硬件。腾讯混元推出开源3D角色动画生成模型HY-Motion 1.0,助力游戏与动画制作。智谱AI在港上市,募资43亿港元,加速商业化落地。抖音在深圳南山设立第二总部,聚焦AI与泛视频研发。OpenAI推出ChatGPT Health,强化健康数据管理与隐私保护。法拉第未来宣布进军具身智能机器人领域,推动汽车与机器人业务协同。蚂蚁阿福月活超3000万,AI健康赛道进入中美竞速新阶段。MiroThinker 1.5以300亿参数实现媲美万亿模型的性能,显著降低推理成本。

  • AI日报:腾讯开源3D动作神器混元Motion1.0;罗永浩发布AI讲书App“且听”;夸克AI眼镜首次OTA

    本期AI日报聚焦多领域动态:腾讯开源10亿参数文生3D动作模型,赋能游戏影视;罗永浩发布AI讲书App“且听”,年费不足40元;京东上线自营租赁业务,推动机器人技术普及;夸克AI眼镜首次OTA升级,新增图文备忘等功能;MiniMax启动港股IPO,拟募资约41.9亿港元;阿里通义实验室推出多模态智能代理MAI-UI,性能超越同行;百度文心AI发布年度提示词“工作”,反映社会关注;2026年“两新”政策新增智能眼镜等产品补贴,加速AI终端落地。

  • 千问App接入淘宝闪购和支付宝AI付 推出“AI点外卖”

    千问App宣布完成与淘宝闪购、支付宝的深度技术整合,正式推出“一句话点单”功能。用户只需在聊天框输入“帮我点杯奶茶”或“订10杯加冰、10杯无糖的果汁”等自然语言指令,系统即可自动调用淘宝闪购的商家资源,精准匹配用户所在位置,推荐符合需求的店铺并生成订单,随后通过内置的“支付宝AI付”功能完成一键支付,全程无需跳转至其他应用,实现“指令下达-订�

  • NVIDIA RTX 加速 PC 端 4K AI 视频生成,LTX-2 与 ComfyUI全面升级

    2025年是PC端AI发展的突破之年,小语言模型(SLM)准确率相比2024年提升近2倍,显著缩小了与云端大语言模型(LLM)的差距。NVIDIA在CES上宣布了一系列针对RTX设备的AI升级,以解锁PC上的生成式AI性能。通过优化ComfyUI、开源LTX-2视频生成模型、加速Ollama和llama.cpp等工具,实现了视频/图像生成性能最高提升3倍、显存占用最多降低60%,以及SLM推理性能最高提升35%。这些改进让用户能在本地RTX AI PC上无缝运行先进的工作流,同时享受隐私、安全和低延迟优势。全新的视频生成工作流和由Nexa.ai推出的Hyperlink本地智能搜索工具,将进一步推动生成式AI在2026年全面走向大众创作者、游戏玩家和生产力用户。

  • AI能成交客户?2026年AI销冠智能体正在颠覆转化效率,快来雇佣AI员工!

    文章探讨了在AI技术快速发展的背景下,2025年作为AI+Agent元年,AI智能体已广泛应用于内容生成、客服等领域。随着技术进步,2026年企业级AI应用将更规模化落地。文章重点介绍了尘锋AI销冠智能体,它能模拟人类销售思维,通过智能对话、自动化触达等方式,深度参与销售环节,帮助企业提高线索跟进、销售转化和客户服务效率。相比传统问答机器人,它能准确识别客户意图,进行个性化响应,在多个场景中提升效率,减轻销售负担,降低培训与管理成本。文章建议企业积极尝试AI应用,以驱动业务增长。

  • 公考面试三大困境?中公AI面试来了!26年教研+AI一站式破解

    中公教育推出AI面试产品,针对国考面试三大痛点:方向迷茫、实战恐惧、瓶颈难破。产品集成26年教研积累与AI技术,打造“考试+岗位+能力”三维真题库,覆盖12大专业岗位。支持看题听题双模式,1:1还原真实面试流程,提供五维AI评分与深度解析,生成详细点评报告,帮助考生精准改进。24小时专业陪练,全方位助力考生高效备考,提升面试能力。

  • AI手串、AI调香、AI照相机……AI养活小摊贩?

    在AI席卷各行各业的这一年,不少巨头在这条赛道上不断深耕,也有不少新兴公司应运而生。 而如今,这股AI风潮,也开始席卷大街小巷。从三亚红树林的AI艺术节,到深圳的AI切磋大会,再到上海交大徐汇校区的AI集市,AI正养活一群“小摊贩”。在这些摊点,你能看到高大上的人工智能产品,也能看到许多小玩意儿,从AI手串,到AI冰箱贴,再到AI写真……总之,但凡前缀有个

  • AI日报:火山引擎成春晚独家AI合作伙伴;元宝 AI上线任务提醒;开源神器ClipSketchAI视频一键变手绘分镜

    本期AI日报聚焦多项AI领域新动态:火山引擎成为2026年春晚独家AI云伙伴,将提升互动体验;元宝AI上线任务提醒功能,支持一句话设定循环定时任务;B站开源神器ClipSketch AI可将视频一键转为手绘分镜;阶跃星辰推出高性价比深度研究模型Step-DeepResearch;广州海珠区成立全国首个区级人工智能发展局,每年投入3.1亿支持产业发展;AI编程工具Windsurf Wave13发布,集成SWE-1.5模型;Meta AI推出Pixio图像模型,凭借像素重建刷新3D重建纪录;开源框架VideoPipe简化视频AI应用开发,降低CV门槛。

  • AI成CES 2026绝对主角 英伟达万兴科技等头部企业AI布局受关注

    全球科技盛会CES 2026在美国拉斯维加斯开幕,规模空前,参展商超4100家,观众预计突破15万人。本届展会聚焦AI技术,呈现从“数字智能”向“具身智能”的转变趋势。英伟达、AMD、英特尔等芯片巨头发布新一代AI芯片平台,显著提升算力性能。同时,以万兴科技为代表的AI应用企业加速技术落地,推动视频、文档、绘图等创意软件智能化升级,大幅降低专业创作门槛。AI正快速融入生产与生活全场景,驱动新一轮效率革命。

今日大家都在搜的词: