首页 > 业界 > 关键词  > DiffusionLight最新资讯  > 正文

DiffusionLight:用AI绘制铬球精准评估照片光照环境

2024-01-05 17:50 · 稿源:站长之家

划重点:

1. 🌐 **DiffusionLight方法简单而高效**:利用生成的铬球进行单张图像的照明评估,具有多种应用,包括虚拟物体逼真插入图像、增强AR和VR、建筑和室内设计中的逼真可视化、计算机游戏中更逼真的场景,以及摄影和电影中更准确的规划。

2. 📸 **SDXL扩散模型的创新运用**:与传统HDR全景数据集训练的方法不同,DiffusionLight采用了Stable Diffusion XL(SDXL)扩散模型,通过渲染铬球来间接学习HDR和广泛亮度范围。

3. 🎨 **细致处理生成的铬球**:通过迭代修补技术处理SDXL生成的初始扩散噪声图,生成一致质量的铬球,进而生成HDR铬球,提供逼真的光照评估。

站长之家(ChinaZ.com)1月5日 消息:DiffusionLight 是一种使用生成的镀铬球来估计图像中的光照的方法。

研究人员开发了一种简单但有效的技术来估计单个输入图像中的照明。他们使用在数十亿张标准图像上训练的扩散模型来渲染输入图像中的铬球并将其用作光探针。

这种方法有多种应用,包括将虚拟对象真实地插入图像中、AR和VR的增强、建筑和室内设计中的真实可视化、计算机游戏中更真实的场景以及摄影和电影中更准确的规划。

image.png

DiffusionLight 使用 Stable Diffusion XL

当前的照明估计技术基于用于训练神经网络的 HDR 全景数据集。然而,由于可用数据集的种类和大小有限,这些方法常常难以处理现实世界的图像。

相比之下,名为“DiffusionLight”的技术使用经过数十亿张图像预先训练的Stable Diffusion XL扩散模型,在输入图像中渲染铬球。该方法假设人工智能模型已经从训练集中曝光不足和曝光过度的图像示例中间接了解了 HDR 和大范围的亮度。

但是,如果没有进一步干预,SDXL 会生成不正确或不一致的对象,并且无法轻松生成 HDR 格式的图像。因此,研究人员使用了一种称为“迭代修复”的技术来找到初始扩散噪声图,然后将其用于生成质量一致的铬球。

image.png

为了创建 HDR 色球,研究人员还生成并组合了多个具有不同曝光值的 LDR 铬球,这些球用于通过 LoRA 进一步细化 SDXL。

训练后,DiffusionLight 在不同设置下提供令人信服的光线估计,并且可以处理非常不同的场景。

使用DiffusionLight进行环境光线估计后,可以将3D 对象无缝插入到现有照片中,让插入的物体光影无比真实。

image.png

项目体验网址:https://top.aibase.com/tool/diffusionlight

举报

  • 相关推荐
  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 《舞侠Online》七夕限定活动浪漫开启 同心共舞赢限定好礼

    《舞侠Online》将于七夕期间推出“七夕舞动全城·爱在指尖”特别活动,包含三大主题内容:完成指定模式挑战可获得“同心结”道具,解锁专属特权和精美服饰奖励;发送七夕限定公告表达情感,参与越多奖励越丰富;七夕限定盲盒享七折抽取优惠,内含全新玩法与主题道具。活动深度融合传统文化,通过丰富玩法和限定奖励营造浪漫节日氛围。

  • vivo Vision探索版发布 将于明日开放线下体验

    今日下午,vivo正式发布了备受瞩目的vivo Vision探索版MR头显,尽管该设备暂未确定上市销售时间,但已引发市场广泛关注。从8月22日起,北京、深圳等10余座城市的12家vivo官方授权体验店将率先开启抢先预约体验活动,后续还将有第二批线下体验门店加入,让更多消费者有机会亲身感受这款创新产品的魅力。

  • 百度APP发布AI星河计划,构建AIGC创作者全方位扶持体系

    8月29日,百度AIGC未来创作联赛颁奖典礼在京举行,活动汇聚众多高质量AIGC作品与优秀创作者。百度发布“AI星河计划”,投入亿级流量和千万现金补贴,通过流量扶持、涨粉加速、分成翻倍、多元变现等手段,构建全方位创作者专属成长扶持体系。该计划根据作者AI技术与内容创作能力区分4档创作者,提供定制化支持套餐,最高可享亿级流量池和3倍分成补贴。百度APP依托月活7.35亿流量池与技术优势,已成为AIGC内容平台市场头部玩家,期待与更多优秀创作者共建未来内容生态。

  • 电子证件(Digital ID)的全球信任度全景:亚洲、中东与非洲领先,欧美市场滞后

    Checkout.com最新全球调研报告显示,不同地区对电子证件(digital ID)的接受度存在显著差异。亚洲、中东和非洲消费者对电子证件和生物识别认证表现出高度信任,而欧洲和北美则态度谨慎。AI电商代理的兴起进一步凸显了数字身份验证在交易中的重要性。报告强调,建立数字信任对全球商业发展至关重要,需行业和政策制定者优先考虑数字身份管理方式。

  • 全球最轻的MR头显!vivo Vision探索版亮相:仅重398g

    今天下午,vivo Vision发布会暨影像盛典正式开启,vivo Vision探索版正式亮相,这是蓝厂首款MR头显。 vivo智慧终端产品总经理洪沂介绍,vivo Vision从一开始立项,减重”就是核心命题,因为太重的话大家就很难长时间沉浸体验。 目前市面上的大部分MR头显设备重量都超过了500g,苹果Vision Pro的重量甚至超过了600g,这次vivo Vision探索版的重量压缩至398g,是目前行业内最轻的MR头显。

  • 每日互动GAI Station亮相2025数博会 新一代智能终端为企业落地AI保驾护航

    2025中国国际大数据产业博览会于8月27日在贵阳开幕,聚焦数据智能与产业融合。每日互动公司展示其AI拳头产品GAI+Station,这是一站式AI落地应用解决方案,集成算力与知识库,覆盖主流办公场景。同时推出AI机器狗,具备多模态交互能力。展会还呈现“数智绿波”等数据应用成果,提升交通效率20%以上。活动凸显大数据与人工智能深度融合,推动产业智能化升级。

  • vivo Vision探索版双目8K分辨率 1000度近视也能用

    今日,vivo首款混合现实设备vivo Vision探索版正式亮相。 vivo Vision探索版采用双目8K Micro-OLED屏幕,拥有94% DCI-P3色域,色彩准确度E2。 通过双目校准,保证每台设备的两块屏幕保持一致的、专业级电影监视器的色彩容差体验。

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

今日大家都在搜的词: