首页 > 业界 > 关键词  > 正文

Ambient Diffusion:从受损数据中学习干净分布的创新方法

2023-08-01 17:52 · 稿源:站长之家

站长之家(ChinaZ.com)8月1日 消息:Ambient Diffusion 是一种能够从损坏数据中学习干净分布的创新方法,为科学应用中无法获得未损坏样本的问题提供了解决方案。该框架不仅适用于学习分布,还可以训练生成模型,避免记忆训练样本。

研究人员通过在扩散过程中引入额外的测量失真,进一步破坏原始扭曲图像,并挑战模型从其他扭曲图像中预测原始扭曲图像。

image.png

项目地址:https://github.com/giannisdaras/ambient-diffusion

研究表明,即使训练样本中有90% 的像素丢失,模型仍然可以学习到原始图片的分布。该方法还可以用于改进标准预训练扩散模型,并可以在几个小时内在单个 GPU 上完成微调过程。

它通过引入额外的测量失真和条件期望学习的方式,能够适应各种失真过程,并在高度损坏的样本中实现准确的学习。此外,该框架还具有良好的可扩展性,支持在常用数据集上进行训练,并能够处理大规模的损坏数据。

核心功能:

1. 学习未知分布:通过引入额外的测量失真,训练模型预测原始损坏图像。

2.条件期望学习:使用任何满足一些技术条件的失真过程训练模型,可以学习到给定附加测量损坏的完整未损坏图像的条件期望。

3. 应用范围广泛:支持包括修复和压缩感知在内的各种损坏过程。

4. 可扩展性:支持在标准数据集上进行训练,并能够在所有训练样本中有90% 像素丢失的情况下学习分布。

举报

  • 相关推荐
  • 大家在看
  • 突发!Stable Diffusion 3,可通过API使用啦

    4月18日,著名开源大模型平台Stability.ai在官网宣布,最新文生图模型StableDiffusion3和SD3Turbo可以在API中使用。本次继续由知名API管理平台FireworksAI提供服务。在山顶上有一位巫师创作了一幅令人惊叹的艺术作品,他用魔法创造了文字"StableDiffusion3API"。

  • Pika联创参与新研究:Diffusion能抢GPT的活了,成功挑战自回归文本范式

    纵观生成式AI领域中的两个主导者:自回归和扩散模型。一个专攻文本等离散数据,一个长于图像等连续数据。通讯作者为一二作的导师StefanoErmon,他是斯坦福计算机科学系副教授。

  • Stable Diffusion 3 API申请入口 AI文生图API官方免费申请地址

    StableDiffusion3API是一款先进的文本到图像生成系统,它在排版和提示遵循方面与DALL-E3和Midjourneyv6等顶尖系统相匹敌或更优。该系统采用新的多模态扩散变换器架构,使用不同的权重集来改善图像和语言的表示,从提高文本理解和拼写能力。StableDiffusion3API的使用场景示例在以下情况下,您可以使用StableDiffusion3API进行图像生成:生成广告宣传图创建游戏角色概念图辅助教学材料的图像制作产品特色和功能StableDiffusion3API具有以下特色和功能:文本到图像的生成多模态扩散变换器架构图像和语言的独立表示文本理解和拼写能力提升想要了解更多关于StableDiffusion3API的信息并开始您的图像生成之旅,请访问StableDiffusion3API官方网站。

  • 模型未发API先至!Stable Diffusion 3 API 发布 性能比肩 Midjourney v6

    其开发者平台API现已支持最新版本的StableDiffusion3及其增强版本StableDiffusion3Turbo。这一发布标志着StabilityAI在文字到图像生成领域的技术进步,其性能已经达到甚至超越了行业内的一些领先模型,如DALL-E3和Midjourneyv6。公司承诺提供99.9%的服务可用性,这对于企业用户来说尤为重要,因为他们在使用开发者平台进行关键的生成型AI工作时,需要确保服务的稳定性和可靠性。

  • Diffusion-RWKV官网体验入口 AI生成高质量图像工具使用地址

    Diffusion-RWKV是一种基于RWKV架构的扩散模型,旨在提高扩散模型的可扩展性。它针对图像生成任务进行了相应的优化和改进,可以生成高质量的图像。欲了解更多详细信息并开始使用Diffusion-RWKV,请访问Diffusion-RWKV官方网站。

  • 旷视发布HiDiffusion,SD生成速度更快,图片质量更高

    最近,旷视发布的HiDiffusion技术,近日引起业界广泛关注。这一新技术只需一行代码,便能显著提升SD(扩散模型)生成图像的分辨率和生成速度,允许图像生成的分辨率高达4096×4096,同时将图像生成速度提高1.5至6倍。值得一提的是,HiDiffusion不仅支持所有SD模型,也兼容SD模型的下游模型,如Playground。

  • Grok-1.5 Vision Preview官网体验入口 X.AI多模态AI模型详细介绍

    Grok-1.5VisionPreview是X.AI公司推出的首个多模态模型。除了强大的文本处理能力,Grok还能处理各种视觉信息,如文档、图表、截图和照片等。点击前往Grok-1.5VisionPreview官网体验入口需求人群:辅助决策分析内容生成工作效率提升使用场景示例:使用Grok-1.5V分析复杂的商业报告,快速提取关键数据和见解利用Grok-1.5V自动生成项目计划草稿,并优化资源分配通过Grok-1.5V理解工厂设备使用说明,提高维修效率产品特色:多学科推理文档理解图表解读现实世界理解图像处理掌握Grok-1.5VisionPreview,体验多模态AI的强大功能和无限潜力。

  • AI21发布世界首个Mamba的生产级模型Jamba 支持256K上下文长度

    AI21发布了世界首个Mamba的生产级模型:Jamba。这个模型采用了开创性的SSM-Transformer架构,具有52B参数,其中12B在生成时处于活动状态。这意味着Jamba模型在处理需要理解大量文本和复杂依赖关系的任务时,既能保持高效率,又不会牺牲性能或精度。

  • AI日报:首个AI程序员Devin造假被抓;​Sora平替?StreamingT2V试玩地址公布;Udio AI还可以创作喜剧、演讲;XAI发布Grok-1.5Vision多模态模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用Sora平替?2分钟超长AI视频模型StreamingT2V免费开源试玩地址公布UdioAI提供多功能音频生成还可以创作喜剧、演讲、电台广播等美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格StableDesign:适用于室内装修设计的SD方案文字提示就可修改室内设计图比换脸更强大!SwapAnything:替换图片中的任意元素AI延时视频生成工具MagicTime在线体验地址放出自动化写作工具STORM:可生成像维基百科一样的深度长篇内容Meta推出ViewDiff模型:文本生成多视角3D图像📰🤖📢AI新鲜事首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒皮视频文字详解附上马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息360智脑7B参数大模型正式开源最长支持约50万字输入Adobe图像生成AI“Firefly”训练集中约有5%为AI图像代码、模型全开源!贾佳亚团队多模态模型Mini-Gemini登上热榜面壁智能开源MiniCPM2.0系列模型OCR等能力显著增强竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起InstantID团队推新风格迁移方法InstantStyle一键置身“梵高星空”——————每日midjourneyprompt:小说古风美女图源备注:图片由AI生成,图片授权服务商MidjourneyAbeautifulwomanfromancientChina,dressedinagorgeousredHanfu,withlonghairdrapedoverhershoulders,satinherboudoirwithasmile.Ancientstyle,hanfu,boudoir,gorgeous,palace,screen,carpet,softlight,eleganttemperament,ancientculture,inlinewithorientalaesthetics,richdetails,bestquality,exquisitemakeup,cleareyelinerpen,slendereyebrows,texturedskin,whiteskin,charmingheaddress,--ar3:4--niji6--styleraw一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。

  • 据报道,苹果因需求低迷而削减 Vision Pro 产量

    苹果在VisionPro推出美国以外市场之前就已削减了订单。消息人士称,苹果现在预计2024年仅销售大约40万至45万台VisionPro市场预期为70万至80万台。郭明錤认为,某些虚拟现实和增强现实特定组件的需求,如MicroOLED显示屏,可能不会达到大规模生产所需的采纳率,无法应用于其他设备中。

今日大家都在搜的词:

热文

  • 3 天
  • 7天