首页 > 业界 > 关键词  > AlignProp最新资讯  > 正文

CMU与Google DeepMind研究人员推出AlignProp:微调文本到图像扩散模型的创新方法

2023-10-17 14:32 · 稿源:站长之家

站长之家(ChinaZ.com)10月17日 消息:卡内基梅隆大学(CMU)和Google DeepMind的研究人员引入了一种突破性的方法,称为"AlignProp"。该方法利用直接反向传播来微调文本到图像扩散模型,解决了将这些模型与所需的奖励功能对齐的挑战。AlignProp提供了一种更高效和有效的方式来优化文本到图像扩散模型,适用于图像生成等领域。

image.png

项目地址:https://align-prop.github.io/

概率扩散模型的崛起

概率扩散模型已经成为连续领域生成建模的标准。DALLE,一种文本到图像扩散模型,已经成为该领域的领导者。这些模型以其能够通过在广泛的网络规模数据集上训练来生成图像的能力而闻名。然而,它们的无监督或弱监督性质使得在下游任务中控制其行为,如优化图像质量、图像文本对齐或伦理图像生成成为一项具有挑战性的任务。

微调扩散模型的挑战

最近的尝试使用强化学习技术来微调扩散模型受制于梯度估算中的高方差。AlignProp通过在去噪过程中启用奖励梯度的端到端反向传播,从而对这一问题提供了创新性的解决方案,将扩散模型与所需的奖励功能对齐。

AlignProp的创新特点:

AlignProp引入了一些创新特点,以提高微调扩散模型的效率:

减轻高内存需求: AlignProp通过微调低秩适配器权重模块和实施梯度检查点来减轻通常与现代文本到图像模型的反向传播相关的高内存需求。

性能评估: 研究论文评估了AlignProp在微调扩散模型以实现各种目标的性能,包括图像文本语义对齐、美学、图像可压缩性以及生成图像中对象数量的可控性等目标的性能。AlignProp在较少的训练步骤中实现了更高的奖励,胜过了其他方法。

概念上的简单性: AlignProp因其概念上的简单性而备受赞誉,使其成为基于可区分奖励函数的扩散模型优化的明智选择。

提高采样效率和计算有效性

AlignProp利用从奖励函数获得的梯度来微调扩散模型。这种方法提高了采样效率和计算有效性。实验一致表明,AlignProp在优化一系列奖励函数方面的有效性,甚至对于难以仅通过提示定义的任务也是如此。

未来的研究方向

未来,研究人员可以探索将AlignProp的原则扩展到基于扩散的语言模型,以增强其与人类反馈的一致性。

举报

  • 相关推荐
  • 当贝 D7X Pro 新品投影发布,和 D6X Pro 区别大吗?

    当贝D7X+Pro投影仪作为D6XPro升级款,在光源、光学设计、核心性能等方面全面优化:搭载全新QuaLas三色激光光源,色彩更纯净;新增0.98-1.3:1无损光学变焦,小空间灵活适配;升级MT9681芯片与3+64GB存储,运行更流畅;支持DynamicX深黑算法与HDR Vivid解码,画面对比度达20000:1;新增米家生态联动,语音控制智能设备。适合追求4K画质、灵活安装及智能家居联动的用户。

  • 华为nova 14活力版、nova Flip S官宣明天发布

    华为终端官方宣布,将于10月17日14:30举行nova系列新品玩机秀活动,届时华为nova 14活力版与华为nova Flip S将同步登场。nova Flip S已在中国电信终端产品库亮相,提供六款时尚配色,存储版本包括12GB+256GB、12GB+512GB和12GB+1TB,出厂预装鸿蒙OS5系统,预计售价5000元价位段。外观延续经典1:1方形外屏设计,镜头模组与屏幕巧妙融合,展现独特科技美感。

  • 全球首次!万元相机置换OPPO Find X9 Pro:OPPO最高补贴1400元

    OPPO为Find X9 Pro推出全球专属相机置换补贴,最高补贴1400元,活动10月22日截止。该机搭载哈苏真2亿长焦镜头,采用AOA光学校准技术提升解析力,F2.1超大光圈进光量提升140%,配合70mm黄金焦段与超晶态蓝玻璃,实现行业首个哈苏真两亿直出画质。超动态大底主摄升级第四代曝光技术,支持瞬时三曝,融合高动态与抓拍。全新LUMO超像素引擎支持2亿像素多帧合成,实现可裁切的高画质体验,成像素质媲美中画幅相机。

  • 万元以内最值得买的相机 OPPO Find X9 Pro发布:5299元起

    OPPO Find X9 Pro于10月16日发布,售价5299元起,提供追光红、绒光钛和霜白三色。搭载6.78英寸1.5K直屏、天玑9500平台、7500mAh电池,支持80W有线及50W无线闪充。影像系统升级为哈苏2亿超清长焦镜头,配合LUMO超像素引擎实现2亿像素多帧融合,提升画质清晰度。主摄索尼LYT-828支持第四代传感器曝光技术,视频拍摄新增4K 120fps格式,并集成智能防抖和杜比视界。变焦操作优化,实现即触即变,视频系统革新带来旗舰级表现。

  • 苹果回应橙色iPhone 17 Pro Max褪色成玫瑰金:正常使用不会掉色

    日前,有网友在Reddit论坛反馈称,自己的iPhone 17 Pro Max星语橙配色后盖出现褪色问题,变成了玫瑰金”配色,铝合金表面橙色几乎完全消失。 今日,据媒体报道,苹果客服表示,正常使用情况下手机颜色不会发生变化,未受高温、化学试剂等外部因素影响时不会掉色。

  • AI日报:LiblibAI 2.0正式上线;通义千问、豆包开启记忆功能;Sora已登陆Google Play

    本期AI日报聚焦多项重要进展:LiblibAI 2.0上线,内置多模型并提供限时免费算力;通义千问和豆包开启记忆功能内测;OpenAI视频生成应用Sora登陆Google Play并开放北美预注册;Qoder推出提示词增强功能提升开发效率;Cherry Studio集成主流AI模型并推出优惠活动;港中文团队推出首个结构化图像生成系统;DeepSeek入选2025全球十大工程成就。这些突破展示了AI技术快速迭代与多领域应用�

  • 苹果宣布推出M5芯片 新款iPad Pro发布:8999元起

    苹果正式发布M5版iPad Pro,起售价8999元。新品延续经典设计,采用双尺寸OLED屏,搭载M5芯片实现性能突破:256GB/512GB版配备9核CPU+10核GPU,1TB/2TB版升级至10核CPU。运行内存最高达16GB,支持Wi-Fi7与蜂窝网络提速50%。10月17日开启预售,22日全球发售,以全面升级巩固其最强平板地位。

  • OPPO ColorOS 16发布:Find X9等机型将全球首发

    10月15日,OPPO正式发布ColorOS 16系统,由Find X9系列、一加15、一加Ace6及OPPO Pad5等机型首发。系统在流畅度、AI功能和生态互联实现重大突破:三大引擎提升流畅度,系统重载流畅度提升37%,功耗降低13%;新增一键闪记、智能场景识别等便捷功能;小布助手升级,提供个性化推荐;AI实景对话支持声纹识别;生态互联打通与Apple Watch壁垒,实现跨设备信息显示与操作迁移,全面提升用户体验。

  • 外观设计颠覆行业!真我GT8 Pro明天官宣

    realme中国区CMO楚楚_Jessie预告,真我GT8和真我GT8 Pro明天会正式官宣发布时间。 该机的看点之一是工业设计,楚楚_Jessie表示真我GT8 Pro的外观前无古人后无来者,如果让我用四个字来形容,那只能是颠覆行业”。 据悉,真我GT8 Pro采用了独

  • 苹果发布Vision Pro新配件:双圈编织头带售价799元

    在发布搭载M5芯片的新款Vision Pro之际,苹果同步推出了一款全新设计的双圈编织头带,售价为799元。 该头带上下两层均采用一体成型的3D针织工艺,构成独特的双罗纹结构,在提供有效缓冲的同时,兼具良好透气性与弹性。 下层表带选用弹性织物罗纹,并创新嵌入钨丝配件,通过产生均衡的约束力

今日大家都在搜的词:

热文

  • 3 天
  • 7天