首页 > 业界 > 关键词  > FourieScale最新资讯  > 正文

FourieScale:无需训练,生成高分辨率图像

2024-04-08 14:15 · 稿源:站长之家

划重点:

FourieScale 通过引入空洞卷积和低通滤波操作,实现不同分辨率下的结构和尺度一致性。

⭐ 采用「填充然后裁剪」策略,使 FourieScale 能够适应生成任意尺寸的图像。

⭐ 引入 FourieScale 作为引导,提高生成图像质量,解决细节缺失和伪影问题。

站长之家(ChinaZ.com)4月8日 消息:最近,香港中文大学和商汤科技联合实验室的研究人员提出了一种名为 FourieScale 的新方法,用于改善利用预训练扩散模型生成高分辨率图像的效果。

随着扩散模型在生成式模型中的应用日益普遍,传统问题是生成超出训练分辨率的图像时会出现模式重复和人工伪影的情况。为解决这一难题,FourieScale 通过引入空洞卷积和低通滤波操作,确保不同分辨率下的图像保持一致的结构和尺度。

image.png

与此同时,研究人员还采用了「填充然后裁剪」的策略,使得 FourieScale 具备生成任意尺寸图像的能力。此外,他们还引入了 FourieScale 作为引导,通过额外的条件生成估计来提高生成图像的质量,解决细节缺失和伪影等问题。

定量和定性实验结果显示,FourieScale 在不同预训练模型和分辨率下都取得了显著的提升,为高分辨率图像生成领域带来了新的可能性。这一研究成果为图像生成技术的发展提供了新的思路和方法,值得关注。

论文地址:https://arxiv.org/abs/2403.12963

开源代码:https://top.aibase.com/tool/fouriscale

举报

  • 相关推荐
  • BOE(京东方)携手UNESCO推动亚太科学俱乐部网络落地

    联合国教科文组织2026科学俱乐部挑战赛亚太站及科学俱乐部网络亚太启动活动在京东方技术创新中心闭幕。活动汇聚全球科教代表、杰出女科学家等80余位嘉宾,共商科教协同发展。继2025年在非洲落地全球首个科学俱乐部网络后,京东方与UNESCO将模式拓展至亚太,标志着“科学十年”倡议的重要里程碑。京东方以创新科技赋能活动,彰显中国科技企业助力全球STEM教育、践行可持续发展的责任担当。

  • 腾讯混元最新数据:Hy3 preview上线两周Token调用量激增 超上版本10倍

    今日,腾讯混元官方发文称,自Hy3 preview上线以来,其Token调用量持续增加,目前总量已经是上一代版本模型Hy2的10倍之多。 尤其是代码和智能体类场景的Token调用量增明显,在腾讯的WorkBuddy/Codebuddy以及Qclaw类应用中,增长幅度超过16.5倍。 此外,来自OpenRouter的公开数据显示,Hy3 preview在过去一周以3.66万亿Token的调用量拿到周榜总榜以及市场占有率双第一”,并且在编程和工具�

  • 腾讯最强!混元Hy3 preview发布并开源:底层推倒重建

    腾讯正式发布并开源混元Hy3 preview大语言模型,该模型为混元基础设施重建后的首个成果,采用快慢思考融合的混合专家架构,总参数295B,激活参数21B,最大支持256K上下文长度。 模型遵循能力体系化、评测真实性、性价比追求三大实用原则,在复杂推理、指令遵循、上下文学习、代码生成与智能体(Agent)能力上实现显著提升。

  • MicroComputer深度评测:助力Token吞吐飙升,忆联AM6D1 PCIe 5.0 SSD击穿AI存储墙

    本文介绍了忆联AM6D1 PCIe 5.0固态硬盘,它采用4通道DRAMLess主控设计,旨在解决AI大模型本地部署中的存储瓶颈。测试显示,其顺序读写速度分别超过11400MB/s和10900MB/s,随机4K读写性能达1600K+ IOPS和1150K+ IOPS。在加载32B和235B大模型时,耗时仅10.52秒和53.99秒,游戏载入测试也表现出色。同时,其功耗控制优秀,空闲功耗可低至3mW。该产品兼顾高性能与低成本,适合从工作站到移动设备的全场景AI部署需求。

  • DELIVAN品牌伯明翰车展全球首发,奇瑞商用车FSCV计划再添里程碑

    4月21日,奇瑞商用车在伯明翰商用车展发布全新数字化智能商用车品牌DELIVAN。该品牌定位“未来超级商用车”,以“全生命周期价值伙伴”为核心,通过“品牌欧洲化、数据商用化、价值共享化、运营本地化”四大特质,构建“1+3”品牌生态体系,涵盖服务、智能科技和改装三大子品牌。DELIVAN以深度本地化战略扎根欧洲,组建本地大使矩阵,整合政府、产业、金融等资源,助力欧洲商用车绿色转型。

  • AI日报:快手拟分拆可灵AI独立融资;360升级“安全龙虾”平台;网信办要求AI生成视频必须标注

    快手拟分拆可灵AI独立融资,估值200亿美元剑指明年IPO,其年化营收已破3亿美元,覆盖C端订阅与B端API调用,全球创作者超6000万。网信办发布短视频标注新规,要求平台为AI生成及虚构内容提供六类必选标签,强化存量视频追溯补标,推动产业合规。小米自研大模型MiMo获国际认可,百度发布Ernie5.1预训练成本骤降94%,性能挺进全球Search排行前四。360升级“安全龙虾”平台,10分钟可自建专家智能体;Claude Code推出Agent View统管后台AI任务。宇树科技发布全球首款量产载人变形机甲GD01,起售价390万元。谷歌地图深度集成Gemini,CarPlay导航将进入对话时代。

  • 灵瑞集首发瑞兽AI灵宠:以IP重构AI陪伴新范式

    芯伴科技推出“灵瑞集”AI灵宠系列,以中国瑞兽文化为内核,结合自研角色性格模型与全场景交互技术,打造6款差异化IP角色(辟邪、天禄、九尾狐等),定价169元起。产品搭载4G独立联网模块、长续航与Type-C快充,实现无WiFi秒级响应;配套互动小程序与治愈经营游戏,构建“硬件+软件+内容”生态闭环。该系列旨在将传统瑞兽转化为年轻人专属的“有文化、有温度、可成长”情感陪伴伙伴,降低AI潮玩体验门槛。

  • 海尔智家发布2025年ESG报告:MSCI评级AA行业最高

    海尔智家发布2025年ESG报告,MSCI ESG评级获AA级(国内家电行业最高),连续四年位居《财富》中国ESG影响力榜行业榜首。公司承诺2050年实现全球运营碳中和,打造全场景绿色方案(AI智慧能源管理节能20%以上),建成13座“灯塔工厂”,构建行业首个全链路循环体系(累计回收近3000万台废旧家电)。同时深耕社会公益(援建406所希望学校)与员工关怀,完善现代治理架构,以全链条实践回应全球可持续发展期待。

  • 中国优秀的AI企业有哪些?科技巨头——联想集团用“AI原生”战略给出答案

    联想集团作为中国优秀AI企业的标杆,通过混合式AI战略和ESG双重底色展现多维竞争力。其不仅在CDP气候、水安全及供应商参与度三项评级中获最高“A”级,连续三年蝉联供应商参与度A级,更在AI领域加速布局,提出成为AI原生公司目标,预计营收突破5600亿元。通过构建从终端到云端的全栈AI能力,联想推动AI规模化应用,并深度融合绿色供应链管理,实现技术与社会责任的平衡,成为全球AI竞赛中不可忽视的中国力量。

  • 被AI洗牌的人才市场:谁在决定你的身价?

    全球科技公司大裁员还在继续。今年2月以来,多家公司宣布裁员,有的裁员规模甚至是公司成立以来最大的一次。 甲骨文一夜之间上演「跨国大清洗」,预计裁员人数高达3万。Twitter前CEO Jack Dorsey创办的金融科技公司Block更是一次性砍掉40%员工。Meta也被曝正计划启动新一轮大规模裁员,20%(近1.6万)员工或将丢掉工作。 科技行业的大规模裁员正在世界各地蔓延。4月8日,《�

今日大家都在搜的词: