旷视发布HiDiffusion，SD生成速度更快，图片质量更高

2024-04-25 11:29 · 稿源：站长之家

站长之家（ChinaZ.com）4月25日消息:最近，旷视发布的HiDiffusion技术，近日引起业界广泛关注。这一新技术只需一行代码，便能显著提升SD（扩散模型）生成图像的分辨率和生成速度，允许图像生成的分辨率高达4096×4096，同时将图像生成速度提高1.5至6倍。值得一提的是，HiDiffusion不仅支持所有SD模型，也兼容SD模型的下游模型，如Playground。

QQ截图20240425111400.png

在详细介绍中，我们了解到，当直接使用已训练好的图像扩散模型尝试生成更高分辨率的图像时，常会遇到图像中对象不合理重复的问题，且图像生成时间会大幅增加。研究发现，这种对象重复问题主要由U-Net模型深层中的特征重复导致，而图像生成时间增长则主要是由于U-Net中一个自机制注意力的动画操作所致。

为了解决这些问题，旷视推出了新的高分辨率生成框架——HiDiffusion。该框架包含一个称为认知分辨率U-Net（RAU-Net）的模块，能够动态调整特征图尺寸，有效避免了图像中的对象重复现象。此外，HiDiffusion还采用了一种优化后的窗口注意力机制，称为修改版本升降窗多头自注意力(MSW-MSA)，显着减少了计算量。

通过将HiDiffusion应用于各种预训练的扩散模型，不仅可以将图像生成的分辨率提高至4096×4096，而且能将图像生成速度提升1.5至6倍。广泛的实验验证表明，这一方法不仅解决了对象重复和高计算负担的问题，而且在生成高分辨率图像的任务上取得了卓越的效果。

项目页:https://top.aibase.com/tool/hidiffusion

代码:https://github.com/megvii-research/HiDiffusion

（举报）

相关推荐

关键词：

vivo Vision探索版发布将于明日开放线下体验

今日下午，vivo正式发布了备受瞩目的vivo Vision探索版MR头显，尽管该设备暂未确定上市销售时间，但已引发市场广泛关注。从8月22日起，北京、深圳等10余座城市的12家vivo官方授权体验店将率先开启抢先预约体验活动，后续还将有第二批线下体验门店加入，让更多消费者有机会亲身感受这款创新产品的魅力。

vivo Vision探索版 MR头显
豆包1.5 Vision Lite 对比 GPT-5-min，谁更适合你？实测AI模型选型利器｜AIBase

文章探讨了企业选择AI大模型时面临的实际决策难题，指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台（https://model.aibase.cn/compare）通过三大核心价值解决痛点：1）聚焦业务场景而非参数堆砌，突出价格、语言支持、上下文长度等实用维度；2）透明化成本计算，标注长文本溢价规则和多模态附加费；3）一键生成对比报告。平台特别强调中文场景的特殊性（如豆包1.5在中文处理成本的优势），并揭示厂商宣传中容易忽略的隐藏成本（如GPT-5-min超5000字符的30%溢价）。典型电商客服案例显示，需综合中文理解、多模态、性价比等维度决策，最终选择取决于具体业务需求而非绝对性能排名。

智能客服系统中文场景预算有限
全球最轻的MR头显！vivo Vision探索版亮相：仅重398g

今天下午，vivo Vision发布会暨影像盛典正式开启，vivo Vision探索版正式亮相，这是蓝厂首款MR头显。 vivo智慧终端产品总经理洪沂介绍，vivo Vision从一开始立项，减重”就是核心命题，因为太重的话大家就很难长时间沉浸体验。目前市面上的大部分MR头显设备重量都超过了500g，苹果Vision Pro的重量甚至超过了600g，这次vivo Vision探索版的重量压缩至398g，是目前行业内最轻的MR头显。

vivo Vision MR头显
vivo Vision探索版双目8K分辨率 1000度近视也能用

今日，vivo首款混合现实设备vivo Vision探索版正式亮相。 vivo Vision探索版采用双目8K Micro-OLED屏幕，拥有94% DCI-P3色域，色彩准确度E2。通过双目校准，保证每台设备的两块屏幕保持一致的、专业级电影监视器的色彩容差体验。

vivo Vision探索版混合现实设备
电子证件（Digital ID）的全球信任度全景：亚洲、中东与非洲领先，欧美市场滞后

Checkout.com最新全球调研报告显示，不同地区对电子证件（digital ID）的接受度存在显著差异。亚洲、中东和非洲消费者对电子证件和生物识别认证表现出高度信任，而欧洲和北美则态度谨慎。AI电商代理的兴起进一步凸显了数字身份验证在交易中的重要性。报告强调，建立数字信任对全球商业发展至关重要，需行业和政策制定者优先考虑数字身份管理方式。

电子证件生物识别认证数字身份系统
vivo Vision官宣8月21日发布：佩戴舒适设计超前

就在刚刚，vivo正式官宣了自家新产品的发布时间。根据vivo官方公告，8月21日下午14点30分，备受期待的Vision将正式与大众见面。 vivo Vision被看作是类苹果Vision Pro的MR头显设备，从目前透露的信息来看，它在交互体验方面有着超前的设计。vivo产品经理韩伯啸提前剧透了不少关键细节，引发了众多科技爱好者的关注。韩伯啸着重强调了vivo Vision的佩戴舒适性，他表示这款设备非�

vivo Vision MR头显设备
主流手机厂商第一款！曝vivo Vision本月正式发布

vivo通信科技有限公司产品经理韩伯啸今天发文透露，vivo Vision发布会已经在紧锣密鼓的准备中了。随后博主数码闲聊站爆料称，vivo Vision将在本月正式发布，这是主流手机厂商中第一个做出的类苹果Vision Pro MR头显设备。

vivo Vision MR头显
荐AI日报：B站测试AI视频工具花生AI；腾讯发布多模态模型Large-Vision；昆仑万维开源Skywork UniPic 2.0

【AI日报】主要内容： 1. B站测试"花生AI"视频工具，3分钟可成片，同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0，实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI，苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision，支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐，仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新：恢复GPT-4o默认模式，为GPT-5引入多模式选择，优化交互体验

AI视频创作花生AI B站AI工具
荐“无限量”供应Claude，就是AI IDE们的百亿补贴

Anthropic于2025年7月28日宣布，将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用，一次使用成本甚至高达数万美元，远远超过普通订阅预期。同样在上个月，Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制，导致大量用户抱怨“实际上并非无限”，纷纷在社群中吐槽，迫使公司CEO出面道歉、甚至给出退款补偿。这两�

文章搜索核心标签 AI工具
每日互动GAI Station亮相2025数博会新一代智能终端为企业落地AI保驾护航

2025中国国际大数据产业博览会于8月27日在贵阳开幕，聚焦数据智能与产业融合。每日互动公司展示其AI拳头产品GAI+Station，这是一站式AI落地应用解决方案，集成算力与知识库，覆盖主流办公场景。同时推出AI机器狗，具备多模态交互能力。展会还呈现“数智绿波”等数据应用成果，提升交通效率20%以上。活动凸显大数据与人工智能深度融合，推动产业智能化升级。

数博会数据智能 AI落地应用

今日大家都在搜的词：

热文

3 天
7天

旷视发布HiDiffusion，SD生成速度更快，图片质量更高

vivo Vision探索版发布将于明日开放线下体验

豆包1.5 Vision Lite 对比 GPT-5-min，谁更适合你？实测AI模型选型利器｜AIBase

全球最轻的MR头显！vivo Vision探索版亮相：仅重398g

vivo Vision探索版双目8K分辨率 1000度近视也能用

电子证件（Digital ID）的全球信任度全景：亚洲、中东与非洲领先，欧美市场滞后

vivo Vision官宣8月21日发布：佩戴舒适设计超前

主流手机厂商第一款！曝vivo Vision本月正式发布

荐AI日报：B站测试AI视频工具花生AI；腾讯发布多模态模型Large-Vision；昆仑万维开源Skywork UniPic 2.0

荐“无限量”供应Claude，就是AI IDE们的百亿补贴

每日互动GAI Station亮相2025数博会新一代智能终端为企业落地AI保驾护航

今日大家都在搜的词：

热文

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为MatePad Mini外观公布支持蜂窝网络通话功能

特斯拉Model 3长续航后轮驱动版降价1万元售价25.95万起

小米汽车8月交付量超3万台全年交付量有望冲击42万

小鹏汽车：8月共交付新车37709台单月交付量创历史新高

苹果上架翻新版Apple Pencil Pro售价849元

零跑汽车8月交付57066台增长超88%

苹果首款折叠iPhone或不会采用屏下指纹将于明年发布

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

今日七夕节微信 520 元大额红包限时上线

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

realme真我15000mAh电池容量手机亮相

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为三折叠屏手机Mate XTs非凡大师上架开启预约

站长商机