训练成本降低16倍，极限压缩42倍！开源文本生成图片模型

2023-09-18 08:41 · 稿源： AIGC开放社区公众号

Stable Diffusion是目前最强开源文本生成图片的扩散模型之一，但对于那些没有A100、H100的中小企业、个人开发者来说有一个很大缺点，需要花费高昂的训练成本。为了解决这一痛点，Wuerstchen开源模型采用了一种全新的技术架构，在保证图片质量的情况下实现了42倍极限压缩。以512x51

......

本文由站长之家合作伙伴自媒体作者“AIGC开放社区公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

模型

如何辨别AI生成的图片文字声音？分享一些小技巧

在人工智能生成内容日益普及的今天，辨别AI生成的图片、文字和声音变得尤为重要。以下是一些实用的技巧，希望能帮到你……

如何辨别AI生成的图片文字声音 AI生成 AI生成内容
鸿蒙微信1.0.7.16开启邀测升级：支持管理黑名单、图片发送前编辑

鸿蒙微信1.0.7.16（1050384）版本开启邀测升级，测试时间为2025/5/26-2025/6/25，需收到短信通知后点击链接跳转安装，无法主动下载安装。这次升级功能更加完善，新增了包括管理通讯录黑名单、图片发送前支持编辑、置顶聊天支持折叠等实用功能。

鸿蒙微信版本升级功能更新
火山引擎推出豆包·语音播客模型：文本秒变双人对话播客，5 秒生成热点音频！

5月20日，火山引擎推出豆包·语音播客模型，实现文本秒转专业播客内容。该模型三大优势：1）自然流畅的双人对话效果，语音拟真度高；2）支持热点话题即时生成，5秒产出最新资讯播客；3）提供端到端创作链路，支持超长文本/网页链接转播客。相比传统AI播客，解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端，6月11日将在火山引擎大会上展示更多功能。

火山引擎豆包语音播客 AI创作
原来微信过期图片是可以找回的上热搜腾讯员工否认

日前，词条“原来微信过期图片是可以找回的”登上微博热搜，引发众多网友热议。在该词条下，有网友发布“教程”，详细讲解如何找回微信过期图片，这一内容迅速吸引了大量关注。然而，微信员工“客村小蒋”转发该“教程”并作出回应，直言“没有一处是对的”，明确指出该做法行不通。同时，“客村小蒋”还针对网络上

微信过期图片找回方法
荐月访问量超千万的AI图片产品，如何炼成

作为与 AI 最容易产生化学反应的图片行业，在 AIGC 来临后最早起势，但同样面临竞争激烈、产品同质化等挑战，而在如今图片编辑细分方向几乎处于横盘的状态下，这类产品前路如何、团队如何维系用户基础、又怎样探索新的增长机会?在上个月的 GTC 全球流量大会上，我

AI图片编辑 AI图片生成 AIGC行业分析
腾讯混元上线“游戏工业级”视觉生成平台：效率最高提升数十倍！

腾讯5月20日发布混元游戏视觉生成平台，该平台基于混元大模型打造，专为游戏行业内容生产设计。平台能快速生成高质量游戏素材和概念草图，支持多种主流游戏风格，实现创作闭环。通过AI技术，可将整套流程压缩至一个工作页面，用户只需输入提示词即可获得灵感参考图，并直接绘制草图和生成标准三视图及360度旋转演示视频，效率最高提升数十倍。平台还具备角色多视图自动生成能力，上传一张正面图即可自动生成标准三视图和360度展示视频，角色一致性最高达99%。腾讯表示，该平台将显著改善灵感迟滞、多视图缺失等常见问题。

腾讯混元游戏 AI内容引擎
荐AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

本文汇总了AI领域最新动态：1)中国信通院发布智能体开发标准，推动AI商业化进程；2)阿里推出QwenLong-L1-32B长文本推理模型，性能媲美Claude-3；3)GPT-4o语音模式升级，新增唱歌功能；4)秘塔AI搜索推出极速模型，响应速度达400tokens/秒；5)谷歌发布LMEval评估框架，统一大模型评测标准；6)Chrome浏览器集成Gemini AI助手；7)阿联酋全民免费使用ChatGPT Plus；8)苏州成立60亿元AI产业基金；9)法国Kyutai实验室推出10秒定制语音的Unmute系统；10)UAV-Flow项目实现无人机语音精准控制；11)Claude将升级支持百万字上下文和记忆功能；12)百度心响iOS版上线；13)夸克推出高考深度搜索功能；14)Chrome v137开发者工具升级；15)美团AI业务接近GPT-4o水平；16)Direct3D-S2实现3D生成速度提升10倍；17)OpenAI计划2026年推出首款AI硬件。

人工智能软件开发 AI标准
594.15元起人人买得起魅族Note 16系列卖爆：销量增长10倍

魅族Note16系列正式发布，包含Note16和Note16 Pro两款机型。Note16起售价594.15元，配备6.78英寸120Hz LCD屏、5000万双摄、6600mAh电池和40W快充；Note16 Pro起售价1274.15元，搭载骁龙7s Gen3处理器、1.5K 144Hz OLED屏、6200mAh电池和80W快充，支持IP68级防尘防水。开售5小时销量较上代增长10倍，跻身京东天猫同价位段销量TOP3。魅族称该系列定位"人人都买得起、用得爽的国民手机"。

魅族Note 16 魅族手机
荐即梦图片3.0又重磅更新，这可能是对普通人最有用的一次。

MD，这次连设计师的参考图也一键干碎了。。。我测了整整一夜，现在是凌晨4点21，我还在写这篇文章。我人真的傻了，我真的不愿意用一些什么很夸张的词语，但是即梦的绘图，每一次，带给我的震撼，都会觉得，我这么多年的设计师生涯，在AI的进化速度面前，不值一提。什么样的言语，都无法比拟直接看图来的直接，直接给你们看效果。这是一张，很好看的北京的�

AI绘图设计师工具即梦图片3.0
持续霸榜！可灵2.0模型登顶全球视频生成大模型榜单

快手旗下可灵AI 2.0模型在权威AI评测中表现优异，以1124分超越自研1.6版本，连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示，自2023年6月上线以来，可灵AI全球用户突破2200万，月活激增25倍，累计生成视频1.68亿个、图片3.44亿张。商业化方面，其单月流水已超千万元，并与伊利、vivo等头部品牌达成深度合作，展现出AI视频生成技术的广阔商业前景。

热文

3 天
7天

训练成本降低16倍，极限压缩42倍！开源文本生成图片模型

如何辨别AI生成的图片文字声音？分享一些小技巧

鸿蒙微信1.0.7.16开启邀测升级：支持管理黑名单、图片发送前编辑

火山引擎推出豆包·语音播客模型：文本秒变双人对话播客，5 秒生成热点音频！

原来微信过期图片是可以找回的上热搜腾讯员工否认

荐月访问量超千万的AI图片产品，如何炼成

腾讯混元上线“游戏工业级”视觉生成平台：效率最高提升数十倍！

荐AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

594.15元起人人买得起魅族Note 16系列卖爆：销量增长10倍

荐即梦图片3.0又重磅更新，这可能是对普通人最有用的一次。

持续霸榜！可灵2.0模型登顶全球视频生成大模型榜单

热文

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

从心脏、到血管……3D打印开启“器官替换”时代

无缝且安全的密钥导入、导出功能将登陆苹果系统

点击已死？“AI引用”才是流量未来，SEO正在被SAO、AEO取代

苹果研究发现：AI 模型在遇到复杂难题时会“崩溃放弃”

王自如：在格力工资是以前几分之一有公开资料可查

苹果举行WWDC 25开发者大会 iOS 26更新汇总

李世石：AI不会“解读”……直觉依然属于人类！

iOS26的这五大“新功能”，我在安卓机上已经用了好几年！

苹果公布 Intel Mac 支持终止时间表，Rosetta 2 也将逐步淘汰

苹果全新AirTag即将推出：将有这几点提升

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

格力否认董明珠孟羽童直播是策划：就是一次很自然的会面

站长商机