比Stable Diffusion便宜118倍！1890美元训出11.6亿参数高质量文生图模型

2024-08-12 17:37 · 稿源：新智元公众号

【新智元导读】近日，来自加州大学尔湾分校等机构的研究人员，利用延迟掩蔽、MoE、分层扩展等策略，将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法（Wuerstchen）用了28400美元，而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

微算法科技（NASDAQ MLGO）研究基于信任场模型的异构物联网区块链分片算法，提高区块链的可扩展性

物联网设备激增带来海量数据，区块链技术虽能保障安全交互，但可扩展性不足。微算法科技提出基于信任场模型的异构物联网区块链分片算法，通过多维度评估设备信任度并聚类分片，实现并行交易处理。该方案提升系统扩展性、安全性和效率，在智能电网、智慧交通、医疗物联网等领域具有应用前景，推动区块链与物联网深度融合。

物联网区块链数据安全
忆联AE531 QLC SSD以三重创新，破局存储密度与能效

在AI与高性能计算推动下，存储技术不再局限于容量突破，更致力于性能、能效与兼容性的全局优化。忆联消费级SSD AE531以QLC介质为基础，通过架构创新与智能温控实现存储密度提升超30%、运行温度≤60℃及无缝兼容三大突破。其采用优化的DRAM-less架构，顺序读写达6800/5600MB/s，4K随机读写达700K/800K IOPS，突破传统QLC性能瓶颈。产品通过7000余项测试，支持全平台兼容与硬件加密，以高密度、低功耗、强兼容的核心竞争力重新定义消费级SSD的TCO价值体系，推动TB级存储普及。

存储技术 QLC介质 SSD性能
荐盈利仅用4年、上市却不融资，岚图图什么？

这个10月，两家自主车企新能源高端品牌几乎同时冲击港股。一家是赛力斯，旗下有与华为深度合作的问界品牌，2024年销量43万辆。10月13日，赛力斯通过港交所上市聆讯，计划募资约156亿港元。另一家是岚图，东风旗下的高端新能源品牌，2024年销量8万辆，行业排名第12位;它的核心车型MPV“梦想家”，2024年销量4.7万辆，在新能源MPV市场排名第二。 10月2日，岚图递交招股书�

新能源高端品牌港股上市
马斯克：特斯拉FSDV14.2会大规模推送

特斯拉FSD V14.2无人驾驶系统即将全面更新，马斯克确认该系统稳定性更佳、功能更完善。新版已解决超92%技术障碍，尤其在变道迟疑和刹车异常方面优化显著。新增"疯狂麦克斯"模式兼顾高速行驶与主动变道策略，智能性较前代大幅提升。实测显示系统能高效应对复杂路况，完成并行操作，体现高识别功能与稳健驾驶风格。马斯克表示V14.2将推动FSD大规模应用，后续版本将持续迭代，助力无人驾驶迈向新时代。

特斯拉 FSD V14.2
打破应用孤岛——个推AI SDK全面接入MCP全场景能力

大模型技术正推动产业从移动互联网向智能互联网跃迁，用户需求转向场景化、主动化、闭环化的智能体验。个推推出行业首个AI+SDK，集成自然语言交互、上下文理解、行业知识库等能力，帮助APP一键集成AI功能，降低开发成本。通过智能搜索、跨应用服务协同（MCP）等，实现从"字面匹配"到"意图识别"的升级，为用户提供精准服务。该方案已接入AI协同应用创新平台，支持多行业快速构建专业可信的智能应用生态。

AI技术产业革命智能互联网
荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

视觉中国与多家AI公司合作开发可商用视觉大模型，已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频，引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人，仅保留Meta AI。宇树科技推出仿人机器人Unitree H2，具备拟人化设计。谷歌为Gemini集成地图数据工具，可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器，但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能，可分析手机未分享照片。

AI 视觉大模型版权合规
来教装展，看全栈自主可控国产教育大模型何以赋能教学？

10月24-26日，第86届中国教育装备展在青岛举行。科大讯飞以“全栈自主可控国产教育大模型”为核心，展示五大智慧教育场景：智慧教学通过AI黑板实现师生协同，提升效率；科学教育推出AI虚拟科学家互动平台，激发探索精神；身心健康方案构建体育健康闭环与心理服务体系；教育治理推出数据驱动决策平台；学前教育引入游戏化学习产品。目前方案已覆盖全国5万余所学校，服务超1.3亿师生，展现AI从工具升级为“教育伴侣”的价值。

教育装备展示会人工智能+教育智慧教学
一图读懂FusionXpark™随身智能体开发平台

文章搜索核心标签内容检索
AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

微软发布首款自研图像生成模型MAI-Image-1，跻身LMArena前十，注重实用性与光影效果；百度世界2025大会将聚焦大模型与AI全球化战略；Meta新技术使RAG推理速度提升30倍；开源项目nanochat实现低成本构建聊天AI；谷歌NotebookLM新增动漫视频生成功能；中国农大发布神农大模型3.0助力智慧农业；腾讯启动"青云奖学金"培养AI人才；苹果FS-DFM模型长文本生成效率提升128倍；谷歌Lens整合AI图像编辑功能；港大与美团提出CodePlot-CoT方法，通过代码绘图解决数学难题，性能提升21%。

AI 图像生成微软
荐只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型。

这几天，OCR这个词，绝对是整个AI圈最火的词。因为DeepSeek-OCR，甚至让OCR这个赛道文艺复兴，又给直接带火了。整个Hugging Face的趋势版里，前4有3个OCR，甚至Qwen3-VL-8B也能干OCR的活，说一句全员OCR真的不过分。然后在我上一篇讲DeepSeek-OCR文章的评论区里，有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比，也有很多人都在问，能不能再解读一下百度那个OCR模型（也就是PaddleOCR-VL

OCR DeepSeek-OCR PaddleOCR-VL

今日大家都在搜的词：

热文

3 天
7天

比Stable Diffusion便宜118倍！1890美元训出11.6亿参数高质量文生图模型

微算法科技（NASDAQ MLGO）研究基于信任场模型的异构物联网区块链分片算法，提高区块链的可扩展性

忆联AE531 QLC SSD以三重创新，破局存储密度与能效

荐盈利仅用4年、上市却不融资，岚图图什么？

马斯克：特斯拉FSDV14.2会大规模推送

打破应用孤岛——个推AI SDK全面接入MCP全场景能力

荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

来教装展，看全栈自主可控国产教育大模型何以赋能教学？

一图读懂FusionXpark™随身智能体开发平台

AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

荐只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型。

今日大家都在搜的词：

热文

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

REDMI K90标准版12+512GB降价300元小米回应：可退差价

小米汽车发布跨年购置税补贴方案至高不超15000元

卢伟冰：REDMI K90标准版12+512首销月直降300 售价2899元

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

华为nova Flip S小折叠开售：首发3388元起

真我GT8发布：售价2899元起骁龙8至尊版双芯

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

余承东官宣华为路由X3 Pro 采用“日照金山”设计

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

站长商机