首页 > 业界 > 关键词  > SD最新资讯  > 正文

比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型

2024-08-12 17:37 · 稿源: 新智元公众号

【新智元导读】近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 微算法科技(NASDAQ MLGO)研究基于信任场模型的异构物联网区块链分片算法,提高区块链的可扩展性

    物联网设备激增带来海量数据,区块链技术虽能保障安全交互,但可扩展性不足。微算法科技提出基于信任场模型的异构物联网区块链分片算法,通过多维度评估设备信任度并聚类分片,实现并行交易处理。该方案提升系统扩展性、安全性和效率,在智能电网、智慧交通、医疗物联网等领域具有应用前景,推动区块链与物联网深度融合。

  • 忆联AE531 QLC SSD以三重创新,破局存储密度与能效

    在AI与高性能计算推动下,存储技术不再局限于容量突破,更致力于性能、能效与兼容性的全局优化。忆联消费级SSD AE531以QLC介质为基础,通过架构创新与智能温控实现存储密度提升超30%、运行温度≤60℃及无缝兼容三大突破。其采用优化的DRAM-less架构,顺序读写达6800/5600MB/s,4K随机读写达700K/800K IOPS,突破传统QLC性能瓶颈。产品通过7000余项测试,支持全平台兼容与硬件加密,以高密度、低功耗、强兼容的核心竞争力重新定义消费级SSD的TCO价值体系,推动TB级存储普及。

  • 盈利仅用4年、上市却不融资,岚图图什么?

    这个10月,两家自主车企新能源高端品牌几乎同时冲击港股。 一家是赛力斯,旗下有与华为深度合作的问界品牌,2024年销量43万辆。10月13日,赛力斯通过港交所上市聆讯,计划募资约156亿港元。 另一家是岚图,东风旗下的高端新能源品牌,2024年销量8万辆,行业排名第12位;它的核心车型MPV“梦想家”,2024年销量4.7万辆,在新能源MPV市场排名第二。 10月2日,岚图递交招股书�

  • 马斯克:特斯拉FSDV14.2会大规模推送

    特斯拉FSD V14.2无人驾驶系统即将全面更新,马斯克确认该系统稳定性更佳、功能更完善。新版已解决超92%技术障碍,尤其在变道迟疑和刹车异常方面优化显著。新增"疯狂麦克斯"模式兼顾高速行驶与主动变道策略,智能性较前代大幅提升。实测显示系统能高效应对复杂路况,完成并行操作,体现高识别功能与稳健驾驶风格。马斯克表示V14.2将推动FSD大规模应用,后续版本将持续迭代,助力无人驾驶迈向新时代。

  • 打破应用孤岛——个推AI SDK全面接入MCP全场景能力

    大模型技术正推动产业从移动互联网向智能互联网跃迁,用户需求转向场景化、主动化、闭环化的智能体验。个推推出行业首个AI+SDK,集成自然语言交互、上下文理解、行业知识库等能力,帮助APP一键集成AI功能,降低开发成本。通过智能搜索、跨应用服务协同(MCP)等,实现从"字面匹配"到"意图识别"的升级,为用户提供精准服务。该方案已接入AI协同应用创新平台,支持多行业快速构建专业可信的智能应用生态。

  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • 来教装展,看全栈自主可控国产教育大模型何以赋能教学?

    10月24-26日,第86届中国教育装备展在青岛举行。科大讯飞以“全栈自主可控国产教育大模型”为核心,展示五大智慧教育场景:智慧教学通过AI黑板实现师生协同,提升效率;科学教育推出AI虚拟科学家互动平台,激发探索精神;身心健康方案构建体育健康闭环与心理服务体系;教育治理推出数据驱动决策平台;学前教育引入游戏化学习产品。目前方案已覆盖全国5万余所学校,服务超1.3亿师生,展现AI从工具升级为“教育伴侣”的价值。

  • AI日报:微软发布首款自研图像生成模型 MAI-Image-1;百度世界大会时间公布;AI大牛开源nanochat教学工具

    微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。

  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    ​这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL

今日大家都在搜的词: