首页 > 业界 > 关键词  > OnnxStream最新资讯  > 正文

OnnxStream:内存友好的机器学习推理引擎 可在树莓派Zero 2上运行Stable Diffusion 1.5

2023-10-08 10:12 · 稿源:站长之家

站长之家(ChinaZ.com)10月8日 消息:OnnxStream是一款专注于减少内存占用、提高推理效率的机器学习推理引擎。它的设计目标是在资源受限的环境中运行深度学习模型,如树莓派Zero2,该设备只有512MB的RAM。

通过OnnxStream,用户现在可以在这种低功耗设备上运行复杂的算法,这对于需要在移动环境中处理大量数据的用户来说是一个重大突破。

image.png

项目地址:

https://github.com/vitoplantamura/OnnxStream/tree/846da873570a737b49154e8f835704264864b0fe

目前,OnnxStream的源代码已经在GitHub上开源,任何感兴趣的用户都可以查看和使用。这一创新为在资源有限的环境中运行深度学习算法提供了新的可能性,对于技术爱好者和开发者来说是一个令人振奋的消息。

核心功能:

1. 内存占用极低:OnnxStream的最大特点之一是其出色的内存管理能力。它可以将内存占用降低到极低的水平,甚至可以在RAM只有512MB的树莓派Zero2上运行大型深度学习模型,如Stable Diffusion XL1.0。

2. 权重加载器:OnnxStream提供了权重加载器(WeightsProvider)的接口,用户可以根据自己的需求实现不同的权重加载逻辑。默认情况下,OnnxStream提供了两种加载器:DiskNoCache和DiskPrefetch,分别用于不缓存和预加载权重数据。

3. 注意力切片:在运行UNET模型时,OnnxStream支持注意力切片(Attention Slicing),这可以显著减少计算中的内存占用,从而使模型在资源受限的设备上运行更加顺畅。

4. 动态量化和静态量化:OnnxStream支持动态量化和静态量化,这有助于减少模型的内存占用,并提高推理速度。用户可以根据自己的需求选择不同的量化方式。

5. 跨平台支持:OnnxStream可以在多个平台上运行,包括Linux、Mac、Windows和Termux。它的跨平台性使得用户可以在不同的设备上灵活使用。

举报

  • 相关推荐
  • 算力架起文明之桥 ——新维畅想携手 AMD 解码古埃及萨卡拉文明密码

    在埃及萨卡拉沙漠,中埃联合考古队于2025年启动第四季考古,利用新维畅想与AMD合作打造的AI算力平台,对4500年历史的阶梯金字塔及木乃伊棺椁进行数字化保护。面对50℃高温、缺氧墓室等极端环境,团队采用高精度扫描设备采集上万张照片,并通过AMD EPYC处理器和Radeon显卡的协同算力,成功处理百亿像素数据,实现文物三维重建与色彩还原,将模糊雕刻信息向前推进20个王朝,为全球文化遗产打造“数字永生”范例。

  • 芯联生态 智合共赢|2026 AMD EPYC 行业生态峰会・深圳站制造业专场圆满举办

    AMD于2026年6月10日在深圳举办“芯联生态 智合共赢”制造业生态峰会,聚焦工业AI、高性能计算与制造业数字化融合,汇聚550余位行业专家。峰会围绕以算力驱动研发仿真、智能生产、工业质检等核心议题展开探讨,展示EPYC处理器与Radeon PRO显卡的“CPU+GPU”异构算力平台,携手Ansys、openEuler等生态伙伴,为制造业提供从硬件到软件的一体化解决方案,助力中国制造业智能化转型。

  • CAME喀美亮相永康门博会:意式门控科技与Motorline新品引关注

    2026年5月26-28日,第16届中国(永康)国际门业博览会圆满落幕。CAME咔美以“意识科技·智启未来”为主题,携经典产品及子品牌Motorline新品亮相A馆A3T16展位,并采用线上线下联动模式,通过直播与全国合作伙伴深度交流。展会重点展示了FROG系列、FLUO系列及两款Motorline新品——STARK系列(工业级重型滑动门机,最大门重8000kg)和FORT系列(住宅平移门机,噪音低至50dB)。CAME与Motorline双品牌协同,为住宅、商业及工业领域提供精准出入口控制解决方案。

  • OPPO首款阔折叠已开案:尺寸和苹果iPhone Ultra接近 售价过万

    有博主爆料,OPPO首款阔折叠屏目前已经进入开案测试阶段,新品预计在明年Q1正式亮相,这可能会是安卓阵营最强悍的阔折叠旗舰。 新机的硬件规格已经基本敲定,配备7.6英寸内屏和5.5英寸外屏,两块屏幕的供应商是京东方和三星,其尺寸和苹果即将发布的iPhone Ultra折叠屏非常接近,整体比iPad mini还要小一圈,单手握持的压力不大。 核心性能层面,OPPO阔折叠将会搭载高通骁

  • 苹果折叠屏不再是传说!iOS 27提前泄露iPhone Ultra:9月见真章

    苹果在WWDC2026首日推送了iOS 27首个开发者测试版,开发者从底层代码中发现三组关键参数:foldState(判断设备闭合、展开或半折叠状态)、angleDegrees(精确读取铰链开合角度)及MG key(双屏数据读取接口)。这些代码去年iOS 26测试版中完全不存在,证实苹果折叠屏设备iPhone Ultra正在同步进行系统联调测试,预计今年9月正式亮相。苹果正提前为折叠屏做全链路系统适配,确保多屏联动、应用流转等体验达到统一标准。

  • vivo X300 Ultra影像实测|全焦段V单创作真实体验

    vivo X300Ultra定位“最强全能影像旗舰”,采用蔡司三大全主摄大底镜头(14mm超广角、35mm人文纪实、85mm云台级长焦),覆盖黄金创作焦段,全焦段支持4K120fps 10bit Log与杜比视界,配备NICE3.0画质引擎与多光谱传感器。实测白天色彩自然、夜景氛围感强、人像肤质通透、长焦准焦率提升显著,视频规格满足专业创作需求。适合专业创作者、Vlog博主与演唱会观众,售价6999元起。

  • iPhone Ultra详细规格偷跑:A20 Pro+7.8英寸屏 苹果首款大折叠

    苹果首款折叠屏iPhone Ultra将于今年秋季发布,硬件规格提前曝光。该机采用横向大折叠设计,配备5.5英寸外屏和7.8英寸内屏,由三星供应,采用新铰链工艺实现近乎无折痕效果。性能上首发A20 Pro芯片,标配12GB内存,内置自研C2基带,电池容量达5500mAh。相机仅保留4800万像素主摄和超广角,取消长焦镜头。取消实体SIM卡槽,仅支持eSIM,展开厚度4.5mm,折叠后9.2mm。还砍掉Face ID改用侧边指纹,音量键移至顶部,交互逻辑与以往iPhone差异显著。这标志着苹果在折叠屏赛道上的差异化尝试。

  • 板选X3D,U超X3D,6月装机就看这几款AMD主板

    2026年618大促启动,AMD平台装机热度攀升。技嘉AM5系列主板凭借扎实用料、完善功能与可靠售后成为玩家首选。主流价位B850M AORUS PRO WIFI7以均衡配置受关注,配备12+2+2相80A供电、双PCIe5.0 M.2接口及Wi-Fi7网络。X870E AORUS PRO ICE冰雕采用全白设计,搭载18+2+2相110A供电和双USB4接口,兼顾美学与旗舰性能。X870E AORUS ELITE X3D小雕在2000元档以16+2+2相80A供电和4个M.2插槽展现竞争力。全系标配D5内存黑科技2.0,X3D型号支持鸡血模式2.0,性能提升最高25%,配合4年质保与个人送保服务,提供可靠品质保障。

  • AI日报:阿里上线首个官方大模型NBA Chat; Ideogram4.0开源发布;OpenAI升级ChatGPT记忆系统

    今日AI领域动态:Ideogram 4.0开源发布,93亿参数打造最强文字生成AI,提升海报与品牌营销创作;OpenAI升级ChatGPT记忆系统,算力降至1/5,解决过时与准确性痛点;腾讯文档推出行业首创“人机双写”原生编辑器;xAI发布Grok Imagine Video 1.5,支持图片转视频;豆包回应AI识别野生蘑菇误判,强调仅供参考;知乎Q1扭亏为盈,AI短剧成增长点;腾讯云ADP 4.0新增Claw模式,提升企业Agent构建效率;NBA中国与阿里推出首个官方大模型“NBA Chat”。

  • 率先支持 AMD EXPO™ ULL | Origin Code部分Vortex DDR5内存套装正式兼容新一代超频规范

    Origin Code宣布旗下部分Vortex DDR5内存套装已正式支持AMD最新EXPO™ ULL规范,成为业内首批支持该技术的品牌之一。该规范优化了DDR5内存超频配置,在兼容性、训练机制及高频扩展能力上全面提升。目前已有48GB(6000CL26/6200CL28)及96GB(6000CL26)等多款配置完成优化适配。此外,Origin Code将在COMPUTEX 2026现场展示基于新规范的高频DDR5配置,并首次公开与Futuremach联合打造的全新开放式机箱。

今日大家都在搜的词: