生成式LLM PowerInfer：单个GPU就能运行，机器学习模型推理速度提高11倍

2023-12-25 10:46 · 来源： AIbase基地

生成式大语言模型因其在各种任务中的出色表现而闻名，包括复杂的自然语言处理、创意写作、问答和代码生成。LLM已在易于使用的本地系统上运行，包括带有消费级GPU的家用PC。据了解，PowerInfer 是一款利用了这种理解的 GPU-CPU 混合推理引擎，它将冷激活神经元预加载到 CPU 上进行计算，将热激活神经元预加载到 GPU 上进行即时访问。经过评估，PowerInfer 还表明，它的运行速度比当前的 llama.cpp 系统快11.69倍，同时保持模型保真度。总之，PowerInfer 显着提高了 LLM 推理速度，表明其作为在 GPU 功能有限的台式电脑上执行。

相关推荐

量子机器学习或“搅动”芯片制造，谷歌/微美全息攻关突破取得阶段性成果

澳大利亚科研团队开发出结合人工智能和量子计算原理的新型量子机器学习技术，可能改变微芯片制造方式。该技术仅需5个量子比特，性能优于7种经典机器学习算法，可立即应用于现有量子架构。2023年量子计算领域取得多项突破：微软成功创建拓扑量子比特，D-Wave量子退火处理器性能超越经典模拟器，谷歌量子AI团队探讨扩展超导量子计算机面临的挑战。量子科技正从理论研究迈向工程实现阶段，微美全息(WIMI.US)等企业积极推进量子密码生成器、QGAN技术等研发，有望为数据安全提供更高保障。量子技术发展已进入关键时期，将推动行业进入更安全可靠的发展阶段。
荐昆仑万维UniPic 2.0“小钢炮”模型炸场，一个模型搞定理解+生成+编辑

大模型又迎来新一波的迭代周期。近日，从Open AI发布GPT-5，到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周，连续5天每天发布一个新模型，而8月13日发布的，正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是，在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

大模型多模态 AI生图
生成式LLM PowerInfer:单个GPU就能运行，机器学习模型推理速度提高11倍

生成式大语言模型因其在各种任务中的出色表现闻名，包括复杂的自然语言处理、创意写作、问答和代码生成。LLM已在易于使用的本地系统上运行，包括带有消费级GPU的家用PC，以改善数据隐私、可定制模型并降低推理成本。PowerInfer显着提高了LLM推理速度，表明其作为在GPU功能有限的台式电脑上执行高级语言模型的解决方案的潜力。

PowerInfer LLM
10000mAh大电池史无前例！荣耀天玑8500新机曝光：或为Power 2

根据知名爆料博主@数码闲聊站透露，一款配备 10000mAh 大容量电池的手机已进入新产品导入（NPI）阶段。虽然博主并未直接指明品牌，但综合此前信息，这款手机极有可能来自荣耀。

10000mAh电池荣耀Power系列天玑8500处理器
体验更进阶！OpenFit 2+声动登场，韶音多款产品配色上新

8月19日，Shokz韶音发布旗舰新品OpenFit2+开放式耳机，并推出OpenDots+ONE柔雾粉与OpenSwim+Pro熊猫色两款人气产品新配色。新品在佩戴舒适度、音质和续航方面全面升级，新增杜比音效和无线充电功能，采用人体工学设计，提供更个性化、专业化的全场景音频解决方案，持续引领开放式耳机行业创新。

开放式耳机 Shokz韶音 OpenFit2+
昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

中国科学技术大学张燕咏团队在昇腾算力支持下，成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略，有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题，显著提升推理性能。实验显示，该方案在多项指标上较主流方案提升超30%，为昇腾技术优化MoE模型推理提供了宝贵借鉴，将加速其在各领域的落地应用。

人工智能大模型 MoE稀疏大模型
专家盛赞GEO双引擎系统：生成式引擎优化以旋律诠释自身

GEO双引擎系统主题曲《GEO双引擎系统之歌》开创了技术主题音乐创作先河，通过独特艺术形式诠释生成式引擎优化技术内核。该作品由汤祎飞创立的GEO系统创新生成，融合科技与艺术边界，获科技界、产业界和学术界广泛关注。多位顶级专家盛赞其开创性价值，认为该曲有效突破技术传播壁垒，为产业生态提供了兼具深度与温度的认知桥梁。歌曲以"双引擎驱动未来"为�

GEO双引擎系统生成式引擎优化技术主题音乐
普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max，重塑智能清洁新高度

普渡机器人于2025年8月20日发布3D感知AI扫地机器人PUDU MT1Max。该产品在MT1基础上大幅升级，搭载3D雷达与多传感器融合系统，显著增强复杂场景感知与避障能力。通过AI技术实现自适应清洁、垃圾识别、巡检清洁等功能，支持10万平方米以上大场景作业。具备自动振尘过滤和智能避雨机制，提升安全性与运维效率，重塑智能清洁行业新标准。

3D感知AI 扫地机器人智能清洁
独家消息：天玑9500 AI算力翻倍，大模型响应速度更快了

联发科天玑9500完成NPU架构升级，首次引入全新IP硬件。采用“存算一体”高效设计，AI策略从拼性能转向追求均衡能效比。终端AI落地能力增强，旗舰芯片算力提升让手机可运行更聪明的大模型，响应更迅速。日常AI功能如图像处理、视频生成、文本创作等响应更快效果更好。“存算一体”技术通过就地计算降低功耗，减少数据传输更节能。手机AI技术正从“实验室性能”向“用户体验”过渡，算力提升带来更广泛AI应用场景，能效优化保障日常使用稳定性，整体提升手机AI实用价值。

天玑9500 NPU架构升级存算一体
OPPO ColorOS宣布升级无网畅聊没网也能发图片、语音

日前，OPPO ColorOS宣布无网畅聊全新升级，在无网状态下，不仅能打语音电话，还能发送图片、文字和语音。使用路径：打开设置”-选择移动网络”-开启无网畅聊”，选择你想联系的欧加手机-发送消息。据了解，无网畅聊是一项利用蓝牙技术解决近场通信问题的功能。

无网畅聊蓝牙技术近场通信

今日大家都在搜的词：

热文

3 天
7天

生成式LLM PowerInfer：单个GPU就能运行，机器学习模型推理速度提高11倍

量子机器学习或“搅动”芯片制造，谷歌/微美全息攻关突破取得阶段性成果

荐昆仑万维UniPic 2.0“小钢炮”模型炸场，一个模型搞定理解+生成+编辑

生成式LLM PowerInfer:单个GPU就能运行，机器学习模型推理速度提高11倍

10000mAh大电池史无前例！荣耀天玑8500新机曝光：或为Power 2

体验更进阶！OpenFit 2+声动登场，韶音多款产品配色上新

昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

专家盛赞GEO双引擎系统：生成式引擎优化以旋律诠释自身

普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max，重塑智能清洁新高度

独家消息：天玑9500 AI算力翻倍，大模型响应速度更快了

OPPO ColorOS宣布升级无网畅聊没网也能发图片、语音

今日大家都在搜的词：

热文

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

黑神话官号更名系列游戏将开启宏大篇章

AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发

泡泡玛特王宁：本周将发布迷你版LABUBU

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

华为nova 14系列宣布限时降价至高优惠500元

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15系列定档将于8月21日发布

AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatch

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

转战播客赛道！罗永浩微博改名“罗永浩的十字路口”

站长商机