英特尔推Extension for Transformers工具包大模型推理性能提升40倍

2023-11-30 17:44 · 稿源：站长之家

要点:
通过该工具包，使用英特尔® 至强® 处理器可实现大型语言模型（LLM）推理性能加速达40倍，满足各种应用需求。
工具包提供轻量级但高效的LLM推理运行时，优化了内核，支持多种量化选择，提供更优的KV缓存访问和内存分配策略，显著提升了性能。
工具包攻克了对话历史、输出长度有限以及效率低下等聊天场景应用难题，通过引入流式LLM技术优化内存使用和推理时延。

站长之家（ChinaZ.com）11月30日消息:在当前技术发展的背景下，英特尔公司推出的Extension for Transformers工具包成为一个重要创新，实现了在CPU上对大型语言模型（LLM）推理性能的显著加速。该工具包通过LLM Runtime技术，优化了内核，支持多种量化选择，提供更优的KV缓存访问和内存分配策略，使得首个token和下一个token的推理速度分别提升多达40倍和2.68倍。这一技术的推出，极大地满足了不同场景对于LLM推理性能的需求。

项目地址:https://github.com/intel/intel-extension-for-transformers

在性能测试方面，通过与llama.cpp进行比较，LLM Runtime在输入大小为1024时能够实现3.58到21.5倍的性能提升，而在输入大小为32时，提升为1.76到3.43倍。同时，工具包还通过验证了多个模型的INT4推理准确性，表明在性能提升的同时准确性损失微小。

然而，不仅仅是性能的提升，工具包还在聊天场景中应用方面取得了显著成果。通过引入流式LLM技术，解决了对话历史、输出长度有限和效率低下等应用难题，使得LLM在聊天场景中更加实用。这一技术的特性，包括对话历史的纳入和输出长度的优化，使得工具包在解决聊天场景难题方面具有先进性和前瞻性。

英特尔® Extension for Transformers工具包在大型语言模型推理性能的提升以及聊天场景应用方面的创新成果，标志着对于人工智能领域的进一步推动。通过不断引入先进的技术和解决实际问题的能力，该工具包展现了英特尔在人工智能领域的领先地位，为未来的发展提供了强有力的支持。

（举报）

相关推荐

关键词：

英特尔举办工业AI与具身智能生态大会，加速智造升级

在2025年中国国际工业博览会上，英特尔携手生态伙伴以“工业+AI”为核心，展示了具身智能、人形机器人、工业AI与大模型等前沿解决方案。发布了基于酷睿Ultra平台的工厂落地案例，实现“大小脑融合”从概念到真实工业场景的跨越。通过全栈式边缘AI技术体系，为智慧工厂等行业智能化转型提供支撑。英特尔将持续推动开放平台与工业场景结合，加速智能制造发展。

工业AI 具身智能人形机器人
PICO × 英特尔× 央美共探 AI 艺术新生态：技术重塑创作、教育与产业未来

AI与艺术融合正加速发展：AI重塑设计流程，使创作者更专注美学思辨；三维重建技术以毫米级精度改写传统工艺，为文物复原提供科学依据；虚拟数字展厅凭借沉浸式体验与互动，为策展提供新可能。PICO联合中央美院等机构举办论坛，探讨AI赋能下的艺术生态。英特尔推出酷睿Ultra处理器，支持智能抠像、文生图等功能，提升创作效率。未来AI将推动艺术教育转型，培养复合型

AI艺术三维重建虚拟数字展厅
英特尔联动「扣子 AI 工坊」启动高校计划——让校园创意一键开挂

英特尔与新一代AI平台扣子联合发起“英特尔×扣子AI工坊高校计划”，旨在通过校企合作推动AI技术在教育领域的深度融合。该计划以校园场景化实践为核心，通过线下工作坊、创新挑战赛等形式，将前沿AI工具引入高校，帮助学生掌握AI应用能力。活动覆盖全国数百所高校，结合酷睿Ultra处理器的硬件优势，让学生直观体验AI在创作、学习等场景的高效赋能。未来双方计划深化课程共建与就业对接，构建AI教育新生态，助力青年适应智能时代发展需求。

AI人才培养 AI技术教育高校AI实践
荐没想到，音频大模型开源最彻底的，居然是小红书

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源33款、31款各类型大模型。这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域，而音频生成占比很小。

开源 AI社区音频生成
GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

随着AI大模型成为用户获取信息的主要入口，AIBase推出GEO排名查询工具，帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示，可精准分析品牌是否被推荐、出现频次及具体场景，为制定AI大模型排名优化策略提供数据支撑。在GEO时代，抢占AI回答推荐位意味着获得全新流量入口。

AI大模型 GEO排名查询生成引擎优化
荐AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Gaga AI发布；vivo蓝心3B端侧大模型发布

本文汇总AI领域最新动态：美图通过组织变革推动AI应用RoboNeo月活破百万；vivo发布蓝心3B端侧大模型，性能超越8B模型；Gaga AI实现静态照片生成60秒电影级视频；ChatGPT周活用户突破8亿；Figma引入Gemini模型提升设计效率；印度试点AI聊天机器人购物；Figure AI推出第三代家用机器人Figure 03；谷歌推出Gemini Enterprise自动化工作流平台。显示AI正从工具向创作者跃升，加速渗透各行业。

AI原生美图RoboNeo MAU破百万
易鑫发布Agentic大模型，破解汽车金融风控与效率痛点

9月12日，易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”，成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出，易鑫以AI为核心驱动力，通过自研大模型“智鑫多维”等技术，显著提升风控水平与融资通过率，推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构，服务覆盖牧民、基层员工等多元群体，体现技术普惠价值。未来将持续加大科技创新投入，深化国内普惠金融服务，并探索技术出海，助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可，更反映出行业正加速拥抱智能化变革。

AI应用汽车金融金融科技
深度解读丨悠然无界大模型BLM-1.0：跨空间、跨任务与跨本体泛化的里程碑

9月28日，悠然大模型BLM-1.0完成迭代升级并全面开源。该模型突破数字与物理世界壁垒，实现跨空间迁移、跨任务学习与跨本体泛化能力，以统一模型覆盖多种机器人平台。在空间理解、推理与执行评估中综合超越同规模SOTA方法，支持工业制造、智慧城市等场景应用，推动空间智能生态共建。

悠然无界大模型 BLM-1.0 开源模型权重
考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

9月28日，在成都举行的“2025天府人工智能产业生态大会”上，考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源，同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略，推动空间智能产业生态共建。BLM-1.0突破传统模型局限，具备跨空间、跨任务、跨本体的“三跨”统一能力，在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互，实现工业运维、安装巡检等场景的全程自动化与智能辅助，显著提升效率并降低成本。

人工智能开源大模型空间智能
2025数贸会 | 每日互动：大数据+大模型，重塑营销价值

9月26日，全球数字生态大会在杭州举行，聚焦AI与大数据如何重塑营销价值。每日互动朱晓鸣提出，企业需转变思维，从数据中洞察价值而非仅追求数据量，并介绍了“大数据联合计算模式”以平衡合规与营销增效。大会还推出AI营销产品AITA助手，结合大数据与行业经验，为品牌提供智能策略，助力降本增效，推动营销新纪元。

全球数字生态大会 AI变革营销范式转移

今日大家都在搜的词：

热文

3 天
7天

英特尔推Extension for Transformers工具包大模型推理性能提升40倍

英特尔举办工业AI与具身智能生态大会，加速智造升级

PICO × 英特尔× 央美共探 AI 艺术新生态：技术重塑创作、教育与产业未来

英特尔联动「扣子 AI 工坊」启动高校计划——让校园创意一键开挂

荐没想到，音频大模型开源最彻底的，居然是小红书

GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

荐AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Gaga AI发布；vivo蓝心3B端侧大模型发布

易鑫发布Agentic大模型，破解汽车金融风控与效率痛点

深度解读丨悠然无界大模型BLM-1.0：跨空间、跨任务与跨本体泛化的里程碑

考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

2025数贸会 | 每日互动：大数据+大模型，重塑营销价值

今日大家都在搜的词：

热文

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

雷军：小米17系列首销权益延续至10月31日

京东双11今晚开启：现货开卖官方直降低至一折

iQOO 15官宣：10月20日发布

三星W26折叠屏手机官宣10月11日发布

新款智界R7/S7上市44天大定破38000台

荣耀Magic8系列暨MagicOS10发布会定档10月15日

iQOO 15搭载自研电竞芯片Q3 能效提升40%

真我官宣与理光达成影像战略合作：真我GT8 Pro首发搭载

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

比特币价格突破12.5万美元刷新历史最高纪录

雷军：小米17系列首销权益延续至10月31日

京东双11今晚开启：现货开卖官方直降低至一折

腾讯混元图像3.0登顶LMArena榜一

雷军：小米17系列开售仅5天销量破100万台

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

iQOO 15官宣：10月20日发布

三星W26折叠屏手机官宣10月11日发布

站长商机

英特尔推Extension for Transformers工具包 大模型推理性能提升40倍

今日大家都在搜的词：

热文

站长商机

英特尔推Extension for Transformers工具包大模型推理性能提升40倍