首页 > 传媒 > 关键词  > 正文

酷睿Ultra Day 0适配部署大模型,率先赋能驱动人生AIGC助手

2025-08-08 14:11 · 稿源: 站长之家用户

今日,腾讯正式发布新一代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型的第零日(Day0)部署与性能优化。值得一提的是, 依托于OpenVINO™ 构建的 AI 软件平台的可扩展性,英特尔助力ISV生态伙伴率先实现应用端Day0模型适配,大幅加速了新模型的落地进程,彰显了 “硬件 + 模型 + 生态” 协同的强大爆发力。

图片1.png

混元新模型登场:多维度突破,酷睿Ultra平台Day0适配

腾讯混元宣布开源四款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景。新开源的4个模型均属于融合推理模型,具备推理速度快、性价比高的特点,用户可根据使用场景灵活选择模型思考模式——快思考模式提供简洁、高效的输出;而慢思考涉及解决复杂问题,具备更全面的推理步骤。

这些模型已在英特尔酷睿 Ultra 平台实现全面适配,其在 CPU、GPU、NPU 三大 AI 运算引擎上都展现了卓越的推理性能表现1。以酷睿 Ultra2代 iGPU 平台为例,7B 参数量模型在 INT4精度下,吞吐量达20.93token/s;0.5B 小尺寸模型在 FP16精度下吞吐量达68.92token/s。值得一提的是,英特尔对新模型的 NPU 第零日支持已形成常态化能力,为不同参数量模型匹配精准硬件方案,满足从个人终端到边缘设备的多样化需求。

图片2.png

OpenVINO:新模型快速落地的“关键引擎”

作为英特尔推出的开源深度学习工具套件,OpenVINO 以 “性能优化 + 跨平台部署” 为核心优势,可充分释放英特尔硬件资源潜力,广泛应用于 AI PC、边缘 AI 等场景。其核心价值在于能将深度学习模型的推理性能最大化,同时实现跨 CPU、GPU、NPU 等异构硬件的无缝部署。

目前,OpenVINO已支持超过900个人工智能模型,涵盖生成式 AI 领域主流模型结构与算子库。这样的模型支持体系,使其能在新模型发布的Day0,即完成英特尔硬件平台的适配部署。此次混元模型的快速落地,正是 OpenVINO 技术实力的直接体现 —— 通过其优化能力,混元模型在酷睿 Ultra 平台的性能得到充分释放,为用户带来即发即用的 AI 体验。

生态共创:AI技术到应用的“最后一公里”加速

生态合作是英特尔 AI 战略的核心支柱,驱动人生作为其长期合作伙伴,专注于互联网客户端软件研发及运营,本着“以用户为中心,以技术为根本,以开放为原则”的理念,长期致力于技术研发和技术创新,为用户提供优质的服务。其 AIGC 助手软件,实现本地部署,离线使用,支持文字输入、语音转译,将大模型装进背包,可随时随地与它进行智能对话,还能让它帮忙解读文档,编撰方案。

该应用采用 OpenVINO推理框架,借助其快速适配能力,在混元模型发布当日即完成应用层适配,成为首批支持新模型的应用之一。

目前,驱动人生 AIGC 助手、英特尔AIPC应用专区和多家OEM 应用商店的 AI PC专区均已上线,搭载混元模型的新版本也将在近期推出,用户可第一时间体验更智能的交互与服务。这种 “模型发布 - 硬件适配 - 应用落地” 的全链条第零日响应,正是英特尔生态协同能力的生动写照。

AI 的发展离不开模型创新与软硬件生态协同 —— 模型如同燃料,生态则是驱动前进的引擎。英特尔通过硬件平台、软件工具与生态网络的深度协同,实现对新模型的第零日适配,不仅加速了技术到应用的转化,更推动着整个 AI 产业的高效创新。未来,英特尔将持续深化与合作伙伴的协同,让 AI 创新更快走进千行百业与大众生活。

快速上手指南

第一步,环境准备

通过以下命令可以搭建基于Python的模型部署环境。

图片3.png

该示例在以下环境中已得到验证:

硬件环境:

Intel® Core™ Ultra7258V

iGPU Driver:32.0.101.6972

NPU Driver:32.0.100.4181

Memory:32GB

操作系统:

Windows1124H2(26100.4061)

OpenVINO版本:

openvino2025.2.0

openvino-genai2025.2.0.0

openvino-tokenizers2025.2.0.0

Transformers版本:

第二步,模型下载和转换

在部署模型之前,我们首先需要将原始的PyTorch模型转换为OpenVINOTM的IR静态图格式,并对其进行压缩,以实现更轻量化的部署和最佳的性能表现。通过Optimum提供的命令行工具optimum-cli,我们可以一键完成模型的格式转换和权重量化任务:

图片4.png

开发者可以根据模型的输出结果,调整其中的量化参数,包括:

--model:为模型在HuggingFace上的model id,这里我们也提前下载原始模型,并将model id替换为原始模型的本地路径,针对国内开发者,推荐使用ModelScope魔搭社区作为原始模型的下载渠道,具体加载方式可以参考ModelScope官方指南:https://www.modelscope.cn/docs/models/download

--weight-format:量化精度,可以选择fp32,fp16,int8,int4,int4_sym_g128,int4_asym_g128,int4_sym_g64,int4_asym_g64

--group-size:权重里共享量化参数的通道数量

--ratio:int4/int8权重比例,默认为1.0,0.6表示60%的权重以int4表,40%以int8表示

--sym:是否开启对称量化

此外我们建议使用以下参数对运行在NPU上的模型进行量化,以达到性能和精度的平衡。

图片5.png

这里的--backup-precision是指混合量化精度中,8bit参数的量化策略。

第三步,模型部署

目前我们推荐是用openvino-genai来部署大语言以及生成式AI任务,它同时支持Python和C++两种编程语言,安装容量不到200MB,支持流式输出以及多种采样策略。

GenAI API部署示例

图片6.png

其中,'model_dir'为OpenVINOTM IR格式的模型文件夹路径,'device'为模型部署设备,支持CPU,GPU以及NPU。此外,openvino-genai提供了chat模式的构建方法,通过声明pipe.start_chat()以及pipe.finish_chat(),多轮聊天中的历史数据将被以kvcache的形态,在内存中进行管理,从而提升运行效率。

开发者可以通过该该示例的中方法调整chat template,以关闭和开启thinking模式,具体方式可以参考官方文档 。由于目前OpenVINOTM Tokenizer还没有完全支持Hunyuan-7B-Instruct模型默认的chat template格式,因此我们需要手动替换原始的chat template,对其进行简化,具体方法如下:

图片7.png

chat模式输出结果示例:

图片8.png

关于该示例的后续更新,可以关注OpenVINO notebooks仓库

驱动人生应用获取方式:

驱动人生 AIGC 助手

英特尔AIPC应用专区

1.通过使用 OpenVINO 框架版本2025.2.0在 英特尔® 酷睿™ Ultra7258V 和 英特尔® 酷睿™ Ultra9285H 上进行测试获得了性能数据,计算过程发生在 iGPU 或 NPU 上。测试评估了首 Token 的延迟以及在 int4-mixed、int4-mixed-cw-sym 和 fp16精度设置下1K 输入的平均吞吐量。每项测试在预热阶段后执行三次,并选择平均值作为报告数据。

性能因使用方式、配置和其他因素而异。

性能结果基于测试时的配置状态,可能未反映所有公开可用的更新内容。请参阅相关文档以获取配置详情。没有任何产品或组件能够保证绝对安全。

您的实际成本和结果可能会有所不同。

相关英特尔技术可能需要启用相关硬件、软件或激活服务。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 雷军推荐小米15 Ultra时尚影像套装:很好用!

    小米创办人,董事长兼CEO雷军今天中午发文,向大家推荐小米15 Ultra时尚影像套装,称这个带握柄的保护壳很好用”。 这个套装是6月26日的在YU7、MIX Flip 2、平板7S Pro发布会上,与小米15 Ultra限定色一起登场的。

  • 乐道L90全国交付已开启一周:超一半车主直接上六座Ultra顶配

    上周,蔚来汽车旗下乐道L90上市并开启交付,租电价格17.98万元起,整车购买26.58万元起,乐道L90一上市就呈现出爆款态势。 蔚来李斌称,乐道L90短短三天时间累计交付量达1976辆, 跻身大型SUV销量周榜top3,仅次于问界M9,相比理想L9/L8两款车型同期销量叠加还多775台。 今日,乐道L90全国交付开启一周后,乐道汽车方面分享了首批车主们的选配情况。

  • 卢伟冰称小米16 Ultra是移动影像新高度 博主:升级确实很明显

    此前小米集团总裁卢伟冰表示,过去4年小米徕卡合作了20多款机型,非常愉快且卓有成效,小米和徕卡过去是、未来也将一直是紧密的合作伙伴,我很有信心小米16 Ultra将会是移动影像的新高度,敬请期待。 今天博主数码闲聊站爆料,小米16 Ultra的影像硬件升级确实很明显,主要是升级前摄 主摄 长焦,目前摸到的工程机主要是玻纤材质,主打轻薄,正面是大R角大直屏,四等�

  • 曝OPPO Find X9 Ultra配备1.5K屏 周意保:假的

    OPPO Find系列产品负责人周意保与网友互动时表示,OPPO Find X9 Ultra配备1.5K屏是假消息。从周意保的爆料来看,Find X9 Ultra似乎会配备2K直屏。 博主数码闲聊站称,OPPO Find X9 Ultra测试了三块屏幕,一块新开1.5K LTPO,一块新开2K LTPS,一块2K LTPO,明年上半年才会发布,具体使用哪块屏幕再观望观望。

  • 雷鸟电视全国补贴开启,85英寸鹤6Ultra 电视国补优惠后5599元

    文章揭露家电行业"国家补贴延期至2025年底"政策下的乱象:部分品牌将补贴变成数字游戏,先涨价再补贴,如65英寸电视"补贴价"竟与半年前首发价持平,热销机型暗涨千元。雷鸟电视采取"真降价+真补贴"策略形成对比:85英寸版本直降1000元叠加20%补贴,到手仅5599元;98英寸版本同样直降千元加补贴,成为万元内最具性价比的百吋电视。文章指出,产品力才是关键,雷鸟鹤6Ultra凭借MT9655芯片三重优势(48Gbps带宽、AV1解码效率提升40%、WiFi6+蓝牙5.2)和原生无广告系统、灵控桌面3.0等用户体验设计,在5599元价位段展现出精准的产品定位,主打"好用不贵"的消费理念。

  • 小米16 Ultra已在路上!徕卡考夫曼博士送给卢伟冰最好的礼物

    本周小米集团总裁卢伟冰现身上海邮政博物馆,为徕卡百年庆生。 在这次活动上,卢伟冰为老朋友徕卡监事会主席考夫曼先生准备了一份特别礼物小米15 Ultra致百年全球限定典藏礼盒。 考夫曼博士也为卢伟冰准备了一份礼物小米和徕卡合作的下一款影像旗舰,卢伟冰称这是徕卡考夫曼博士送给我的最好的礼物”。 结合卢伟冰的微博来看,这份礼物”就是小米16 Ultra,卢伟冰�

  • 大家绝对没见过的高端旗舰!荣耀Magic8系列新增Ultra版

    荣耀Magic8系列产品线迎来大变化,这次荣耀不仅会推出Magic8、Magic8 Pro,还有全新的Ultra版本,前两款会在今年下半年登场,Ultra版则是在明年上半年登场。博主数码闲聊站表示,荣耀Magic8系列Ultra版本将带来高规格影像。 据悉,荣耀Magic8 Ultra预计在明年Q1登场,该机搭载高通骁龙8 Elite 2旗舰平台,后置主摄是豪威集团的全新超大底Sensor,还有一颗2亿像素大底潜望长焦,影像将�

  • OPPO Find X9 Ultra关键参数曝光:1.5K极窄直屏+骁龙8 Elite 2芯片

    OPPO Find X9 Ultra目前测试1.5K LIPO极窄直屏,搭载高通骁龙8 Elite 2旗舰平台。 对比上代,OPPO Find X9 Ultra进一步缩窄屏幕边框,该机采用全新的LIPO屏幕封装工艺,中文名为低注射压力包覆成型”。

  • 小米手机影像新高度!曝小米16 Ultra支持连续光学变焦

    上周小米集团总裁卢伟冰超前预热小米16 Ultra,他表示,我很有信心小米16 Ultra将会是移动影像的新高度,敬请期待。卢伟冰对小米16 Ultra的提早预热,似乎意味着该机提前发布。 博主数码闲聊站暗示,小米16 Ultra将支持连续光学变焦,该机配备2亿像素大底 多群潜望方案,双光变焦段共享CMOS,连续变焦更顺滑。

  • 第二代骁龙8 Elite真全面屏!努比亚Z80 Ultra首曝:沿用1.5K无孔屏

    今日知名数码博主数码闲聊站曝光了新一代努比亚旗舰手机的相关信息,预计新机为今年的努比亚旗舰机型Z80 Ultra。

今日大家都在搜的词: