首页 > 传媒 > 关键词  > 华为最新资讯  > 正文

openEuler 全栈式 AI 推理方案 使能 AI 普惠千行百业,推动企业实现数智化转型

2025-03-25 20:02 · 稿源: 站长之家用户

【中国,深圳, 2025 年 3 月 21 日】在华为中国合作伙伴大会——鲲鹏伙伴产业峰会上,华为联合 openEuler 社区发布全栈式 AI 推理方案。通过这套方案,企业和开发者可在鲲鹏+xPU硬件上,分钟级实现模型部署、天级实现 AI 助手开发,推理性能相较于其他开源方案提升10%-50%。该方案从开发、运行、运行全流程助力企业实现规模部署,实现数智化转型,推动 AI 普惠千行百业。

sysHAX+GMEM:释放鲲鹏+xPU 算力潜能

如今,大模型已经从模型训练阶段转向模型推理和智能体开发阶段,操作系统作为连接软件和硬件的基础软件,在使能模型推理和智能体开发上发挥着不可代替的作用。在硬件上,目前 openEuler 社区已经适配了昇腾、寒武纪、摩尔线程、天数等xPU,并通过 sysHAX,GMEM 等技术实现推理任务吞吐量提升10%-50%:

- sysHAX:通过 NUMA 亲和性优化模型参数、KVCache调度、适配鲲鹏SVE指令集等方式,动态调度鲲鹏CPU与异构算力资源,智能分配 decode 任务,使推理任务吞吐量提升10%-30%。

- GMEM:通过加速器透明超分技术,将主机内存扩展至TB级,大模型推理吞吐量提升50%,提供OS原生malloc接口,仅需百行代码即可接将设备接入 GMEM,开发效率提升 10 倍。

适配流程请参考:https://www.openeuler.org/zh/compatibility/

社区兼容性 SIG 组:https://www.openeuler.org/zh/sig/sig-Compatibility-Infra

oeDeploy:一键分钟级部署模型推理环境

oeDeploy 一键式软件编排部署工具是 openEuler 社区的开源项目,该项目通过编写配置文件即可实现AI框架、驱动、第三方组件部署,极大的简化软件部署流程。oeDeploy 已经支持一键式部署 DeepSeek,将原本需3- 5 天的部署流程缩短至分钟级,极大的提高 DeepSeek 的部署效率。

欢迎开发者贡献自己编写的 oeDeploy 配置文件

配置文件可通过 PR 提交,PR提交地址:https://www.openeuler.org/zh/sig/sig-Compatibility-Infra

EulerCop ilot+RAG:天级开发一个智能体

RAG 即检索增强生成技术。RAG+大模型可以很好的弥补基础模型缺失行业数据、企业数据的不足,使大模型更懂企业业务,是一种非常有效的开发行业智能体应用的方法。openEuler Co pilot System 平台已经支持 RAG,并对 RAG的智能语料治理、多级检索优化等环节进行优化,回答准确率高达 90%。企业和开发者可在本地部署 openEuler Cop ilot System,并输入行业数据,天级实现企业智能体应用的开发。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 智能体生态圈破茧,联想与ISV编织千行百业 AI 落地未来

    5月9日,联想在上海举办2025智能体解决方案生态论坛,发布面向AI生态伙伴的私有化部署与行业场景落地合作战略。联想将通过品牌力、方案力、营销力与销售力四大核心方向,为AI解决方案提供商(ISV)提供全栈支持,加速智能体在垂直行业落地。联想集团副总裁王立平指出,每个场景背后都是真实行业问题,需要多方合作解决。联想推出"擎天AI适配中心"提供软硬件全栈适配支持,并发布"擎天智能体集市"平台,汇集超百家ISV产品,实现"线上体验+线下部署"闭环。针对不同发展阶段ISV,联想推出三种合作模式:品牌代销、联合品牌和方案整合,助力ISV跨越技术验证与商业转化鸿沟。联想ThinkStation智能体工作站系列成为硬件载体,其中PX型号支持4张RTX 5880 Ada GPU,兼顾高性能与便捷部署。天士力、蜜度等合作伙伴现场分享了与联想共同打造的医疗、政务行业智能体落地案例。

  • 九四智能亮相大阪,AI大模型驱动全球企业实现智能化转型

    2025年5月28-29日,九四智能(94AI)将携自主研发的"大模型联络中心"解决方案亮相大阪"2025呼叫中心CRM演示和会议"。该方案通过AI Agent技术实现从用户触达、需求挖掘到服务闭环的全流程自动化,助力企业重构客户服务与运营效率。作为智能语音领域领军企业,九四智能已在金融、电商、保险等行业积累创新实践,其解决方案支持多语种与文化适配,满足GDPR等全球合规要求。会议重点探讨了数字化转型背景下AI与CRM系统的深度融合,展示了AI在跨境场景中的语言、文化及合规优势。未来,九四智能将持续推动全球企业智能化转型。

  • 阿里云全栈AI技术引擎驱动SaaS企业全球化升级 构建出海新范式

    全球SaaS市场正以16.4%的年复合增长率迈向万亿规模,中国企业引领的智能化升级正在改写行业全球化叙事。阿里云发布"全栈AI+全球化"技术体系,通过端到端技术栈重构打造可扩展、低门槛的全球化智能基座,释放技术红利。通义千问大模型通过参数效率优化突破AI规模化应用的经济性瓶颈,支持119种语言适配不同市场。e签宝推出行业首个智能合同Agent,实现合同全生命

  • AI机器人赛道竞速,英伟达/微美息GPU+AI全栈布局双轮驱动产业化浪潮!

    英伟达CEO黄仁勋在Computex2025电脑展发表主题演讲,宣布公司转型为AI基础设施提供商。重点展示了四大方向:消费级RTX显卡、B300服务器芯片、Omniverse软件平台及自动驾驶/机器人技术。推出全新GB300 Blackwell Ultra AI平台,提升训练和推理能力。黄仁勋强调机器人技术将引领下一场工业革命,推出Isaac GR00T机器人开发平台和Jetson Thor处理器。摩根士丹利预测人形机器人市场规模将达60万亿美元,中国到2050年市场规模或达6万亿元。微美全息等企业正加速布局该领域,通过AI视觉、自然语言处理等技术提升机器人环境感知与决策能力。黄仁勋指出智能体(Agent)、模型(Model)和机器人(Robot)将成为未来十年技术话语权争夺的关键。

  • 如何实现产AI破局?北电数智以星火·大平台筑基新生态

    今年以来,我国人工智能领域政策密集落地,北京、山东、广东、武汉等多地相继推出专项措施,围绕算力普惠、场景应用、开源生态等关键环节,推动人工智能科技创新与产业创新深度“双向奔赴”。从山东省千亿产值目标到北京市单项目最高 3000 万元资金激励,从武汉中小企业算力补贴到广东全产业链协同布局,政策“组合拳”正加速构建技术攻关、企业培育、数据要素�

  • AI无能」正在拖垮企业 再不AI,就真的晚了

    据Gartner预测,到2028年,33%的企业软件将整合自主型AI,30%的《财富》500强企业将通过单一的、支持多模态交互的AI渠道彻底重构其服务运营,超过70%的客户服务互动将通过第三方AI助手发起并解决,这意味着企业与客户之间的交互界面正在被AI重新定义。麦肯锡则警告:缺乏AI能力的企业将在效率与创新上遭遇前所未有的落后,这种差距将呈指数级扩大。 这种“知道重要但不知�

  • 智邦国际携艺术家刘欢奏响ERP交响曲:数智化转型的黄金拍档已就位

    全球经济增速放缓背景下,企业面临同质化竞争加剧、管理僵化等挑战。智邦国际推出新一代"一体化ERP"系统,通过四个维度的全面整合实现企业生态信息实时共享,并融入智能化决策支持。该系统采用买断制销售模式,打破传统ERP租赁服务局限,同时推动产业链协同和绿色生态构建。2023年11月,智邦国际宣布由艺术家刘欢担任全球品牌代言人,彰显品牌建设决心。该方案已连续五年销量领先,助力企业实现数字化管理革新和竞争力持续提升。

  • 众惠保打造数智化,重构会员服务新生态

    众惠相互保险通过科技驱动创新,构建"极速理赔+健康管理+数智赋能"三位一体服务体系。其全流程线上化理赔实现82%自动化率,平均结案周期缩短40%;"智惠赔"风控平台运用大数据算法,风险识别准确率显著提升;健康管理覆盖"预防-诊疗-康复"全周期,连接800余家三甲医院,用户满意度达91%。作为国内首家相互制健康险组织,众惠以会员需求为核心,通过数字化创新重塑保险价值,推动行业服务标准升级。

  • 腾讯云天御发布海外交易风控解决方案AI+情报双擎护航企业全球化

    中国企业在全球化浪潮下加速出海布局,截至2024年底,中国对外直接投资存量近3万亿美元,位列全球第三。但跨境交易面临复杂安全威胁,包括数据泄露、账户盗用等风险。2023年全球电商欺诈损失达480亿美元,其中跨境支付欺诈占比显著。腾讯云天御推出智能风控方案,通过AI动态风控和全球情报中枢双引擎,实现支付欺诈拦截率99.5%,合规适配效率提升70%。方案构建三层防护体系:智能人机验证识别真人用户、设备指纹技术穿透虚拟环境、分层分级实时拦截恶意行为。依托腾讯威胁情报云,方案能同步全球黑产特征库,并持续投入AI大模型研发提升风控能力。目前该方案已帮助某电商将欺诈率从0.9%降至0.25%,支付成功率从85%提升至89%,平衡了安全与业务增长需求。

  • 从江苏样板到球标准:远东控股背后的数智化密码

    2025年江苏省先进级智能工厂名单公示,远东控股集团旗下远东电缆、新远东电缆、远东复合技术四家公司凭借智能制造实力入选。这标志着远东从"单点突破"到"集群成势"的产业升级跨越,构建起覆盖"技术研发-场景应用-生态协同"的全链条数智化体系。四家智能工厂通过技术赋能、系统集成、数据驱动等维度,运用AI、5G、物联网等前沿技术,实现端到端业务全面数智化。远东在材料研发、产品创新与系统集成领域实现三重突破,如碳纤维复合芯导线提升输电容量30%,液冷大功率充电电缆实现"充电5分钟续航100公里"。产业布局从单一制造向智慧能源解决方案延伸,产品覆盖特高压、风电光伏等领域,出口160余国。远东正以智能制造为笔,勾勒中国制造业全球竞争力,展现从"规模优势"向"价值优势"跃迁的转型路径。