首页 > AI头条  > 正文

红帽联手谷歌、NVIDIA启动llm-d开源项目,破解大规模AI推理成本与延迟双重难题

2025-05-27 11:58 · 来源: AIbase基地

全球开源解决方案领导者红帽公司近日宣布启动革命性开源项目llm-d,专门应对生成式AI大规模推理的迫切需求。该项目汇聚了CoreWeave、Google Cloud、IBM Research和NVIDIA等行业巨头作为创始贡献者,旨在通过突破性技术让大语言模型推理云满足最严苛的生产服务级目标。

推理时代来临,挑战日益严峻

根据Gartner最新数据预测,"到2028年,随着市场成熟,80%以上的数据中心工作负载加速器将专门部署用于推理,而非训练用途。"这一趋势凸显了推理技术的战略重要性。

然而,随着推理模型复杂性和规模持续扩大,资源需求急剧攀升正在限制集中式推理的可行性。过高的成本和过长的延迟有可能成为AI创新发展的关键瓶颈,迫切需要新的技术解决方案。

机器人 AI 人工智能

llm-d:统一平台的创新突破

red帽及其合作伙伴通过llm-d项目直面这一挑战,成功将先进推理能力集成到现有企业IT基础设施中。该统一平台赋能IT团队在满足关键业务工作负载各种服务需求的同时,部署创新技术以最大化效率,并显著降低高性能AI加速器的总体拥有成本。

这一解决方案的核心价值在于打破了传统推理部署的局限性,为企业提供了更加灵活、高效且经济的AI推理选择。

强大的产业联盟支持

llm-d项目已获得由生成式AI模型提供商、AI加速器先驱和主要AI云平台组成的强大联盟支持。除了四家创始贡献者外,AMD、思科、Hugging Face、英特尔、Lambda和Mistral AI等重要企业也作为合作伙伴加入该项目,展现了业界在构建大规模LLM服务未来方面的深度合作意愿。

行业领袖积极响应

Google Cloud AI与计算基础设施副总裁兼总经理Mark Lohmeyer强调:"在企业大规模部署AI并为用户创造价值的过程中,高效的AI推理至关重要。在我们进入推理新时代之际,Google Cloud很荣幸能够作为llm-d项目的创始贡献者,在我们开源贡献传统的基础上再接再厉。"

NVIDIA工程AI框架副总裁Ujval Kapasi表示:"llm-d项目是对开源AI生态系统的重要补充,体现了NVIDIA对合作推动生成式AI创新的承诺。可扩展、高性能的推理是下一波生成式AI和代理式AI的关键。我们正与红帽和其他支持合作伙伴合作,利用NIXL等NVIDIA Dynamo创新帮助加速llm-d的发展。"

开源驱动产业变革

llm-d项目的启动标志着AI推理领域进入新的发展阶段。通过开源模式汇聚产业智慧,该项目不仅有望解决当前大规模推理面临的成本和性能挑战,更将为整个AI生态系统的可持续发展奠定坚实基础。

随着更多企业和开发者的参与,llm-d有望成为推动AI推理技术标准化和普及化的重要力量,为即将到来的推理时代做好充分准备。

  • 相关推荐
  • Intel至强6处理器又上新了:与NVIDIA AI GPU珠联璧合

    英特尔推出三款至强6系列AI专用处理器,采用P-Core性能核设计,支持PCT和SST-TF睿频技术,最高128核。新品专为AI系统优化,能动态分配CPU资源,显著提升GPU在高强度AI运算中的性能。其中6776P处理器已用于NVIDIA最新DGX B300 AI加速系统。新品还支持MRDIMM内存、CXL技术,PCIe通道数增加20%,并具备AMX高级矩阵指令集和FP16精度运算能力,专为最大化系统稳定性和AI工作负载设计。

  • 三星OLED 产品搭载NVIDIA G-SYNC技术,打造顶尖游戏体验

    三星2025款OLED产品将支持NVIDIA G-SYNC技术,提供165Hz高刷新率和Motion Xcelerator技术,实现无卡顿、低延迟的游戏体验。产品同时兼容AMD FreeSync Premium Pro,配备自动低延迟模式(ALLM)和AI游戏优化功能,可智能分析游戏场景并自动调节画质。通过三星游戏中心可一键直达主机和云游戏平台,搭载AI画质增强和防眩光技术,兼顾影院级视听效果与智能家居控制。该技术将率先应用于旗舰机型S95F,后续扩展至全系2025 OLED产品线。

  • RTX 5060/Ti重启黑屏有救了!NVIDIA发布紧急固件更新

    快科技5月25日消息,NVIDIA近期针对RTX 5060和RTX 5060 Ti显卡发布了一项紧急固件更新,旨在解决部分用户在重启系统时遇到的黑屏问题。这一问题自RTX 5060系列显卡发布以来一直困扰着部分用户,尤其是在系统重启时,显卡无法正常显示图像,导致用户无法正常使用。此次更新并非通过驱动程序发布,而是直接对显卡的vBIOS进行更新,NVIDIA强调,只有遇到黑屏问题的用户才需要更新固件,正常使用的设备无需进行此操作。NVIDIA的技术文档显示,黑屏问题可能是由于特定主板的BIOS/UEFI版本与新显卡的兼容性冲突所致。如果用户的主板不支持UEFI启

  • 华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

    要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。 它的巧妙之处,就在于把不同的任务分配给擅长处理的专家网络,让整个系统性能得以提升。 但你知道吗? 正是这个关键的专家网络,也是严重影响系统推理性能的因素之一。 因为在大量任务来临之际(尤其是超大规模时),MoE并不是以“雨露均沾”的方式去分配——专家网络们的负�

  • AI日报:小米首个推理大模型开源Xiaomi MiMo;快手上线AI笔记工具“喵记多”;腾讯拆分AI团队

    本文汇总了AI领域最新动态:1)小米开源70亿参数大模型Xiaomi MiMo,在数学推理和代码竞赛中超越OpenAI和阿里模型;2)快手推出AI笔记工具"喵记多",简化笔记管理;3)Luma AI发布电影级镜头控制API,降低视频生成门槛;4)腾讯重组AI团队,加大语言模型研发投入;5)Anthropic为Claude引入新语音"Glassy";6)谷歌NotebookLM新增50+语言音频概述功能;7)xAI将发布Grok3.5模型;8)Meta推出独立AI助手应用挑战ChatGPT;9)OpenAI紧急修复GPT-4o"谄媚"问题;10)Mac本地AI助手Simular升级隐私保护;11)CameraBench项目帮助AI理解镜头运动;12)谷歌推出个性化语言学习AI工具。

  • AI日报:腾讯语音数字人模型HunyuanVideo-Avatar;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放

    本文汇总了AI领域最新动态:1)腾讯开源数字人模型HunyuanVideo-Avatar,支持图像转视频创作;2)Trae国际版开启付费订阅,首月3美元;3)Claude网页搜索功能向免费用户开放;4)印度AI初创Builder.ai破产,亏损超5亿美元;5)腾讯元宝接入微信读书平台;6)快手计划加大AI投入但预计影响利润率;7)Mistral推出智能代理API;8)Claude移动端上线语音对话测试版;9)OpenAI拟推ChatGPT第三方登录功能;10)掘金发布AI项目一键部署工具;11)多模态模型视觉推理能力评估显示准确率仅25.8%;12)中石油发布3000亿参数昆仑大模型,推动油气产业智能化。

  • 松下将进行大规模重组,裁员约 10000 人

    松下控股公司宣布计划裁员约 1 万人,约占其全球员工总数的 4%,这是该公司重大集团重组计划的一部分……

  • 小米通报海信Vidda商业诋毁案 称海信Vidda构成商业诋毁

    5月13日,小米法务部就与聚好看科技(海信旗下Vidda品牌)商业诋毁纠纷案终审结果发布声明。法院终审维持一审判决,认定聚好看2021年11月发布的含"米有问题""米有屌丝"等谐音文案的海报构成对小米商业诋毁,要求其在Vidda官微置顶致歉7天并赔偿小米55万元。Vidda已于5月10日发布致歉声明承认文案存在误导性。该案为净化行业竞争环境提供了司法范例,法院在审理中重点审查了涉案文案的语义指向性、传播范围及实际损害后果。小米强调企业竞争应遵循商业道德和法律规范,任何通过诋毁对手获取市场优势的行为都将受到法律制裁。(140字)

  • AI浪潮袭来,慕思如何解答价值难题

    调查显示,国人睡眠问题依旧待解。一方面,国人平均睡眠时间持续下降,2025年降至6.67小时;另一方面,睡眠质量恶化,易醒、深睡时间短等问题突出。睡眠产业迎来"效率革命",智能床垫等产品通过AI技术实现个性化适配,慕思等企业构建睡眠数据系统,推动健康睡眠解决方案。同时,行业践行ESG理念,从环保材料到低碳生产,形成绿色产业链。睡眠科技正从单一产�

  • 雷军:小米自研玄戒O1 3nm芯片已开始大规模量产

    小米将于5月22日发布搭载自研3nm旗舰芯片"玄戒O1"的两款新品:小米15S Pro和小米平板7 Ultra。小米15S Pro延续15 Pro设计,配备6.73英寸2K LTPO屏幕、6100mAh电池、90W快充,搭载Summilux三摄系统,支持8K视频拍摄。小米平板7 Ultra采用14英寸刘海屏,支持120W闪充,有望成为小米史上最强平板。两款产品均采用超窄边框设计,标志着小米自研芯片进入3nm时代。

今日大家都在搜的词:

热文

  • 3 天
  • 7天