首页 > 业界 > 关键词  > 英伟达最新资讯  > 正文

英伟达与 Anyscale 合作:提高大型语言模型和生成式 AI 应用的开发效率

2023-09-19 09:48 · 稿源:站长之家

站长之家(ChinaZ.com) 9月19日消息:用于生成式 AI 工具的大型语言模型通常会极大地增加对更多处理器的需求,这些处理器通常价格昂贵且供应受限。即使是云资源也不能总是解决企业试图扩展规模并利用最新的生成式 AI 技术所面临的问题。

NVIDIA-Anyscale-logos-x1280.jpg

图片来自NVIDIA

「GPU 芯片的扩展迟早将无法跟上模型大小的增长。」Gartner Research 副总裁兼杰出分析师 Avivah Litan 在接受 Computerworld 采访时表示。因此,「继续制造越来越大的模型不是可行选项。」

市场上最大的 GPU 制造商英伟达显然看到了开源软件提高 AI 开发和效率方面价值。周一,Anyscale 宣布将英伟达 AI 引入 Ray 开源和 Anyscale 平台中。英伟达 AI 还将在 Anyscale Endpoints 中运行,该服务可帮助应用程序开发人员使用流行的开源模型(如 Code Llama、Falcon、Llama 2、SDXL 等)嵌入 LLMs 到其应用程序中。

最近宣布的 Nvidia TensorRT-LLM 将支持 Anyscale 以及 Nvidia AI Enterprise 软件平台。它可用于自动扩展推理以在多个 GPU 上并行运行模型,从而在运行 Nvidia H100 Tensore Core GPU 时提供 8 倍的性能提升,英伟达在博客中表示。

此外,英伟达 Triton Interence Server 软件支持在 GPU、CPU 和其他处理器上跨云、数据中心、边缘和嵌入式设备进行推理。当与 Ray 集成时,开发人员可以提高来自各种框架的 AI 模型(包括 TensorRT、TensorFlow、PyTorch、ONNX、OpenVINO 等)的效率。

Anyscale 声称其 Ray 是全球增长最快的可扩展计算统一框架。英伟达 NeMo 是一个面向云原生的框架,可以被 Ray 开发人员用于为客户提供 LLMs。

「我们与英伟达的合作将为 Anyscale 的产品组合带来更多性能和效率,以便开发人员随处创建具有前所未有速度和效率的 LLMs 和生成 AI 应用程序。」Anyscale 首席执行官兼联合创始人 Robert Nishihara 在一份声明中表示。

举报

  • 相关推荐
  • 即将超越英伟达!谷歌母公司Alphabet市值已达4.6万亿美元

    受超预期财报提振,谷歌母公司Alphabet股价周四(4月30日)大涨10%,年内累计涨幅达到140%,市值突破4.6万亿美元。 该公司周三公布的营收超出分析师预期,其中谷歌云业务收入更是突破200亿美元大关。 目前,全球市值第一的公司仍是人工智能芯片霸主英伟达,市值接近4.9万亿美元。不过,由于商业伙伴OpenAI被曝未能达成内部收入与增长预期,英伟达股价在两天内累计下跌超�

  • 蚂蚁灵光圈,补上了AI生成应用的最后一块拼图

    想拿AI赚到一个“小目标”,这是诈骗;但想拿它赚个9.9的小钱,可以说轻轻松松。 有人用AI“手搓”出背单词、定时打卡的小应用,比起需要每月订阅会员的同类产品,只需要花十几块就能一直免费使用;有人卖AI生成的拼豆参考图,吸引了大批爱好者;甚至有人直接卖起了产品提示词,让你轻松复刻出同款应用。

  • AI日报:快手拟分拆可灵AI独立融资;360升级“安全龙虾”平台;网信办要求AI生成视频必须标注

    快手拟分拆可灵AI独立融资,估值200亿美元剑指明年IPO,其年化营收已破3亿美元,覆盖C端订阅与B端API调用,全球创作者超6000万。网信办发布短视频标注新规,要求平台为AI生成及虚构内容提供六类必选标签,强化存量视频追溯补标,推动产业合规。小米自研大模型MiMo获国际认可,百度发布Ernie5.1预训练成本骤降94%,性能挺进全球Search排行前四。360升级“安全龙虾”平台,10分钟可自建专家智能体;Claude Code推出Agent View统管后台AI任务。宇树科技发布全球首款量产载人变形机甲GD01,起售价390万元。谷歌地图深度集成Gemini,CarPlay导航将进入对话时代。

  • AI日报:Kimi K3将于第三季度推出;英伟达发布多模态“全能模型”;Claude深度集成Adobe、Blender

    本期AI日报聚焦八大热点:月之暗面将推2.5万亿参数Kimi K3大模型,长文本处理能力突破;英伟达发布多模态模型Nemotron-3 Nano Omni,推理效率提升9倍;蚂蚁集团开源百灵Ling-2.6-flash模型;商汤推出原生多模态统一模型SenseNova U1;Claude深度集成Adobe等八大软件;字节TRAE SOLO上线语音输入;科大讯飞发布星火X2-Flash模型;ima上线知识Agent copilot,内置记忆系统。

  • AI仿真人不如AI仿超市

    我真没空管你们这些水果蔬菜、厨房用品、酒水饮料的事了。 谁也没想到,在经历了邪恶猫狗的叙事浪潮后,AI短片的新风口是火车上的小推车——啤酒饮料矿泉水,花生瓜子八宝粥,前面的乘客把腿收一收!

  • 易鑫2026一季度AI增效显著,筑牢金融级AI安全合规底座

    易鑫集团(02858.HK)5月12日披露2026年一季度部分业务及未经审核运营报告。在国内乘用车销量承压背景下,公司依托AI驱动的数字化转型实现稳健发展,期内汽车融资交易量达22.6万笔,融资总额196亿元。AI战略从“以模型为中心”升级为“以系统为中心”,代理式人工智能已在业务场景完成多轮迭代,自主驱动流程比例提升至65%。公司构建了“Harness”人工智能治理框架,实现人机毫秒级无缝交接与端到端可追溯、可审查。此前,易鑫在世界互联网大会亚太峰会上宣布,计划于今年下半年开源部分自研AI Infra,以技术普惠助力行业生态共建。

  • 造一台AI PC=跑一遍AI基建——重新认识“创新的联想”

    联想在2026年4月22日发布ThinkPad新品及天禧AI生态,提出“超级个体”概念,即个体×ThinkPad×天禧AI=超级个体。文章从四个工序解析AI+PC的制造:大脑(天禧AI3.7的端云混合架构)、产线(天津工厂60%自动化率,每9秒下线一台)、神经(iChain供应链智能体覆盖90%部门)、地基(生态级零碳工厂和海神液冷技术)。联想通过自研技术整合算法、芯片、供应链和能耗,让AI+PC成为用户不在时也能工作的“分身”,体现中国创新的另一种形态——工程纪律与产品落地。

  • 数字人是一场AI的具象化革命

    去年由百度慧播星提供技术支持的罗永浩的数字人带货直播让人印象深刻。 这不仅因为他幽默生动,偶尔会作出推眼镜的动作,甚至能做出接过样品的互动,更因为他能在观众抛出问题时,像罗永浩本人一样抖出调侃式包袱。观众们第一次发现数字人开始有「灵魂」了。 到了今年,数字人已经走出直播间,开始参与带货视频、广告片的创作。 百度创始人李彦宏在Create2026百�

  • 灵瑞集首发瑞兽AI灵宠:以IP重构AI陪伴新范式

    芯伴科技推出“灵瑞集”AI灵宠系列,以中国瑞兽文化为内核,结合自研角色性格模型与全场景交互技术,打造6款差异化IP角色(辟邪、天禄、九尾狐等),定价169元起。产品搭载4G独立联网模块、长续航与Type-C快充,实现无WiFi秒级响应;配套互动小程序与治愈经营游戏,构建“硬件+软件+内容”生态闭环。该系列旨在将传统瑞兽转化为年轻人专属的“有文化、有温度、可成长”情感陪伴伙伴,降低AI潮玩体验门槛。

  • 最懂购物的AI,竟然会劝你别买了?

    ​过去买一支电动牙刷,我们可能要搜索、筛选、看参数、翻评价、比价格、凑满减。现在这个复杂的购物过程,压缩成了与AI的一段对话。 5月11日,阿里巴巴宣布千问与淘宝全面打通。以往我们想象过AI电商的样子,如今购物入口、决策方式和交易流程都开始被AI重写。 你可以在千问内完成从找东西、挑东西、下单、付款到查快递的全流程;也可以在淘宝App内点击底部“消息

今日大家都在搜的词: