首页 > 业界 > 关键词  > 英伟达最新资讯  > 正文

英伟达与 Anyscale 合作:提高大型语言模型和生成式 AI 应用的开发效率

2023-09-19 09:48 · 稿源:站长之家

站长之家(ChinaZ.com) 9月19日消息:用于生成式 AI 工具的大型语言模型通常会极大地增加对更多处理器的需求,这些处理器通常价格昂贵且供应受限。即使是云资源也不能总是解决企业试图扩展规模并利用最新的生成式 AI 技术所面临的问题。

NVIDIA-Anyscale-logos-x1280.jpg

图片来自NVIDIA

「GPU 芯片的扩展迟早将无法跟上模型大小的增长。」Gartner Research 副总裁兼杰出分析师 Avivah Litan 在接受 Computerworld 采访时表示。因此,「继续制造越来越大的模型不是可行选项。」

市场上最大的 GPU 制造商英伟达显然看到了开源软件提高 AI 开发和效率方面价值。周一,Anyscale 宣布将英伟达 AI 引入 Ray 开源和 Anyscale 平台中。英伟达 AI 还将在 Anyscale Endpoints 中运行,该服务可帮助应用程序开发人员使用流行的开源模型(如 Code Llama、Falcon、Llama 2、SDXL 等)嵌入 LLMs 到其应用程序中。

最近宣布的 Nvidia TensorRT-LLM 将支持 Anyscale 以及 Nvidia AI Enterprise 软件平台。它可用于自动扩展推理以在多个 GPU 上并行运行模型,从而在运行 Nvidia H100 Tensore Core GPU 时提供 8 倍的性能提升,英伟达在博客中表示。

此外,英伟达 Triton Interence Server 软件支持在 GPU、CPU 和其他处理器上跨云、数据中心、边缘和嵌入式设备进行推理。当与 Ray 集成时,开发人员可以提高来自各种框架的 AI 模型(包括 TensorRT、TensorFlow、PyTorch、ONNX、OpenVINO 等)的效率。

Anyscale 声称其 Ray 是全球增长最快的可扩展计算统一框架。英伟达 NeMo 是一个面向云原生的框架,可以被 Ray 开发人员用于为客户提供 LLMs。

「我们与英伟达的合作将为 Anyscale 的产品组合带来更多性能和效率,以便开发人员随处创建具有前所未有速度和效率的 LLMs 和生成 AI 应用程序。」Anyscale 首席执行官兼联合创始人 Robert Nishihara 在一份声明中表示。

举报

  • 相关推荐
  • 共建可信AI,共治智能未来 “生成式 AI 进展:应用、治理与社会影响”研讨会成功举办

    5月22日,腾讯研究院与新加坡管理大学数字法研究中心联合举办"生成式AI进展:应用、治理与社会影响"研讨会。会议汇聚中新两国近百名专家学者,围绕生成式AI的技术趋势、产业应用、监管治理、社会伦理等议题展开讨论。腾讯高级副总裁郭凯天强调AI不仅是技术革命,更是人类社会的深刻变革,应构建开放共享的AI生态。新加坡国立大学教授Mohan Kankanhalli指出生成式A

  • 全球首款生成式人形机器人运动大模型发布:可根据指令生成跑步、舞蹈等连贯动作

    今日上午,国家地方共建人形机器人创新中心联合复旦大学未来信息创新学院,正式发布了全球首款生成式人形机器人运动大模型 龙跃”(MindLoongGPT)。 龙跃大模型以自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆传统运动控制范式。 也就是说,用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如以优雅的姿势递

  • 京东云升级JoyScale AI算力平台:支持超10万卡调度

    京东云在上海发布九大AI产品,包括智能体2.0、大模型开发平台和算力平台等,助力企业重构AI基础设施。针对AI应用深化带来的技术挑战,京东云推出以GPU为核心的JoyScale算力平台,具备两大优势:极致算力性能,支持单集群万卡调度和超10万卡全局调度,大模型算力利用率提升至75%;灵活异构算力管理,适配十余种国产算力,集群利用率提升70%。基于京东复杂场景实践,京东云构建一站式大模型产品矩阵,从底层算力设施到上层应用开发,支持企业快速部署大模型及应用。未来将持续深耕技术,以开放协同的生态理念拓展大模型技术边界,助力企业重塑AI生产力。

  • Meta拟重金加码AI赛道,传将斥资超百亿美元投资Scale AI

    Meta 正与人工智能数据服务公司 Scale AI 商讨一项巨额投资,金额可能高达或超过 100 亿美元……

  • 英伟达重夺全球市值第一头衔 再度超越微软

    去年6月19日,英伟达股价曾以135.58美元创下历史新高,当时总市值达3.335万亿美元,一举超越微软和苹果,首次登上全球市值最高上市公司的宝座。此后,在全球市值排名中,英伟达与苹果、微软展开激烈角逐,三者轮番登顶。上一次英伟达成为市值最高的公司是在今年1月24日。 从英伟达自身的财务表现来看,其业绩也相当亮眼。根据英伟达2026财年第一季度财报,该季度公司

  • 英伟达最新高算力芯片上车 雷军:小米YU7全系标配激光雷达

    5月22日,小米正式发布YU7智能汽车,全系标配激光雷达和4D毫米波雷达。新车搭载第三代骁龙8移动平台,采用4nm工艺,显著提升运行速度,OTA升级最快仅需15分钟。配备英伟达Thor计算平台,算力达700TOPS,支持大模型上车。激光雷达探测距离200米,暗光环境下性能更强,能精准识别异形障碍物。同时应用ALD镀膜技术摄像头,有效减少眩光干扰,提升雨雾天气行车安全,实现更智能的辅助驾驶体验。

  • AI机器人赛道竞速,英伟达/微美全息GPU+AI全栈布局双轮驱动产业化浪潮!

    英伟达CEO黄仁勋在Computex2025电脑展发表主题演讲,宣布公司转型为AI基础设施提供商。重点展示了四大方向:消费级RTX显卡、B300服务器芯片、Omniverse软件平台及自动驾驶/机器人技术。推出全新GB300 Blackwell Ultra AI平台,提升训练和推理能力。黄仁勋强调机器人技术将引领下一场工业革命,推出Isaac GR00T机器人开发平台和Jetson Thor处理器。摩根士丹利预测人形机器人市场规模将达60万亿美元,中国到2050年市场规模或达6万亿元。微美全息等企业正加速布局该领域,通过AI视觉、自然语言处理等技术提升机器人环境感知与决策能力。黄仁勋指出智能体(Agent)、模型(Model)和机器人(Robot)将成为未来十年技术话语权争夺的关键。

  • 生成式引擎优化(GEO):金口碑网络解码AI时代的品牌认知渗透术

    生成式人工智能重塑信息传播范式,GEO(生成式引擎优化)技术突破传统SEO局限,成为企业抢占AI认知主导权的关键赛道。GEO通过深度解构大语言模型语义认知架构,实现品牌信息与AI决策系统的原生耦合,构建"空间-时间-认知"三维竞争壁垒。金口碑网络依托语义解析引擎、动态知识图谱等四大技术工具链,帮助企业在AI神经网络中建立品牌印记,实现从流量争夺到认知主导的战略升级。该技术体系支持7*24小时实时响应,通过AI监测与动态调整机制确保优化效果稳定高效。

  • 多平台合作升级,京东内容营销生态持续深化种收协同效率

    京东正加速布局内容营销生态,通过"京魔方"和"红京计划"等项目打通种草到交易的转化链路。近期与小红书合作推出"种草直达"功能,实现内容到电商的一键跳转,优化用户转化路径。同时联合抖音、B站等平台构建立体化合作矩阵,通过数据智能分析实现全链路营销闭环。618期间,京东将依托日趋完善的内容生态,帮助商家实现科学种草,提升增长确定性和持续性。未来将持续深化跨平台合作,通过数据反馈优化策略,构建完整的内容营销双循环体系。

  • 你想成为“首席AI官”吗?生成式AI催生全新职业路径

    亚马逊云科技(AWS)最新发布的一项调研显示,超过八成的企业已经设立、或正在积极物色首席AI官。而这背后,是一场争分夺秒的AI人才争夺战……