首页 > 业界 > 关键词  > 正文

魔搭社区与vLLM和FastChat展开合作 提供高效LLM推理和部署服务

2023-12-29 08:29 · 稿源:站长之家

站长之家(ChinaZ.com)12月29日 消息:最近,魔搭社区与 vLLM 和 FastChat 展开合作,联合为中国开发者提供更快更高效的 LLM 推理和部署服务。开发者可以使用 vLLM 作为 FastChat 中的推理引擎,提供高吞吐量的模型推理。

FastChat 是一个开放平台,用于训练、服务和评估基于 LLM 的 ChatBot。它具有优秀的大语言模型训练和评估代码,并且具有 Web UI 和 OpenAI 兼容的 RESTful API 的分布式多模型服务系统。

vLLM 是一个由加州伯克利分校、斯坦福大学和加州大学圣迭戈分校的研究人员开发的 LLM 服务系统。它基于操作系统中经典的虚拟缓存和分页技术,实现了几乎零浪费的 KV 缓存,并且可以在请求内部和请求之间灵活共享 KV 高速缓存,从而减少内存使用量。

通过 FastChat 和 vLLM,开发者可以快速加载魔搭的模型进行推理。可以使用 FastChat 发布 model worker (s),并通过命令行客户端或网页端 WebUI 进行问答。还可以结合 FastChat 和 vLLM 搭建一个网页 Demo 或者类 OpenAI API 服务器。

微信截图_20231229083256.png

FastChat开源链接:

https://github.com/lm-sys/FastChat

vLLM开源链接:

https://github.com/vllm-project/vllm

新鲜AI产品点击了解https://top.aibase.com/

举报

  • 相关推荐
  • 小红书正式上线RED Skill功能,发力AI Skill创新生态

    6月8日,小红书正式上线RED Skill功能,创作者可在笔记中直接嵌入AI Skill组件,用户点击即可一键复制口令并安装至个人Agent使用,无需跳转第三方。平台推出“RED Skill大赏”扶持活动,并计划完善Skill站内使用功能。目前已有近千个原创Skill发布,相关创作者达30万,话题曝光超6亿。此举旨在降低AI Skill分发门槛,构建从创造、种草到转化的创新社区生态。

  • ROG Xbox Ally X20 搭载谷粒GuliKit TMR 摇杆,双方合作进一步深化

    谷粒科技GuliKit宣布其TMR电磁摇杆技术已应用于ROG最新发布的Xbox Ally X20掌机,双方合作进一步深化。该技术采用非接触式电磁感应方案,解决了传统碳膜电位器摇杆的漂移问题,提升了稳定性和寿命。此前谷粒已为ROG提供官方授权维修替换模块,此次直接应用于整机核心部件,展现了其行业领先地位。谷粒持续研发电磁摇杆技术,并已为Steam Deck、Switch等多类掌机及游戏控制器提供元件供应和定制化解决方案,未来将继续推动游戏操控体验升级。

  • AI日报:阿里上线首个官方大模型NBA Chat; Ideogram4.0开源发布;OpenAI升级ChatGPT记忆系统

    今日AI领域动态:Ideogram 4.0开源发布,93亿参数打造最强文字生成AI,提升海报与品牌营销创作;OpenAI升级ChatGPT记忆系统,算力降至1/5,解决过时与准确性痛点;腾讯文档推出行业首创“人机双写”原生编辑器;xAI发布Grok Imagine Video 1.5,支持图片转视频;豆包回应AI识别野生蘑菇误判,强调仅供参考;知乎Q1扭亏为盈,AI短剧成增长点;腾讯云ADP 4.0新增Claw模式,提升企业Agent构建效率;NBA中国与阿里推出首个官方大模型“NBA Chat”。

  • OpenAI拟大幅降价 与Anthropic展开用户争夺

    知情人士透露,OpenAI正考虑大幅下调其人工智能产品的价格,以从竞争对手Anthropic手中争取更多客户。 相关讨论仍在进行中,可能的调整方向是降低token(衡量AI使用成本的核心计价单位)的价格。 与此同时,有消息称OpenAI已于近日向美国证券交易委员会(SEC)秘密提交了IPO申请。这一动作紧随Anthropic提交IPO申请一周之后,两家公司相继步入上市轨道。

  • 2026 高品质冰箱选购攻略,容声 WILL 生态舱冰箱满足精细化储鲜需求

    过去两年冰箱市场最火的概念是“平嵌”和“美学”,但消费者冷静后发现,冰箱核心价值应是“全食材养鲜”而非外观。调研超300名高端用户发现,购买时最关注“好不好看”,使用后最后悔的却是“菜没放两天就蔫了”“肉冻过就柴”“海鲜串味”。因此,判断冰箱是否具备真正养鲜能力至关重要。以容声WILL生态舱552为例,它通过主动补水、光养保鲜和除菌防霉技术,实现果蔬7日不蔫、肉类即取即切、海鲜长期锁鲜,并采用双系统独立风道和7:3黄金分储格局杜绝串味,同时60cm超薄平嵌设计兼顾美学,真正实现“饮食健康自由”。

  • 扫描全能王深耕AI扫描技术,为多场景资料流转提供高效解决方案

    合合信息旗下扫描全能王亮相浙江卫视《无限超越班》第四季,凭借高效资料扫描与归档能力获艺人学员及导师认可。节目中,学员频繁使用该工具处理笔记、资料归档等任务,导师对其清晰度与专业性给予肯定。产品通过智能高清模式、证件模式、格式转换等功能解决传统手机拍照反光、模糊等问题,并支持水印与加密分享。未来,扫描全能王将持续深耕图像文本处理,助力数字化生活与办公效率提升。

  • 电脑DLL缺失、DirectX报错频发,暴喵修复匠提供一站式修复方案

    近年来,随着3A游戏体量增大,PC游戏环境日益复杂,玩家常遇驱动不兼容、运行库缺失、系统组件异常等“日常烦恼”。暴喵加速器生态推出的【暴喵修复匠】工具,通过自动扫描与智能修复,整合50余项系统环境内容,帮助玩家快速定位并解决常见问题。相比传统手动排查,该工具强调“可视化修复”和“游戏专项修复”,且安装纯净无捆绑,降低了PC游戏的技术门槛,正成

  • 肯德基Skill正式接入千问:疯狂星期四一句话下单 直接到店取

    肯德基Skill接入千问App,全国1.3万门店可直接语音点单,如“帮我点附近肯德基的疯狂星期四”,系统自动匹配门店、套餐并显示距离和取餐时间。作为首个接入的餐饮品牌,肯德基与千问会员权益打通,下单自动使用大神卡和优惠券。千问近期宣布全面开放第三方Agent和Skill,瑞幸咖啡、蜜雪冰城、东方航空等首批企业已测试,将陆续上线。Agent具备记忆和主动规划能力,可提供行程提醒、权益到期提醒等服务。

  • 暴喵修复匠修复电脑DLL、DirectX靠谱吗?实测暴喵修复匠的修复原理与用法

    文章指出电脑游戏运行时频繁出现DLL缺失、DirectX报错等问题,主要因系统断电、软件残留、驱动不匹配或DX版本冲突引起。暴喵修复工具通过智能扫描,一键检测并修复缺失或损坏的DLL与DirectX组件,支持区分32/64位及新旧DX版本,避免手动下载风险。相比传统方案,它更精准、纯净、全面,适合PC游戏玩家、系统重装用户及电脑小白,能有效解决游戏启动故障。

  • 千问宣布全面开放第三方Agent、Skill:肯德基、瑞幸、蜜雪冰城首批接入

    今日,千问App宣布,将向第三方Agent、Skill全面开放,所有企业均可在千问运营自己的品牌Agent。 据悉,瑞幸咖啡、肯德基、蜜雪冰城、东方航空等首批企业已在千问进行Agent服务测试,并将陆续上线。 未来,企业可在千问App内打造专属Agent,自定义人设、服务范围与交互方式,通过对话为用户提供产品咨询、下单推荐、行程服务、权益提醒等能力。 与传统客服不同,Agent具�

今日大家都在搜的词: