英伟达宣布 TensorRT 登陆 Windows，为消费类 PC 带来巨大的 AI 性能提升

2023-10-18 09:22 · 稿源：站长之家

站长之家(ChinaZ.com) 10月18日消息:在过去的一年里，生成式人工智能已经成为一种变革趋势。随着其快速增长和可用性的不断提高，消费者现在拥有简化的界面和用户友好的工具，可以利用 GPU 优化的人工智能、机器学习和高性能计算 (HPC) 软件的强大功能。

英伟达

英伟达已经在拥有大量 GPU 的数据中心实现了大部分人工智能革命，现在它正在将其引入全球超过 1 亿台 Windows PC 上基于 RTX 的 GPU。将 AI 集成到主要 Windows 应用程序中已经经历了五年的历程，GeForce RTX 和 Nvidia RTX GPU 中的专用 AI 处理器（称为 Tensor Core）推动了 Windows PC 和工作站上的生成式 AI 功能。

现在英伟达宣布将支持其 TensorRT-LLM SDK 适用于 Windows 以及 Stable Diffusion 等模型，以使大型语言模型（LLM）和相关工具运行更快。

TensorRT 加速了推理过程，即通过预训练信息进行计算，以得出结果，比如生成新的 Stable Diffusion 图像。通过这款软件，英伟达希望在生成式人工智能的领域扮演更重要的角色。

TensorRT-LLM 将 LLMs（如 Meta 的 Llama 2）和其他 AI 模型（如 Stability AI 的 Stable Diffusion）进行分解，以在英伟达的 H100 GPU 上运行更快。该公司表示，通过运行 LLMs，TensorRT-LLM 能够「显著改善更复杂的 LLM 用途的体验，比如写作和编码助手」。

这样，英伟达不仅可以提供训练和运行 LLMs 所需的 GPU，还可以提供软件，使模型能够更快地运行和工作，以使用户不再寻求其他方法来提高生成式人工智能的成本效益。该公司表示，任何希望使用或集成该软件的人都可以公开使用 TensorRT-LLM，并可以在其官网上访问 SDK。

英伟达已经几乎垄断了用于训练 LLMs（如 GPT-4）的强大芯片市场，要训练和运行 LLM 通常需要大量 GPU。对其 H100 GPU 的需求已经急剧增加，估计价格已经达到每片 40000 美元。该公司宣布将在明年推出其 GPU 的新版本——GH200。这使得英伟达的收入在第二季度达到 135 亿美元。

但是，生成式人工智能的世界发展迅速，已经出现了不需要大量昂贵 GPU 的运行 LLM 的新方法。微软和 AMD 等公司宣布将推出自己的芯片，减少对英伟达的依赖。

各家公司都把目光投向了人工智能开发的推理领域。AMD 计划收购软件公司 Nod.ai，以帮助 LLMs 专门在 AMD 芯片上运行，而像 SambaNova 这样的公司已经提供了使模型更容易运行的服务。

目前，英伟达仍然是生成式人工智能领域的硬件领军企业，但看起来它已经在谋求一个人们不必依赖购买大量 GPU 的未来。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Windows11 Moment5 更新带来更多 AI 功能

Microsoft最新发布的Windows11Moment5更新带来了一系列令人期待的AI功能。在这次更新中，用户可以体验到VoiceAccess功能的新增，该功能使得跨窗口操作变得更加容易，同时还可以在VoiceAccessCommands窗口中设置语音快捷方式，例如复制粘贴文本、打开特定文件或应用程序等。Windows11Moment5更新为用户带来了更多AI功能，使得操作系统的使用更加智能和便捷。

AI功能 Windows11 AI头条
收费、不兼容等！德国一州决定抛弃微软：政府所有PC不用Windows、Office

德国北部的石勒苏益格-荷尔斯泰因州政府宣布了一项重大变革计划，即将更换政府计算机中的微软系统和软件。这意味着约有3万台政府计算机将从微软的Windows和Office365迁移到使用Linux和LibreOffice等开源软件。尽管微软的一些产品，如ActiveDirectory，目前尚无可替代的开源替代品，但该州政府已经着手计划构思和开发一种基于开源代码的目录服务，以在未来替代微软的ActiveDirectory。

德国政府计算机
微软将在五月公布新的 Windows 和云 AI 功能

微软将在年度Build大会上揭示全新的人工智能工具，用于PC和云端应用。CEOSatyaNadella在一月份告诉分析师，2024年将成为“AI成为每台PC的头等部分”的一年五月的会议议程也反映了这一目标。你可以在这里找到2024年Build大会的完整会议目录。

Windows AI功能
一文速览铁威马TOS 6全新“文件管理”：跟Windows一样好用

铁威马对最新NAS系统TOS6中的文件管理”工具进行了深度优化，并新增了许多便捷的功能。为了向用户提供更流畅、更便捷的文件管理体验，铁威马的研发团队借鉴了WindowsOS和MacOS在文件管理方面的优点。铁威马介绍称，除了上述功能，文件管理还新增和优化了文件全选与反选、文件任务进度、更多文件上传来源、文件冲突策略、自定义外网分享链接”等功能，为用户打造更便捷高效地文件管理工具。

文件管理 NAS系统目录导航分类
微软计划在Windows 11“开始”菜单中投放广告：已在测试

Windows11家庭版和专业版用户可能很快就会在开始”菜单中看到官方推荐的广告。微软已经在Windows11上测试在开始”菜单的推荐区域中显示广告，这些广告将包括网站、应用程序以及简要的推广说明。该功能处于预览测试阶段，最终是否上线还要看用户的反馈。

Windows 11 开始菜单
Windows 30年前支持ZIP格式：任务管理器之父差点被炒鱿鱼

前微软工程师DavePlummer回顾了他的职业生涯，尤其提到了一段趣事，那就是30年前为了让Windows系统支持ZIP压缩文件格式，自己差点丢了工作。DavePlummer曾在微软实习期间就开发了WindowsNT4.0系统的任务管理器等核心组件，功勋卓著，这也成了他保住饭碗的关键原因。以后还会分享更多在微软工作期间发生的趣事。

Dave Plummer Windows
高通骁龙X Elite“低配版”Windows芯片曝光！集成5G基带

除了骁龙XElite外，高通还在测试代号为X1P”的SoC存在两个版本。正在测试的两款SoC的SKU编号为X1P”，由于骁龙XElite的SKU编号为X1E”，因此可以暂时理解为这两款SoC命名是骁龙XPLUS。且已有测试中的骁龙X系列集成了高通第四代5G基带骁龙X65，若相关产品研制成功，以后将会有更多支持5G网络功能的笔记本电脑推出。

高通
微软公布2025年之后使用Windows 10付费更新价格：每台电脑441元每年涨一倍

去年，微软宣布了一项针对Windows10的扩展支持计划，允许用户在2025年10月官方支持结束之后付费购买持续的安全更新。微软终于公布该计划的定价策略，每台设备起价61美元，并且三年内每年翻一番。Windows112021年就发布了，尽管微软尽了最大努力，用了各种办法，包括向老用户弹窗等等，但其市场份额表现依然远远落后于Win10。

Windows 10 微软
英伟达联合火星时代发布《NVIDIA TensorRT Stable Diffusion创作加速指南》

火星时代教育AI设计教研团队在英伟达RTXAI媒体品鉴会上宣布联合发布《NVIDIATensorRTStableDiffusion创作加速指南》，为创作者提升AI创作效率，加速商业创意落地。火星时代教育AI设计教研总监吴大吉现场分享据悉，该创作指南是基于GeForceRTX40系GPU，提升StableDiffusion创作效率的实操性教程，内容包括:安装与设置、加速引擎构建、加速效果对比以及NVIDIATensorRT在实际商业创作场景:海报设计、电商设计、室内效果图设计、插画设计的应用，未来指南还将根据应用软件版本优化进行迭代升级，帮助更多AI设计爱好者和创作者感受速度加持下的创作美好。火星时代将持续聚焦AI及元宇宙双域，整合优质CG技术资源，培养数字时代全能型CG人才。

火星时代教育 AI设计 NVIDIA
荐AI行业买英伟达GPU，花的钱比赚的多17倍

搞AI大模型，实在太烧钱了。如今的生成式AI有很大一部分是资本游戏，科技巨头利用自身强大的算力和数据占据领先位置，并正在使用先进GPU的并行算力将其推广落地。无论花掉多少钱，成为第一可能就会带来潜在的收益……但是什么样的收益，我们还无法作出预测。

AI 大模型资本游戏

Chat UI:开源代码库，为HuggingChat应用提供动力

chat-ui是一个开源的聊天界面，使用开源模型如OpenAssistant或Llama。它是一个SvelteKit应用程序，为hf.co/chat上的HuggingChat应用提供支持。该产品允许用户通过自定义配置来运行和部署自己的Chat UI实例，支持多种语言模型和功能，如Web搜索、自定义模型等。

开源聊天应用 SvelteKit

360AI浏览器APP:360AI 浏览器，AI 赋能，秒懂一切。

360AI 浏览器利用人工智能技术，提供智能搜索、PDF、视频、网页总结等功能，旨在帮助用户高效获取知识，提升阅读体验。

智能搜索 PDF 阅读视频播放

FAQ Generator:免费AI生成FAQ，无需注册即可创建网站FAQ模板。

AI FAQ Generator是一款利用先进AI技术，通过分析常见问题自动生成FAQ列表的工具。它能够快速高效地生成FAQ，节省时间和资源，同时提供准确的答案，帮助提高客户满意度，并改善SEO效果。

AI技术自动化 FAQ创建

BrickCenter:一个创意无限的乐高设计平台，让你的想象力变为现实。

BrickCenter是一个在线平台，允许用户免费创建自己的乐高套装和迷你人物。它提供了一个将创意转化为详细乐高设计的工具，无论是复杂的场景还是个性化的迷你人物，用户都可以在这个平台上实现自己的设计梦想。该平台以其用户友好的界面和强大的定制功能而受到乐高爱好者的欢迎。

创意设计乐高

100 UI/UX Tips:在一个小时内学习如何制作令人印象深刻的应用程序界面。

《100 UI/UX Tips》提供了设计界面所需的所有提示，让用户感到满意。强调产品的主要优点、背景信息、价格和定位。

设计用户界面用户体验

whatwide.ai:提高生产力的AI助手，简单易用

whatwide.ai是一个提高生产力的AI助手，使用人工智能技术来节省时间并提高工作效率。它提供了50多种AI模型，包括文本生成、网站帮助、社交媒体分析、编程辅助等多种功能。whatwide.ai的优点在于高质量的内容生成、快速且安全的操作，以及多种AI类型供用户选择。

生产力文本生成网站帮助

Stream of Consciousness:一个展示想象中艺术家思绪的日常表演，通过创作和分享图像来表达创造力。

Stream of Consciousness是一个记录并分享艺术家思维的项目，通过创作和分享图像来展示创造力。它提供了一个深入艺术家思维的窗口，让人们了解艺术创作的过程和灵感的来源。

艺术创作思绪

Neurelo:是一种用于PostgreSQL、MongoDB和MySQL的云数据API平台，通过自动生成REST和GraphQL数据API、AI辅助的自定义查询API、查询可观察性等功能，简化和加速现代云应用程序开发。

Neurelo是一个专为云数据库而设计的平台，通过使用云API和人工智能技术，提供自动生成API、自定义查询API、查询可观察性和Schema as Code等功能，以提高开发人员的生产力。Neurelo能够简化数据库编程相关的复杂性，并具备可伸缩性、安全性和查询优化能力。

数据库云应用程序 API

EdrawMax:智能且风格多样的图表解决方案，简化您的想法可视化过程。

EdrawMax是一款功能强大的图表设计软件，它提供一站式的图表解决方案，适用于流程图、思维导图、组织结构图、甘特图、平面图和ER图等210多种图表类型。它具有简洁的用户界面，类似于MS Office的干净、整齐的界面，直观且易于导航的工具集，以及无缝的拖放功能。此外，EdrawMax还提供了23000多个用户制作的模板，850个精心制作的内置模板，以及26000多个免费符号，覆盖所有图表类型。它还具备AI功能，可以生成和分析22种类型的图表，包括文本到绘图和图片到绘图以及AI聊天。EdrawMax支持跨平台集成，可以在云端保存文件并通过链接共享，支持通过社交媒体或电子邮件发送作品，并能以13种格式导出图表，包括VSDX、PPTX和SVG等。此外，EdrawMax遵循GDPR标准，使用最高级别的256位SSL加密，确保用户隐私和数据安全。

图表设计 AI生成跨平台

Notta Showcase:通过AI技术，轻松实现视频的多语言翻译和配音，连接全球观众。

Notta Showcase是一款在线视频翻译和配音工具，它通过AI技术帮助用户将视频内容翻译成15种不同的语言，同时保持原始的语音风格和情感，以提供自然的听觉体验。该产品的主要优点包括高效率、成本效益、用户友好的界面、高准确度的转录和翻译，以及支持多种文件格式和平台。它适用于营销、社交媒体和教育等多个领域，可以显著扩大内容的全球影响力。

AI翻译视频配音内容本地化

SunoAI API:开源项目，实现AI音乐服务的API接口

Suno API是一个开源项目，允许用户设置自己的Suno AI音乐服务API。它实现了app.suno.ai的创建API，兼容OpenAI的API格式，支持自定义模式，一键部署到Vercel，并且拥有开放源代码许可证，允许自由集成和修改。

AI音乐 API 开源

x-crawl:灵活的 Node.js AI 辅助爬虫库，让爬虫工作更高效、智能、便捷。

x-crawl 是一款基于 Node.js 的 AI 辅助爬虫库，它通过强大的 AI 辅助功能，使得爬虫工作变得更加高效、智能和便捷。它支持对动态页面、静态页面、接口数据以及文件数据的爬取，同时提供了自动化操作、键盘输入、事件操作等控制页面的能力。此外，它还具备设备指纹、异步同步、间隔爬取、失败重试、轮换代理、优先队列和记录爬取等功能，以适应不同的爬取需求。x-crawl 拥有类型，通过泛型实现完整的类型，基于 MIT 许可发布，适合需要进行数据爬取的开发者和企业。

爬虫 AI辅助自动化

MetaCLIP:一种用于图像和文本数据的先进机器学习模型，专注于数据质量和透明度。

MetaCLIP是一个开源的机器学习模型，用于图像和文本的联合表示学习。它通过一个简单算法对CLIP数据进行筛选，不依赖于先前模型的过滤，从而提高了数据的质量和透明度。MetaCLIP的主要贡献包括无过滤的数据筛选、透明的训练数据分布、可扩展的算法和标准化的CLIP训练设置。该模型强调数据质量的重要性，并提供预训练模型，以支持研究人员和开发者进行控制实验和公平比较。

机器学习图像识别文本处理

AITown:一个虚拟城镇，AI角色在这里生活、聊天和社交。

AI Town是一个基于MIT许可的可部署启动套件，用于构建和定制您自己的AI城镇版本。这个项目受到了研究论文'Generative Agents: Interactive Simulacra of Human Behavior'的启发，旨在提供一个强大的基础平台，旨在被扩展。后端原生支持共享全局状态、事务和模拟引擎，适用于从简单的项目到可扩展的多人游戏。

AI 虚拟城镇聊天模拟

Vanna:通过自然语言生成SQL查询，简化数据库交互。

Vanna是一个使用Retrieval-Augmented Generation (RAG) 技术的开源Python框架，用于SQL生成和相关功能。它通过训练RAG模型，将自然语言问题转换为SQL查询，从而允许用户以提问的形式与数据库进行交互。Vanna的主要优点包括高准确度、安全性、私有性、自学习能力，并且支持任何SQL数据库。

SQL 自然语言处理数据库

Fal AI:AI图片生成式开发者平台

fal.ai 是一款面向开发者的生成媒体平台，提供了业界最快的推理引擎，可以让您以更低的成本运行扩散模型，创造出全新的用户体验。它拥有实时、无缝的 WebSocket 推理基础设施，为开发者带来了卓越的使用体验。fal.ai 的定价方案根据实际使用情况灵活调整，确保您只为消耗的计算资源付费，实现了最佳的可扩展性和经济性。

生成媒体推理引擎开发者工具

Chat With Llama 3:一个开源的聊天机器人，能够解释概念、写诗、编程、解逻辑谜题。

Chat With Llama 3 是一个开源的聊天机器人，由Meta AI开发。它能够进行多种智能对话，包括解释复杂概念、创作诗歌、编写代码、解决逻辑谜题，甚至帮助用户给宠物起名。这个聊天机器人的主要优点在于它的多功能性和开源性，使其可以被广泛地应用于各种场景，并且可以根据需要进行定制和改进。

人工智能聊天机器人开源

AI图片生成与搜索:释放创意，一键生成或搜索超过200万张AI图片。

AI图片生成与搜索是一个在线平台，利用先进的人工智能技术，允许用户快速生成或搜索各种风格的AI图片。该技术的重要性在于它能够极大提高设计和创意工作的效率，同时降低成本。产品的主要优点包括丰富的图片资源、高效的生成速度、以及用户友好的界面。产品背景信息显示，这是一个面向广大创意工作者和设计师的工具，旨在帮助他们快速实现创意构想。目前，该产品提供免费试用，但具体价格和定位信息未在页面中提供。

AI技术图像生成创意工具

OpenPerplex:，您的知识门户

OpenPerplex是一个提供广泛知识资源的在线平台，它通过整合多种信息源，为用户提供了一个便捷的知识获取渠道。该产品以其丰富的信息量、高效的检索能力和友好的用户界面而受到用户的青睐。它不仅适用于个人学习，也适合专业人士进行深入研究。

知识获取信息检索在线学习

JavaVision:基于Java的全能视觉智能识别项目

JavaVision是一个基于Java开发的全能视觉智能识别项目，它不仅实现了PaddleOCR-V4、YoloV8物体识别、人脸识别、以图搜图等核心功能，还可以轻松扩展到其他领域，如语音识别、动物识别、安防检查等。项目特点包括使用SpringBoot框架、多功能性、高性能、可靠稳定、易于集成和灵活可拓展。JavaVision旨在为Java开发者提供一个全面的视觉智能识别解决方案，让他们能够以熟悉且喜爱的编程语言构建出先进、可靠且易于集成的AI应用。

英伟达宣布 TensorRT 登陆 Windows，为消费类 PC 带来巨大的 AI 性能提升

今日大家都在搜的词：

热文

站长商机