首页 > 传媒 > 关键词  > ComfyUI最新资讯  > 正文

NVIDIA RTX 加速 PC 端 4K AI 视频生成,LTX-2 与 ComfyUI全面升级

2026-01-06 15:49 · 稿源: 站长之家用户

ComfyUILTX-2Llama.cppOllama、Hyperlink 等迎来全面 RTX 加速,解锁 AI PC 上的视频、图像与文本生成应用场景

2025年是 PC 端 AI 发展的突破之年。

PC 级小语言模型 (SLM) 的准确率相比2024年提高近2倍,显著缩小与前沿云端大语言模型 (LLM) 之间的差距。AI PC 开发工具,如 Ollama、ComfyUI、llama.cpp、Unsloth 等日趋成熟,受欢迎程度同比翻倍,下载 PC 级模型的用户数量也较2024年增长10倍。

上述进展将推动生成式 AI 在2026年全面走向大众 PC 创作者、游戏玩家和生产力用户。

在 CES 上,NVIDIA 宣布为 GeForce RTX、NVIDIA RTX PRO 以及 NVIDIA DGX Spark 设备推出一系列 AI 升级,为 PC 上部署生成式 AI 解锁性能,降低显存需求,包括:

• 通过 PyTorch-CUDA 优化以及在 ComfyUI 中原生支持 NVFP4/ FP8精度,视频和图像生成式 AI 性能至高提升3倍,显存占用至多降低60%。

• 在 ComfyUI 中集成 RTX 视频超分辨率(RTX VSR),加速4K 视频生成。

• 为 Lightricks 业界领先的 LTX-2音视频生成模型开源权重版本做出优化,推出 NVIDIA NVFP8量化模型。

• 为由 Blender 中的3D 场景生成4K AI 视频提供了一个 AI Blueprint,实现对输出结果的精确控制。

• 通过加速 Ollama 和 llama.cpp,将小语言模型 (SLM) 推理性能至高提升35%。

• 为 Nexa.ai 的 Hyperlink 全新视频搜索功能提供 RTX 加速。

这些改进让用户能够在无缝运行先进的视频、图像和语言 AI 工作流的同时享受本地 RTX AI PC 带来的隐私性、安全性和低延迟优势。

在 RTX PC 上实现 3 倍加速的 4K 视频生成

生成式 AI 能够制作出令人惊艳的视频内容,但仅依靠提示词的在线工具往往难以精准控制其生成效果。而尝试生成4K 视频几乎是不可能的,因为大多数模型体量过大,难以载入个人 PC 的显存。

1月6日,NVIDIA 推出了一套由 RTX 加速的视频生成工作流,使创作者能够更精准地控制生成结果,同时还能以3倍速度生成视频并将其提升至4K 分辨率 – 仅需占用一小部分显存。

这套视频工作流支持现代创作者从分镜脚本出发,生成照片级写实画面的关键帧,并最终生成高质量的4K 视频。整个流程由三大 AI Blueprint 模块构成,艺术家可根据需求灵活组合和调整:

• 3D 物体生成器:用于创建场景所需的资产。

• 3D 引导的图像生成器:用户可在 Blender 中搭建场景,并据此生成照片级写实的关键帧。

• 视频生成器:根据用户设定的起始与结束关键帧来生成动画视频,并借助 NVIDIA RTX Video 技术将视频升级至4K。

这一视频生成工作流由 Lightricks 的全新 LTX-2模型实现,该模型于1月6日正式发布并开放下载。

LTX-2在本地 AI 视频创作取得重要里程碑,其生成效果可与领先的云端模型媲美,能生成长达20秒且视觉保真度极高的4K 视频。模型内置音频功能、支持多关键帧,并通过可控低秩适配增强的高级条件控制功能,使创作者无需依赖云端,即可获得电影级的画质与精细控制。

这套工作流在底层由 ComfyUI 驱动。过去数月,NVIDIA 与 ComfyUI 团队紧密合作,使其在 NVIDIA GPU 上的性能提升了40%,最新版本增加了对 NVFP4与 NVFP8的支持,在 RTX50系列 GPU 上采用 NVFP4格式可实现3倍的性能提升、显存占用降低60%;采用 NVFP8格式则可实现2倍的性能提升、显存占用降低40%。

目前,NVFP4和 NVFP8Checkpoints 现已在 ComfyUI 中直接开放给部分热门模型,包括 Lightricks 的 LTX-2、Black Forest Labs 的 FLUX.1与 FLUX.2,以及阿里巴巴的 Qwen-Image 和 Z-Image。用户可在 ComfyUI 中直接下载,后续还将支持更多模型。

在视频生成完成后,用户可通过 ComfyUI 中全新的 RTX Video 节点,在数秒内将视频放大至4K分辨率。该图像放大 (Upscaler) 功能可实时运行,锐化画面边缘并消除压缩伪影,输出清晰的画面。RTX Video 将于下个月正式登陆 ComfyUI。

为了帮助用户突破 GPU 显存限制,NVIDIA 与 ComfyUI 团队合作,进一步优化了其 weight streaming 功能。启用该功能后,当显存不足时,ComfyUI 可调用系统内存,从而在主流 RTX GPU 上运行更大规模的模型与更复杂的多阶段节点图。

这套视频生成工作流将于下个月开放下载,而 LTX-2视频模型的开源权重以及 ComfyUI 的 RTX 相关更新现已上线。

全新的 PC 文件与视频搜索方式

几十年来,PC 上的文件搜索方式几乎没有发生变化,仍主要依赖文件名和零散的元数据。这种方式让用户想要找到一年前的某个特定文档变得异常困难。

Hyperlink 是由 Nexa.ai 推出的本地搜索智能体。它可以将 RTX PC 变为一个可搜索的知识库,支持以自然语言提问,并在结果中提供可追溯的引用来源。它能够扫描并索引文档、PPT、PDF 以及图像,让搜索不再依靠猜测文件名,而是基于内容和需求本身。所有数据均在本地处理并保存在用户的 PC 上,以确保隐私与安全。此外,Hyperlink 还支持 RTX 加速,在 RTX5090GPU 上,索引文本和图像文件的速度约为 每 GB30秒,查询响应时间仅3秒。相比之下,使用 CPU 索引文件每 GB 则需要约1小时,查询响应时间长达90秒。

  在 CES2026上,Nexa.ai 发布了 Hyperlink 的全新测试版本,新增对视频内容的支持,使用户可以在本地视频中搜索物体、动作以及语音内容。这一功能可以帮助视频创作者快速查找所需的 B-roll 素材,或让游戏玩家找到自己赢得比赛的精彩瞬间,与好友分享。

体验 Hyperlink 的私有测试版本,请前往 Nexa.ai 官网注册。访问权限将从本月起陆续开放。

小语言模型 (SLM) 性能提升高达 35%

NVIDIA 携手开源社区,基于 llama.cpp 与 Ollama,为 RTX GPU 和 NVIDIA DGX Spark 桌面级超级计算机上的小语言模型带来了显著的性能提升。最新优化对混合专家模型 (MoE) 尤为有利,其中包括 NVIDIA 近期发布的 Nemotron3系列开放模型。

在过去四个月中,小语言模型的推理性能在 llama.cpp 上提升了35%,在 Ollama 上提升了30%。Ollama 的相关更新现已发布,而 llama.cpp 则已提供了用户体验升级,可显著加快大语言模型的加载速度。

这些性能提升将在 LM Studio 的下一次更新中实现,并将很快应用于各种智能体应用,例如全新的 MSI AI Robot 应用。MSI AI Robot 同样受益于 llama.cpp 的优化,使用户能够更便捷地控制 MSI 设备设置,并在即将发布的版本中整合最新性能的升级。

NVIDIA Broadcast2.1 将虚拟补光带给更多 PC 用户

NVIDIA Broadcast 应用 AI 特效提升麦克风和摄像头的质量,成为直播和视频会议的理想之选。

2.1版本对虚拟补光效果进行了性能优化。它不仅支持 RTX3060及以上 GPU,还能适应更多光照环境,提供更广的色温调节,并使用更新的 HDRi 基础贴图,实现常见于专业直播的双主灯效果。查看链接下载 NVIDIA Broadcast 的更新版本。

热门直播平台Bilibili即将集成更新后的虚拟补光效果。此次更新将使更多 GeForce RTX 用户能够在直播中获得更优质的面部补光效果。对 NVIDIA Broadcast 特效感兴趣的开发者可查看最新版本的软件开发工具包 (SDK)。

DGX Spark:将居家创意工作室升级为 AI 超级工作站

随着每个月越来越多更强大的 AI 模型不断登陆 PC 端,开发者对更高性能、更灵活的本地 AI 环境的需求持续增长。DGX Spark 是一款紧凑型 AI 超级计算机,可放置在桌面上,与主力台式机或笔记本电脑无缝配合,使用户能够与现有 PC 共同进行实验、原型设计以及运行高级的 AI 工作负载。

Spark 非常适合希望测试大语言模型、原型化智能体工作流的开发者,或希望在工作流中并行生成创作素材的艺术家,这样他们的主力 PC 仍能继续进行编辑工作。

在 CES2026上,NVIDIA 发布了 Spark 的重大 AI 性能更新,使其相较于不到三个月前首次发布时,最高可获得高达2.6倍的性能提升。

NVIDIA还推出了全新的 DGX Spark Playbooks,包括用于推测解码以及使用两个 DGX Spark 模块微调模型的示例方案。

NVIDIA RTX AI PC的相关信息请关注微博、抖音及哔哩哔哩官方账号。

软件产品信息请查看声明。

关于NVIDIA

NVIDIA (NASDAQ: NVDA) 是加速计算领域的全球领导者。

# # #

媒体咨询:

Jade Li

NVIDIA GeForce, Studio PR

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 别傻傻买Mac Mini跑OpenClaw了!玩转AI代理,拼的不是显卡,是Token

    OpenClaw作为代理式AI开源框架,让AI从被动应答转向主动规划、调用工具、串联多步操作,成为数字世界的“全能助理”。其GitHub星标数已达14.3万,增长迅猛。然而,其自主决策特性也带来安全风险,如权限滥用、数据误删等。同时,OpenClaw的火爆推动了Agent普及,带来三大产业机会:一是云服务成为个人与中小企业入局的最低门槛;二是Token消耗迈入指数级增长阶段;三是Agent�

  • AI日报:宇树开源UnifoLM-VLA-0大模型;腾讯“元宝派”内测截图泄露;Clawd更名为OpenClaw

    本期AI日报聚焦具身智能与AI应用新动态。蚂蚁集团发布LingBot-VLA模型,实现双手机器人通用操控;宇树开源UnifoLM-VLA-0模型,为机器人注入物理常识。开源AI助手OpenClaw更名后受关注,强调隐私安全。商汤开源SenseNova-MARS模型,在多个榜单超越GPT-5.2。腾讯“元宝派”社交功能内测截图泄露,整合微信与QQ好友,支持同步观影听歌。马斯克计划明年推出高度个性化AI生成游戏与影音内容。Anthropic因涉嫌大规模盗版遭音乐出版商起诉,索赔30亿美元。字节与阿里在春节前后发布新一代大模型,争夺云端主导权。

  • AI日报:腾讯混元图像3.0正式开源;Clawdbot迫于压力更名Moltbot;月之暗面发布 Kimi Code

    本期AI日报聚焦多领域AI新动态:腾讯混元图像3.0开源,成为全球最强开源图生图模型;月之暗面发布Kimi Code,推动国产AI编程工具进入新阶段;开源项目Clawdbot因商标风险更名Moltbot,并遭诈骗者利用旧账号发布虚假代币;谷歌AI Plus计划正式扩展至美国等35个市场,月费不足8美元;OpenAI发布基于GPT-5.2的科研协作平台Prism;谷歌Aluminum OS界面首曝,深度融合Android与ChromeOS;Mistral AI发布终端编程助手Vibe 2.0,步入“子代理”时代;小米AI眼镜深度集成支付宝,实现停车缴费与健康管理“无感交互”。

  • 酷哇发布 WAM 2.0 世界模型,加速构建“自动驾驶+机器人”RoboCity 新基建

    酷哇科技发布通用世界模型底座Coowa WAM2.0,并率先实现年度EBITDA回正。公司已完成从“单点技术”向“城市通用智能”的战略跃迁,构建起“技术底座+商业规模”双轮驱动体系,开启万台级“城市新基建”规模化部署。依托三大业务矩阵(智慧出行、智慧物业、智慧城市管家),酷哇已在全球超50个城市实现商业化落地,累计安全运营里程突破500万公里。其规模化订单市场占有率约80%,一线城市业务占比从2022年的不足2%跃升至2025年的25%,客户长期价值认可度持续提升。

  • Checkout.com 与 Spotify 达成全球战略支付合作伙伴关系,助力其全区业务版图

    全球领先数字支付服务商Checkout.com宣布与音频流媒体平台Spotify达成战略合作,将成为其全球支付服务商。Checkout.com将为Spotify遍布180多个国家和地区的订阅用户提供高效数字支付体验,利用其全球收单网络与本地化资源优化支付绩效。合作将集成Checkout.com的智能支付解决方案“Intelligent Acceptance”,通过AI驱动的实时数据智能路由支付订单,以提升交易成功率与支付效率。同时,双方将整合网络令牌化与身份验证服务,通过高级安全技术保障用户支付安全与订阅服务的定期支付顺畅。此次合作旨在为Spotify超7亿月活用户及超2.8亿付费用户打造流畅、安全且可靠的支付体验,支持其全球业务拓展。

  • WLS 2026在迪拜开幕,WLA主办、KuCoin联合主办,聚焦基础科学与全球治理的未来路径

    世界顶尖科学家协会(WLA)与KuCoin联合主办的世界顶尖科学家峰会2026(WLS2026)于2月1日在阿联酋迪拜开幕。本届峰会以“基础科学:以科学共识应对人类挑战”为主题,汇聚全球顶尖科学家、科研机构代表、政策制定者与技术实践者,共同探讨基础科学、前沿技术与全球治理的未来路径。峰会强调将基础科学发现与全球治理及公共政策需求更直接地连接,推动科学从知识积累走向制度与治理层面的结构性支撑。KuCoin作为联合主办方,从“可信数字基础设施”的视角参与议程,探讨区块链与人工智能在科研协作、数字基础设施与公共治理领域的基础性价值,并主导“AI×区块链科学论坛”。峰会获得阿联酋政府的高规格支持,为期三天,吸引了来自全球的逾千名与会者,包括诺贝尔奖、图灵奖、沃尔夫奖等国际顶级科学奖项获得者,规模与学术影响力再创新高。

  • AMD去年营收346亿美元创纪录!苏姿丰:我们卖爆了

    AMD公司公布2025年第四季度及全年财务报告,双双创下历史新高。 财报显示,该公司2025年第四季度营收103亿美元创纪录,同比增长34%;2025年全年,AMD实现创纪录的346亿美元营收,同比增长34%。 本季度,AMD的毛利率为54%,净利润为15亿美元。全年来看,AMD的非GAAP毛利率为52%,净利润为68亿美元。 该公司预计2026年第一季度营收约为98亿美元,上下浮动3亿美元。 AMD的数据中心业

  • AI日报:Kimi K2.5上线;阿里发布推理模型Qwen3-Max-Thinking;Claude 深度集成 Slack 等办公神器

    本期AI日报聚焦多款AI产品更新:Kimi K2.5上线,视觉与工具调用功能升级;腾讯搜狗输入法20.0版本全面AI化;阿里发布万亿参数Qwen3-Max-Thinking模型,性能对标国际顶尖;阿里健康AI应用“氢离子”新增动态证据定位功能;百度文心APP开启“多人多Agent”群聊内测;千问PC和网页端上线国内最强推理模型;Anthropic推出交互式应用,深度集成办公工具;蚂蚁灵波开源空间感知模型LingBot

  • 拉烤签打鼠鼠,《别拽了!烤串师傅》正式上线Steam,首发仅 17.99 元

    《别拽了!烤串师傅》是一款融合塔防与自走棋养成的休闲游戏,玩家扮演烤串师傅,通过实时拖动烤签、摆放食材和调料来抵御“不速之鼠”。游戏强调即时操作与策略,食材可成长互动,随机机制增加变数。目前已在Steam上线,首周折后17.99元,支持键鼠和手柄操作,包含无尽模式。画风可爱,节奏轻快,适合寻求操作与策略结合的塔防爱好者。

  • ​先摆猫,再出牌:《风水喵将》现已上线Steam,首发优惠仅需22.49元

    《风水喵将》是一款以猫咪表情包为灵感的肉鸽策略卡牌游戏,现已上线Steam,售价24.99元,首发优惠价22.49元。游戏融合麻将框架、肉鸽策略与猫咪元素,玩家需在有限手牌、宝物与随机选项中权衡调整,构建不同打法思路。游戏画风抽象温馨,加入“天命肉鸽”等机制增强趣味性,无论麻将新手或老手都能快速上手,体验构筑成型与分数翻倍的爽感。

今日大家都在搜的词: