首页 > 业界 > 关键词  > NVIDIA最新资讯  > 正文

NVIDIA发布SteerLM:个性化定制大型语言模型响应的新AI方法

2023-10-16 17:32 · 稿源:站长之家

划重点:

NVIDIA发布了一项名为SteerLM的新技术,旨在解决大型语言模型的问题,使用户能够自定义模型的响应。

SteerLM通过四个步骤的监督微调过程,允许用户定义关键属性,如帮助性、幽默和创造力,来引导模型的行为。

这项技术的一个亮点是其实时可调性,用户可以在推断过程中微调属性,从而为各种应用提供个性化的能力。 NVIDIA将SteerLM作为开源软件发布,为开发者提供了机会。性能上表现出色,还具有实时可调整性,可应用于多个领域,从游戏到教育再到无障碍领域。

站长之家(ChinaZ.com) 10月16日 消息:在人工智能领域,开发人员和用户一直面临一个挑战,那就是需要更加定制和细致的大型语言模型响应。虽然这些模型,比如Llama2,可以生成类似人类的文本,但它们通常需要提供真正针对个体用户独特需求的答案。然而,现有的方法,如监督微调(SFT)和从人类反馈中强化学习(RLHF),存在一些局限,导致生成的响应可能显得机械和复杂。

机器人写作AI写作AI记者

图源备注:图片由AI生成,图片授权服务商Midjourney

NVIDIA研究部门推出了SteerLM,这是一项突破性技术,旨在解决这些挑战。SteerLM提供了一种新颖的以用户为中心的方法,用于定制大型语言模型的响应,允许用户定义引导模型行为的关键属性。SteerLM通过一个四步骤的监督微调过程来运作,简化了大型语言模型的定制过程。

首先,它使用人工标注的数据集训练属性预测模型,以评估诸如帮助性、幽默和创造性等特性。接下来,它利用这个模型来标注各种不同的数据集,丰富了语言模型可访问的数据的多样性。然后,SteerLM采用属性条件的监督微调,训练模型生成基于指定属性的响应,如感知质量。最后,它通过引导训练来精炼模型,生成各种不同的响应,以实现最佳的微调。

SteerLM的一个显著特点是其实时可调整性,允许用户在推断过程中微调属性,以满足他们的具体需求。这种灵活性为各种潜在应用敞开了大门,从游戏和教育到无障碍领域。有了SteerLM,公司可以为多个团队提供个性化能力,而无需为每个不同的应用重新构建模型。

SteerLM的简单和用户友好性在其指标和性能中表现出色。在实验中,SteerLM43B在Vicuna基准上表现优于现有的RLHF模型,如ChatGPT-3.5和Llama30B RLHF。通过提供一个简单的微调过程,几乎不需要对基础架构和代码进行大幅度更改,SteerLM可以以更少的麻烦交付出色的结果,使其成为AI定制领域的一项重大进展。

NVIDIA正在通过在其NVIDIA NeMo框架中发布SteerLM的开源软件来推动先进的定制。开发人员现在有机会访问代码,并使用Hugging Face等平台上提供的自定义的13B Llama2模型来尝试这一技术。

官方博客说明:https://blogs.nvidia.com/blog/2023/10/11/customize-ai-models-steerlm/?ref=maginative.com

举报

  • 相关推荐
  • NVIDIA PhysX物理加速不死!内核源代码终于开源

    PhysX物理加速技术已经不再有NVIDIA官方的支持,但并不意味着这项优秀技术会消失在历史的长河中,因为它完全开源了!其实早在2018年底,NVIDIA就公开了PhysXSDK4.0开发包,根据BSD-3许可协议公开了源代码,但不包括最核心的GPU模拟内核。理论上完全可以将PhysX代码从CUDA平台上,移植到Vulcan、OpenCL,从支持AMD、Intel显卡。

  • 深度系统deepin 23.1发布NVIDIA显卡、Intel/AMD处理器集体升级

    快科技4月16日消息,deepin深度操作系统团队发布了deepin 23.1版本,主要解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本重点改进:硬件兼容性与内核优化:集成Linux 6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU处理器微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;开发工具与跨平台支持:应用商店适配Debian/Ubuntu/Arch等子系统环境,支持快速启动;如意玲珑

  • NVIDIA修复AMD Linux驱动Bug!自家驱动还在被吐槽

    最近,一位NVIDIA的Linux内核工程师成功修复了一个影响AMD集成和独立显卡驱动性能的问题。问题的根源在于Linux6.15内核代码中引入的一个变更,NVIDIA工程师BalbirSingh在为Linux6.15内核更新时,对x86_64系统的内核地址空间布局随机化进行了调整,以支持PCIBAR空间扩展到10TB以上。受影响的显卡型号包括RTX50系列和RTX40系列,甚至一些RTX30系列显卡也受到了影响,在安装该驱动程序后,电脑可能会在安装过程中或重启时出现黑屏,少数用户还报告了蓝屏死机的问题。

  • RTX 50/40系用户崩溃!NVIDIA驱动易致Win10/11设备黑屏

    NVIDIA在上个月发布了572.83新版显卡驱动程序,不过根据最新消息,该驱动程序容易导致Windows10和Windows11系统设备出现黑屏问题。在更新日志中,官方称其修复了RTX5080/5090在超频时无法发挥最大性能的漏洞,并声称解决了部分黑屏问题。对于已经安装该驱动程序并遇到黑屏问题的用户,可以尝试回退到旧版本驱动程序,如566.36版本,或者尝试关闭G-Sync、降低刷新率等方法来缓解问题。

  • 黄仁勋最爱吃!NVIDIA“天才早餐”开售:价格不到5美元 不缺货

    这是2025年唯一一款价格亲民、容易买到且售价符合预期的NVIDIA品牌产品,价格在5美元以下。NVIDIA与丹尼餐厅合作推出了一款限时早餐菜品NvidiaBreakfastBytes,以此向NVIDIACEO黄仁勋致敬,让顾客有机会体验同款天才早餐”。位于加州圣何塞的部分丹尼餐厅还为堂食顾客提供该菜品。

  • Check Point: 领先安全防护技术确保新一代 NVIDIA AI 云数据中心安全

    随着AI技术的爆炸式增长,企业和云提供商对安全、高性能AI基础设施的需求也达到了前所未有的高度。在刚刚结束的2025年NVIDIAGTC大会上,CheckPoint分享如何将其全新安全解决方案与NVIDIACybersecurityAI平台集成,以实现对新一代AI云基础设施的大规模保护。2025年NVIDIAGTC大会CheckPoint公司在本次GTC大会上演示了如何帮助企业从容部署和扩展其AI计划,以及云提供商和企业如何利用该解决方案在加速创新和增长的同时保护其AI基础设施安全。

  • 黄仁勋自曝NVIDIA新一代GPU!GAA晶体管技术将带来20%性能提升

    近日,黄仁勋在GTC2025大会访谈中表示,依靠环绕栅极晶体管的下一代制程技术,将为新一代GPU带来20%的性能提升。黄仁勋所说新一代GPU,应该是指预计在2028年推出的Feynman。理论上台积电N2制程技术是三星的类似技术,甚至是Intel18A都有可能。

  • 首个支持NVIDIA DLSS的Switch 2游戏确认:《赛博朋克2077》

    文章主要讨论了Digital Foundry发布的一份关于Nintendo Switch新版本的报告,特别提到了《赛博朋克2077》在Nintendo Switch 2版本上运行时的性能表现。CD Projekt Red对此进行了优化,使得在高分辨率模式下游戏可以稳定在30fps,而在720p模式下则能以40fps运行。此外,文章指出,理论上在高分辨率模式下游戏可以达到1080p,而720p模式下则能以30fps运行。文章还提到,VGC对用户反馈的分析表明,《赛博朋克2077》在Switch 2版本上运行时达到了30FPS的性能目标,但是由于性能限制,仍然存在一些问题。

  • 任天堂Switch 2芯片首次曝光!搭载NVIDIA Tegra239支持DLSS

    任天堂Switch 2核心芯片Tegra 239参数曝光:采用8核Arm Cortex-A78C架构,集成1536个CUDA核心的GPU融合了Ada Lovelace和Ampere架构,支持128位LPDDR5内存。原生支持DLSS技术,可实现4K/60FPS输出,性能较前代显著提升。芯片主频1.1-1.5GHz,功耗表现优化。延续任天堂与NVIDIA合作传统,但官方尚未公布完整参数。此前Switch采用Tegra X1芯片,新款性能提升明显,有望带来更好的游戏体验。

  • 时空壶接入DeepSeek、豆包等大语言模型,翻译准确度再次跃升

    在全球跨语言沟通需求持续攀升的当下,时空壶再次以创新之举震撼行业。时空壶正式宣布接入DeepSeek、豆包等大语言模型,为其同传耳机产品带来了前所未有的体验升级,彻底改写了同传翻译的游戏规则,也让传统机翻模式成为历史。这一创新举措不仅满足了当下各行业对高质量跨语言沟通的迫切需求,更为未来跨语言交流的发展指明了方向,有望推动整个行业向更加智能、精准、自然的方向迈进,助力全球交流合作开启全新篇章。