NVIDIA发布SteerLM:个性化定制大型语言模型响应的新AI方法

2023-10-16 17:32 · 稿源：站长之家

划重点:
NVIDIA发布了一项名为SteerLM的新技术，旨在解决大型语言模型的问题，使用户能够自定义模型的响应。
SteerLM通过四个步骤的监督微调过程，允许用户定义关键属性，如帮助性、幽默和创造力，来引导模型的行为。
这项技术的一个亮点是其实时可调性，用户可以在推断过程中微调属性，从而为各种应用提供个性化的能力。 NVIDIA将SteerLM作为开源软件发布，为开发者提供了机会。性能上表现出色，还具有实时可调整性，可应用于多个领域，从游戏到教育再到无障碍领域。

站长之家(ChinaZ.com) 10月16日消息:在人工智能领域，开发人员和用户一直面临一个挑战，那就是需要更加定制和细致的大型语言模型响应。虽然这些模型，比如Llama2，可以生成类似人类的文本，但它们通常需要提供真正针对个体用户独特需求的答案。然而，现有的方法，如监督微调（SFT）和从人类反馈中强化学习(RLHF)，存在一些局限，导致生成的响应可能显得机械和复杂。

机器人写作AI写作AI记者

图源备注：图片由AI生成，图片授权服务商Midjourney

NVIDIA研究部门推出了SteerLM，这是一项突破性技术，旨在解决这些挑战。SteerLM提供了一种新颖的以用户为中心的方法，用于定制大型语言模型的响应，允许用户定义引导模型行为的关键属性。SteerLM通过一个四步骤的监督微调过程来运作，简化了大型语言模型的定制过程。

首先，它使用人工标注的数据集训练属性预测模型，以评估诸如帮助性、幽默和创造性等特性。接下来，它利用这个模型来标注各种不同的数据集，丰富了语言模型可访问的数据的多样性。然后，SteerLM采用属性条件的监督微调，训练模型生成基于指定属性的响应，如感知质量。最后，它通过引导训练来精炼模型，生成各种不同的响应，以实现最佳的微调。

SteerLM的一个显著特点是其实时可调整性，允许用户在推断过程中微调属性，以满足他们的具体需求。这种灵活性为各种潜在应用敞开了大门，从游戏和教育到无障碍领域。有了SteerLM，公司可以为多个团队提供个性化能力，而无需为每个不同的应用重新构建模型。

SteerLM的简单和用户友好性在其指标和性能中表现出色。在实验中，SteerLM43B在Vicuna基准上表现优于现有的RLHF模型，如ChatGPT-3.5和Llama30B RLHF。通过提供一个简单的微调过程，几乎不需要对基础架构和代码进行大幅度更改，SteerLM可以以更少的麻烦交付出色的结果，使其成为AI定制领域的一项重大进展。

NVIDIA正在通过在其NVIDIA NeMo框架中发布SteerLM的开源软件来推动先进的定制。开发人员现在有机会访问代码，并使用Hugging Face等平台上提供的自定义的13B Llama2模型来尝试这一技术。

官方博客说明：https://blogs.nvidia.com/blog/2023/10/11/customize-ai-models-steerlm/?ref=maginative.com

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
NVIDIA明年上马3nm！私人定制但不是游戏卡

NVIDIA将在明年推出采用台积电3nm级工艺的下一代高性能计算GPUBlackwellGB100，以及下一代加速卡B100。NVIDIA现有的GH100GPU使用的是台积电4nm工艺是定制版。Intel、AMD、高通等也都会纷纷升级台积电的3nm工艺。
NVIDIA下一代GPU架构巨变！首次上马多芯片学习AMD/Intel

NVIDIARTX40系列、AMDRX7000系列这一代显卡都已经布局完毕下一代还要等差不多两年，至少NVIDIABlackwell在路线图上看要到2025年才会推出明年来一波Super系列？2021年就第一个曝出Blackwell这个代号的曝料高手kopite7kimi给出的最新说法称，Blackwell不会明显增加GPC、TPC等计算单元的数量，CUDA核心数自然也不会大幅提升，但是会在基础架构上做出巨大的革新。GB20x系列游戏卡核心，应该还是单芯片，这倒是和AMDNavi31/32不一样。
A轮获NVIDIA领投1亿美元融资，大模型先驱和斯坦福教授用AI颠覆制药业

AI生物医药领域，DeepMind的AlphaFold是最出名的研究，它几乎完整解析了所有蛋白质结构。AlphaFold的AI系统基于Transformer架构Transformer论文主要的作者JakobUszkoreit也已投身AI医药领域。数据安全的逻辑下，很可能诞生一批中国本土的AI药物研发和AI医疗健康创业公司，十分值得期待。

NVIDIA
美国最受欢迎CEO榜单出炉：NVIDIA黄仁勋夺魁库克仅第四

据美国科技公司职场社区Blind调查，NVIDIACEO黄仁勋成为美国最受员工欢迎的CEO，支持率高达96%。今年8月，Blind面向硅谷科技员工展开了全美CEO支持率调查，共有13171名美国员工进行了匿名投票。AMDCEO苏姿丰支持率为79%，排在第八。
Nvidia第二季度交付900吨AI芯片 Meta可能是最大单客户

根据Omdia研究公司称，芯片巨头Nvidia在第二季度交付了900吨其旗舰型号H100GPU的AI芯片，这一庞大的交付量主要是由于对其AI芯片需求的急剧增加。Omdia报告指出，大量的GPU正涌入超大规模数据中心，这对服务器的出货量造成了不利影响。这是因为领域特定的AI模型具有“显著较少”的参数、数据集大小、标记和时代，这是根据研究公司的观察得出的结论。

Nvidia AI芯片 AI头条
NVIDIA官方自曝下下代GPU：2025年这么着急？

NVIDIA最近在一份面向投资者的演示文件中，意外披露了下下代GPU架构的路线图。NVIDIA目前有两种截然不同的GPU架构，一是面向消费级游戏和图形的AdaLovelace，二是面向高性能计算和人工智能的Hopper。Blackwell架构在此前路线图上要到2024年才会登场再下代2025年就推出，时间过于紧凑，所以这个X架构的定位可能会有所不同。
Getty Images与Nvidia合作开发生成式AI图片工具

图片库巨头GettyImages与芯片制造商Nvidia宣布合作，共同开发生成式AI图片工具。这一消息引发了有关图片创作者应该获得图片创作权的争议。这一合作引发的争议将继续推动我们思考和探讨AI技术如何塑造我们的文化和创意产业，以及如何平衡技术的创新和创作者的权益。

Nvidia 生成式AI AI头条
DistilBERT：更小、更快、更便宜的大型语言模型压缩方法

大型语言模型的发展迅猛，BERT成为其中最受欢迎和高效的模型，但其复杂性和可扩展性成为问题。为了解决这些问题，市面上目前由三种常见的模型压缩技术:知识蒸馏、量化和剪枝。DistilBERT通过知识蒸馏技术在保持性能的同时显著压缩了大型语言模型，为在资源受限设备上的部署提供了可能性。

DistilBERT
用PIT框架提升大型语言模型的质量

传统方法中，提高LLMs性能需要通过人工注释来收集更多多样化和高质量的训练数据，但这是一项资源密集型的任务，尤其是对于专业领域言。为了解决这个问题，来自伊利诺伊大学厄巴纳-香槟分校和Google的研究人员提出了“ImplicitSelf-Improvementframework”。通过从人类偏好数据中学习改进目标，PIT解决了传统提示方法的限制，并展示了在各种数据集和条件下提高LLMs响应质量的有效性。

PIT
思看科技3D扫描仪助力大型房车个性化定制改装！

汽车产业正在迈入个性化定制新时代，传统的大规模生产已经不能满足人们对汽车的多样化需求，汽车制造商和经销商可以借助思看科技三维扫描技术，为消费者提供高效、精准、灵活、全方位的定制选择和体验。01客户需求与痛点房车作为一种独特的出行方式，具有自由、灵活、舒适和独特的特点，给人们带来非常特殊的旅行和居住体验。思看科技的产品与解决方案还可用于汽车开发设计、冲压件检验、汽车车身检测、其它零部件检测、维护检修与其他车型的定制化环节，为全球客户提供专业的三维数据获取方法，降低检测人工及时间成本，以数字化技术驱动汽车制造产业转型升级。

TravAI:是一款AI驱动的旅行培训产品，提供交互式AI培训、模拟、评估和智能助手，为旅行行业人员提供最新的技能和知识。

TravAI是一款旅行行业的AI驱动培训产品，通过注入AI技术，为培训注入活力。它能创建引人入胜、交互式的培训课程，进行逼真的角色扮演模拟，并设计能够真正起作用的测验。同时，TravAI利用您的数据为旅行团队量身定制个性化学习体验，让培训不再是通用的、一刀切的。它是培训旅行业专业人员的更智能、更快速的方式。

旅行培训 AI

Nextminds:是一家提供在线辅导服务的平台，为所有科目和学术水平的学生提供个性化辅导。

Nextminds是一个提供在线辅导服务的平台，通过与经验丰富的导师在线互动，为学生提供个性化的学习经验。平台提供ICSE、CBSE和州委员会等多种教育体系的辅导。Nextminds的主要优点是学生可以在舒适的家中与专业的导师进行一对一的在线学习，为学生提供高质量的辅导服务。

在线辅导学习个性化

Pedagogue.io:每天花费10分钟，提升您的AI技能。

Pedagogue是一款AI技能培训平台，旨在帮助个人和企业提升AI技能。通过该平台，用户可以学习AI工具、技术和策略，并获得40%的生产力提升。Pedagogue的优势在于更新及时的内容库、个性化的技能培养、有趣的学习方式以及具有商业价值的数据驱动洞察。

AI 技能培训教育

LexiGym:你的语言学习伴侣。🚀 # #HinkouLabs

LexiGym是一款语言学习应用，帮助用户提升语言技能。它具有离线和多语言支持的创新功能，是最强大的语言学习伴侣。用户可以根据自己的预算选择免费使用或付费订阅，灵活选择学习方式。LexiGym还提供易于创建字典和智能学习等功能，以及详细的训练统计数据。

语言学习词汇训练多语言

Alevels.ai:A Levels AI是一个利用人工智能提高A Levels学习成绩的工具。

A Levels AI利用人工智能技术，提供个性化的学习计划和辅导资源，帮助学生在A Levels考试中取得优异成绩。它通过分析学生的学习情况和弱点，为其提供针对性的学习建议和练习题。A Levels AI还提供实时答疑和学习进度跟踪功能，帮助学生更好地掌握知识。

教育考试辅导人工智能

MailReply:是一款AI助手，可生成专业且人性化的邮件回复，节省时间。

MailReply通过AI生成邮件回复，帮助用户节省时间。它可以在保持人类写作风格的同时，根据邮件内容生成上下文相关的回复。MailReply适用于Windows和macOS，并兼容多种邮件客户端。

邮件回复 AI助手工具

Notification harbor:高性能团队的电子邮件营销平台

Notification harbor是一个为电子邮件营销团队提供AI优化的电子邮件内容和自动化流程的平台。通过使用LLM技术，我们可以在短短5分钟内创建高性能的电子邮件营销内容，并且随着时间的推移，产品甚至可以自我优化。我们的平台简化了电子邮件营销活动的方式，确保每个活动都能精准地与您的目标受众建立联系。AI生成的电子邮件模板根据您提供的信息和要求选择最合适的模板。实时个性化电子邮件可以提高用户参与度和转化率，并根据每个用户实时定制内容。AI驱动的电子邮件营销使您的团队在创建电子邮件模板和文本方面节省了60％的时间。

电子邮件电子邮件营销 AI优化

Magic Loops:通过结合ChatGPT自动化与代码，创建简单的自动化任务

Magic Loops是一种基于ChatGPT的自动化工具，可以连接数据、发送电子邮件、接收短信、爬取网站等功能。它能够帮助用户自动化生活中的各种任务，提高工作效率。Magic Loops的主要优点是可以与各种数据源和应用程序集成，轻松实现个性化的自动化需求。

自动化工具 ChatGPT

ReplyAuto:Reply Auto是一款AI邮件助手，能够根据上下文理解邮件内容，并提供智能回复。

Reply Auto是一款使用AI技术的邮件助手，它能够自动分析邮件内容，根据上下文提供智能回复。它的主要优点是提高工作效率，减轻用户的邮件负担，并能够个性化定制回复。Reply Auto定位于帮助用户更高效地处理电子邮件，提高工作效率。

邮件智能回复工作效率

Mailman Workcation:智能邮递员 - 自动化影响力的智能Twitter机器人

AI Mailman利用最新的人工智能技术创建世界上最准确的邮件，比人类更快速和高质量。它提供简单的用户界面，能够创建世界上最强大的邮件模板，打开率更高。使用AI Mailman创建的邮件打开率是其他方式的10倍，生成时间只需10秒。

邮件自动化影响力

Inpost:一款AI驱动的移动应用程序，可以改善个人电子邮件体验。

Inpost.ai是一款基于AI的移动应用程序，可以优化个人电子邮件体验。它帮助用户智能地组织和清理收件箱，专注于重要的电子邮件。它提供无缝的邮件交互，提供增强的安全性和独家功能。通过高级AI模型分析邮件内容，而不暴露用户的敏感信息。用户可以轻松追踪支出、管理发票，并利用促销优惠来优化个人预算。Inpost.ai还提供定制的收件箱分类，让用户能够个性化和高效地管理和优化收件箱。

电子邮件 AI 个人化

Leadog:AI驱动的冷邮件营销、线索跟踪和互动

Leadog.io是一款AI驱动的冷邮件营销平台，提供冷邮件发送、线索跟踪和互动等功能。它采用先进的AI技术来优化冷邮件营销策略，提供精确的邮件投递和跟踪，帮助用户更好地了解和转化潜在客户。

冷邮件线索跟踪营销工具

Prospect AI:一键查找网站上的电子邮件地址和联系人信息

Prospect AI是一款插件，可以帮助销售团队、数字营销人员和公关专业人员免费查找公司的联系人。它使用人工智能技术，快速获取所需的联系人信息，帮助用户拓展业务关系。

市场营销销售潜在客户

Email whisperer:写作完美邮件，让你的电子邮件沟通更上一层楼！

Email Whisperer是一个用于Gmail和Outlook的AI电子邮件编写工具。它可以帮助你轻松地写出完美的电子邮件，提供重新表达、拼写检查和修正功能。它能够提高你电子邮件的清晰度和风格，并确保邮件无错误。Email Whisperer是一个提高电子邮件写作效率的工具，让你的邮件专业而准确。

生产力电子邮件 AI工具

Humanize AI by AI Text Converter:将AI生成的文本转换为与人类写作相匹配的内容。

Humanize AI Text是一个免费在线的AI文本人性化转换工具，能够绕过AI检测，并将AI生成的文本转换为与人类写作相匹配的内容。

AI转换工具文本人性化 AI检测绕过

Happily.ai:使用，超越传统调查。我们的AI平台分析员工情绪，提供可操作的见解，为健康、投入、高绩效的团队提供支持。

Happily.ai是一个AI工具包，帮助人力资源和经理人通过无忧无虑的参与、认可和绩效管理来提高人才留存和团队生产力。

员工参与度人力资源绩效管理

ChatKPI:是一款基于AI的数据分析工具，可以通过文本消息跟踪销售趋势、识别热门产品、了解客户行为，提供图表、定制CSV等功能。

ChatKPI是一个AI数据分析工具，旨在帮助Shopify商家做出更明智的数据驱动决策。它可以提供实时洞察力，跟踪销售趋势，识别热门产品，了解客户行为，并通过自然语言对话提供个性化的商业洞察。ChatKPI可以通过文本消息或在Shopify商店内安装的应用程序使用。

数据分析销售趋势热门产品

Limodify.AI | Email Marketing Design Meets AI:Limodify.AI通过AI技术提供电子商务邮件创建服务。

Limodify.AI革新了电子商务邮件的创建过程，只需点击几下，选择格式，输入关键信息，即可在30秒内获得准备好发送的AI设计的邮件。节省时间，利用先进技术，精确实现您的营销目标。立即免费开始使用。

电子商务邮件营销 AI

PurplePro:使用AI技术，只需两个点击即可启动您的忠诚度俱乐部。

PurplePro是一个使用AI技术的插件，它可以帮助您在短短两个点击的时间内启动您的忠诚度俱乐部。PurplePro通过游戏化和动态的积分规则增加用户参与度，并奖励他们。它还提供了强大的推荐、挑战、问卷和可变奖励功能，帮助您将首次用户转化为忠实的客户。

忠诚度俱乐部用户参与度奖励

LISUTO:株式会社は、eコマースのセラーやマーケットプレイスが売上を増やし、時間を節約し、コアビジネスに集中できるスマートデータ構造化ソリューションのリーダーです。

LISUTO株式会社は、eコマースのセラーやマーケットプレイスが売上を増やし、時間を節約し、コアビジネスに集中できるスマートデータ構造化ソリューションのリーダーです。LISUTO AIは、AIタッガーやイメージタッガーなどのサービスを提供し、商品のタグ登録やナビゲーション改善などを自動化し、効率を向上させます。

NVIDIA发布SteerLM:个性化定制大型语言模型响应的新AI方法

今日大家都在搜的词：

热文

站长商机