首页 > 业界 > 关键词  > NVIDIA最新资讯  > 正文

NVIDIA发布SteerLM:个性化定制大型语言模型响应的新AI方法

2023-10-16 17:32 · 稿源:站长之家

划重点:

NVIDIA发布了一项名为SteerLM的新技术,旨在解决大型语言模型的问题,使用户能够自定义模型的响应。

SteerLM通过四个步骤的监督微调过程,允许用户定义关键属性,如帮助性、幽默和创造力,来引导模型的行为。

这项技术的一个亮点是其实时可调性,用户可以在推断过程中微调属性,从而为各种应用提供个性化的能力。 NVIDIA将SteerLM作为开源软件发布,为开发者提供了机会。性能上表现出色,还具有实时可调整性,可应用于多个领域,从游戏到教育再到无障碍领域。

站长之家(ChinaZ.com) 10月16日 消息:在人工智能领域,开发人员和用户一直面临一个挑战,那就是需要更加定制和细致的大型语言模型响应。虽然这些模型,比如Llama2,可以生成类似人类的文本,但它们通常需要提供真正针对个体用户独特需求的答案。然而,现有的方法,如监督微调(SFT)和从人类反馈中强化学习(RLHF),存在一些局限,导致生成的响应可能显得机械和复杂。

机器人写作AI写作AI记者

图源备注:图片由AI生成,图片授权服务商Midjourney

NVIDIA研究部门推出了SteerLM,这是一项突破性技术,旨在解决这些挑战。SteerLM提供了一种新颖的以用户为中心的方法,用于定制大型语言模型的响应,允许用户定义引导模型行为的关键属性。SteerLM通过一个四步骤的监督微调过程来运作,简化了大型语言模型的定制过程。

首先,它使用人工标注的数据集训练属性预测模型,以评估诸如帮助性、幽默和创造性等特性。接下来,它利用这个模型来标注各种不同的数据集,丰富了语言模型可访问的数据的多样性。然后,SteerLM采用属性条件的监督微调,训练模型生成基于指定属性的响应,如感知质量。最后,它通过引导训练来精炼模型,生成各种不同的响应,以实现最佳的微调。

SteerLM的一个显著特点是其实时可调整性,允许用户在推断过程中微调属性,以满足他们的具体需求。这种灵活性为各种潜在应用敞开了大门,从游戏和教育到无障碍领域。有了SteerLM,公司可以为多个团队提供个性化能力,而无需为每个不同的应用重新构建模型。

SteerLM的简单和用户友好性在其指标和性能中表现出色。在实验中,SteerLM43B在Vicuna基准上表现优于现有的RLHF模型,如ChatGPT-3.5和Llama30B RLHF。通过提供一个简单的微调过程,几乎不需要对基础架构和代码进行大幅度更改,SteerLM可以以更少的麻烦交付出色的结果,使其成为AI定制领域的一项重大进展。

NVIDIA正在通过在其NVIDIA NeMo框架中发布SteerLM的开源软件来推动先进的定制。开发人员现在有机会访问代码,并使用Hugging Face等平台上提供的自定义的13B Llama2模型来尝试这一技术。

官方博客说明:https://blogs.nvidia.com/blog/2023/10/11/customize-ai-models-steerlm/?ref=maginative.com

举报

  • 相关推荐
  • AI日报:生数科技上线Vidu Q1参考生图;字节跳动发布Seedream4.0;百度文心大模型X1.1发布

    本期AI日报聚焦多项AI技术突破与应用进展。生数科技推出Vidu Q1参考生图功能,支持多图输入与一致性生成;字节跳动发布Seedream4.0多模态图像创作模型,推理速度提升10倍;腾讯推出国内首款全形态AI编程工具CodeBuddy,编码效率提升40%;百度文心大模型X1.1升级深度学习能力;OpenAI支持AI动画长片《Critterz》制作;上海AI实验室发布XTuner V1训练引擎提升效率20%;谷歌AI搜索新增5种语言支持;我国发布30项人工智能和15项人形机器人国家标准,推动行业规范化发展。

  • 四方合力推进菁彩Vivid技术应用,引领电影产业视听体验革新

    中国电影科研所、华夏电影、UWA联盟与华为在国家电影局指导下,于9月9日签署战略合作协议,共同推进HDR Vivid技术标准体系建设。该合作将打通从技术标准到内容制作、发行放映的完整产业链,加速超高清视频技术在全行业落地应用,推动中国自主音视频技术标准走向国际,助力2035年电影强国建设目标。

  • 阿联酋部长在京见证|Klickl与Investopia开启全面战略合作

    2025年9月19日,阿联酋数字金融平台Klickl与阿联酋政府支持的全球投资平台Investopia在北京签署全面战略合作协议。双方将在金融科技、数字金融基础设施、绿色能源投资、跨境支付与资本对接等重点领域展开深度合作,推动中阿经贸合作从政策沟通迈向实体产业协同。Klickl将于2026年起成为Investopia全球战略合作伙伴,共同打造区域经济联动与全球共建的新里程碑。

  • 安信证书双节钜惠:DigiCert OV SSL证书限时直降,立省1099元!

    安信证书推出中秋国庆双节特惠活动,DigiCert SSL证书限时优惠,最高直降1099元。涵盖四款OV企业型证书,包括基础版、高级版、通配符版及专业版,适用于不同企业网站安全需求。活动期间享免费安装、重签及到期提醒服务,助力企业低成本实现HTTPS加密升级。活动时间截至2025年10月20日,企业可前往官网优惠申请。

  • AI日报:腾讯发布混元3D 3.0模型;昆仑万维上线Agent Studio功能;阿里Qoder推出付费订阅服务

    AI日报汇总最新行业动态:腾讯发布混元3D+3.0模型,建模精度提升3倍;昆仑万维Mureka上线音乐创作功能;阿里Qoder推出付费订阅服务;VEED Fabric 1.0实现图片转视频;OpenAI发布GPT-5-Codex革新编程;全国发布AI安全治理框架2.0;Mini-o3实现超长视觉推理;上海AI Lab推出多模态模型Lumina-DiMOO;腾讯微调技术提升图像美感300%;Meta推出轻量级MobileLLM-R1;腾讯启动AI应用繁荣计划;谷歌DeepMind�

  • 腾讯云联合IDC发布AI Infra报告:定义Gen Al时代智算新范式

    2025年腾讯全球数字生态大会于9月16-17日在深圳召开。在Infra+Agent专场,腾讯云与IDC联合发布《AI+Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告。报告指出,随着AI应用规模化落地,AI云基础设施正向核心智算设施演进,涵盖分布式底座、异构硬件、高性能软件和场景化方案四大维度。报告还提出六大演进趋势:架构重构、行业垂直化、算力智能化、安全能力提升、研发范式创新和服务化转型,并解析了腾讯云在交通、制造、医疗等领域的落地案例,为企业智能化转型提供实践指南。

  • 不止于价格,DigitalOcean、AWS和Linode该选谁?

    本文对比了DigitalOcean、AWS和Linode三大海外云服务商,从定位、成本、易用性、GPU性能及本土化支持等维度分析其优劣势。DigitalOcean以开发者友好、简单易用和高性价比著称,适合初创企业和中小团队;AWS功能全面但复杂昂贵,适合大型企业;Linode性能稳定但生态有限。特别强调DigitalOcean通过卓普云提供本土化支持,解决支付、备案和技术响应等痛点,是中国企业出海的高效选择。

  • AI眼镜的痛,Meta也治不了

    对于全球科技从业者而言,Meta Connect大会是一年一度的重要时刻。 不少人早早守在电脑前,想知道扎克伯格此次会带来哪些前沿技术产品,更对会上即将亮相的新款AI眼镜充满关注。 事实上,AI眼镜这类消费电子产品,在过去一年里已快速从“小众科技产品”走进大众视野,但看似火热的市场背后,AI眼镜当下的发展却陷入了明显瓶颈。 此前,国内AI眼镜市场曾掀起“百镜大

  • Nano Banana更像是AI图像领域的DeepSeek

    这是《窄播Weekly》的第66期,本期我们关注的商业动态是:Google最新的AI图像生成模型Nano Banana,可能会给AI图像领域带来一场应用大爆炸。 去年这个时候,我想把照片中人物手里拿的玩具火车换成玩具飞机,还需要给玩具火车做出精细标记,找到干净的玩具飞机图片,告诉AI将其替换成另一张图里的飞机。我花费一个小时,多番尝试下来,飞机会变形,人物的手会消失,最后的�

  • 破解 AI “安全与性能” 难题!DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

    9月18日,华为全联接大会2025在上海开幕。会上,华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出,对有害言论、敏感内容等14个维度的防御成功率近100%,同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作,推动AI安全技术与产业生态协同发展,为我国人工智能高质量发展提供支撑。

今日大家都在搜的词: