首页 > 业界 > 关键词  > NVIDIA最新资讯  > 正文

NVIDIA发布SteerLM:个性化定制大型语言模型响应的新AI方法

2023-10-16 17:32 · 稿源:站长之家

划重点:

NVIDIA发布了一项名为SteerLM的新技术,旨在解决大型语言模型的问题,使用户能够自定义模型的响应。

SteerLM通过四个步骤的监督微调过程,允许用户定义关键属性,如帮助性、幽默和创造力,来引导模型的行为。

这项技术的一个亮点是其实时可调性,用户可以在推断过程中微调属性,从而为各种应用提供个性化的能力。 NVIDIA将SteerLM作为开源软件发布,为开发者提供了机会。性能上表现出色,还具有实时可调整性,可应用于多个领域,从游戏到教育再到无障碍领域。

站长之家(ChinaZ.com) 10月16日 消息:在人工智能领域,开发人员和用户一直面临一个挑战,那就是需要更加定制和细致的大型语言模型响应。虽然这些模型,比如Llama2,可以生成类似人类的文本,但它们通常需要提供真正针对个体用户独特需求的答案。然而,现有的方法,如监督微调(SFT)和从人类反馈中强化学习(RLHF),存在一些局限,导致生成的响应可能显得机械和复杂。

机器人写作AI写作AI记者

图源备注:图片由AI生成,图片授权服务商Midjourney

NVIDIA研究部门推出了SteerLM,这是一项突破性技术,旨在解决这些挑战。SteerLM提供了一种新颖的以用户为中心的方法,用于定制大型语言模型的响应,允许用户定义引导模型行为的关键属性。SteerLM通过一个四步骤的监督微调过程来运作,简化了大型语言模型的定制过程。

首先,它使用人工标注的数据集训练属性预测模型,以评估诸如帮助性、幽默和创造性等特性。接下来,它利用这个模型来标注各种不同的数据集,丰富了语言模型可访问的数据的多样性。然后,SteerLM采用属性条件的监督微调,训练模型生成基于指定属性的响应,如感知质量。最后,它通过引导训练来精炼模型,生成各种不同的响应,以实现最佳的微调。

SteerLM的一个显著特点是其实时可调整性,允许用户在推断过程中微调属性,以满足他们的具体需求。这种灵活性为各种潜在应用敞开了大门,从游戏和教育到无障碍领域。有了SteerLM,公司可以为多个团队提供个性化能力,而无需为每个不同的应用重新构建模型。

SteerLM的简单和用户友好性在其指标和性能中表现出色。在实验中,SteerLM43B在Vicuna基准上表现优于现有的RLHF模型,如ChatGPT-3.5和Llama30B RLHF。通过提供一个简单的微调过程,几乎不需要对基础架构和代码进行大幅度更改,SteerLM可以以更少的麻烦交付出色的结果,使其成为AI定制领域的一项重大进展。

NVIDIA正在通过在其NVIDIA NeMo框架中发布SteerLM的开源软件来推动先进的定制。开发人员现在有机会访问代码,并使用Hugging Face等平台上提供的自定义的13B Llama2模型来尝试这一技术。

官方博客说明:https://blogs.nvidia.com/blog/2023/10/11/customize-ai-models-steerlm/?ref=maginative.com

举报

  • 相关推荐
  • Intel至强6处理器又上新了:与NVIDIA AI GPU珠联璧合

    英特尔推出三款至强6系列AI专用处理器,采用P-Core性能核设计,支持PCT和SST-TF睿频技术,最高128核。新品专为AI系统优化,能动态分配CPU资源,显著提升GPU在高强度AI运算中的性能。其中6776P处理器已用于NVIDIA最新DGX B300 AI加速系统。新品还支持MRDIMM内存、CXL技术,PCIe通道数增加20%,并具备AMX高级矩阵指令集和FP16精度运算能力,专为最大化系统稳定性和AI工作负载设计。

  • RTX 5060/Ti重启黑屏有救了!NVIDIA发布紧急固件更新

    快科技5月25日消息,NVIDIA近期针对RTX 5060和RTX 5060 Ti显卡发布了一项紧急固件更新,旨在解决部分用户在重启系统时遇到的黑屏问题。这一问题自RTX 5060系列显卡发布以来一直困扰着部分用户,尤其是在系统重启时,显卡无法正常显示图像,导致用户无法正常使用。此次更新并非通过驱动程序发布,而是直接对显卡的vBIOS进行更新,NVIDIA强调,只有遇到黑屏问题的用户才需要更新固件,正常使用的设备无需进行此操作。NVIDIA的技术文档显示,黑屏问题可能是由于特定主板的BIOS/UEFI版本与新显卡的兼容性冲突所致。如果用户的主板不支持UEFI启

  • 三星OLED 产品搭载NVIDIA G-SYNC技术,打造顶尖游戏体验

    三星2025款OLED产品将支持NVIDIA G-SYNC技术,提供165Hz高刷新率和Motion Xcelerator技术,实现无卡顿、低延迟的游戏体验。产品同时兼容AMD FreeSync Premium Pro,配备自动低延迟模式(ALLM)和AI游戏优化功能,可智能分析游戏场景并自动调节画质。通过三星游戏中心可一键直达主机和云游戏平台,搭载AI画质增强和防眩光技术,兼顾影院级视听效果与智能家居控制。该技术将率先应用于旗舰机型S95F,后续扩展至全系2025 OLED产品线。

  • 超擎数智协办的2025 NVIDIA 创业企业展示——澳门站“首秀”圆满收官!

    5月22日,2025 NVIDIA创业企业展示活动在澳门永利皇宫成功举办。活动聚焦AI智能体、物理AI和机器人等前沿技术,展示NVIDIA Omniverse、NIM等最新技术应用。超擎数智作为协办单位全程参与,其总经理唐春峰出席活动并担任路演评委。活动期间还启动了第三届NVIDIA DPU中国黑客松竞赛,旨在挖掘BlueField DPU在AI等领域的潜力。37家会员企业将在BEYOND EXPO展示创新成果。NVIDIA专家探讨了物理AI推动数字化转型的趋势,强调计算、存储和网络是AI基础设施的关键。活动为创业生态搭建了交流平台,促进AI技术商业化落地。

  • 曝苹果iOS 26.4明年春季登场:集成个性化Siri

    苹果记者马克古尔曼透露,苹果计划将屡次延期的个性化Siri功能推迟至2026年春季发布,苹果内部已设定2026年发布的目标,这与本周苹果高管的表态相符。 在WWDC25开发者大会结束后,苹果软件工程高管接受了媒体采访,称新Siri将推迟至2026年,官方解释是工程师测试中发现新Siri存在持续性质量问题,因此决定重构更强大的底层架构。 据悉,新Siri原计划是在iOS 18.4版本中上线�

  • 如何用指令句式让豆包生成个性化学生评语库

    本文介绍如何利用豆包工具快速生成个性化期末评语库。操作步骤包括:1.登录豆包平台输入详细指令,要求生成50名本科生的A级评语,内容需涵盖学术亮点、改进建议和假期规划,确保个性化差异度高于30%;2.检查生成结果是否符合要求;3.通过细化指令优化不满意内容,如突出学科优势或提供更具体学习方法建议。该工具能帮助教师高效完成评语撰写,节省时间精力。

  • AI日报:腾讯语音数字人模型HunyuanVideo-Avatar;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放

    本文汇总了AI领域最新动态:1)腾讯开源数字人模型HunyuanVideo-Avatar,支持图像转视频创作;2)Trae国际版开启付费订阅,首月3美元;3)Claude网页搜索功能向免费用户开放;4)印度AI初创Builder.ai破产,亏损超5亿美元;5)腾讯元宝接入微信读书平台;6)快手计划加大AI投入但预计影响利润率;7)Mistral推出智能代理API;8)Claude移动端上线语音对话测试版;9)OpenAI拟推ChatGPT第三方登录功能;10)掘金发布AI项目一键部署工具;11)多模态模型视觉推理能力评估显示准确率仅25.8%;12)中石油发布3000亿参数昆仑大模型,推动油气产业智能化。

  • DeepSeek更新R1推理AI模型,已发布Hugging Face

    更新后的 R1 拥有 6850 亿个参数,体量庞大。由于模型规模极大,普通消费者级别的硬件很可能无法直接运行。

  • 用户对离谱回答不满激增,OpenAI回应:将持续公开AI模型安全性评估

    OpenAI于5月14日上线"安全评估中心"网页,公开其AI模型在有害内容生成、越狱行为和幻觉等方面的安全测试结果。此举旨在回应外界对其模型透明度的质疑,此前GPT-4o更新因不当赞美引发争议,导致全面撤回。该平台将定期更新数据,CEO奥特曼也承认存在问题并承诺改进。通过公开安全指标,OpenAI希望提升行业透明度,重建用户信任。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。