首页 > 业界 > 关键词  > NVIDIA最新资讯  > 正文

NVIDIA发布SteerLM:个性化定制大型语言模型响应的新AI方法

2023-10-16 17:32 · 稿源:站长之家

划重点:

NVIDIA发布了一项名为SteerLM的新技术,旨在解决大型语言模型的问题,使用户能够自定义模型的响应。

SteerLM通过四个步骤的监督微调过程,允许用户定义关键属性,如帮助性、幽默和创造力,来引导模型的行为。

这项技术的一个亮点是其实时可调性,用户可以在推断过程中微调属性,从而为各种应用提供个性化的能力。 NVIDIA将SteerLM作为开源软件发布,为开发者提供了机会。性能上表现出色,还具有实时可调整性,可应用于多个领域,从游戏到教育再到无障碍领域。

站长之家(ChinaZ.com) 10月16日 消息:在人工智能领域,开发人员和用户一直面临一个挑战,那就是需要更加定制和细致的大型语言模型响应。虽然这些模型,比如Llama2,可以生成类似人类的文本,但它们通常需要提供真正针对个体用户独特需求的答案。然而,现有的方法,如监督微调(SFT)和从人类反馈中强化学习(RLHF),存在一些局限,导致生成的响应可能显得机械和复杂。

机器人写作AI写作AI记者

图源备注:图片由AI生成,图片授权服务商Midjourney

NVIDIA研究部门推出了SteerLM,这是一项突破性技术,旨在解决这些挑战。SteerLM提供了一种新颖的以用户为中心的方法,用于定制大型语言模型的响应,允许用户定义引导模型行为的关键属性。SteerLM通过一个四步骤的监督微调过程来运作,简化了大型语言模型的定制过程。

首先,它使用人工标注的数据集训练属性预测模型,以评估诸如帮助性、幽默和创造性等特性。接下来,它利用这个模型来标注各种不同的数据集,丰富了语言模型可访问的数据的多样性。然后,SteerLM采用属性条件的监督微调,训练模型生成基于指定属性的响应,如感知质量。最后,它通过引导训练来精炼模型,生成各种不同的响应,以实现最佳的微调。

SteerLM的一个显著特点是其实时可调整性,允许用户在推断过程中微调属性,以满足他们的具体需求。这种灵活性为各种潜在应用敞开了大门,从游戏和教育到无障碍领域。有了SteerLM,公司可以为多个团队提供个性化能力,而无需为每个不同的应用重新构建模型。

SteerLM的简单和用户友好性在其指标和性能中表现出色。在实验中,SteerLM43B在Vicuna基准上表现优于现有的RLHF模型,如ChatGPT-3.5和Llama30B RLHF。通过提供一个简单的微调过程,几乎不需要对基础架构和代码进行大幅度更改,SteerLM可以以更少的麻烦交付出色的结果,使其成为AI定制领域的一项重大进展。

NVIDIA正在通过在其NVIDIA NeMo框架中发布SteerLM的开源软件来推动先进的定制。开发人员现在有机会访问代码,并使用Hugging Face等平台上提供的自定义的13B Llama2模型来尝试这一技术。

官方博客说明:https://blogs.nvidia.com/blog/2023/10/11/customize-ai-models-steerlm/?ref=maginative.com

举报

  • 相关推荐
  • 隐私为先,安心体验:探索保障Galaxy AI个性化体验的安全技术

    三星Galaxy AI通过个人数据引擎(PDE)实现个性化体验,该技术随Galaxy S25系列首次亮相。配合Knox+++增强加密保护(KEEP)技术,在设备端安全处理用户数据,确保隐私安全。KEEP为敏感数据创建独立加密空间,支持即时简报等功能,不影响使用流畅性。安全文件夹功能提供额外保护层,用户可自定义加密方式。这套系统构建了新一代移动智能安全标准,在提供个性化服务的同时保障数据本地处理,不上传不外泄,实现体验与隐私的双重提升。

  • 三星推出面向未来的移动安全解决方案,赋能个性化AI体验

    三星推出Knox增强加密保护(KEEP)和抗量子加密Wi-Fi等多项安全创新功能,为新一代Galaxy设备提供更强大的隐私保护。KEEP通过独立加密存储空间隔离应用数据,结合Knox Vault硬件级防护,确保AI功能数据安全。安全Wi-Fi引入抗量子加密技术,抵御未来网络威胁,并在公共网络自动激活防护。这些升级将隐私保护从可选功能提升为系统级设计原则,通过多层防护机制为用户数据安全提供可靠保障。

  • 苹果自研AI模型难产:改用第三方大语言模型

    苹果可能会跟OpenAI或Anthropic合作,双方正在谈判讨论一项潜在交易,苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。 据悉,OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型,苹果也在进行测试,目前苹果发现Anthropic的AI模型最适合Siri,且与Anthropic初步讨论了一些财务条款,消息称Anthropic要求苹果每年支付数十亿美元的费用,且该费用会随时间�

  • AI技术赋能教育革新,猿辅导引领个性化学习新浪潮

    猿辅导作为中国在线教育领军企业,正通过AI大模型技术推动教育变革。其自主研发的"猿力大模型"与开源模型深度融合,打造出海豚AI学等智能产品,实现实时互动答疑、个性化学习建议等功能。2023年推出的"小猿学练机"智能硬件销量突破百万台。通过多模态AI算法,平台能动态调整学习计划,实现"千人千面"精准教学。猿辅导累计投入超百亿研发资金,构建了覆盖语音识别、自然语言处理等核心技术体系,并获中国信通院"可信AI"5级认证。其探索不仅推动商业成功,更致力于通过技术降低教育门槛,促进教育公平发展。

  • 明略科技研究成果被ACM MM 2025接收,攻克个性化注视点预测难题

    明略科技与北京大学、吉林大学合作研发的PRE-MAP模型被ACM MM2025接收。该研究针对现有视觉注意力模型在个性化注视点预测中的局限性,提出新方法PRE-MAP和大规模多模态数据集SPA-ADV,能更好捕捉个体差异并提升高分辨率视频中的多属性注视点预测精度。该成果是明略科技在AI大模型应用领域的又一突破,此前其超图多模态大模型(HMLLM)曾获ACM MM2024最佳论文提名。研究团队通过4500名不同背景用户的真实视觉行为数据,结合多模态大模型技术,实现了"某类人会看哪里"的精准预测,为广告创意优化和投放效果评估提供科学依据。

  • 聚焦临床,共探个性化治疗!YOUMAGIC舒立缇第二届「临床精英实践研讨会」高能举行

    7月4日,YOUMAGIC舒立缇举办第二届《焕新·源点 临床精英实践研讨会》。会议聚焦"能量医学技术创新与临床实践深度融合",汇集全国皮肤科专家,围绕新一代单极射频技术的临床应用展开研讨。数据显示,该设备6个月有效率达96.2%,3个月改善率显著优于对照组39%。专家指出,其创新温控技术能平衡高能量与舒适度,通过AI能量匹配实现个性化抗衰方案。作为国内首个获NMPA和FDA双认证的单极射频设备,YOUMAGIC将持续深耕临床科研,推动抗衰行业高质量发展。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • Nothing Phone 3发布:最具个性的骁龙8系手机 5700元起

    Nothing正式发布新一代旗舰Nothing Phone 3,起售价是799美元(12GB 256GB,约合人民币5700元)。 作为新一代旗舰,Nothing Phone 3最大的变化是外观设计,正面是一块6.67英寸AMOLED屏幕,分辨率为FHD ,刷新率为120Hz,峰值亮度为4500尼特,支持2160Hz高频PWM调光,前置5000万像素摄像头。 背部右上角嵌入了一块副屏,官方称之为Glyph Matrix”,这是一块单色LED屏幕,由由489颗独立发光的LED灯组�

  • 企业如何低成本搭建可快速响应的远程技术支持平台?

    文章探讨了极端天气下企业技术支持的转型需求,重点介绍了远程技术支持的解决方案。传统线下服务面临出行困难、安全隐患等问题,而远程技术支持能实现设备监测、故障排查等操作,保障人员安全。贝锐向日葵推出的远程控制方案具有高效稳定、快速响应等特点,支持文件传输、工单流转等功能,并与ITSM平台深度整合,形成闭环服务体系。方案还提供团队版共享机制,适合初创团队低成本使用。在极端天气频发的当下,远程方案能显著提升企业抗灾能力,实现降本增效。