首页 > 业界 > 关键词  > HelpSteer最新资讯  > 正文

英伟达发布HelpSteer:一个用于构建有用LLM的开源数据集

2023-11-28 11:19 · 稿源:站长之家

站长之家(ChinaZ.com)11月28日 消息:英伟达最近宣布了NVIDIA NeMo SteerLM技术作为英伟达 NeMo框架的一部分。这项技术使用户能够在推断过程中控制大型语言模型(LLM)的响应。

英伟达 NeMo团队现在正在开源一个名为HelpSteer的多属性数据集。这个新资源使开发人员能够快速开始使用SteerLM技术并构建最先进的自定义模型。HelpSteer是我们团队与Scale AI合作的成果。结合SteerLM技术,它提高了响应的事实性和连贯性。开发人员现在可以在复杂性和冗长度等其他属性上引导LLM的响应,增强响应对最终用户的整体可控性。

image.png

项目地址:https://huggingface.co/datasets/nvidia/HelpSteer

通过使用这个新的数据集和SteerLM技术,英伟达训练了一个名为Llama270B的基础模型,其表现优于Llama2-70B聊天模型。

为了构建这个数据集,NeMo团队收集了约10,000个高质量提示,并使用内部LLM为每个提示生成了四个响应。然后,团队请人工专家根据0-4的评分来评估每个响应。Scale的生成式AI数据引擎将自动化和人工智能相结合,快速生成与特定AI目标和数据需求相适应的训练数据。

image.png

数据集中的所有响应都以五个属性进行了注释,包括:响应在整体上满足了提示的要求程度、响应是否包含事实准确、相关的信息而没有幻觉或虚假信息、响应的清晰度、逻辑性和自洽性以及响应的词汇和句子结构的复杂程度(从基础到专家级)、响应相对于提示所要求的是简洁还是冗长。

通过这个数据集和SteerLM技术的应用,英伟达取得了令人满意的结果,为构建自定义的LLM提供了更大的灵活性和可控性。这个新的开源数据集为开发人员提供了一个有用的工具,帮助他们更好地理解和应用NVIDIA NeMo框架中的SteerLM技术。

举报

  • 相关推荐
  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • 前DeepSeek研究员罗福莉已加入小米:全力奔赴AGI

    11月12日,“95后AI天才少女”罗福莉宣布加入小米MiMo大模型团队。她曾因“雷军千万年薪挖角”话题引发热议,拥有丰富AI研发经历,先后在幻方量化和DeepSeek参与大模型研发。罗福莉表示,将与团队致力于推动AI从语言迈向物理世界,全力构建通用人工智能。她的加入将为小米AI研究注入新活力。

  • Qwen用开源逆袭GPT的故事,千问APP要再干一遍

    Qwen模型逆袭GPT的策略,阿里准备再用一次。 2018年,OpenAI发布了自己的第一个模型GPT1,占据了技术先机,随后变得越来越封闭。在大洋彼岸,阿里几乎同一时间着手大模型研究,到2023年推出“通义千问”时,则选择了一条完全不同的路径:直接开源模型,允许开发者免费使用、改进和集成。 这个策略让Qwen逐步积累起规模,做到了如今全球开发者基于它发布了17万个衍生模型�

  • ​你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略,3步把曝光拉满

    GEO指数是AI搜索时代的品牌可见度衡量指标,量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同,GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示,高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明,企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控,把握AI搜索新机遇。

  • 华为FreeBuds Pro 5悦彰耳机价格公布:1449元 支持星闪音频

    华为于11月18日宣布FreeBuds Pro5悦享耳机开启预售,首发价1449元,11月25日正式开售。作为行业首款支持星闪音频的无线耳机,搭载麒麟A3芯片与星闪2.0技术,实现4.6Mbps高速传输和96kHz/24bit无损音质。采用双路独立驱动设计,配备双频灵犀天线,降噪效果提升220%,续航达6小时(降噪开启)或9小时(关闭)。支持HarmonyOS多设备连接、AI录音转写等实用功能,提供便捷体验。

  • Creators’ App迎来重大更新

    索尼与分秒帧联合推出云端影像创作平台ICE-Cloud,集成索尼先进影像技术与高效云端协作能力,为创作者提供从拍摄到后期全流程赋能。平台支持移动端、PC端及网页应用,实现素材自动上传、云端管理、在线审片和项目协同,打破时空限制,提升创作效率。通过Creators’ App连接相机与云端,实现即拍即传、异地实时协作,致力于打造新一代创意工作流。

  • 反诈从身边小事做起,WEEX的用户安全手册

    本文强调投资安全是智慧起点,提出三点防护建议:一、辨别信息真伪,警惕“内部消息”,通过官方渠道核实;二、养成账户安全习惯,如强密码、双重验证、定期检查设备;三、防范陌生人“帮助”陷阱,不轻信代操作承诺。安全非一时谨慎,而是持续意识,助力投资者理性成长。

  • TikTok Shop美区黑五重磅开启,黑五大战正式打响

    TikTok Shop美区黑五于11月13日启动,首次开展多市场联动大促。活动分三阶段:13-15日为开幕引爆期,16-27日为品类日蓄势期,28日至12月2日为冲刺高峰期。平台通过内容驱动增长,整合明星达人共创、千亿商品曝光及专项补贴资源,助力商家实现爆发。跨境与全托管模式提供结构化激励,多市场错峰接力延长热度,推动全球生意持续增长。

  • OpenAI发布GPT-5.1:情商大涨 本周开始推送

    OpenAI正式推出GPT-5.1模型,以“智商与情商深度融合”为核心亮点。新模型优化推理能力,强化情绪价值与个性化交互,包含Instant与Thinking两大核心版本:Instant首次引入自适应推理功能,针对复杂任务延长思考时间,简单问题保持极速响应;Thinking版本智能分配思考时长,提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型,支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度,防范拟人化风险。付费用户可保留旧版三个月过渡期。

  • 华为Mate 80/Pro/Pro Max/RS开启预约:全系直屏设计

    华为Mate80系列今日开启预约,四款机型亮相官网。全系延续星环设计语言,采用直边直屏方案,配备3D人脸识别技术。核心搭载新一代麒麟9030处理器,性能强劲。配色与存储选择丰富:Mate80提供四色及三种存储组合;Mate80 Pro增加16GB+1TB选项;Mate80 Pro+Max以四款独特配色亮相;顶配Mate80 RS大师版则带来三款高端配色及独家20GB定制内存方案,彰显技术实力。

今日大家都在搜的词: