首页 > 业界 > 关键词  > RefuelLLM-2最新资讯  > 正文

Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2

2024-05-13 15:36 · 稿源:站长之家

站长之家(ChinaZ.com)5月13日 消息:Refuel AI 最近宣布推出两个新版本的大型语言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务而设计,旨在提高处理大规模数据集的效率。

image.png

RefuelLLM-2的主要特点包括:

  1. 自动化数据标注:能够自动识别和标记数据中的关键信息,如分类数据和解析特定属性。

  2. 数据清洗:自动检测并修正数据中的错误或不一致性,例如拼写错误和格式问题。

  3. 数据丰富:根据现有数据自动补充缺失信息或提供额外上下文,增加数据的价值和可用性。

  4. 高准确率:在约30项数据标注任务的基准测试中,RefuelLLM-2以83.82%的准确率优于所有其他最先进的大型语言模型,包括 GPT-4-Turbo 和 Claude-3-Opus。

两款模型的比较:

  • RefuelLLM-2:基于 Mixtral-8x7B 模型,支持高达32K的最大输入上下文长度,适合处理长文本输入。

  • RefuelLLM-2-small:基于 Llama3-8B 模型,提供一个成本更低、运行更快的选项,同时保持高性能,支持高达8K的输入上下文长度。

训练细节:

  • 两款模型都在超过2750个数据集上进行训练,涵盖分类、阅读理解、结构化属性提取和实体解析等任务。

  • 训练方法:包括两个阶段,第一阶段专注于指令调整训练,第二阶段则加入更长上下文的输入,以提高模型在复杂数据处理任务中的表现。

性能提升:

  • 两阶段训练方法使得 RefuelLLM-2在基本数据处理任务中表现出色,并能有效处理长上下文输入。

质量评估:

  • 在长上下文数据集和非公开数据集的评估中,RefuelLLM-2和 RefuelLLM-2-small 均展现出良好的性能和泛化能力。

  • 在置信度分数质量方面,RefuelLLM-2和 RefuelLLM-2-small 显示出比其他模型更好的置信度分数校准。

Refuel AI 的这一创新为数据标注和清洗领域带来了新的解决方案,有助于自动化和优化大规模数据处理流程。

playground:https://labs.refuel.ai/playground

模型下载:https://huggingface.co/refuelai/Llama-3-Refueled

举报

  • 相关推荐
  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • 狂奔20天,全网“追赶”Sora2

    Sora2的发布,再次搅动了全球人工智能行业的神经。 9月30日,OpenAI正式推出其视频生成模型的重大升级版本——Sora2,以及基于该模型的社交应用Sora App。与前一代相比,Sora2在物理模拟的精确度、画面逼真度和生成可控性上显著提升,并实现了音频与人物对话的同步生成。这不仅让AI视频更“像真的”,也让视频生产“像写字”一样简单。 短短五天,Sora App下载量便突破百万�

  • 2025第十五届贵阳汽车文化,10月23-26日盛大启幕

    2025年第十五届贵阳汽车文化节将于10月23-26日在贵阳国际会议展览中心举办。本届车展推出10余项特色活动,包括国补省补双重购车补贴政策(新能源车最高补贴2万元、燃油车最高1.5万元)、尚格30周年经典老车特展、改装车嘉年华、咖啡主题市集、RC模型车漂移秀、汽车主播挑战赛等。现场还将设置亲子积木乐园、萌宠互动区及打卡抽奖活动,打造集购车、文化体验与娱乐互动于一体的年度汽车盛宴。

  • 半年营收近20亿,2025年了,还有社交公司要上市?

    「米连科技」,可能会有些陌生,但提到「伊对」,想必读者就很熟悉了。 公司成立于2015年,定位为在线情感社交平台,旗下产品包括面向国内市场的「伊对」(恋爱社交平台)、「贴贴」(语音社交平台),和以海外市场为主的「HiFami」(从应用截图来看,类似「贴贴」海外版)、「Chatta」(视频社交平台)、「Seeta」(视

  • 余承东官宣:鸿蒙操作系统6来了 10月22日一同见证

    今日,华为常务董事、终端BG董事长余承东在社交平台官宣鸿蒙操作系统6即将到来。 余承东表示,鸿蒙操作系统以超乎想象的速度持续迭代进化,秉持共建共享的初心,繁荣全新生态。 千万人砥砺前行,只为给用户带来易用、好用的全新体验,打造更好看、更好用、更智能、更安全、更丝滑的操作系统。

  • 最新2025按摩椅排名出炉,选按摩椅看这篇就够了!

    本文针对久坐办公人群常见的肩颈酸痛、腰背劳损等亚健康问题,指出智能按摩椅不仅能缓解不适,还能预防老年人肌肉萎缩。基于2025年市场数据与用户口碑,文章揭晓了最新按摩椅品牌排名前十,依次为:iRest艾力斯特、荣泰、富士、海尔、稻田、奥佳华、松下、奥克斯、西屋、东方神。其中iRest凭借22年专业积淀、多项国际认证及临床研究支持,在技术实力与用户体验上综合领先,成为榜单首位。文章重点推荐了其V5Pro和M6两款产品,并建议消费者优先考虑技术底蕴扎实、认证齐全的品牌。

  • 空气净化器成母婴刚需,2025 市场乱象与优选指南榜

    空气净化器正从“小众电器”转向“健康刚需”。2025年上半年中国市场零售额增长近20%,新装修、母婴、宠物等家庭场景是主要驱动力。但行业存在隐忧:不同品牌甲醛去除效率差距达20倍以上,抽检产品中仅28.6%甲醛CADR值超400m³/h,近三分之一产品存在净化效能不达标、宣传与实际不符等问题。针对母婴群体特殊需求,经实测筛选出斯帝沃A8L、布鲁雅尔7410i等10款硬核机型,其中斯帝沃采用纳米胶分解技术,1小时甲醛去除率超98%,睡眠档噪音仅28.5dB,成为新装修家庭优选。建议消费者重点关注甲醛CADR值、CCM等级及噪音控制三大参数,优先选择具有母婴级认证的产品。

  • 别等11月11日!2025双十一10月20日晚8点提前爆发,国补+平台优惠叠到最低,教你一步步领国补

    2025年双十一提前至10月20日晚8点启动,现货直抢享三重优惠:国补最高减2000元、平台补贴(京东/淘宝/抖音每满300减50)、跨店满减叠加。统一红包口令“天降红包8877”每日可领,京东搜“国补降额678”直达专区。重点商品iPhone16Pro补贴后5499元,75寸电视、洗衣机等家电补贴力度达3-5折。需提前绑定云闪付/支付宝支付,部分商品仅支持云闪付。早买早发货,平台承诺价保双十一,不怕买贵。

  • “变废为美”点亮运动与环保之约,歌尔WTB 亮相歌尔·2025潍坊马拉松

    2025年10月19日,歌尔作为潍坊马拉松冠名商,以“变废为美”为主题打造WTB展区。展品利用废弃铝材、木材、咖啡渣等材料,通过可持续设计转化为艺术品,如“不材之木”系列和“想象力面包灯”。活动传递环保理念,探索从回收到再设计、回归生活的闭环,并逐步将实践融入日常工作场景,构建绿色生态圈,邀请公众共赴可持续生活新旅程。

  • 2025 VDC游戏技术分会召开,多维技术创新定义游戏新体验

    2025年vivo开发者大会于10月10日在深圳召开,游戏技术分会以“极致·共生”为主题,展示了vivo在游戏领域的最新技术成果与合作案例。大会聚焦移动游戏技术爆发新阶段,强调通过软硬件协同实现性能、触控、图形等关键技术突破,为玩家带来多维一体的极致体验。vivo推出自研电竞芯片Q3及图形SDK,支持超分、超帧与光线追踪技术,并与《王者荣耀》《无限暖暖》等游戏深度合作,优化帧率、触控响应及功耗表现。未来vivo将持续夯实技术底座,通过VGS平台携手开发者共建游戏生态,推动移动游戏产业体验升级。

今日大家都在搜的词: