Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2

2024-05-13 15:36 · 稿源：站长之家

站长之家（ChinaZ.com）5月13日消息:Refuel AI 最近宣布推出两个新版本的大型语言模型（LLM），RefuelLLM-2和 RefuelLLM-2-small，这两个模型专为数据标注、清洗和丰富任务而设计，旨在提高处理大规模数据集的效率。

RefuelLLM-2的主要特点包括:

自动化数据标注:能够自动识别和标记数据中的关键信息，如分类数据和解析特定属性。
数据清洗:自动检测并修正数据中的错误或不一致性，例如拼写错误和格式问题。
数据丰富:根据现有数据自动补充缺失信息或提供额外上下文，增加数据的价值和可用性。
高准确率:在约30项数据标注任务的基准测试中，RefuelLLM-2以83.82%的准确率优于所有其他最先进的大型语言模型，包括 GPT-4-Turbo 和 Claude-3-Opus。

两款模型的比较:

RefuelLLM-2:基于 Mixtral-8x7B 模型，支持高达32K的最大输入上下文长度，适合处理长文本输入。
RefuelLLM-2-small:基于 Llama3-8B 模型，提供一个成本更低、运行更快的选项，同时保持高性能，支持高达8K的输入上下文长度。

训练细节:

两款模型都在超过2750个数据集上进行训练，涵盖分类、阅读理解、结构化属性提取和实体解析等任务。
训练方法:包括两个阶段，第一阶段专注于指令调整训练，第二阶段则加入更长上下文的输入，以提高模型在复杂数据处理任务中的表现。

性能提升:

两阶段训练方法使得 RefuelLLM-2在基本数据处理任务中表现出色，并能有效处理长上下文输入。

质量评估:

在长上下文数据集和非公开数据集的评估中，RefuelLLM-2和 RefuelLLM-2-small 均展现出良好的性能和泛化能力。
在置信度分数质量方面，RefuelLLM-2和 RefuelLLM-2-small 显示出比其他模型更好的置信度分数校准。

Refuel AI 的这一创新为数据标注和清洗领域带来了新的解决方案，有助于自动化和优化大规模数据处理流程。

playground:https://labs.refuel.ai/playground

模型下载:https://huggingface.co/refuelai/Llama-3-Refueled

（举报）

相关推荐

关键词：

RefuelLLM-2

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

2025年9月29日，深度求索公司发布新一代模型架构DeepSeek-V3.2，引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本，在V3.1-Terminus基础上引入稀疏注意力机制，优化长文本训练和推理效率。目前官方应用端已同步更新，API大幅降价。此次模型体积达671GB，下载需8-10小时。业内专家指出，此次快速适配表明双方早有深度技术协�

DeepSeek-V3.2 大模型架构稀疏注意力机制
狂奔20天，全网“追赶”Sora2

Sora2的发布，再次搅动了全球人工智能行业的神经。 9月30日，OpenAI正式推出其视频生成模型的重大升级版本——Sora2，以及基于该模型的社交应用Sora App。与前一代相比，Sora2在物理模拟的精确度、画面逼真度和生成可控性上显著提升，并实现了音频与人物对话的同步生成。这不仅让AI视频更“像真的”，也让视频生产“像写字”一样简单。短短五天，Sora App下载量便突破百万�

Sora2 人工智能视频生成模型
2025第十五届贵阳汽车文化，10月23-26日盛大启幕

2025年第十五届贵阳汽车文化节将于10月23-26日在贵阳国际会议展览中心举办。本届车展推出10余项特色活动，包括国补省补双重购车补贴政策（新能源车最高补贴2万元、燃油车最高1.5万元）、尚格30周年经典老车特展、改装车嘉年华、咖啡主题市集、RC模型车漂移秀、汽车主播挑战赛等。现场还将设置亲子积木乐园、萌宠互动区及打卡抽奖活动，打造集购车、文化体验与娱乐互动于一体的年度汽车盛宴。

贵阳汽车文化节汽车补贴政策新能源车优惠
荐半年营收近20亿，2025年了，还有社交公司要上市？

「米连科技」，可能会有些陌生，但提到「伊对」，想必读者就很熟悉了。公司成立于2015年，定位为在线情感社交平台，旗下产品包括面向国内市场的「伊对」（恋爱社交平台）、「贴贴」(语音社交平台)，和以海外市场为主的「HiFami」(从应用截图来看，类似「贴贴」海外版)、「Chatta」(视频社交平台)、「Seeta」(视

米连科技伊对 IPO
余承东官宣：鸿蒙操作系统6来了 10月22日一同见证

今日，华为常务董事、终端BG董事长余承东在社交平台官宣鸿蒙操作系统6即将到来。余承东表示，鸿蒙操作系统以超乎想象的速度持续迭代进化，秉持共建共享的初心，繁荣全新生态。千万人砥砺前行，只为给用户带来易用、好用的全新体验，打造更好看、更好用、更智能、更安全、更丝滑的操作系统。

鸿蒙操作系统6 余承东官宣 HarmonyOS
最新2025按摩椅排名出炉，选按摩椅看这篇就够了！

本文针对久坐办公人群常见的肩颈酸痛、腰背劳损等亚健康问题，指出智能按摩椅不仅能缓解不适，还能预防老年人肌肉萎缩。基于2025年市场数据与用户口碑，文章揭晓了最新按摩椅品牌排名前十，依次为：iRest艾力斯特、荣泰、富士、海尔、稻田、奥佳华、松下、奥克斯、西屋、东方神。其中iRest凭借22年专业积淀、多项国际认证及临床研究支持，在技术实力与用户体验上综合领先，成为榜单首位。文章重点推荐了其V5Pro和M6两款产品，并建议消费者优先考虑技术底蕴扎实、认证齐全的品牌。

按摩椅品牌排名智能按摩椅选购肩颈酸痛缓解
空气净化器成母婴刚需，2025 市场乱象与优选指南榜

空气净化器正从“小众电器”转向“健康刚需”。2025年上半年中国市场零售额增长近20%，新装修、母婴、宠物等家庭场景是主要驱动力。但行业存在隐忧：不同品牌甲醛去除效率差距达20倍以上，抽检产品中仅28.6%甲醛CADR值超400m³/h，近三分之一产品存在净化效能不达标、宣传与实际不符等问题。针对母婴群体特殊需求，经实测筛选出斯帝沃A8L、布鲁雅尔7410i等10款硬核机型，其中斯帝沃采用纳米胶分解技术，1小时甲醛去除率超98%，睡眠档噪音仅28.5dB，成为新装修家庭优选。建议消费者重点关注甲醛CADR值、CCM等级及噪音控制三大参数，优先选择具有母婴级认证的产品。

空气净化器健康刚需甲醛去除效率
别等11月11日！2025双十一10月20日晚8点提前爆发，国补+平台优惠叠到最低，教你一步步领国补

2025年双十一提前至10月20日晚8点启动，现货直抢享三重优惠：国补最高减2000元、平台补贴（京东/淘宝/抖音每满300减50）、跨店满减叠加。统一红包口令“天降红包8877”每日可领，京东搜“国补降额678”直达专区。重点商品iPhone16Pro补贴后5499元，75寸电视、洗衣机等家电补贴力度达3-5折。需提前绑定云闪付/支付宝支付，部分商品仅支持云闪付。早买早发货，平台承诺价保双十一，不怕买贵。

双十一红包口令国补
“变废为美”点亮运动与环保之约，歌尔WTB 亮相歌尔·2025潍坊马拉松

2025年10月19日，歌尔作为潍坊马拉松冠名商，以“变废为美”为主题打造WTB展区。展品利用废弃铝材、木材、咖啡渣等材料，通过可持续设计转化为艺术品，如“不材之木”系列和“想象力面包灯”。活动传递环保理念，探索从回收到再设计、回归生活的闭环，并逐步将实践融入日常工作场景，构建绿色生态圈，邀请公众共赴可持续生活新旅程。

歌尔潍坊马拉松绿色科技可持续环保
2025 VDC游戏技术分会召开，多维技术创新定义游戏新体验

2025年vivo开发者大会于10月10日在深圳召开，游戏技术分会以“极致·共生”为主题，展示了vivo在游戏领域的最新技术成果与合作案例。大会聚焦移动游戏技术爆发新阶段，强调通过软硬件协同实现性能、触控、图形等关键技术突破，为玩家带来多维一体的极致体验。vivo推出自研电竞芯片Q3及图形SDK，支持超分、超帧与光线追踪技术，并与《王者荣耀》《无限暖暖》等游戏深度合作，优化帧率、触控响应及功耗表现。未来vivo将持续夯实技术底座，通过VGS平台携手开发者共建游戏生态，推动移动游戏产业体验升级。

vivo开发者大会游戏技术移动游戏

今日大家都在搜的词：

热文

3 天
7天

Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

狂奔20天，全网“追赶”Sora2

2025第十五届贵阳汽车文化，10月23-26日盛大启幕

荐半年营收近20亿，2025年了，还有社交公司要上市？

余承东官宣：鸿蒙操作系统6来了 10月22日一同见证

最新2025按摩椅排名出炉，选按摩椅看这篇就够了！

空气净化器成母婴刚需，2025 市场乱象与优选指南榜

别等11月11日！2025双十一10月20日晚8点提前爆发，国补+平台优惠叠到最低，教你一步步领国补

“变废为美”点亮运动与环保之约，歌尔WTB 亮相歌尔·2025潍坊马拉松

2025 VDC游戏技术分会召开，多维技术创新定义游戏新体验

今日大家都在搜的词：

热文

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

天猫双11今晚8点开卖品类券每人可领万元

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

余承东官宣华为路由X3 Pro 采用“日照金山”设计

苹果天猫双11今晚开卖 iPhone17pro天猫官旗首次降价

火车免费坐？12306今起又上新功能：积分可兑换车票

红米REDMI K90 Pro Max官宣搭载7560mAh电池

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

王腾首次回应下一步计划：称在考虑些创业项目

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

站长商机