首页 > 业界 > 关键词  > RefuelLLM-2最新资讯  > 正文

Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2

2024-05-13 15:36 · 稿源:站长之家

站长之家(ChinaZ.com)5月13日 消息:Refuel AI 最近宣布推出两个新版本的大型语言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务而设计,旨在提高处理大规模数据集的效率。

image.png

RefuelLLM-2的主要特点包括:

  1. 自动化数据标注:能够自动识别和标记数据中的关键信息,如分类数据和解析特定属性。

  2. 数据清洗:自动检测并修正数据中的错误或不一致性,例如拼写错误和格式问题。

  3. 数据丰富:根据现有数据自动补充缺失信息或提供额外上下文,增加数据的价值和可用性。

  4. 高准确率:在约30项数据标注任务的基准测试中,RefuelLLM-2以83.82%的准确率优于所有其他最先进的大型语言模型,包括 GPT-4-Turbo 和 Claude-3-Opus。

两款模型的比较:

  • RefuelLLM-2:基于 Mixtral-8x7B 模型,支持高达32K的最大输入上下文长度,适合处理长文本输入。

  • RefuelLLM-2-small:基于 Llama3-8B 模型,提供一个成本更低、运行更快的选项,同时保持高性能,支持高达8K的输入上下文长度。

训练细节:

  • 两款模型都在超过2750个数据集上进行训练,涵盖分类、阅读理解、结构化属性提取和实体解析等任务。

  • 训练方法:包括两个阶段,第一阶段专注于指令调整训练,第二阶段则加入更长上下文的输入,以提高模型在复杂数据处理任务中的表现。

性能提升:

  • 两阶段训练方法使得 RefuelLLM-2在基本数据处理任务中表现出色,并能有效处理长上下文输入。

质量评估:

  • 在长上下文数据集和非公开数据集的评估中,RefuelLLM-2和 RefuelLLM-2-small 均展现出良好的性能和泛化能力。

  • 在置信度分数质量方面,RefuelLLM-2和 RefuelLLM-2-small 显示出比其他模型更好的置信度分数校准。

Refuel AI 的这一创新为数据标注和清洗领域带来了新的解决方案,有助于自动化和优化大规模数据处理流程。

playground:https://labs.refuel.ai/playground

模型下载:https://huggingface.co/refuelai/Llama-3-Refueled

举报

  • 相关推荐
  • 时空壶接入大语言模型,跨语言沟通已成翻译的艺术

    在当今全球化浪潮中,跨语言沟通的需求如潮水般汹涌。从商务领域的跨国谈判,到文化交流中的思想碰撞,高效、精准的语言翻译成为关键桥梁。随着技术的不断发展与迭代,时空壶有望持续引领行业变革,推动全球交流合作迈向新的高度,真正实现跨越语言障碍,让世界沟通无阻。

  • 提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据

    今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言,是真正面向全栈工程”的评测基准。相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。

  • 苦等一年 Meta终于放大招 正式发布开源大模型Llama 4

    美国科技巨擘Meta重磅推出其迄今最为强大的开源AI模型Llama4,恰逢Llama3上市一周年之际。Llama4系列采用了先进的混合专家架构,这一架构在模型训练及用户查询回答过程中展现出更高效率,通过将模型划分为多个专注于特定任务的专家”子模型,实现精准高效的处理。Meta首席执行官扎克伯格表示:他们的目标是建立世界领先的人工智能,将其开源,并使其普遍可用,以便世界上每个人都能受益。

  • 时空壶接入DeepSeek、豆包等大语言模型,翻译准确度再次跃升

    在全球跨语言沟通需求持续攀升的当下,时空壶再次以创新之举震撼行业。时空壶正式宣布接入DeepSeek、豆包等大语言模型,为其同传耳机产品带来了前所未有的体验升级,彻底改写了同传翻译的游戏规则,也让传统机翻模式成为历史。这一创新举措不仅满足了当下各行业对高质量跨语言沟通的迫切需求,更为未来跨语言交流的发展指明了方向,有望推动整个行业向更加智能、精准、自然的方向迈进,助力全球交流合作开启全新篇章。

  • Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

    被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文,打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆,恐将在AI竞赛中进一步失去开发者支持。

  • AI模型的困境:数据才是真正的“燃料”

    一旦掉入AI坟场,幻觉将永远存在,噩梦才刚开始。最近有许多客户在考虑上AI大模型一体机、AI私有化、AI大模型部署等项目,但小心进入AI大模型的坟场,在光鲜亮丽的背后,AI大模型也面临着诸多困境,其中最为核心的问题便是数据。只有拥有高质量、多样化、易于管理的数据,AI大模型才能发挥出其真正的潜力,为企业带来更大的价值。

  • 英伟达将首次在美制造 AI 超算、及 Blackwell 芯片

    站长之家(ChinaZ.com) 4月15日 消息:随着 AI 行业的蓬勃发展,英伟达位于美国的人工智能芯片和超 级计算机工厂将创造数千个就业机会。科技巨头英伟达(NVIDIA)宣布,其 AI 超 级计算机将完全在美国本土生产。在全球贸易战的背景下,英伟达这一举动是为了减少对海外市场的依赖,并促进美国国内的生产。英伟达确认,他们已开始在台积电位于美国亚利桑那州凤凰城的工厂生产�

  • 刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

    Llama4重磅发布了!Meta官宣开源首个原生多模态Llama4,首次采用的MoE架构,支持12种语言,首批发布一共两款:Llama4Scout:共有1090亿参数,17B活跃参数,16个专家,1000万上下Llama4Maverick:共有4000亿参数,17B活跃参数,128个专家,100万上下文另外,2万亿参数Llama4Behemoth将在未来几个月面世,288B活跃参数,16个专家。Llama4的横空出世,成为迄今为止开源最强,多模态能力最好的模型之一。L

  • AI日报:智谱开源32B/9B系列GLM模型并启用Z.ai域名;OpenAI发布GPT-4.1系列模型;阿里魔搭上线MCP广场

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型,并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议,支持商业用途,提升了

  • 字节AI加速文生图技术新突破,GOOG/微美全息引领开源大模型释放科技势能

    字节跳动发布豆包1.5深度思考模型,升级文生图能力。该模型在专业领域和通用任务中表现突出,采用MoE架构,总参数量200B,激活参数20B,推理成本优势显著。同时,其图像生成模型Seedream 3.0性能追平GPT-4o等顶尖模型。全球AI产业加速发展,开源模型降低技术门槛,推动商业化落地。微美全息等企业构建开放AI生态,DeepSeek等公司通过开源策略促进技术普惠。行业迎来"开源AI+"新阶段,企业需把握机遇应对挑战。