Meta新语言模型Humpback 遵循指令能力超越LLaMa模型

2023-08-17 13:34 · 稿源：站长之家

本文概要:
1. Meta 开发了一种方法，使大型语言模型能够在不依赖人工注释或更强大的模型的情况下，迭代地提高其遵循指令的能力。
2. 该方法使用了一种名为 "指令回译（instruction backtranslation）" 的技术，通过自我增强和自我管理的两步过程来优化语言模型的表现。
3. 使用该方法，Meta 的研究人员开发的 Humpback65B 模型在 Alpaca 指令跟踪基准测试中取得了最先进的结果。

站长之家（ChinaZ.com）8月17日消息:Meta 的研究人员开发了一种名为 "指令回译（instruction backtranslation）" 的新技术，用于提高大语言模型的指令跟踪能力。该技术可对 LLaMa 等大型语言模型进行微调以遵循指令，而无需依赖昂贵的人工注释或从 GPT-4等更强大的模型进行提炼。

AI机器人打游戏

这一方法包括自我增强和自我管理两个步骤。在自我增强阶段，模型从未标记的文本语料库中生成候选指令 - 响应对，并预测哪些指令会引发相应的响应。

然后，在自我管理阶段，模型对候选对进行评分和筛选，只保留得分最高的子集。通过这种迭代的自我训练过程，模型学习生成更好的指令，并能够更好地区分高质量的示例。

Metas 研究人员表明，这种方法可以带来强大的指令跟踪性能，优于之前使用相同规模的 LLaMa 模型的工作。Meta 的研究人员通过这一方法开发的 Humpback65B 模型在 Alpaca 指令跟踪基准测试中取得了最先进的结果，超过了其他竞争模型如 Anthropics Claude、Guanaco、LIMA 和 Falcon-Instruct 的性能。

研究人员表示，他们计划通过考虑更大的未标记语料库来进一步扩展这一方法，从而获得更好的效果。

（举报）

Meta新语言模型Humpback 遵循指令能力超越LLaMa模型

Meta悄然发布Llama 2 Long AI模型

Meta发布Llama 2-Long模型处理长文本计算量需求减少40%

Meta研究人员提出轻量级微调方法RA-DIT 以增强语言模型知识检索能力

Meta悄然发布Llama 2 Long AI，在某些任务上击败GPT-3.5 Turbo和Claude 2

荐Meta版ChatGPT来了：Llama 2加持，接入必应搜索，小扎现场演示

Meta视Llama为主导开源领域的人工智能生态系统

Riiid AI模型Sheep-duck-llama-2在HuggingFace排名第一

荐AI视野：Adobe发布新一代AI生成模型Firefly Image2；Meta发布Llama2-Long模型；TikTok支持从AI应用直接发布内容；Opera浏览器推出升级版的AI工具Aria

荐开源标杆！最强中英双语大模型来了，340亿参数，超越 Llama2-70B等所有开源模型

昆仑万维：天工大模型推理能力超过GPT-3.5和LLaMA2

热文

华为Mate X5折叠屏降价：8999元起至高优惠4000元

微信：聊天记录备份和迁移已支持外部存储设备可自动备份

罗马仕辟谣倒闭称定将努力解决一切问题

小米汽车回应YU7是否难破窗：无需担心随车赠送破窗锤

特斯拉中国宣布Model 3/Y长续航版续航提升

小鹏G7官宣7月3日发布全球首款L3级算力车型

华为Mate X5折叠屏降价：8999元起至高优惠4000元

董明珠说自己尽量少说话让年轻管理团队走向台前

安克修改召回方案充电宝泡盐水处理后可获赔

小米YU7将开启限时改配非准现车锁单用户可参与

微信：聊天记录备份和迁移已支持外部存储设备可自动备份

罗马仕辟谣倒闭称定将努力解决一切问题

站长商机