伯克利分校推开放大模型Starling-7B 接受人工智能反馈训练

2023-11-29 10:58 · 稿源：站长之家

要点:
由加州大学伯克利分校研究人员推出的Starling-7B是一款基于Reinforcement Learning from AI Feedback（RLAIF）的开放式大型语言模型(LLM)，采用人工智能反馈来提升其性能，特别是在聊天机器人响应方面。
RLAIF采用来自其他人工智能模型的反馈进行训练，以改进模型的性能。相比于以往的人工反馈，AI反馈具有更低的成本、更快的速度、更透明和更可扩展的潜力。Starling-7B通过RLAIF在性能上取得了显著的改进。
Starling-7B在两个基准测试中（MT-Bench和AlpacaEval）表现优异，尤其在安全性和帮助性方面。研究人员指出，虽然RLAIF主要提高了模型的帮助性和安全性，但在基本能力方面，如回答基于知识的问题、数学或编码，改进不大。未来的研究方向可能包括引入高质量的人工反馈数据，以更好地适应模型对人类需求的理解。

站长之家（ChinaZ.com）11月29日消息:加州大学伯克利分校的研究人员推出了一款名为Starling-7B的开放式大型语言模型（LLM），采用了一种称为Reinforcement Learning from AI Feedback(RLAIF)的创新训练方法。

RLAIF的独特之处在于利用其他人工智能模型的反馈来提升性能，相较于传统的人工反馈，这种方法更具有成本效益、速度快、透明度高、可扩展性强的优势。Starling-7B基于新的Nectar数据集进行训练，包含183，000个聊天提示和380万个成对比较。

研究人员使用两个基准测试（MT-Bench和AlpacaEval）评估了Starling-7B的性能，这两个测试使用GPT-4进行评分，分别关注模型在简单指令跟随任务中的安全性和帮助性。Starling-7B在MT-Bench中表现良好，与OpenAI的GPT-4和GPT-4Turbo相媲美，在AlpacaEval中达到了与商业聊天机器人相当的水平。

研究人员指出，RLAIF主要改善了模型的帮助性和安全性，而在基本能力方面，如回答基于知识的问题、数学或编码等，改进较小。

尽管基准测试的实际应用有限，但对RLAIF的应用前景充满希望。研究人员建议的下一步是通过引入高质量的人工反馈数据，更好地调整模型以满足人类需求。

与此同时，研究人员强调，Starling-7B和其他类似的大型语言模型在需要推理或数学任务时仍然存在困难，并可能产生幻觉。他们将Nectar数据集、Starling-RM-7B-alpha奖励模型和Starling-LM-7B-alpha语言模型发布在Hugging Face上，并提供了研究许可证，代码和论文将很快公开。感兴趣的人还可以在聊天机器人领域测试该模型。

（举报）

相关推荐
大家在看

关键词：

大模型

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Vana 计划让用户出租他们的 Reddit 数据来训练人工智能

在生成式人工智能蓬勃发展的时代，数据被称为新的"石油"。数据的创造者和所有者往往无法从中获益。尽管Reddit对此表示不满，但Vana认为这是让用户收回对数据的控制权的重要一步。
英国科技部门正考虑监管人工智能模型的立法

英国科技、创新与技术部门的官员已开始起草监管人工智能模型的立法。目前尚不清楚未来的监管将如何与英国已存在的AI安全研究所交汇，该研究所已对最强大的AI模型进行安全测试。任何潜在的法案仍有很长的路要走。

人工智能 AI模型
谷歌照片升级人工智能编辑功能免费向所有用户开放

之前仅限于Pixel设备和付费订阅者的人工智能驱动的照片编辑功能，现已免费向所有GooglePhotos用户开放。这些功能包括MagicEraser、PhotoUnblur、肖像光等，让用户能够更方便地编辑和优化照片。这也反映了科技公司在人工智能应用于日常生活场景方面的不断探索和创新。

Google Photos AI
部分品牌开始禁止广告公司使用人工智能

近日一份新报告显示，越来越多的公司开始担心广告商将生成式人工智能融入其工作流程。在这场人类艺术家与生成式人工智能之间的“冷战”中，企业们成为了意想不到的盟友。更新后的指南现在建议企业在与广告公司的协议中包含关于人工智能和同意的条款，公司似乎开始遵循这一建议。

人工智能
为什么大家都选择“第五届深圳国际人工智能展”?

作为展示人工智能最新成果和前沿技术的重要窗口，第五届深圳国际人工智能展（简称“GAIE”）将于2024年5月29—31日在深圳会展中心（福田）举办。本届展会以“智创未来•价值链接”为主题，将为公众和业界人士呈现一场科技与智慧交织的专业化盛宴。政府指导引领提升展会权威自2020年成功举办以来，深圳国际人工智能展历届受到了国家与省市各级政府相关职能部门的重�
秀域：人工智能助力按摩理疗，打造健康新选择

颈椎病、肩周问题、腰椎间盘突出症、腰肌劳损、膝关节问题等多发于老年群体，属于典型的“老年病”，但随着现代人们生活习惯与工作方式的改变，这些“老年病”开始向年轻化发展，不少正值壮年的职场精英也开始出现颈椎、腰椎问题。大家可以回想一下，自己周围有没有颈、肩、腰、腿不舒服的亲戚朋友呢?答案是一定有。这一创新为健康理疗行业的发展开辟了广阔的可能性，激发了业界对未来的无限遐想。

颈椎病肩周问题腰椎间盘突出症
人工智能是把“双刃剑” 审慎应对科技潜在危害

2023年11月1日，全球首届人工智能（AI）安全峰会在英国开幕，马斯克在峰会上提出:应该建立“第三方裁判”来监督开发人工智能的公司，这个裁判将观察领先的AI公司在做什么，并在必要时发出警报。马斯克表示，政府在制定监管规则之前需要深入了解AI的发展。他把人工智能称为一把“双刃剑”，认为它对人类有益，但同时也存在危险。英国最近发表的一份声明，由28个国家�

人工智能安全 AI监督人类机器合作
研究：人工智能在提供情感支持方面优于人类

在快节奏的现代生活中，真正感到被倾听和理解是一件罕见的事情。许多人并没有从周围的人那里得到他们需要的情感支持、共鸣和认可。这种分辨出正确类型的回应的能力很可能促成了其积极影响。

人工智能 AI头条
美英宣布合作，共同关注人工智能安全与测试

美国和英国于周一宣布了一项新的合作伙伴关系，共同关注人工智能安全科学，针对即将到来的下一代版本引发的日益关注的问题。美国商务部长吉娜・雷蒙多和英国科技部长米歇尔・多纳兰在华盛顿签署了一项谅解备忘录，共同开发先进的AI模型测试，这是继去年11月在布莱切利公园举办的AI安全峰会上宣布承诺后的进展。“那些后果可能是灾难性的，因此我们对某些模型被用于这种能力必须有零容忍。

人工智能
马斯克预测人工智能将在明年超越人类智能

站长之家（ChinaZ.com）4月9日消息:亿万富翁企业家埃隆・马斯克表示，只要供应电力和硬件能够满足日益强大的技术需求，新的人工智能模型的能力将在明年底超越人类智能。他在与挪威国家银行投资管理首席执行官尼古拉・塔根进行的一次访谈中预测称:“我猜测，我们将会在明年底左右拥有比任何一个人类更聪明的人工智能。” 马斯克在 Tesla、X 和 SpaceX 等公司担任首席执行

马斯克人工智能 AI头条

TravAI:是一款AI驱动的旅行培训产品，提供交互式AI培训、模拟、评估和智能助手，为旅行行业人员提供最新的技能和知识。

TravAI是一款旅行行业的AI驱动培训产品，通过注入AI技术，为培训注入活力。它能创建引人入胜、交互式的培训课程，进行逼真的角色扮演模拟，并设计能够真正起作用的测验。同时，TravAI利用您的数据为旅行团队量身定制个性化学习体验，让培训不再是通用的、一刀切的。它是培训旅行业专业人员的更智能、更快速的方式。

旅行培训 AI

Nextminds:是一家提供在线辅导服务的平台，为所有科目和学术水平的学生提供个性化辅导。

Nextminds是一个提供在线辅导服务的平台，通过与经验丰富的导师在线互动，为学生提供个性化的学习经验。平台提供ICSE、CBSE和州委员会等多种教育体系的辅导。Nextminds的主要优点是学生可以在舒适的家中与专业的导师进行一对一的在线学习，为学生提供高质量的辅导服务。

在线辅导学习个性化

Pedagogue.io:每天花费10分钟，提升您的AI技能。

Pedagogue是一款AI技能培训平台，旨在帮助个人和企业提升AI技能。通过该平台，用户可以学习AI工具、技术和策略，并获得40%的生产力提升。Pedagogue的优势在于更新及时的内容库、个性化的技能培养、有趣的学习方式以及具有商业价值的数据驱动洞察。

AI 技能培训教育

LexiGym:你的语言学习伴侣。🚀 # #HinkouLabs

LexiGym是一款语言学习应用，帮助用户提升语言技能。它具有离线和多语言支持的创新功能，是最强大的语言学习伴侣。用户可以根据自己的预算选择免费使用或付费订阅，灵活选择学习方式。LexiGym还提供易于创建字典和智能学习等功能，以及详细的训练统计数据。

语言学习词汇训练多语言

Alevels.ai:A Levels AI是一个利用人工智能提高A Levels学习成绩的工具。

A Levels AI利用人工智能技术，提供个性化的学习计划和辅导资源，帮助学生在A Levels考试中取得优异成绩。它通过分析学生的学习情况和弱点，为其提供针对性的学习建议和练习题。A Levels AI还提供实时答疑和学习进度跟踪功能，帮助学生更好地掌握知识。

教育考试辅导人工智能

MailReply:是一款AI助手，可生成专业且人性化的邮件回复，节省时间。

MailReply通过AI生成邮件回复，帮助用户节省时间。它可以在保持人类写作风格的同时，根据邮件内容生成上下文相关的回复。MailReply适用于Windows和macOS，并兼容多种邮件客户端。

邮件回复 AI助手工具

Notification harbor:高性能团队的电子邮件营销平台

Notification harbor是一个为电子邮件营销团队提供AI优化的电子邮件内容和自动化流程的平台。通过使用LLM技术，我们可以在短短5分钟内创建高性能的电子邮件营销内容，并且随着时间的推移，产品甚至可以自我优化。我们的平台简化了电子邮件营销活动的方式，确保每个活动都能精准地与您的目标受众建立联系。AI生成的电子邮件模板根据您提供的信息和要求选择最合适的模板。实时个性化电子邮件可以提高用户参与度和转化率，并根据每个用户实时定制内容。AI驱动的电子邮件营销使您的团队在创建电子邮件模板和文本方面节省了60％的时间。

电子邮件电子邮件营销 AI优化

Magic Loops:通过结合ChatGPT自动化与代码，创建简单的自动化任务

Magic Loops是一种基于ChatGPT的自动化工具，可以连接数据、发送电子邮件、接收短信、爬取网站等功能。它能够帮助用户自动化生活中的各种任务，提高工作效率。Magic Loops的主要优点是可以与各种数据源和应用程序集成，轻松实现个性化的自动化需求。

自动化工具 ChatGPT

ReplyAuto:Reply Auto是一款AI邮件助手，能够根据上下文理解邮件内容，并提供智能回复。

Reply Auto是一款使用AI技术的邮件助手，它能够自动分析邮件内容，根据上下文提供智能回复。它的主要优点是提高工作效率，减轻用户的邮件负担，并能够个性化定制回复。Reply Auto定位于帮助用户更高效地处理电子邮件，提高工作效率。

邮件智能回复工作效率

Mailman Workcation:智能邮递员 - 自动化影响力的智能Twitter机器人

AI Mailman利用最新的人工智能技术创建世界上最准确的邮件，比人类更快速和高质量。它提供简单的用户界面，能够创建世界上最强大的邮件模板，打开率更高。使用AI Mailman创建的邮件打开率是其他方式的10倍，生成时间只需10秒。

邮件自动化影响力

Inpost:一款AI驱动的移动应用程序，可以改善个人电子邮件体验。

Inpost.ai是一款基于AI的移动应用程序，可以优化个人电子邮件体验。它帮助用户智能地组织和清理收件箱，专注于重要的电子邮件。它提供无缝的邮件交互，提供增强的安全性和独家功能。通过高级AI模型分析邮件内容，而不暴露用户的敏感信息。用户可以轻松追踪支出、管理发票，并利用促销优惠来优化个人预算。Inpost.ai还提供定制的收件箱分类，让用户能够个性化和高效地管理和优化收件箱。

电子邮件 AI 个人化

Leadog:AI驱动的冷邮件营销、线索跟踪和互动

Leadog.io是一款AI驱动的冷邮件营销平台，提供冷邮件发送、线索跟踪和互动等功能。它采用先进的AI技术来优化冷邮件营销策略，提供精确的邮件投递和跟踪，帮助用户更好地了解和转化潜在客户。

冷邮件线索跟踪营销工具

Prospect AI:一键查找网站上的电子邮件地址和联系人信息

Prospect AI是一款插件，可以帮助销售团队、数字营销人员和公关专业人员免费查找公司的联系人。它使用人工智能技术，快速获取所需的联系人信息，帮助用户拓展业务关系。

市场营销销售潜在客户

Email whisperer:写作完美邮件，让你的电子邮件沟通更上一层楼！

Email Whisperer是一个用于Gmail和Outlook的AI电子邮件编写工具。它可以帮助你轻松地写出完美的电子邮件，提供重新表达、拼写检查和修正功能。它能够提高你电子邮件的清晰度和风格，并确保邮件无错误。Email Whisperer是一个提高电子邮件写作效率的工具，让你的邮件专业而准确。

生产力电子邮件 AI工具

Humanize AI by AI Text Converter:将AI生成的文本转换为与人类写作相匹配的内容。

Humanize AI Text是一个免费在线的AI文本人性化转换工具，能够绕过AI检测，并将AI生成的文本转换为与人类写作相匹配的内容。

AI转换工具文本人性化 AI检测绕过

Happily.ai:使用，超越传统调查。我们的AI平台分析员工情绪，提供可操作的见解，为健康、投入、高绩效的团队提供支持。

Happily.ai是一个AI工具包，帮助人力资源和经理人通过无忧无虑的参与、认可和绩效管理来提高人才留存和团队生产力。

员工参与度人力资源绩效管理

ChatKPI:是一款基于AI的数据分析工具，可以通过文本消息跟踪销售趋势、识别热门产品、了解客户行为，提供图表、定制CSV等功能。

ChatKPI是一个AI数据分析工具，旨在帮助Shopify商家做出更明智的数据驱动决策。它可以提供实时洞察力，跟踪销售趋势，识别热门产品，了解客户行为，并通过自然语言对话提供个性化的商业洞察。ChatKPI可以通过文本消息或在Shopify商店内安装的应用程序使用。

数据分析销售趋势热门产品

Limodify.AI | Email Marketing Design Meets AI:Limodify.AI通过AI技术提供电子商务邮件创建服务。

Limodify.AI革新了电子商务邮件的创建过程，只需点击几下，选择格式，输入关键信息，即可在30秒内获得准备好发送的AI设计的邮件。节省时间，利用先进技术，精确实现您的营销目标。立即免费开始使用。

电子商务邮件营销 AI

PurplePro:使用AI技术，只需两个点击即可启动您的忠诚度俱乐部。

PurplePro是一个使用AI技术的插件，它可以帮助您在短短两个点击的时间内启动您的忠诚度俱乐部。PurplePro通过游戏化和动态的积分规则增加用户参与度，并奖励他们。它还提供了强大的推荐、挑战、问卷和可变奖励功能，帮助您将首次用户转化为忠实的客户。

忠诚度俱乐部用户参与度奖励

LISUTO:株式会社は、eコマースのセラーやマーケットプレイスが売上を増やし、時間を節約し、コアビジネスに集中できるスマートデータ構造化ソリューションのリーダーです。

LISUTO株式会社は、eコマースのセラーやマーケットプレイスが売上を増やし、時間を節約し、コアビジネスに集中できるスマートデータ構造化ソリューションのリーダーです。LISUTO AIは、AIタッガーやイメージタッガーなどのサービスを提供し、商品のタグ登録やナビゲーション改善などを自動化し、効率を向上させます。

伯克利分校推开放大模型Starling-7B 接受人工智能反馈训练

今日大家都在搜的词：

热文

站长商机