首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

利用合成数据微调ChatGPT超越GPT-4摘要性能 降低63%成本和提升11倍速度

2023-10-11 14:21 · 稿源:站长之家

文章概要:

- 利用链式密度提示微调ChatGPT在新闻摘要任务上超过GPT-4零样本表现,接近GPT-4链式提示。

- 通过ScoreStringEvalChain和改进的PairwiseStringEvalChain等自动评估链实现人类水平的量化评估。

- 微调ChatGPT比GPT-4零样本快11倍且便宜63%,比GPT-4链式提示快33倍且便宜84%。

站长之家(ChinaZ.com) 10月11日 消息:近日,Elicit公司机器学习工程师Charlie George在LangChain博客上发表文章介绍了他们使用合成数据微调ChatGPT在新闻摘要任务上超越GPT-4的研究成果。

文章提到,尽管GPT-4被公认为世界上最强大的语言模型,但其调用限制、高成本和高延迟也限制了其实际应用。为解决这一问题,一些开发者转而使用ChatGPT等小模型,但小模型的表现通常不如GPT-4。文章介绍了微调的思路,即调整模型参数以更好地适应具体任务,但收集人类标注数据昂贵且耗时,而传统评估指标如困惑度也无法准确反映用户体验。

为解决数据问题,采用了一种合成数据生成方法,即使用GPT-4通过链式密度(CoD)提示逐步改进其生成的摘要。然后,使用LangSmith平台收集这些改进后的摘要作为训练数据,微调ChatGPT。

在评估方面,文章认为传统的BLEU和ROUGE指标往往不能准确捕捉现代语言模型的细微差异。相比之下,人工评估虽可靠但耗时耗力。最佳方案是开发自动化评估系统,但也需要人工验证其有效性。研究者已经开发了与真人高度一致的自动化评估链ScoreStringEvalChain和PairwiseStringEvalChain。

image.png

说明:经过微调的 ChatGPT 超越了 GPT-4零样本,并接近带有 CoD 的 GPT-4

image.png

说明:经过微调的 ChatGPT 比 GPT-4零样本快11倍以上,比带 CoD 的 GPT-4快33倍

image.png

经过微调的 ChatGPT 比 GPT-4零样本便宜63%,比带 CoD 的 GPT-4便宜84%

结果显示,相比GPT-4零样本,微调后的ChatGPT在新闻摘要任务上的表现优于前者,几乎达到GPT-4链式提示的水平,但其速度提高11倍,成本降低63%。与零样本GPT-4相比,微调ChatGPT在双样本评估中获胜率达96%。

分析称,合成数据微调展现了增强语言模型能力的巨大潜力。LangChain提供了创建复杂链条和迁移到小模型的完美工具。自动化评估为快速可靠地评估实际表现提供了有效手段。这为新一代AI应用大规模部署提供了路径。

举报

  • 相关推荐
  • 微软Phi-4封神,14B小模型数学击败GPT-4o,合成数据占比40%,36页技术报告出炉

    微软下一代14B小模型Phi-4出世了!仅用了40%合成数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。140亿参数,40%合成数据,年度SLM之王诞生!最近,微软下一代小模型Phi-4正式亮相。还真有点期待,下一个Phi系列小模型的发布了。

  • ChatGPT终于也推出Projects功能,却故意露出一个“AGI”的项目

    在OpenAI“双十二”的第七天,一种全新的对话交互模式诞生——Projects。它“长”在这儿,主页的左侧导航栏中:如其名,Projects的功能就是按照项目来组织和管理文件,正如官方介绍的那样:操作上也很简单。同样是先上传所需的文件,以及自定义指令:只需一句Prompt,Projects就能帮你生成修改个人网站对应的代码了:最后,一个复制粘贴的动作,网站就变成想要的样子啦:OneMoreThing

  • ChatGPT卷入爆炸案刷屏,AI安全正在成为最贵的学费

    ChatGPT竟成了「恐怖分子」的帮凶?在为一位美国现役军人提供爆炸知识后,后者成功将一辆特斯拉Cybertruck在酒店门口引爆……汽车爆炸现场画面,外媒视频截图这并非科幻电影桥段是AI安全风险正在文明身边真实上演的缩影。知名AI投资人RobToews在《福布斯》专栏预测,2025年我们将迎来「第一起真实的AI安全事件」。变与不变中,AI安全治理或许才是AI行业永恒的话题。

  • 突发!ChatGPT、Sora、API发生重大错误,宕机数小时

    今天凌晨5点,OpenAI宣布,ChatGPT、Sora和API产生了重大错误,大部分已经宕机了几个小时。但已经确定了问题所在,并已开始着手恢复。按照以往修复速度,估计这些功能很快就能使用了。

  • ChatGPT重磅功能!支持AI Agent玩法,OpenAI加入智能体了

    今天凌晨2点,OpenAI开启了第11天的直播技术分享,对ChatGPT的应用程序进行了重磅升级,支持原生应用程序自动化协作功能。从OpenAI在直播中演示的案例来看,基本上与AIAgent功能差不多,尤其是在编程方面非常好。ChatGPT的协作功能已经在Mac应用程序中可以使用了,通过OptionSpace就能快速调用这个功能,并且占用的内存非常小,是一个不错的自动化协作助手。

  • OpenAI称1465元/月的ChatGPT Pro亏损:大家用的太多了

    在2024年12月,OpenAI推出了其最新的人工智能模型o1的满血版本,并同时宣布了史上最贵的订阅服务ChatGPTPro,每月订阅费用高达200美元。然不到一个月的时间,OpenAI的CEOSamAltman就表示,这项服务正在亏损,原因在于用户的使用频率远超预期。在模型背后,OpenAI需要大量GPU资源来处理用户的查询,这些GPU的硬件成本、模型训练成本、电力成本以及工程师的人员成本等,都是可以量化的支出,因此理论上来说OpenAI是可以确认ChatGPTPro整个订阅计划是亏损还是赚钱。

  • ChatGPT重大更新:新增实时搜索和高级语音

    据报道,OpenAI开启了第八天技术分享直播,对ChatGPT搜索功能进行了大量更新。此次ChatGPT新增的功能亮点纷呈。有观点认为,这一功能未来有望与餐厅、商城等商业实体进行深度合作,为用户带来更加便捷、全面的服务体验。

  • OpenAI又一王炸!ChatGPT可以打电话了:老年机、座机也能用

    日前,OpenAI官宣12天将进行12场新品发布会直播,今天是第10天,OpenAI再发王炸。OpenAI宣布推出ChatGPT电话服务,用户将ChatGPT添加到电话通讯录中,然后拨打1-800-242-8478就能和GPT直接语音对话,可以回答用户提出的问题。ChatGPT从今天开始也支持通过WhatsApp使用,适合喜欢以文字方式交流的用户,但因平台限制,用户无法使用ChatGPT的自定义选项。

  • ChatGPT搜索与Her打通了,搜索免费开放,居然还剧透明日直播主题

    ChatGPT今天带来的是搜索功能方面的一些迭代升级。主要有三点,私以为最大亮点是第二:根据用户反馈,优化搜索体验,移动端搜索更快,并能搜索出多模态信息;结合前几日发布的Her功能,可以在实时通话的时候进行语音搜索;免费,接下来逐步向所有ChatGPT用户开放。接下来OpenAI和奥特曼到底会不会有大招啊?以及感觉会不会有更多不慎泄漏的各种边角料出现。

  • OpenAI整大活!ChatGPT新增电话功能,全民AGI要来了

    今天凌晨2点,OpenAI开启了第10天的直播技术分享,ChatGPT新增电话功能,并有了专属电话号码——1-800。目前这个号码仅美国地区,无论你是旧款智能手机还是老掉牙的座机都能打通,极大降低了ChatGPT的使用门槛和应用范围,尤其是对于不懂互联网的老年人来说非常有帮助。如果用户在试用后希望进行更长时间的对话,可以直接去源应用体验。