首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

大模型总结摘要靠谱吗?比人类写的流畅,用GPT-4幻觉还少

2023-09-20 15:22 · 稿源: 机器之心公众号

以后文本摘要总结任务,可以放心交给大模型了。文本摘要,作为自然语言生成(NLG)中的一项任务,主要用来将一大段长文本压缩为简短的摘要,例如新闻文章、源代码和跨语言文本等多种内容都能用到。随着大模型(LLM)的出现,传统的在特定数据集上进行微调的方法已经不在适用。我们

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 谷歌让大模型更具“心智”,GPT-4任务准确率大增

    谷歌联合多所高校的一项最新研究,让大模型开始拥有了人类的“心智”。在新的提示策略下,大模型不仅能推测出人类所面临的问题学会了用推测的结论调整自己的行为。来自谷歌、卡耐基梅隆大学和的芝加哥大学的学者也参与了本项目。

  • GPT-4终结人工标注!AI标注比人类标注效率高100倍,成本仅1/7

    【新智元导读】这个开源工具,居然能用GPT-4代替人类去标注数据,效率比人类高了100倍,但成本只有1/7。大模型满天飞的时代,AI行业最缺的是什么?毫无疑问一定是算力。让用户能够试验多个LLM和不同提示的工作流程。

  • GPT-4就是AGI,谷歌斯坦福科学家揭秘大模型如何超智能

    【新智元导读】谷歌研究院和斯坦福HAI的两位专家发文称,现在最前沿的AI模型,未来将会被认为是第一代AGI。最前沿的LLM已经用强大的能力证明,AGI即将到来!通用人工智能,其实已经实现了?最近,来自谷歌研究院和斯坦福HAI的大佬发文称,现在的大预言模型就是通向AGI的正确方向现在最前沿的模型,已经拥有AGI的能力了!这两位作者都是AI业界大佬,BlaiseAgüerayArcas现在是Google

  • 李彦宏宣布文心大模型4.0正式发布 与GPT-4相比毫不逊色

    百度世界大会2023年10月17日在北京首钢园拉开帷幕,本届大会的主题为“生成未来”。在这个由百度创始人、董事长兼首席执行官李彦宏发表主题演讲的盛会上,他详细探讨了AI原生应用的最新进展,以及如何利用文心大模型进行创新应用开发。文心大模型4.0已经同步开始邀请测试。

  • 对标GPT-4代码解释器!港中大让模型写代码解决数学难题,得分超越GPT-4

    对标GPT-4代码解释器,港中大最新研究放了个“大招”:他们开发了一个叫做MathCoder的大模型,数学能力直接在竞赛级“题库”Math上超过GPT-4。做到这一点靠的就是无缝集成代码的能力——在遇到数学问题时,它不仅能用自然语言推理能自动编写和执行代码来建模、推导公式与方程。通讯作者为李鸿升,为港中大电子工程系副教授,同时也就职于上海人工智能研究室。

  • DeepMind让大模型学会归纳和演绎,GPT-4准确率提升13.7%

    大型语言模型在推理任务上表现出令人惊艳的能力,特别是在给出一些样例和中间步骤时。prompt方法往往依赖于LLM中的隐性知识,当隐性知识存在错误或者与任务不一致时,LLM就会给出错误的回答。对于GPT3.5来说,这种改进并不显著,因为在处理文本输入时,它经常产生除规则幻觉以外的错误。

  • 智谱AI发布MathGLM数学模型 算术任务性能优于GPT-4

    智谱AI发布MathGLM数学模型,旨在增强大模型在数学推理方面的性能。它能够精确计算算术运算,包括基础算术运算和复杂混合运算,并提升模型的中文数学解决能力。MathGLM还在解决不同年级数学问题和数学应用题上进行了实验,取得了较好的结果。

  • GPT-4竟成Nature审稿人?斯坦福清华校友近5000篇论文实测,超50%结果和人类评审一致

    【新智元导读】斯坦福学者发现,GPT-4对于Nature、ICLR的论文给出的审稿意见,竟然和人类审稿人有超过50%的相似性。看来让大模型来帮我们审论文,并不是天方夜谭啊。他的研究兴趣涉及计算社会科学、社会计算和数据科学。

  • 34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%

    数学通才「猛犸」模型给开源语言模型带来了「推理春天」,面对GPT-4都有一战之力!数学推理问题是语言模型绕不过的痛点,在各种黑科技的加持下,开源模型的推理性能依然不够看。滑铁卢大学、俄亥俄州立大学、香港科技大学、爱丁堡大学的研究人员联合开源了一个专为「通用数学问题」定制的大模型MAmmoTH和一个指令调优数据集MathInstruct.论文链接:https://arxiv.org/pdf/2309.05653

  • GPT-4还强,20亿参数模型做算术题,准确率几乎100%

    大型语言模型在处理NLP领域的各种下游任务方面已经表现出卓越的能力。GPT-4、ChatGPT等开创性模型已经接受了大量文本数据的训练,使它们具备强大的文本理解和生成能力,能够生成连贯且上下文相关的响应,在各种NLP任务中具有高度通用性。为了评估模型在不同年级数学问题上的解决能力,该研究在K6数据集上测试评估了几种模型的性能,包括:GPT-4、ChatGPT、Chinese-Alpaca-13B、MOSS-16B、Ziya-LLaMA-13B、Baichuan-7B、ChatGLM-6B、ChatGLM2-6B和MathGLM-GLM-10B,结果如下图8所示。