首页 > 业界 > 关键词  > WebGLM最新资讯  > 正文

清华唐杰新作WebGLM 性能超WebGPT

2023-06-26 10:36 · 稿源:站长之家

站长之家(ChinaZ.com)6月26日 消息:据量子位报道,清华大学唐杰团队发布并开源了WebGLM。这是一个参数量高达100亿的联网问答聊天机器人,已经入选KDD2023会议的相关论文。用户可以向它提出任意问题,然后它会给出网上相关链接(例如维基百科和相关官网),并整理出答案。在性能对比测试中,WebGLM的表现比OpenAI的135亿参数的WebGPT还要强,而在人类评估中,甚至和1750亿参数的模型不相上下。

image.png

WebGLM的目标是通过Web搜索和检索功能来增强预训练的大语言模型,并且实现高效的实际部署。为此,作者采用了三种策略进行开发:大型模型增强检索器、自举生成器、基于人类喜好的评分器。大型语言模型增强检索器将前五个最相关的页面作为参考源,让自举生成器生成多个答案,最终评分器选择最符合人类偏好的那个答案作为最终输出。

除了WebGLM本身,唐杰团队还提出了一个网络增强问答系统的评估标准。该标准既包括参考文献,也包括最终回答,衡量相关性、信息密度、真实性(无事实错误)、无害(无暴力、色情等信息)和社会偏见程度这五个维度。评估最终回答时,标准衡量流畅度、正确性、引用准确性、客观性和冗余程度。根据评估结果,WebGLM的搜索结果虽略逊于WebGPT-175B,但比Perplexity.ai和WebGPT-13B表现更好。

项目地址:https://github.com/THUDM/WebGLM

论文地址:https://arxiv.org/abs//2306.07906

举报

  • 相关推荐
  • 大家在看
  • 挑战GPT-4V!清华&智谱开源国产多模态模型CogVLM-17B

    清华大学与智谱AI合作开发的CogVLM-17B是一款国产多模态模型,具有卓越的性能。该模型不仅可以识别图像中的对象能分辨完整可见和部分可见的物体。其深度融合方法的创新性标志着多模态模型训练范式的改变,为未来的研究和应用提供了新的思路和可能性。

  • 挑战GPT-4V!清华&智谱开源多模态14边形战士CogVLM-17B,在线可玩

    看看这张图中有几个房子?如果你回答3个,就和GPT-4V的答案一样。但是最新开源的国产多模态模型CogVLM-17B,就能看出另有玄机。不过目前仅支持英文,后续会提供中英双语版本支持,可以持续关注。

  • 开启Web3.0新纪元 第三届元宇宙共享大会成功举办

    “趋势与未来”第三届元宇宙共享大会暨Web3.0链改——绿色积分资产化实践项目签约发布会,及汇来购全生态3.0启动盛典于2023年9月26日在广东金海湾成功举办。该活动由中国移动通信联合会元宇宙产业工作委员会,中国通信工业协会区块链专业委员会联合主办;亚洲区块链综合管理机构,汇来购经济服务平台共同承办。为推动社会走向数字文明新时代,共建元宇宙技术创新生态体系,推动元宇宙可持续健康发展。

  • Web3时代加速到来 欧科云链持续推动科技创新应用落地

    世界正处于从商业文明转向价值文明的时代,作为人类历史上最伟大的发明之一,互联网也面临着变革和发展,价值互联网被称为人类社会网络系统进化的最高形式Web3则被认为是最接近价值互联网的产业形态。在元宇宙、NFT等热潮涌起之下,Web3看似并不遥远,作为下一代互联网存在方式的最大可能性,Web3已经构建了完整的模式概念,最为大众所熟知的是其强调用户在互联网拥有自主权,用户与建设者共建共享,以此完成数据资产权属的回归。随着Web3时代的加速来临,区块链多链生态逐步发展,像欧科云链这样的拥有核心优势且不断深耕探索的区块链大数据企业必将迎来属于自己的黄金时代。

  • 第三届元宇宙共享大会|甘华鸣:高屋建瓴地认识Web3.0/元宇宙和区块链积分

    2023年9月26日,“趋势与未来”第三届元宇宙共享大会暨Web3.0链改——绿色积分资产化实践项目签约发布会及汇来购全生态3.0启动盛典在广东惠州金海湾成功举办。该活动由中国移动通信联合会元宇宙产业工作委员会、中国通信工业协会区块链专业委员会联合主办,亚洲区块链综合管理机构、汇来购经济服务平台共同承办,物链芯工程技术研究院,央链直播联合协办。为推动社会走向数字文明新时代,共建元宇宙技术创新生态体系,推动元宇宙可持续健康发展。

  • Tubi推出基于ChatGPT的影视推荐聊天机器人Rabbit AI

    在线影视平台Tubi日前宣布,将推出一款基于ChatGPT的智能聊天机器人RabbitAI,以提升用户的内容发现和交流体验。这标志着娱乐内容推荐正式进入人工智能时代。随着技术的进步,基于人工智能的创新应用有望不断涌现,给用户带来更好的个性化体验。

  • 清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

    为了验证大语言模型的沟通、规划、反思等拟人化能力,清华研究团队发布了一篇名为“探索大语言模型在交流游戏中的应用:《狼人杀》实验”的研究论文。通过ChatGPT构建的7个玩家,在《狼人杀》游戏中展示出了信任、对抗、伪装和领导的拟人化能力研究人员没有进行任何干预和教导。经过几十轮拼杀,最终村民获胜,在整个过程中AI所展示出的能力与人类几乎一样,有的地方甚至超过。

  • Stability AI发布移动端语言模型Stable LM 3B

    StabilityAI发布了最新的语言模型StableLM3B,该模型是为便携式数字设备设计的,参数规模为30亿,比行业通常使用的70亿参数模型要小,具有更高的性能和可移植性。StableLM3B具有较小的体积和高效性的优势,需要更少的资源和较低的运行成本,使其对大多数用户来说更加可承受。该模型已在HuggingFace平台上发布,可以下载权重进行尝试。

  • GitHub Copilot让陶哲轩感到“不安”

    GitHubCopilot,又一次被数学大神陶哲轩“点名”了:并且陶哲轩还给出了一个具体的案例做阐述。例如在上面这个例子中,陶哲轩先是将一个积分分成了三块。这篇文章对于理解非负量的和或积分的估计方法以及它们在各个领域中的应用具有重要意义。

  • 迟到4年的升级!树莓派发布Raspberry Pi 5:4核A76性能翻倍

    树莓派自问世以来,受到了众多计算机发烧友和创客的追捧。不过让人没想到的是,在2019年6月发布RaspberryPi4之后的4年时间里,树莓派竟然一直没有再推出过新品。GPU方面则是800MHzVideoCoreVII,並有512KBL2缓存和2MBL3缓存,内存容量有4GB和8GB二个版本,售价分别为60美元和80美元,几乎于10月份上市销售。

今日大家都在搜的词: