首页 > 业界 > 关键词  > WebGLM最新资讯  > 正文

清华唐杰新作WebGLM 性能超WebGPT

2023-06-26 10:36 · 稿源:站长之家

站长之家(ChinaZ.com)6月26日 消息:据量子位报道,清华大学唐杰团队发布并开源了WebGLM。这是一个参数量高达100亿的联网问答聊天机器人,已经入选KDD2023会议的相关论文。用户可以向它提出任意问题,然后它会给出网上相关链接(例如维基百科和相关官网),并整理出答案。在性能对比测试中,WebGLM的表现比OpenAI的135亿参数的WebGPT还要强,而在人类评估中,甚至和1750亿参数的模型不相上下。

image.png

WebGLM的目标是通过Web搜索和检索功能来增强预训练的大语言模型,并且实现高效的实际部署。为此,作者采用了三种策略进行开发:大型模型增强检索器、自举生成器、基于人类喜好的评分器。大型语言模型增强检索器将前五个最相关的页面作为参考源,让自举生成器生成多个答案,最终评分器选择最符合人类偏好的那个答案作为最终输出。

除了WebGLM本身,唐杰团队还提出了一个网络增强问答系统的评估标准。该标准既包括参考文献,也包括最终回答,衡量相关性、信息密度、真实性(无事实错误)、无害(无暴力、色情等信息)和社会偏见程度这五个维度。评估最终回答时,标准衡量流畅度、正确性、引用准确性、客观性和冗余程度。根据评估结果,WebGLM的搜索结果虽略逊于WebGPT-175B,但比Perplexity.ai和WebGPT-13B表现更好。

项目地址:https://github.com/THUDM/WebGLM

论文地址:https://arxiv.org/abs//2306.07906

举报

  • 相关推荐
  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • 腾讯Kuikly框架进一步开源,新增支持Web,开启一码五端新体验!

    腾讯开源的跨端开发框架Kuikly基于Kotlin Multiplatform技术,新增Web版支持H5和微信小程序。相比主流跨端方案,Kuikly Web版采用DOM渲染,包体积仅463KB,加载速度快,兼容性好,支持SEO优化。已在腾讯多款业务中应用,日活用户超5亿。未来将持续优化性能,探索WASM技术,并计划开源Electron适配版本。

  • AI日报:腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcher;我国首个法律垂直大模型“小包公”发布

    本文介绍了AI领域最新动态:1)腾讯推出电影级音频生成工具AudioGenie,展现中国AI技术实力;2)阿里开源多模态智能体WebWatcher,突破现有系统局限;3)港大等高校联合推出3D建模技术OmniPart,实现模型组件独立性和清晰度;4)Meta发布无需标注数据的通用图像处理模型DINOv3;5)国内首个法律大模型"小包公"发布;6)ChatGPT移动端收入突破20亿美元;7)安卓厂商借鉴灵动岛设计,新芯片推动AI功能普及;8)欧洲AI公司推出仅94MB的超小模型;9)Claude Code新增编程教学模式;10)AI技术被滥用于电商恶意退款;11)IDC报告显示2024年中国AI公有云服务市场将快速增长。

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • 大厂盯上AI玩具,你的下一个LABUBU可能出自阿里

    在2025年下半年,大厂的AI争夺战已经卷到了玩具上。 前有OpenAI宣布与玩具巨头美泰合作,后有马斯克推出AI伴侣,如今,京东更是大张旗鼓地要涉足AI玩具赛道。

  • AI工具导航网站哪个好?如何更快找到真正适合自己的高效AI工具?AIbase帮你解决难题

    AIbase导航平台致力于帮助用户快速精准地找到优质AI工具。通过严格筛选与分类,提供主流高效工具,避免信息冗余。支持多维度深度对比,包括核心功能、模型基础、价格及用户真实评价,助用户理性选择。一键直达官方入口,省去繁琐步骤,确保安全可靠。适合AI新人、效率追求者及专业人士使用,提升工作效率,降低试错成本。

  • HKTWeb3 交易平台正式上线,打造链上资产与实体金融桥梁

    HKTWeb3交易平台将于2025年8月2日在香港正式上线。该平台以"安全、合规、透明"为核心,致力于连接链上资产与实体金融世界,提供六大核心业务模块:链上信托、链上贸易、链上金融、HKT钱包、交易平台和锚定资产储备。平台接受香港持牌信托公司监管,确保资金流转、交易撮合等环节的合规性。作为全球首批采用"实体承兑+链上信托"架构的数字资产平台,HKTWeb3旨在构建服务实体经济的Web3基础设施,推动数字资产在投资、支付等现实场景的应用。平台将与香港Web3科技协会合作,加速本地生态建设。

  • B站发布2025年Q2财报:AI内容成增长最快科技品类

    近日,哔哩哔哩(以下简称“B站”)公布了截至2025年6月30日的第二季度未经审计财务报告。数据显示,本季度B站总营收达73.4亿元人民币,同比增长20%,在整体市场环境中展现出强劲的增长态势。 从业务板块来看,各业务均呈现出积极的发展趋势。广告业务收入为24.5亿元,同比增长20%。游戏业务同样表现出色,收入达16.1亿元,同比增长60%。增值服务业务收入进一步提升至28.

  • 哪里找最新AI工具官网?如何快速对比ChatGPT替代品?AI工具导航指南 - AIbase

    文章探讨了在AI工具爆炸式增长的时代,用户面临的信息过载和筛选困难问题。主要内容包括:1)AI领域迭代速度远超传统软件,个人追踪信息效率低下且容易错过关键更新;2)AIbase.cn平台致力于解决这一问题,通过聚合主流AI工具、严格审核信息来源、持续更新行业动态;3)平台提供多维对比功能,结构化呈现工具参数,帮助用户快速定位适合需求的解决方案;4)建议用户定期浏览平台资讯栏目,善用搜索筛选功能,通过对比视图做出明智选择。核心价值在于降低信息筛选成本,让用户更高效地获取有价值的AI工具和前沿资讯。

  • 华为即将发布AI推理领域突破性成果:或能降低对HBM内存依赖

    华为将于8月12日在2025金融AI论坛发布AI推理领域突破性技术成果。该技术有望降低中国AI对HBM高带宽内存的依赖,提升大模型推理性能,完善国内AI生态。HBM作为3D堆叠DRAM方案,具有高带宽、低延迟等优势,是高端AI芯片标配,但面临产能紧张和美国出口限制。国内厂商正探索Chiplet封装、低参数优化等替代方案。

今日大家都在搜的词: