清华发布大模型性能报告：GPT-4 更懂中文的还是百度

2023-08-10 10:30 · 稿源：快科技

快科技8月10日消息，AI大模型成为今年的热点，OpenAI的ChatGPT一马当先，微软、谷歌、Meta紧随其后，国内科技巨头也迅速跟进，现在国内据说已经有上百款大模型问世了。

这么多大模型中，实力到底如何?日前清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》，将国内外的大模型做了一番对比。

该报告还探讨了这些模型在不同知识领域，如创意写作、代码编程、舆情分析、历史知识等方面的回答情况，以及其在解决实际问题中的有效性和局限性。

从生成质量、使用与性能、安全与合规三个维度，对目前市场上的7个大型语言模型进行了全面的综合评估。

清华发布大模型性能报告：GPT-4第一更懂中文的还是百度

在这7款大模型中，GPT-4获得了毫无悬念的第一，第二名是百度的文心一言，其次是GPT-3.5，后面就是Claude、讯飞星火、阿里云的通义千问及昆仑的天工。

虽然GPT-4各方面领先，但是对国内用户来说，更懂中文的大模型才是关键，这方面百度的文心一言更好，在部分中文语义理解方面，文心一言以92%的得分率排名榜首，超越讯飞星火、GPT-4。

这跟百度的大模型包含大量中文文本有关系，因此能够更好地处理本土文化相关的内容。

（举报）

相关推荐

关键词：

为编程而生？OpenAI 发布 GPT -4.1 系列模型

OpenAI 表示，GPT-4.1 是为开发者量身定制的……

openai gpt-4.1 gpt-4.1mini
第十二届百度奖学金揭晓：半数攻坚大模型，AI解锁医疗、交通新场景

4月25日，第十二届百度奖学金颁奖典礼在武汉举行的"Create 2025百度AI开发者大会"上举行。10位来自全球顶尖高校的青年学者获奖，每人获20万元科研资金。获奖者研究方向涵盖大模型、多模态学习、医疗AI等前沿领域，超半数聚焦大模型技术创新应用。百度CTO王海峰勉励青年人才共同奔赴智能时代。该奖学金自2013年设立以来已累计支持116名全球顶尖学子，提供奖金超千万元。除资金支持外，百度还通过实习、项目合作等方式搭建产学研联动平台，持续推动AI技术生态繁荣。

百度奖学金 AI开发者大会武汉无人车
荐刚刚，OpenAI发布GPT-4.1，性能暴涨、100万上下文

今天凌晨1点，OpenAI进行了技术直播发布了最新模型——GPT-4.1。除了GPT-4.1之外，还有GPT4.1-Mini和GPT4.1-Nano两款模型，在多模态处理、代码能力、指令遵循、成本方面实现大幅度提升。特别是支持100万token上下文，这对于金融分析、小说写作、教育等领域帮助巨大。由于GPT-4.1的发布，OpenAI宣布将会淘汰刚发布不久的GPT-4.5，其能力可见一斑。目前，如果想体验GPT-4.1而无法通过API身�

GPT-4.1 OpenAI 技术直播
荐刚刚，OpenAI发布GPT-image-1模型，更强吉卜力版本来啦

OpenAI发布全新图像生成模型GPT-image-1，通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数，并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能，图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著，开发者可通过API实现更多创意场景。新模型在�

OpenAI GPT-image-1 图像生成
何小鹏：我们要成为物理世界大模型第一名

快科技4月14日消息，今晚小鹏汽车创始人何小鹏发文称，我们的目标是成为物理世界大模型的第一名，推动汽车，机器人，飞行汽车领域的巨大变化。”今天，小鹏在香港举办AI技术分享会，首次披露正在研发720亿参数的超大规模自动驾驶大模型，也即小鹏世界基座模型”。未来，小鹏将通过云端蒸馏小模型的方式将基模部署到车端，给AI汽车”配备全新的大脑。小鹏世界基座�
荐AI日报：百度大招！发布文心大模型X1Turbo和AI开放计划；OpenAI免费开放轻量版Deep Research；即梦视频3.0内测

【AI日报】主要报道了AI领域的最新动态：1)百度发布文心大模型X1Turbo和4.5Turbo，性能价格优势显著；2)百度推出AI开放计划，降低开发者门槛；3)OpenAI免费开放轻量版Deep Research研究工具；4)即梦视频3.0内测展示流畅运镜和精准表情捕捉能力；5)百度发布全球首个内容操作系统"沧舟OS"；6)百度文库与网盘联合推出GenFlow超能搭子和AI笔记工具；7)Pixverse推出MCP协议简化AI视频创作；8)Tavus发布突破性唇形同步模型Hummingbird-0；9)豆包1.5深度思考模型上线，提供免费额度；10)Adobe整合OpenAI和Google模型升级Firefly创意平台；11)ImageSlider2.0即将加入Gradio核心产品线；12)李彦宏谈DeepSeek现存痛点，强调多模态能力与降本需求。

AI日报人工智能文心大模型
荐AI日报：阿里通义千问Qwen3问鼎全球开源模型；Kimi长思考模型API发布；OpenAI发布新一代GPT-4.1模型

【AI日报】汇总了近期AI领域重要动态：1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首，在指令遵循和推理能力上超越闭源模型；2)月之暗面推出Kimi长思考模型API，可解决复杂代码和数学问题；3)OpenAI发布GPT-4.1模型，性能提升显著；4)Google推出Gemini2.5Pro模型，提升开发者编码能力；5)联想发布"天禧超级智能体"，具备多模态感知能力；6)腾讯元宝上线"对话分

AI日报通义千问3 开源模型
合合信息发布“大模型加速器 2.0”，助力大模型跨越“幻觉”障碍

近日，上海合合信息科技股份有限公司（简称“合合信息”）TextIn“大模型加速器 2.0”版本正式上线，凭借其多维度升级，为降低大模型“幻觉”风险、推动大模型精准应用提供了强大助力。训练数据是影响大模型“认知能力”的关键，合合信息“大模型加速器 2.0”基于领先的智能文档处理技术，从数据源头入手，对复杂文档的版式、布局和元素进行精准解析及结构化处理，

大模型加速器合合信息智能文档处理
百度Create AI开发者大会：李彦宏发布两大新模型、多款热门AI应用、开发者全面拥抱MCP

4月25日，百度在武汉举办Create 2025开发者大会。李彦宏发布文心大模型4.5 Turbo和深度思考模型X1 Turbo，性能提升同时价格大幅下降。大会推出全球首个电商交易MCP平台，并发布数字人、智能体心响APP等多款AI应用。百度宣布未来5年培养1000万AI人才，并点亮国内首个三万卡集群。同时启动第三届"文心杯"创业大赛，最高奖金达7000万元。大会还包含6大分会场、40节AI公开课及5000平互动展区，全面展示百度AI生态布局。

百度AI大会李彦宏演讲文心大模型
荐AI日报：智谱开源32B/9B系列GLM模型并启用Z.ai域名；OpenAI发布GPT-4.1系列模型；阿里魔搭上线MCP广场

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型，并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议，支持商业用途，提升了

人工智能开源模型 GLM模型

热文

3 天
7天

清华发布大模型性能报告：GPT-4 更懂中文的还是百度

为编程而生？OpenAI 发布 GPT -4.1 系列模型

第十二届百度奖学金揭晓：半数攻坚大模型，AI解锁医疗、交通新场景

荐刚刚，OpenAI发布GPT-4.1，性能暴涨、100万上下文

荐刚刚，OpenAI发布GPT-image-1模型，更强吉卜力版本来啦

何小鹏：我们要成为物理世界大模型第一名

荐AI日报：百度大招！发布文心大模型X1Turbo和AI开放计划；OpenAI免费开放轻量版Deep Research；即梦视频3.0内测

荐AI日报：阿里通义千问Qwen3问鼎全球开源模型；Kimi长思考模型API发布；OpenAI发布新一代GPT-4.1模型

合合信息发布“大模型加速器 2.0”，助力大模型跨越“幻觉”障碍

百度Create AI开发者大会：李彦宏发布两大新模型、多款热门AI应用、开发者全面拥抱MCP

荐AI日报：智谱开源32B/9B系列GLM模型并启用Z.ai域名；OpenAI发布GPT-4.1系列模型；阿里魔搭上线MCP广场

热文

AI侵权纠纷愈演愈烈，特朗普罢免美国版权主管

在由人类创造的“AI驱动”的世界里，人类该何去何从？

三星、LG本月开始为iPhone 17批量生产OLED面板

2027 年太晚了？随着竞争加剧，iPhone 已失去光彩

C++创始人：需要改变的不是语言，而是开发者的思维方式！

2026年苹果产品迎来革命性升级：折叠屏iPhone/全新MacBook Pro

四年来，软银集团首次实现年度盈利，重振投资者信心

马斯克又看上了一项耗资 80 亿美金的铁路隧道项目

不丹率先为游客提供国家级加密支付

隐私被抛弃，监控成为主流？Meta为其AI眼镜新增人脸识别功能

AI侵权纠纷愈演愈烈，特朗普罢免美国版权主管

在由人类创造的“AI驱动”的世界里，人类该何去何从？

三星、LG本月开始为iPhone 17批量生产OLED面板

特朗普关税政策颠覆汽车行业，福特率先开启“涨价潮”！

2027 年太晚了？随着竞争加剧，iPhone 已失去光彩

C++创始人：需要改变的不是语言，而是开发者的思维方式！

基于安卓16的三星 One UI 8 本月发布首个测试版本

苹果“为彼此创造”不再？听乔纳森·艾维忆往昔、谈传承

三星推出新型微显示技术，加剧 AR 眼镜竞争

站长商机