清华报告：文心一言4.0多项指标

2024-04-23 07:52 · 稿源：快科技

根据清华大学基础模型研究中心发布的《2024年3月SuperBench大模型综合能力评测报告》，14个具有广泛影响力的模型进行了评估。

国内领先模型文心4.0表现抢眼，接近国际顶尖水平，差距逐渐缩小。

在人类对齐能力评估中，文心4.0位居国内第一。

中文推理和语言评估中，文心4.0遥遥领先，与其他模型差距明显。在中文理解方面，其领先优势更甚，高于第二名的GLM-4超过0.41分。

语义理解数学能力评估中，文心4.0与Claude-3并列全球第一，GPT-4系列模型位于第四和第五位。其他模型得分集中在55分左右，远低于领先群体。

阅读理解能力评估中，文心4.0超越GPT-4 Turbo、Claude-3和GLM-4，取得最高成绩。

企业关注的安全性评估中，文心4.0表现出色，压过国际一流的GPT-4系列模型和Claude-3，获得最高分（89.1分），而Claude-3仅位列第四。

自2023年3月16日文心一言首次发布以来，用户数量已超过2亿，每日API调用量超过2亿次。

（举报）

相关推荐

关键词：

张朝阳卢伟冰发文悼念杨振宁清华大学、西湖大学官网已转为黑白

今日，享誉世界的物理学家、诺贝尔物理学奖获得者，中国科学院院士，清华大学教授、清华大学高等研究院名誉院长杨振宁先生，因病在北京逝世，享年103岁。消息传出，清华大学、西湖大学、搜狐创始人张朝阳、小米总裁卢伟冰等各界纷纷发文深切悼念杨振宁先生。张朝阳在社交平台悼念称：学界怀念杨先生。

杨振宁清华大学诺贝尔物理学奖
十方融海小智AI：以科技温度诠释“人工智能+”时代的人文关怀

近日，小女孩“小十三”与十方融海研发的小智AI机器人深情告别的视频走红网络。这段1分17秒的对话不仅让无数网友泪目，更展现了AI技术的情感温度。十方融海团队迅速响应，跨越600公里为女孩送上定制版机器人作为生日礼物，并推出儿童心理陪伴计划。该事件体现了“人工智能+教育”的深刻内涵，彰显科技企业的人文关怀与社会担当，成为“技术向善”的生动实践。
荐市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

9月24日，阿里巴巴股价创下四年新高，单日涨超9%，市值达到约3.32万亿港元，一日增加近3000亿港元。引爆股价的，是阿里集团每年一度的云栖大会。在会上，阿里释放多条重磅消息，尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后，阿里的股价表现就出现了明显的拉升。

阿里巴巴云栖大会股价
微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

微算科技开发了延迟和隐私感知卷积神经网络分布式推理技术，通过创新队列机制和深度强化学习优化CNN推理过程，结合分布式计算与隐私保护机制，在降低边缘设备计算延迟的同时强化数据隐私。该技术将推理任务智能分配到不同节点，减少数据传输范围，实现高效推理与隐私安全的平衡，为智能医疗、交通等领域提供可靠解决方案。

人工智能深度学习隐私保护
“人工智能+”时代，企业做对什么才能抢占先机？

国务院8月26日发布《关于深入实施“人工智能+”行动的意见》，提出加快AI技术与实体经济深度融合，推动产业智能化升级。到2035年，我国将全面步入智能经济和社会新阶段。金蝶集团作为企业数字化服务商，以“AI优先”为战略，将AI技术深度融入SaaS产品与服务，推出金蝶云·星空EMA平台及多款智能产品，覆盖财务、供应链、差旅等场景，助力企业构建“AI+业务”新能力，实现高效管理与创新发展。

人工智能数字化转型产业智能化
腾讯云安全发布人工智能风险评估框架，助企业构建可信智能体

9月17日，腾讯云在2025全球数字生态大会上发布人工智能风险控制框架及多款安全产品。该框架涵盖六大风险模块、七层级、130余项措施，系统性应对AI应用全生命周期的安全挑战，包括数据泄露、供应链隐患及权限滥用等核心问题。同时推出LLM-WAF防火墙、AI-SPM态势管理等产品，构建覆盖研发、部署、运维的全链路防护体系，助力企业建立可信、稳定的AI服务生态。

AI安全智能体安全风险评估
2025 世界设计之都大会“创意可计算性：设计人工智能”，特赞升级五大内容+AI解决方案

2025年9月25日至28日，上海将举办世界设计之都大会（WDCC2025），主题为“设计无界，生生不息”。大会聚焦人工智能赋能设计创新，探讨设计如何驱动产业与城市可持续发展。特赞科技作为内容与AI领域代表企业，将展示“计算×创意”如何拓展设计生命力，包括跨行业赋能、产教融合及人机协作三大板块，呈现AI在打破学科边界、推动产业创新中的实践。WDCC2025旨在为全球设计领域注入新动能，构建“设计×科技×可持续”的新想象空间。

世界设计之都大会设计无界设计人工智能
寒武纪深耕智能芯片技术与软件生态助力大模型应用落地

良好的软件环境能降低AI应用开发门槛，增强用户粘性，对AI芯片发展至关重要。寒武纪专注AI芯片研发，掌握处理器架构、SoC设计等硬件技术及编程框架、编译器、驱动等软件技术。通过芯片、硬件板卡、基础软件三大团队协同，为产品提供全链条技术支持，并构建开发者生态。未来将通过开放生态推动云计算、金融、医疗等行业的智能化升级，以市场为导向保持技术领先。

人工智能芯片软件平台大模型应用
金融行业用好大模型，只有“垂直”一个解

文章探讨大模型在金融等复杂业务场景的落地挑战，指出通用模型难以满足行业对准确性、可解释性及合规性的高要求。垂直模型通过内化行业核心知识与能力，成为解决复杂业务问题的关键路径。实践显示，金融垂直模型已在营销、客服、风控等场景实现显著成效，如提升效率80%、降低风险。未来需通过数据飞轮、深度适配等技术实现模型持续迭代，构建一站式金融垂直模型生产工场。

金融大模型垂直模型 Agentic
铭凡获艾媒咨询“铭凡获艾媒咨询“高性能迷你电脑全球销量领先品牌”等多项市场地位确认

近期，铭凡获艾媒咨询授予六项市场领先认证，彰显其在迷你电脑领域的全球领导地位。行业正经历AI技术变革，从边缘办公工具崛起为消费电子热门品类。铭凡凭借紧凑体积与高性能的平衡，满足现代数字生活对高效能、灵活部署和空间美学的综合需求。其旗舰产品X1Pro-370搭载AMD锐龙AI9 HX370处理器，集成NPU提供80TOPS算力，支持大模型本地运行，打破迷你主机性能瓶颈。未来，铭凡将继续引领行业向AI化、专业化发展，构建以迷你电脑为核心的数字生态系统。

铭凡迷你电脑 AI迷你电脑

今日大家都在搜的词：

热文

3 天
7天

清华报告：文心一言4.0多项指标

张朝阳卢伟冰发文悼念杨振宁清华大学、西湖大学官网已转为黑白

十方融海小智AI：以科技温度诠释“人工智能+”时代的人文关怀

荐市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

“人工智能+”时代，企业做对什么才能抢占先机？

腾讯云安全发布人工智能风险评估框架，助企业构建可信智能体

2025 世界设计之都大会“创意可计算性：设计人工智能”，特赞升级五大内容+AI解决方案

寒武纪深耕智能芯片技术与软件生态助力大模型应用落地

金融行业用好大模型，只有“垂直”一个解

铭凡获艾媒咨询“铭凡获艾媒咨询“高性能迷你电脑全球销量领先品牌”等多项市场地位确认

今日大家都在搜的词：

热文

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

火车免费坐？12306今起又上新功能：积分可兑换车票

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

苹果天猫双11今晚开卖 iPhone17pro天猫官旗首次降价

天猫双11今晚8点开卖品类券每人可领万元

真我GT8官宣搭载Pro同款理光GR影像系统

REDMI K90 Pro Max搭载6.9英寸超级像素屏幕

百度网盘正式适配安卓实况照片：iOS和安卓可跨系统互传

REDMI K90 Pro Max搭载第五代骁龙8至尊版+独显芯片D2

微信回应人去世了朋友圈会消失吗：长时间不使用账号已不再回收

AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

小米推出短剧App围观短剧：主打无广告免费看

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

王腾首次回应下一步计划：称在考虑些创业项目

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

站长商机