首页 > 业界 > 关键词  > 正文

SuperCLUE:GPT-4 Turbo中文基准评测领先国内模型超过30分

2023-11-09 14:19 · 稿源:站长之家

站长之家(ChinaZ.com)11月9日 消息:GPT-4Turbo 是 OpenAI 发布的最新 ChatGPT 模型,具有128K 上下文和训练数据知识截止至2023年4月。

SuperCLUE表示,GPT-4Turbo在 SuperCLUE-OPEN 中文通用大模型综合性评测基准上,取得了总分98.4,八项基础能力满分,领先国内最强模型超过30分。

从定量和定性分析来看,GPT-4Turbo 在各项任务上表现出色,具有强大的计算能力、代码理解、逻辑推理、知识百科、生成创作等能力。

微信截图_20231109141209.png

根据 SuperCLUE 的评测结果,GPT-4Turbo 在中文基准上表现出了非常强大的能力。

以下是一些主要的总结:

1. GPT-4Turbo 在 SuperCLUE-OPEN 基准上取得了98.40的高分,较上一代 GPT4有10.33分的提升。

2. 在十项基础任务中,GPT-4Turbo 有8项能力取得了满分,包括知识百科、代码、逻辑推理、工具使用等。

3. 与国内大模型相比,GPT-4Turbo 在综合能力上处于绝对领先,总分领先国内最强模型30分以上。

4. GPT-4Turbo 支持更长的输入文本,每次可以输入300多页的内容,相当于10万汉字。

5. GPT-4Turbo 对函数调用、指令和 JSON 模式进行了调优,提高了模型的性能。

举报

  • 相关推荐
  • 中国UP主成为不了MrBeast

    影视飓风创始人Tim刚刚结束的“100小时荒岛直播挑战”,无疑是一次B站在这个夏天难得的现象级事件——B站累计超过四千万观众进入直播间,全平台总观看量超过两亿,弹幕数以百万计,甚至带动了直播带货的即时转化。 从数据到热搜,此次直播堪称完美演绎了“爆款”的逻辑。 质疑声同样随之而来:这场直播与其说是“荒岛生存”,不如说是“带电度假”;也评论认为,它

  • 真我Neo7 Turbo AI版发布 首款动感地带AI手机

    日前,真我Neo7TurboAI版发布,这是真我联合中国移动打造的首款动感地带AI手机。 与真我Neo7Turbo标准版相比,新机后盖多了中国移动Logo。 官方表示,真我Neo7TurboAI版将带来极速性能、偶像陪伴、运动竞技、云端空间、社交潮流五大专属体验。 真我Neo7TurboAI版负一屏植入芒果卡俱乐部,集成芒果TV、咪咕视频等App,自带咪咕体育、咪咕快游会员,支持中国移动云盘等服务。 据�

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • 领先苹果 有望国内首发eSIM!华为三折叠Mate XTs今日发布 定价有惊喜

    今天华为将举办新品发布会,而大家期待多时的三折叠Mate XTs非凡大师届时将会登场亮相。 从目前曝光的消息看,华为Mate XTs非凡大师将搭载性能更强劲的麒麟9020s处理器,采用1 x 2.5GHz泰山大核、32.15GHz泰山中核及41.6GHz小核的三丛集架构。 芯片整合了主频高达840MHz的Maleoon 920 GPU,相比上一代的性能将提升40%,功耗降低20%。 此外,这次华为Mate XTs有望国内首发eSIM技术,取消物�

  • 永恒之声,现代演绎 Technics 推出全新直驱式唱盘机SL40C/40CBT

    Technics推出全新SL-40C/40CBT直驱唱盘系统,融合高端机械技术与现代设计。该产品延续品牌经典特性,如无芯直驱电机和高精度S形铝合金唱臂,同时升级外观与易用性。配备预装唱头、内置唱头放大器,支持蓝牙连接(仅40CBT型号),提供三种现代配色。旨在满足HiFi用户和现代家庭音频爱好者的需求,兼顾音质与便捷体验。

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • 中国品牌TOP1!海尔壁挂炉逆势增长43%

    2025年上半年中国壁挂炉行业整体销量下滑3.6%,市场趋冷。然而海尔壁挂炉逆势增长43.29%,凭借“双冷凝”节能科技获评“国际领先”技术,解决传统产品高能耗、水温不稳、预热时间长等痛点。其AI智能算法精准控温,配合水联网平台提供全流程解决方案,实现从产品制造到场景服务的跨越,为行业指明节能化、智能化、用户需求导向的发展方向。

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • 从1920TPS到2400TPS,华为云Tokens服务全面接入384超节点

    华为云在2025年8月27日宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,实现单芯片最高2400TPS吞吐量和50ms低延迟,性能超越业界水平。该服务基于MaaS模式,提供多种规格选择,支持大模型和AI工具,助力企业快速开发AI应用。同时,华为云与超100家伙伴合作,深入行业场景,共建智能生态,加速各行业AI落地。

今日大家都在搜的词: