首页 > 业界 > 关键词  > 正文

SuperClue:百度文心一言总分超GPT-3.5-Turbo

2023-07-26 08:28 · 稿源:站长之家

站长之家(ChinaZ.com)7月26日 消息:中文通用大模型综合性基准SuperClue发布了最新中文大语言模型排行榜。榜单结果显示,百度文心一言总分超GPT-3.5-Turbo,领跑国内大模型。

此次SuperCLUE从基础能力、专业能力、中文特性能力三个维度70余项子能力,选取国内外20个有代表性的可用大模型进行测评,兼具综合能力考量与中文特定任务理解积累的考察,并通过自动化测评以相对客观形式进行效果测评。

微信截图_20230726082742.png

评测基准中,基础能力包括了常见的有代表性的模型能力,如语义理解、对话、逻辑推理、角色扮演、代码、生成与创作等10项能力;专业能力包括了中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等50多项能力;中文特性能力包括了中文成语、诗歌、文学、字形等10项多种能力。

百度表示,文心一言v2.2.0版背后搭载的是文心大模型3.5,文心大模型自2019年3月发布1.0版后,现已升级到3.5版。新版本模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

举报

  • 相关推荐
  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

  • 从温室气体核查到产品LCA,SUPER DRY 干霸干燥剂系统性推进低碳转型

    11月6日,SUPER DRY干霸干躁剂在第八届中国国际进口博览会上,为其三款核心产品获得SGS颁发的生命周期评价(LCA)声明书。该认证覆盖氯化钙、硅胶和矿物干躁剂,标志企业迈出产品全生命周期环境管理关键一步。公司表示将基于LCA报告优化设计、降低碳足迹,并携手合作伙伴推动低碳转型,提升国际市场竞争力与品牌声誉,践行可持续发展承诺。

  • AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归

    本期AI日报聚焦多领域技术突破:美团发布全模态交互模型LongCat-Flash-Omni;阿里通义千问Qwen3-Max上线深度思考功能;百度文心5.0升级多模态生成能力;谷歌确认Gemini3年内发布并整合至苹果Siri;OpenAI向多国开放Sora2视频工具;云存储与AI开发工具持续优化,展现行业加速迭代态势。

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • REDMI Turbo 5 1月登场:首发天玑8500

    博主爆料称,天玑8500芯片预计1月亮相,Redmi Turbo 5将首发搭载。该芯片采用台积电4nm工艺,配备8核A725全大核设计,主频达3.4GHz,GPU为Mali-G720,性能超越骁龙8 Gen3与8s Gen4,安兔兔跑分达220万。新机还将配备1.5K直屏与大容量电池,成为Redmi Turbo系列最强机型,值得期待。

  • 首发科天玑8500!REDMI Turbo 5获认证:支持100W闪充

    继工信部入网之后,REDMI Turbo 5近日又获得了国内的3C认证,距离上市不远了。 认证信息显示,REDMI Turbo 5支持100W有线闪充,这个规格目前已经成为小米旗下主流标配。

  • REDMI Turbo 5参数出炉:首发天玑8500

    REDMI Turbo 5采用6.5英寸LTPS中尺寸直屏,电池是7500mAh,支持100W有线闪充,配备金属中框、光学屏下指纹,支持IP68级防尘防水。 另外,REDMI Turbo 5将会首发搭载天玑8500处理器,这将是联发科最强悍的天玑8系芯片。 在去年12月,天玑8400正式亮相,由REDMI Turbo 4首发,这颗芯片采用了旗舰同款全大核架构设计,拥有8个主频至高达3.25GHz的Arm Cortex-A725大核,并且二级缓存翻倍,三级缓�

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • 卢伟冰:REDMI K系列持续向上 Turbo系列会逐步接棒K系列

    小米集团总裁卢伟冰转发博主对Redmi K90 Pro的评测,称K系列将通过科技创新持续提升体验,Turbo系列将逐步接棒。Redmi产品经理表示Turbo系列将在性能和性价比上带来惊喜。今年1月发布的Turbo 4起售价1999元,4月发布的Turbo 4 Pro同样1999元起。卢伟冰强调,随着小米高端化发展,K系列定位将持续上探,去年独立的Turbo系列正是为承接K系列上移后的定位空间。据悉,Redmi Turbo 5将于今年第四季度登场,首发联发科天玑8500,定位高性能、长续航,并升级金属中框和大R角设计,质感大幅提升。

  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

今日大家都在搜的词: