首页 > 业界 > 关键词  > 人工智能最新资讯  > 正文

四项核心维度居首:百度文心一言稳居国产大模型!

2024-03-27 13:52 · 稿源: 快科技

权威评测揭晓中国大模型格局

弗若斯特沙利文近日发布《2024年中国大模型能力评测》,对15个主流大模型进行评估。

互联网巨头占据领先位置

评测显示,百度腾讯、阿里巴巴等互联网巨头的大模型位居首列,其综合表现优于初创企业。

百度文心一言拔得头筹

百度文心一言在国产大模型中表现突出,荣获数理科学、语言能力、道德责任、行业能力和综合能力五大维度的四项第一。

百度文心一言荣登国产大模型榜首

多维度综合考量

评测覆盖通用基础能力和专业应用能力两大领域,并考量数理科学、语言能力、道德责任、行业能力和综合能力等五大核心维度,以及21个细分维度。

国际模型仍具优势

整体而言,国际领先模型在通用基础能力和专业应用能力上略胜一筹,但文心一言在通用基础能力评测中表现亮眼,超越部分国际大模型。

行业趋势预测

沙利文预测,大模型的发展方向将转向多功能和小规模化。此外,自主研发、行业标准化、伦理责任和数据规范将成为持续发展的关键因素。

举报

  • 相关推荐
  • 六大国产大模型高考作文实测:讯飞星火夺冠

    2025年高考全国一卷作文题引发热议,题目以老舍、艾青、穆旦三位作家的作品为素材,要求考生探讨个体在困境中的表达方式。

  • 难哭了的高考数学题,4家国产大模型表现如何?

    2025年高考数学考试引发热议,多家AI大模型参与测试。腾讯元宝和豆包表现最优,分别获得145分和140分(满分150分),仅错1-2道题。文心一言和QWen3稍逊,得分在120分左右。测试显示,AI在选择题和基础解答题表现良好,但在涉及图像理解、向量分析等复杂题目时仍存在困难。特别是一道包含向量图的"杀手题"让所有AI失分。专家指出,国产大模型数学能力已有显著提升�

  • IDC发布中国金融大模型市场份额报告:百度智能云居首

    IDC最新报告显示,百度智能云以12.2%的市场份额位居中国金融行业生成式AI平台及解决方案厂商首位。2024年中国金融生成式AI市场规模预计达9.14亿元,百度智能云全年营收1.113亿元领跑行业。其全栈大模型解决方案覆盖基础设施、基础模型、生成平台及场景应用,已服务超600家金融机构,包括65%的央企客户。典型案例包括某头部银行构建的全行级知识检索平台,覆盖1.6万用户;银河证券部署的衍生品交易机器人累计处理询价26万次;泰康保险的AI智训系统有效提升代理人获客能力。百度通过"算力云+数据飞轮+模型平台+智能体生态"四轮驱动体系,构建了包含300+培训课程的人才认证体系,并与工信部教考中心联合颁发认证证书,当前持证学员超1万人。2025年Q1财报显示,百度智能云营收同比激增42%,金融领域成为核心增长引擎。

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 极速接入!百度千帆大模型平台宣布上线DeepSeek-R1-0528

    日前,DeepSeek R1模型完成小版本升级,目前最新版本为DeepSeek-R1-0528。 更新后的R1模型在复杂逻辑推理、长文本处理稳定性、代码生成质量等多方面能力大幅提升,整体表现已接近o3、Gemini-2.5-Pro等国际顶尖模型。 今晚,百度智能云千帆大模型平台宣布已正式上架DeepSeek-R1-0528大模型,企业用户和开发者登录千帆即可体验。

  • 荣膺四项殊荣!安凯客车以创新实力引领商用车高质量发展

    安凯客车在"运输新生态高质量发展论坛暨2025中国商用车品牌营销盛典"上斩获四项行业殊荣,包括"重大赛事交通服务突出贡献单位"和"服务金口碑称号"两项服务类奖项,以及旗下N12豪华公路客车获"公路热销车型"、E12S双层观光巴士获"旅游金口碑称号"产品类奖项。N12凭借卓越品质批量交付新疆、山东等地高端旅游市场,并出口沙特;E12S创新文旅融合模式,已在北京、上海等城市及欧美多国投入运营。安凯以"精准响应、高效处理"服务理念构建全国服务网络,连续五届获服务品牌殊荣,并圆满完成北京奥运会等重大国事交通保障任务。未来将持续以"绿智赋能"为驱动,推动中国客车全球化发展。

  • 预测大模型的工业生存法则,华为博士告诉你什么才是B端最需要的大模型!

    华为开发者大会2025期间,AI专家李良基与华为团队围绕预测大模型展开深度对话。华为提出"数据原子级表征体系"理念,旨在通过统一数据编码解决跨场景迁移难题。预测大模型已在钢铁行业成功应用,温度预测准确率远超传统方案。专家指出,AGI发展的核心在于构建知识迁移能力,未来将聚焦To B场景落地,通过统一架构实现跨领域泛化应用。华为云首创Triplet Transformer

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 一场没有“罗永浩”的直播,为百度AI正名

    5500万GMV,这可能是迄今为止,一个AI数字人单次直播带来的最高销量。 过去几年内,数字人直播代替真人主播的传言总是一波又一波,空无一人的直播基地无数手机屏幕“自动地”产生着GMV,这个画面曾经击中了无数网友的心。但现实是,这些数字人们机械重复的动作、无法随机应变的话术反而让真人主播们都松了一口气。 但这次,真正的转折点来了。6月15日,罗永浩数字�

  • 蝉联行业第一!海尔连续9年稳居谷歌&凯度BrandZ中国全球化品牌10强

    【海尔连续9年蝉联BrandZ中国全球化品牌十强】6月19日,谷歌与凯度联合发布《2025年中国全球化品牌50强》榜单,海尔位列行业第一、总榜第六,连续9年稳居中国全球化品牌前十。该榜单覆盖11个国家市场,通过品牌资产评估框架衡量中国品牌全球影响力。海尔凭借"三位一体"本土化创新体系,在全球建立10大研发中心、35个工业园,产品覆盖200多个国家。2024年海尔全球营收达4016亿元,海外收入占比超50%,连续16年蝉联全球大型家电零售量第一。海尔通过切入发达国家市场倒逼技术升级,构建智慧家庭、大健康、数字经济三大产业生态,展现出中国品牌全球化竞争新优势。