首页 > 业界 > 关键词  > 百川智能最新资讯  > 正文

百川智能发布大模型Baichuan3 称中文评测超越GPT-4

2024-01-29 13:48 · 稿源:站长之家

站长之家(ChinaZ.com) 1月29日 消息:百川智能于 1 月 29 日推出了拥有超过千亿参数的大型语言模型Baichuan 3。该模型在多个公认的通用能力评估,如CMMLU、GAOKAO和AGI-Eval等,都展示了卓越的表现,特别是在中文任务上更是超过了GPT- 4 的水平。同时,该模型在数学和代码方面的评估,如MATH、HumanEval和MBPP等,也有着优秀的成绩,证明了Baichuan3 在自然语言处理和代码生成领域的强劲实力。

百川大模型,百川智能

百川智能还表示,其在逻辑推理能力和专业性要求很高的MCMLE、MedExam、CMExam等权威医疗评估上的中文效果也超过了GPT-4,成为中文医疗任务中表现最好的大型模型。Baichuan3 还突破了“迭代式强化学习”技术,进一步增强了语义理解和生成能力,在诗词创作的格式、韵律、表意等方面表现出色,领先于其他大型模型。

为了保证在数千张GPU上高效且稳定地训练超千亿参数模型,百川智能同时优化了模型的训练稳定性和训练框架,并采用了“异步CheckPoint存储”机制,可以在不损失性能的情况下增加存储的频率,减少机器故障对训练任务的影响,使Baichuan3 的稳定训练时间达到一个月以上,故障恢复时间不超过 10 分钟。

训练效率方面,百川智能针对超千亿参数模型的并行训练问题进行了一系列优化,如高度优化的RoPE, SwiGLU计算算子;在数据并行中实现参数通信与计算的重叠,以及在序列并行中实现激活值通信与计算的重叠,从而有效降低了通信时间的比重;在流水并行中引入了将激活值卸载至CPU的技术,解决了流水并行中显存占用不均的问题,减少了流水并行的分段数量并显著降低了空泡率。通过这些技术创新,Baichuan3 的训练框架在性能方面相比业界主流框架提升超过30%。

官方表示,作为参数规模超过千亿的大语言模型,Baichuan3 不仅英文效果达到接近GPT- 4 的水平,还在多项通用中文任务的表现上实现了对GPT- 4 的超越,是百川智能的全新里程碑。Baichuan3 全面的通用能力以及在医疗领域的强大表现,将为百川智能打造“超级应用”,把大模型技术落地到诸多复杂应用场景提供有力支撑。

举报

  • 相关推荐
  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 六项第一!百度文库再获国家工信安全中心认证,持续领跑智能PPT行业

    国家工信安全中心发布《大模型赋能智慧办公评测报告》,对8款主流AI生成PPT产品进行综合评估。百度文库在生成质量、排版美化等六项指标中全部位列第一,持续领跑智能PPT行业。报告显示当前产品已基本满足日常需求,但专业度和时效性仍有提升空间。百度文库依托海量专业文档资源,在产业研究、教育培训等场景表现突出,月活用户超9700万,智能PPT功能月访问量全球第一。

  • 百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5

    今天,在WAVE SUMMIT深度学习开发者大会2025上,百度文心大模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。 百度王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架。 一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练

  • 苹果Apple Watch高血压通知功能上线

    苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能,该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验,但加拿大等部分市场尚未开放,中国大陆地区仍需等待监管审批。该功能依托光学心率传感器,可实时监测用户血管对心跳的反应,识别慢性高血压迹象,并在检测到异常时发出提醒。系统会分析用户最近30天的数据,通过先进算法判断是否需要发出通知。

  • 旧款Apple Watch也将支持高血压警报:涉及这三款

    苹果在发布Apple Watch Series11与Ultra3两款新品之际,同步宣布了一项惠及旧款用户的重大更新——通过即将到来的watchOS26系统升级,Apple Watch Series9、Series10以及Ultra2三款旧机型也将新增高血压警报功能。这一举措意味着,部分持有旧款设备的用户无需更换新表,即可享受到这一前沿的健康监测服务。 watchOS26正式版定于9月15日正式向全球用户推送。新增的高血压警报功能依托于Appl

  • 苹果Apple Watch Series 11发布:新增高血压检测提醒

    今日凌晨,苹果公司正式推出全新一代智能手表Apple Watch Series11。这款新品以“最薄、最舒适”为设计核心,同时显著提升了耐用性,起售价定为399美元。 Apple Watch Series11在材质上实现突破,采用全新玻璃材质并覆盖苹果特制陶瓷涂层,抗刮性能较前代提升两倍,为用户提供更可靠的日常使用体验。网络支持方面,该系列首次引入5G功能,中国电信、中国移动、中国联通三大运

  • 华为穿戴音频新品发布会定档9月24日:WATCH GT6等将发布

    今日,华为官方正式宣布,将于9月24日举办穿戴音频新品发布会,届时备受期待的华为WATCH GT6系列智能手表与华为FreeClip2耳夹耳机二代将同台登场,引发科技圈与消费者的高度关注。 作为本次发布会的重头戏,华为WATCH GT6系列将成为GT系列首款支持星闪技术的智能手表。据透露,该系列预计推出WATCH GT6和WATCH GT6Pro两款机型,覆盖41mm至46mm表盘尺寸,满足不同用户需求。其中,�

  • 永恒之声,现代演绎 Technics 推出全新直驱式唱盘机SL40C/40CBT

    Technics推出全新SL-40C/40CBT直驱唱盘系统,融合高端机械技术与现代设计。该产品延续品牌经典特性,如无芯直驱电机和高精度S形铝合金唱臂,同时升级外观与易用性。配备预装唱头、内置唱头放大器,支持蓝牙连接(仅40CBT型号),提供三种现代配色。旨在满足HiFi用户和现代家庭音频爱好者的需求,兼顾音质与便捷体验。

  • Apple Watch SE3发布:配备全天候显示屏、支持5G

    Apple Watch SE 3正式发布。 作为苹果智能手表产品线的高性价比代表,它在功能和体验上迎来诸多升级,为用户带来更出色的使用感受。 在核心性能方面,Apple Watch SE 3搭载了S10芯片。这一芯片不仅驱动着更多精彩功能,还让手表支持双指互点两下和轻翻手腕等便捷手势操作,大幅提升了交互的流畅性与趣味性。 显示体验上,它配备了全天候显示屏,无需唤醒屏幕,用户就能轻

今日大家都在搜的词: