王小川旗下百川智能发布Baichuan-13B大模型 130亿参数开源可商用

2023-07-11 13:33 · 稿源：站长之家

站长之家（ChinaZ.com）7月11日消息:继Baichuan-7B之后，近日，王小川旗下百川智能再次发布Baichuan-13B大模型。

据介绍，Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含130亿参数的开源可商用的大规模语言模型，在权威的中文和英文 benchmark 上均取得同尺寸最好的效果。本次发布包含有预训练（Baichuan-13B-Base）和对齐 (Baichuan-13B-Chat) 两个版本。

微信截图_20230711133555.png

Baichuan-13B 有如下几个特点:

更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到130亿，并且在高质量的语料上训练了1.4万亿 tokens，超过 LLaMA-13B40%，是当前开源13B 尺寸下训练数据量最多的模型。支持中英双语，使用 ALiBi 位置编码，上下文窗口长度为4096。
同时开源预训练和对齐模型:预训练模型是适用开发者的『基座』，而广大普通用户对有对话功能的对齐模型具有更强的需求。因此本次开源我们同时发布了对齐模型（Baichuan-13B-Chat），具有很强的对话能力，开箱即用，几行代码即可简单的部署。
更高效的推理:为了支持更广大用户的使用，我们本次同时开源了 int8和 int4的量化版本，相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛，可以部署在如 Nvidia3090这样的消费级显卡上。
开源免费可商用:Baichuan-13B 不仅对学术研究完全开放，开发者也仅需邮件申请并获得官方商用许可后，即可以免费商用。

【HuggingFace】

预训练模型:https://huggingface.co/baichuan-inc/Baichuan-13B-Base

对话模型:https://huggingface.co/baichuan-inc/Baichuan-13B-Chat

【GitHub】

https://githuB.com/Baichuan-inc/Baichuan-13B

【Model Scope】

预训练模型:https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Base/

对话模型:https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Chat/

（举报）

相关推荐

关键词：

以开放，致无界：海信发布三款划时代激光显示新品，并逐步开放1300余项专利

9月19日，海信在青岛举办2025激光显示技术与产业发展大会，以“无界”为主题发布三款创新产品：全球首款150英寸屏幕发声激光电视探索X1Ultra、首款100英寸可卷曲激光影院江山画卷R1及投影Vidda C5无界。海信宣布将向全行业开放1300余项三色激光核心专利，推动产业协同发展，构建开放、协同、可持续的激光显示生态。

激光显示技术海信激光电视三色激光专利
vivo X300系列四色公布将于10月13日发布

9月23日，vivo正式公布旗舰机型X300系列配色方案：X300 Pro提供旷野棕、简单白、自在蓝、纯粹黑四款，标准版则带来幸运彩、惬意紫、自在蓝、纯粹黑四种选择，满足用户个性化需求。该系列配备超薄直屏，Pro版厚度仅7.99mm，标准版为7.95mm，兼顾轻薄与手感。全系搭载与X200 Ultra同款的蔡司2.35x长焦增距镜，支持多种拍摄模式，覆盖风光、人像等场景，实现“望远巨炮”般拍摄体验。此外，vivo还推出银色增距镜作为时尚配饰。新品将于10月13日19:00正式揭晓。

vivo X300系列旗舰机型
上市13个月连当13个月纯电A级轿车销冠！小鹏Mona M03累计交付18万台

小鹏MONA M03上市13个月累计交付18万台，连续月交付超1万台，连续13个月获纯电A级车销量冠军。5月28日推出M03 Max版，售价12.98万-13.98万元，搭载自研视觉智能辅助驾驶方案，算力达508Tops，支持全场景智能泊车辅助，将智能驾驶价格拉低至13万级。新车配备电动掀背尾门、超600L后备厢，风阻系数0.194，百公里电耗11.8kWh，支持快充，15分钟补能200公里。凭借高性价比与智能配置，M03系列持续热销。

小鹏MONA M03 纯电A轿销量冠军
荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

快手发布KAT系列代码大模型，腾讯推出“混元图像3.0”实现多模态突破，苹果研发类ChatGPT应用升级Siri，谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型，YouTube Music测试AI音乐主播功能，VideoFrom3D框架简化3D视频生成，Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型，展现强大性能。

AI日报快手KAT系列大模型
海信开放1300余项三色激光专利，助推激光显示产业 “破界” 前行

9月19日，海信在青岛举办激光显示技术大会，发布多款创新产品：全球首款150英寸屏幕发声激光电视X1 Ultra、100英寸可卷曲激光影院江山画卷R1及投影Vidda C5。海信通过折叠屏技术实现尺寸突破，并推动三色激光技术普及，宣布开放1300余项核心专利，促进产业协同创新。激光显示因护眼优势获医学界认可，正重塑产业价值。

激光显示产业合作技术突破
荐超1300亿！“星巴克祖师爷”被卖了

千亿并购接踵而至，巨头出售传闻不断，全球咖啡市场又迎来了新变局。这次站在聚光灯下的，是有着“星巴克之父”之称的精品咖啡标杆——皮爷咖啡。 8月25日，美国饮料巨头Keurig Dr Pepper（以下简称KDP）抛出重磅消息，公司将重金收购皮爷咖啡母公司JDE Peet's，总股权对价高达157亿欧元(约合人民币1300亿元)。这笔交易的双方，分别是饮料领域与咖啡领域的实力玩家。KDP�

咖啡市场皮爷咖啡 KDP收购
四川人3000年前就是“氪金”大佬三星堆最新考古成果公布

三星堆遗址最新考古成果揭示，三千年前古蜀人已展现出对黄金的极致热爱与精湛工艺，堪称“氪金”鼻祖。这一发现颠覆了人们对古蜀文明财富观的认知，为研究古代文化交流与工艺发展提供了全新视角。古蜀人在制作祭祀礼器和彰显权力地位时，毫不吝惜地投入当时最珍贵的黄金资源，其奢华程度与现代“氪金”含义不谋而合。出土的黄金器物工艺复杂、造型独特，充分展现了古蜀人的创造力和审美水平。尤为值得注意的是，古蜀人尚未掌握焊接技术，却能通过精湛工艺将黄金打造成精美器物，说明他们已深刻掌握金银材质的物理特性。随着考古工作的深入，未来或将揭示更多关于古蜀人“氪金”传统的秘密。

三星堆古蜀文明黄金工艺
vivoX300系列定档10月13日：常温跑分突破412万为业内最高

vivo X300系列将于10月13日19:00发布，搭载天玑9500旗舰芯片，采用台积电N3P工艺，安兔兔常温跑分超412万创行业新高。屏幕配备京东方定制Q10+顶级屏，支持8T LTPO技术。影像方面全系搭载V3+影像芯片，X300标准版采用三星HPB主摄，Pro版首发索尼LYT-828云台级主摄，支持CIPA防抖认证。此外配备90W有线无线快充、USB 3.2等配置，即日开启预售。

vivoX300 天玑9500 跑分412万
荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型

本期AI日报聚焦多项前沿动态：阿里云开源轻量级AI代理DeepResearch，性能媲美OpenAI；夸克推出国内首个全阶段医师考试大模型测试集；微软Copilot将上线类ChatGPT记忆管理功能；迪士尼等巨头起诉MiniMax侵犯版权；OpenAI提升ChatGPT搜索准确性；Notion推出个性化AI助手；谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5；Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

AI 开源轻量级
荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0，在多项基准测试中表现优异；阿里通义7款模型登顶Hugging Face榜单，Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限，可自动完成视觉任务；特斯拉推进人形机器人量产，马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密，苹果内部测试聊天机器人Veritas优化Siri，YouTube推出AI音乐主播增强互动，LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

AI 开源模型高性能思考模型

今日大家都在搜的词：

热文

3 天
7天

王小川旗下百川智能发布Baichuan-13B大模型 130亿参数开源可商用

以开放，致无界：海信发布三款划时代激光显示新品，并逐步开放1300余项专利

vivo X300系列四色公布将于10月13日发布

上市13个月连当13个月纯电A级轿车销冠！小鹏Mona M03累计交付18万台

荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

海信开放1300余项三色激光专利，助推激光显示产业 “破界” 前行

荐超1300亿！“星巴克祖师爷”被卖了

四川人3000年前就是“氪金”大佬三星堆最新考古成果公布

vivoX300系列定档10月13日：常温跑分突破412万为业内最高

荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型

荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

今日大家都在搜的词：

热文

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

雷军：小米17 Pro Max很多门店已经缺货

iPhone调休闹钟上热搜苹果客服回应：需手动设置

雷军晒第100次健身打卡提前3个月完成健身目标

京东双11购物节官宣：10月9日晚8点开启

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

卢伟冰称小米17首销结果很不错并回应小米17为何最初无1TB

小米澎湃OS 3穿戴设备适配升级计划公布：10月开启推送

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布

理想i6正式上市：首销直减1万限时售价23.98万元

AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问

小米17系列开售5分钟破25年国产手机首销纪录

雷军大方推荐友商产品：不买YU7 可以考虑Model Y和理想i6

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

雷军称没什么好犹豫的：50岁正是闯的年纪

小米非常非常缺人上热搜雷军谈小米成功秘诀

站长商机