首页 > 热点 > 关键词  > 正文

王小川旗下百川智能发布Baichuan-13B大模型 130亿参数开源可商用

2023-07-11 13:33 · 稿源:站长之家

站长之家(ChinaZ.com)7月11日 消息:继Baichuan-7B之后,近日,王小川旗下百川智能再次发布Baichuan-13B大模型。

据介绍,Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含130亿参数的开源可商用的大规模语言模型,在权威的中文和英文 benchmark 上均取得同尺寸最好的效果。本次发布包含有预训练 (Baichuan-13B-Base) 和对齐 (Baichuan-13B-Chat) 两个版本。

微信截图_20230711133555.png

Baichuan-13B 有如下几个特点:

  1. 更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到130亿,并且在高质量的语料上训练了1.4万亿 tokens,超过 LLaMA-13B40%,是当前开源13B 尺寸下训练数据量最多的模型。支持中英双语,使用 ALiBi 位置编码,上下文窗口长度为4096。

  2. 同时开源预训练和对齐模型:预训练模型是适用开发者的『 基座 』,而广大普通用户对有对话功能的对齐模型具有更强的需求。因此本次开源我们同时发布了对齐模型(Baichuan-13B-Chat),具有很强的对话能力,开箱即用,几行代码即可简单的部署。

  3. 更高效的推理:为了支持更广大用户的使用,我们本次同时开源了 int8和 int4的量化版本,相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛,可以部署在如 Nvidia3090这样的消费级显卡上。

  4. 开源免费可商用:Baichuan-13B 不仅对学术研究完全开放,开发者也仅需邮件申请并获得官方商用许可后,即可以免费商用。

【HuggingFace】

预训练模型:https://huggingface.co/baichuan-inc/Baichuan-13B-Base

对话模型:https://huggingface.co/baichuan-inc/Baichuan-13B-Chat

【GitHub】

https://githuB.com/Baichuan-inc/Baichuan-13B

【Model Scope】

预训练模型:https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Base/

对话模型:https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Chat/

举报

  • 相关推荐
  • 以开放,致无界:海信发布三款划时代激光显示新品,并逐步开放1300余项专利

    9月19日,海信在青岛举办2025激光显示技术与产业发展大会,以“无界”为主题发布三款创新产品:全球首款150英寸屏幕发声激光电视探索X1Ultra、首款100英寸可卷曲激光影院江山画卷R1及投影Vidda C5无界。海信宣布将向全行业开放1300余项三色激光核心专利,推动产业协同发展,构建开放、协同、可持续的激光显示生态。

  • vivo X300系列四色公布 将于10月13日发布

    9月23日,vivo正式公布旗舰机型X300系列配色方案:X300 Pro提供旷野棕、简单白、自在蓝、纯粹黑四款,标准版则带来幸运彩、惬意紫、自在蓝、纯粹黑四种选择,满足用户个性化需求。该系列配备超薄直屏,Pro版厚度仅7.99mm,标准版为7.95mm,兼顾轻薄与手感。全系搭载与X200 Ultra同款的蔡司2.35x长焦增距镜,支持多种拍摄模式,覆盖风光、人像等场景,实现“望远巨炮”般拍摄体验。此外,vivo还推出银色增距镜作为时尚配饰。新品将于10月13日19:00正式揭晓。

  • 上市13个月 连当13个月纯电A级轿车销冠!小鹏Mona M03累计交付18万台

    小鹏MONA M03上市13个月累计交付18万台,连续月交付超1万台,连续13个月获纯电A级车销量冠军。5月28日推出M03 Max版,售价12.98万-13.98万元,搭载自研视觉智能辅助驾驶方案,算力达508Tops,支持全场景智能泊车辅助,将智能驾驶价格拉低至13万级。新车配备电动掀背尾门、超600L后备厢,风阻系数0.194,百公里电耗11.8kWh,支持快充,15分钟补能200公里。凭借高性价比与智能配置,M03系列持续热销。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 海信开放1300余项三色激光专利,助推激光显示产业 “破界” 前行

    9月19日,海信在青岛举办激光显示技术大会,发布多款创新产品:全球首款150英寸屏幕发声激光电视X1 Ultra、100英寸可卷曲激光影院江山画卷R1及投影Vidda C5。海信通过折叠屏技术实现尺寸突破,并推动三色激光技术普及,宣布开放1300余项核心专利,促进产业协同创新。激光显示因护眼优势获医学界认可,正重塑产业价值。

  • 超1300亿!“星巴克祖师爷”被卖了

    千亿并购接踵而至,巨头出售传闻不断,全球咖啡市场又迎来了新变局。这次站在聚光灯下的,是有着“星巴克之父”之称的精品咖啡标杆——皮爷咖啡。 8月25日,美国饮料巨头Keurig Dr Pepper(以下简称KDP)抛出重磅消息,公司将重金收购皮爷咖啡母公司JDE Peet's,总股权对价高达157亿欧元(约合人民币1300亿元)。 这笔交易的双方,分别是饮料领域与咖啡领域的实力玩家。KDP�

  • 四川人3000年前就是“氪金”大佬 三星堆最新考古成果公布

    三星堆遗址最新考古成果揭示,三千年前古蜀人已展现出对黄金的极致热爱与精湛工艺,堪称“氪金”鼻祖。这一发现颠覆了人们对古蜀文明财富观的认知,为研究古代文化交流与工艺发展提供了全新视角。古蜀人在制作祭祀礼器和彰显权力地位时,毫不吝惜地投入当时最珍贵的黄金资源,其奢华程度与现代“氪金”含义不谋而合。出土的黄金器物工艺复杂、造型独特,充分展现了古蜀人的创造力和审美水平。尤为值得注意的是,古蜀人尚未掌握焊接技术,却能通过精湛工艺将黄金打造成精美器物,说明他们已深刻掌握金银材质的物理特性。随着考古工作的深入,未来或将揭示更多关于古蜀人“氪金”传统的秘密。

  • vivoX300系列定档10月13日:常温跑分突破412万为业内最高

    vivo X300系列将于10月13日19:00发布,搭载天玑9500旗舰芯片,采用台积电N3P工艺,安兔兔常温跑分超412万创行业新高。屏幕配备京东方定制Q10+顶级屏,支持8T LTPO技术。影像方面全系搭载V3+影像芯片,X300标准版采用三星HPB主摄,Pro版首发索尼LYT-828云台级主摄,支持CIPA防抖认证。此外配备90W有线无线快充、USB 3.2等配置,即日开启预售。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

    蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

今日大家都在搜的词: