首页 > 业界 > 关键词  > 正文

万卡训练史上参数模型!百度文心大模型4.0最快下周见

2023-10-09 15:25 · 稿源: 快科技

快科技10月9日消息,日前有媒体报道称,百度正加紧训练文心大模型4.0,已经接近可发布状态,这将是文心大模型3.5版本后,又一个重磅版本。

消息称,文心大模型4.0进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆核心能力都将提升,特别是在逻辑推理、代码和数学等方面提升最明显。

根据我们获得的最新消息,上述消息基本属实。目前了解到,文心大模型4.0实际上已经在小流量测试。

根据我们拿到的消息,文心大模型4.0的参数规模要大于目前所有公开发布参数的LLM,也是国内首次使用万卡集群训练的大模型。这意味着文心大模型4.0的参数规模预计能突破万亿级别。

万卡集群什么概念?国内之前只有华为、阿里透露已建成万卡AI集群,但我们都没看到基于它推出的具体模型。万卡集群就不容易建了,如果用起来发挥最大化作用则更难了。

据分析,正是因为飞桨的深度联合,才能高效地基于万卡集群训练起如此规模的模型。

不仅训练成本在增加,文心4.0的推理成本比3.5增加很多,我们还没拿到具体每千token的推理成本,但据传大概是此前的8-10倍,这还是在高利用率(MFU)的情况下。如果利用率更低,估计成本还会继续增加。

不得不说,大模型真的很费钱。可见,打造领先的底层基础打模型,就是一场巨头的游戏。

根据IDC发布的首个大模型评估报告《AI大模型技术能力评估报告,2023》,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一,综合能力在众多国产大模型中遥遥领先

经过全面升级后,文心大模型4.0的训练速度、推理速度等将进一步提升,能否与GPT-4一战甚至超越后者的表现,我们拭目以待。

举报

  • 相关推荐
  • 大家在看
  • 百度文心大模型4.0正加紧训练 已接近可发布状态

    百度正在加速训练文心大模型4.0,并预计在10月17日的百度世界大会上发布。这个新版本的大模型是继文心大模型3.5之后的又一重要升级,将着重在基础模型上实现大提升。自全面开放以来,文心一言的App下载量猛增,甚至一度登上苹果AppStore免费应用榜的榜首,成为首个登顶应用商店榜首的中文AI原生应用。

  • 消息称百度文心大模型4.0正加紧训练 四大核心能力将提升

    凤凰网科技讯10月8日,据《科创板日报》援引消息人士消息,百度正在加紧训练文心大模型4.0,或将在10月17日百度世界大会上发布。文心大模型4.0的进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆四大核心能力都将提升,尤其在逻辑推理、代码和数学等方面提升最明显。在百度披露的一张测试图中,prompt为:“如果一个公司想要在他们的产品线中添加新的手表,以应对市场中的新趋势和客户的新需求,那么他们如何利用已有的数据和工具进行有效的商业分析,以确定这个新产品的商业潜力呢?”文心一言从市场调研、数据分析、目标客户分析、预测分析等方面给出了操作建议。

  • 百度放大招!消息称文心大模型4.0即将发布:理解、逻辑大提升

    目前,国内有多家科技大厂陆续发布自家大模型,被业内看作为AI大模型百模”大战已经打响。百度正加紧训练文心大模型4.0,预计将在10月17日的百度世界大会上发布,这将是文心大模型3.5版本后,又一个重磅版本。文心一言全面开放后App下载量猛增,一度登上苹果AppStore免费应用榜排行第一,成为首个登顶应用商店榜首的中文AI原生应用。

  • 国内首个“产业级”医疗大模型百度“灵医”发布:文心大模型加持

    目前,国内已有多家科技大厂扎堆发布自家大模型,被业内看作为AI大模型百模”大战已经打响。在各家大战的同时,百度日前正式发布了国内首个产业级”医疗大模型灵医大模型,这也是国内首个实现商业化落地的医疗大模型。技术底座方面,根据IDC发布《AI大模型技术能力评估报告,2023》,灵医大模型的技术底座百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一。

  • 百度发布医疗大模型“灵医大模型

    9月19日,百度正式发布国内首个“产业级”医疗大模型——灵医大模型。百度正式宣布面向大健康上下游产业开放灵医大模型测评、试用,推动医疗行业的数字化和智能化进程。在辅助诊疗方面,灵医大模型可实现通过多轮对话了解病人病情,实时辅助医生确诊疾病,推荐治疗方案,提升就诊全流程的效率和体验,并成为患者的24小时“健康管家”,提供智能客服服务。

  • 百度文心一言软件著作权获批

    中国版权保护中心显示,9月13日,北京百度网讯科技有限公司“文心一言软件”著作权获登记批准,当前版本号为V1.0.0。8月31日,百度「文心一言APP」宣布向全社会全面开放。广大用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”体验。

  • 百度CIO李莹接棒小度 大模型或助力小度增长

    百度宣布百度集团副总裁、CIO李莹博士出任小度科技CEO。李莹于2004年加入百度,在多个核心业务IntegerField上获得丰富经验,任百度CIO期间,她运用AI优化内部流程。小度可望借助百度在AI方面的技术优势,在大模型加持下获得进一步发展。

  • 华为发布全新昇腾AI计算集群 支持超万亿参数大模型训练

    华为在全联接大会2023期间发布了全新架构的昇腾AI计算集群Atlas900SuperCluster,该集群可支持超万亿参数的大模型训练。该集群采用了全新的华为星河AI智算交换机CloudEngineXH16800,并使用了创新的超节点架构,大大提升了大模型训练能力。该集群还通过提升系统可靠性,将大模型训练的稳定性从天级提升到月级。

  • AI视野:文心大模型4.0将发布;Stability AI发布移动端语言模型Stable LM3B;OpenAI举办ChatGPT应用开发大赛;视觉中国、华为云携手打造视觉大模型

    百度正在加速训练文心大模型4.0,并计划在10月17日的百度世界大会上发布。这一新版本将是文心大模型3.5的重要升级,重点提升基础模型能力,尤其在逻辑推理、代码和数学等方面取得显著进展。GoogleDeepMind提出DRaFT算法以高效优化扩散模型GoogleDeepMind最新提出的DRaFT算法用于高效优化扩散模型,提高了文本到图像生成等实际应用的效率和性能,成为机器学习领域的有价值工具�

  • 兴科技发布百亿级参数多媒体大模型 “天幕”

    在近日的2023世界计算大会上,万兴科技宣布将发布国内首个以视频创意应用为核心的百亿级参数多媒体大模型“天幕”。“天幕”多媒体大模型将以视频、绘图、文档等数字创意软件业务场景为依托,为创作者提供更专业化的AI创新解决方案。这些产品通过集成大模型能力,实现了数字创意软件的升级和智能化。

今日大家都在搜的词:

热文