首页 > 业界 > 关键词  > Cerebras最新资讯  > 正文

在全球芯片上训练!AI芯片初创公司Cerebras新推出七种开源语言模型

2023-03-31 15:10 · 稿源:站长之家

站长之家(ChinaZ.com)3月31日 消息:AI芯片初创公司Cerebras宣布进军大型语言模型领域,推出了七种新的开源语言模型。称为Cerebras-GPT 的模型系列的大小范围从1.11亿个参数到130亿个参数。

image.png

这家初创公司表示,这些模型使用 DeepMind 的Chinchilla公式进行训练,旨在让任何人都能以更低的成本使用它们,其消耗的能量实迄今为止公开可用的模型中最少的。

Cerebras 决定构建并提供这些开源模型它认为访问应该更加开放。Cerebras ML 研究科学家 Nolan Dey 在博客文章中写道:“最新的大型语言模型OpenAI 的GPT-4发布时没有关于其模型架构、训练数据、训练硬件或超参数的信息。该公司越来越多地使用封闭数据集构建大型模型,并仅通过 API 访问提供模型输出。要让 LLM 成为一种开放和可访问的技术,我们认为重要的是能够访问最先进的模型,这些模型对于研究和商业应用都是开放的、可复制的和免版税的。”

image.png

Cerebras模型的数据集尚未公开,目前可以通过HuggingFace访问模型本身。

在全球最大芯片上训练模型

Cerebras 以其WSE-2芯片而闻名,它是世界上最大的芯片之一,类似于一个8x8英寸的平板,每个平板包含2.6万亿个晶体管和85万个“人工智能优化”内核。

image.png

Cerebras 的CS-2系统包含大量 WSE-2AI 芯片。这家初创公司采用了其中的16个系统来为其 AI 超级计算机 Andromeda 提供动力。Andromeda于去年11月发布,旨在大大减少训练大型语言模型所需的时间。

这家初创公司甚至声称超级计算机可以处理具有巨大序列长度的大型语言模型,这是传统 GPU 根本无法做到的。在去年底接受AI Business采访时,Cerebras 首席执行官 Andrew Feldman 表示 Andromeda 已经帮助进行了 COVID-19研究。

这家初创公司已将注意力转向大型语言模型,以此来展示其技术的能力。

Cerebras-GPT 模型是在 Andromeda 上训练的,Cerebras 表示它能够“快速完成训练,无需GPU集群上所需的传统分布式系统工程和模型并行调优。” 用于训练 Cerebras-GPT 模型的集群也已通过Cerebras AI Model Studio在云端提供。

促进大语言模型大众化

主要的人工智能实验室已经做了很多开发语言模型的工作,但却隐瞒了有关底层系统如何工作的信息。例如,OpenAI在本月早些时候发布GPT-4引起了愤怒,只是透露了很少的技术规格,却没有提及所使用的确切数据或尺寸细节。

很多人,比如斯坦福大学的 AI 研究人员,认为由于 OpenAI 等公司已经关闭了他们的模型,这使得对这些技术的潜在影响进行研究变得更加困难。

Cerebras 设计了新模型以提供更广泛的访问,并表示希望这些模型将“作为有效培训的秘诀,并作为进一步社区研究的参考。”

站长之家注:

Cerebras-GPT 官方博客网址:https://www.cerebras.net/blog/cerebras-gpt-a-family-of-open-compute-efficient-large-language-models/

Cerebras-GPT模型HuggingFace网址:https://huggingface.co/cerebras

举报

  • 相关推荐
  • 英伟达CEO黄仁勋造访白宫:希望特朗普修改AI芯片出口规则

    快科技5月1日消息,据媒体报道,美国当地时间周三, 英伟达公司首席执行官黄仁勋造访白宫时表示,他希望特朗普政府修改从美国向全球出口人工智能(AI)技术的相关法规,以便美国企业能更好地抓住未来的机遇。我们需要加速美国AI技术在全球的扩散,”黄仁勋在与媒体的简短会面中表示,政府的政策和鼓励措施必须真正支持这一点。”与此同时,黄仁勋还呼吁美国政府放宽人工智能图形处理单元出口规定,但媒体报道特朗普政府计划加强控制。众所周知,英伟达目前主导着用于训练AI模型的尖端AI芯片市场,但其向中国客户销售最先进产品的渠道已被?

  • 新一代AI芯片赋能三星OLED S90F系列,掌控客厅娱乐新主场

    三星推出全新OLED S90F系列电视,搭载新一代NQ4 AI Gen3芯片,通过AI技术重塑家庭娱乐体验。该系列提供83/77/65/42英寸多尺寸选择,采用自发光OLED面板,支持4K AI影像增强、杜比全景声和144Hz可变刷新率,实现沉浸式视听效果。产品配备智能家居控制中心,可连接SmartThings平台管理智能设备,并支持7年系统升级服务。游戏性能方面,支持FreeSync Premium技术、21:9和32:9超宽屏比例,打造专业电竞体验。外观采用纤薄设计,获潘通色彩认证,兼顾科技美学与家居融合。

  • 全球最大线上批发商城与线下商城战略合作,阿里云赋能全球贸易AI时代新篇章

    作为“全球贸易中心”的义乌国际商贸城屡为天下先。今天,世界上最大的线上批发商城与世界上最大的线下商城正式签约,此次合作由阿里巴巴先进的AI云技术提供支撑,共同开启全球贸易数字化新篇章。 4 月 15 日,义乌商城集团宣布正式接入阿里通义大模型,结合阿里巴巴的云计算、大数据和电商等领域的优势,帮助 210 万中小商家利用AI技术精准经营,快速出海。签约仪�

  • 全球首个女性肿瘤AI大模型 “木兰”正式进入临床应用

    快科技5月14日消息,华中科技大学宣布,全球首个女性肿瘤AI大模型木兰”,正式进入临床应用阶段。目前,公众可通过华中科技大学同济医院”公众号或掌上同济”APP,在互联网医院下的同济木兰AI咨询”栏目中获得免费服务。未来,该模型还将通过更多手机端线上平台、电脑端应用以及各级医疗机构等多种渠道,向公众开放。据介绍,木兰”由华中科技大学同济医学院附属同济医院主导研发,该模型以国内外权威的女性肿瘤医疗指南和高质量专家共识为基础,融合了同济医院近20年来的高质量病例数据。还整合了中国工程院院士、同济医院妇产科学系主任

  • 阿里千问3登顶全球最强开源模型 已在通义App上线

    阿里集团推出新一代开源AI模型"通义千问3"(Qwen3),包含8款不同规格的混合推理模型。旗舰型号Qwen3-235B采用混合专家架构,创下国产模型性能新纪录;Qwen3-32B则以部署成本低、运行稳定见长。该系列在逻辑推理、编程、翻译等专业领域表现卓越,用户可通过通义App和网页版体验。升级后的通义App整合问答对话、图像理解与生成等多项功能,持续强化代码生成、数学解题等专业场景应用能力,致力于打造实用性强的个人AI助手。

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • 李彦宏:如果没有应用 模型芯片都没有价值

    百度在4月25日开发者大会上发布文心4.5 Turbo和X1 Turbo两款大模型,同时推出数字人、智能体APP、内容操作系统等多款AI应用及全球首个电商交易MCP平台。李彦宏强调,没有应用场景,芯片和模型都无价值。他指出大模型更新迭代快(去年Q4发布49个,今年Q1达55个),开发者应专注应用开发而非担心模型迭代。百度通过提供完整工具链,让开发者能聚焦场景创新。李彦宏认为,未来主导AI世界的将是应用而非模型,选对基础模型并做好调优的应用不会过时。

  • 上线仅7天!阿里通义千问3强势登顶全球开源模型宝座

    据了解,千问3是国内首个混合推理模型”,快思考”与慢思考”集成进同一个模型,对简单需求可低算力秒回”答案,对复杂问题可多步骤深度思考”,大大节省算力消耗。

  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • OpenAI达成收购初创公司Windsurf 约30亿美元

    彭博社报道,OpenAI拟以约30亿美元收购AI编程助手Windsurf(原Codeium),这将成为该公司迄今最大规模收购。该交易尚待最终完成,若成功将显著增强OpenAI在AI领域的影响力。值得注意的是,Windsurf部分竞争对手曾获OpenAI创业基金支持,此次收购可能引发行业争议。与此同时,OpenAI宣布将推迟转型为营利性公司的计划,此前该计划已面临马斯克等联合创始人的法律诉讼。尽管面临挑战,OpenAI仍是全球最具价值的AI公司之一,此次收购或将重塑AI编程助手市场格局。