首页 > 传媒 > 关键词  > 寒武纪最新资讯  > 正文

寒武纪:等待下一个爆发期

推广 · 2021-11-11 17:25 · 稿源: 厂商投稿

前几日,寒武纪在官网宣布推出第三代云端AI芯片思元 370 及搭载该芯片的MLU370-S4、MLU370-X4 加速卡和全新升级的Cambricon Neuware软件栈等新品。没有华丽的发布会,没有炫彩的PPT,寒武纪发布新品的风格,依然是典型的朴素“理工男”特点。

在这个愈发重视AI芯片自主架构、能拥有“杀手级”应用场景、能实现算力突破与能耗双控的时代,思元 370 其实具有多项领先优势:

在架构上,思元 370 属于寒武纪第四代自研智能芯片架构,第一代架构MLUarch00 主打智能加速IP核,第二代MLUarch01 主打多核架构,第三代MLUarch02 主打多核共享片内存储,第四代MLUarch03 更是寒武纪首款采用 chiplet(芯粒)技术的AI芯片,在国内应该也属于行业首颗chiplet AI芯片。

在应用场景灵活性上,由于思元 370 在一颗芯片中封装 2 颗AI计算芯粒(MLU-Die),每一个MLU-Die都具备独立的AI计算单元、内存、IO以及MLU-Fabric控制和接口,不同MLU-Die可以组合规格多样化的产品,为用户提供适用不同场景的高性价比AI芯片。

在算力上基于台积电7nm 制程工艺、整体集成 390 亿个晶体管的思元 370 最大算力达到256TOPS(INT8),相比上一代思元 270 算力直接翻倍。

不到 18 个月就实现了算力翻倍,在通用处理器领域已经失效的摩尔定律,在AI芯片领域还在延续。

造芯片,技术和市场各有多重要

算力翻倍究竟有多重要?

现实世界对于算力的需求远没有到达顶峰。以英伟达为例,自 2017 年底英伟达发布Tesla V100 之后,训练最大模型的算力需求增长了 3000 倍。

举例来说,仅是分析 3000 万路视频,以常见的英伟达Tesla P4 显卡为例约需 100 万块,总硬件成本 200 亿元以上,一块显卡按照 75 瓦起步功耗计算总功耗也高达7. 5 万千瓦。

通过如思元 370 这样更具效率的AI芯片在云端场景替代传统GPU,就能够大幅降低前期基础设施建设成本,减少后期运行能耗。

可以说,思元 370 成功推出的背后,不仅是寒武纪研发人员的日夜努力,也是社会各行各业对更高效率AI芯片的迫切需求。正如恩格斯所说,社会一旦有技术上的需要,则这种需要就会比十所大学更能把科学推向前进

随着新一轮产业竞争与供应链争夺正在展开,对人工智能、数字化技术的需求只增不减。而各行各业更是向科创类产业企业界提出了前所未有的技术需求,在这种需求刺激下,AI创业企业的研发成果获得落地应用的机会更多,市场也更大。

乘风起势,市场的需求让AI芯片赛道涌入更多入局者,推动新技术的不断迭代,也让行业格局逐渐发生变动。

目前,英伟达在AI芯片领域仍具有最大的影响力。在全球云端训练芯片市场,英伟达基本是一家独大,其GPU+CUDA计算平台是应用最多的AI训练方案。在推理芯片领域,则呈现出百家争鸣的竞争生态,因为推理芯片更注重功耗、时延、成本等因素,且相比于训练芯片需求量更高,使用场景更广泛。

英伟达之外,英特尔、谷歌、IBM、AMD等巨头以及寒武纪等初创企业,都在AI芯片领域耕耘多年,并一步一步进行纵深研发。

市场只会留给有准备的人。寒武纪作为初创企业,对客户需求的把握也精细到全流程跟进。比如思元370,不仅可以作为推理芯片,也可以作为训练芯片使用。这样做的好处不仅是寒武纪自己的产品能够兼顾训练与推理,也方便客户全流程的模型部署、业务落地。

实际上,今年 1 月寒武纪发布的首颗训练芯片思元290,在训练为主的同时也可以进行推理。借助Cambricon Neuware软件栈提供的软件及应用生态,就可以在思元 290 芯片上实现图形图像、语音、NLP、搜索推荐等多种应用的训练和推理。

此次思元 370 发布,Cambricon Neuware进一步整合了训练和推理的全部底层软件栈,包括底层驱动、运行时库、算子库以及工具链等,将MagicMind和深度学习框架Tensorflow、Pytorch深度融合,实现训推一体。依托于训推一体,在寒武纪全系列计算平台上,从云端到边缘端,用户均可以无缝地完成从模型训练到推理部署的全部流程,进行灵活的训练推理业务混布和潮汐式的业务切换,加快了用户端到端业务落地的速度,减少模型训练研发到模型部署之间的繁琐流程,可快速响应业务变化,提升算力利用率,降低运营成本。

推理加速引擎MagicMind是寒武纪软件栈Cambricon Neuware全新升级的重要组成部分

图源:企业官网

在巨大的市场需求推动下,技术进步也愈加快速,硬件上翻倍甚至更多倍的增长比比皆是。比如今年 1 月发布的思元290,相比思元 270 就实现峰值算力提升 4 倍、内存带宽提高 12 倍、芯片间通信带宽提高 19 倍。

硬件强只是起步,AI芯片企业更需要软件强。比如英伟达在AI芯片领域的强大,除了硬件性能之外,也因为其CUDA生态已经成为众多人工智能开发者主流选择,从而为自己造就了一条护城河。初创企业,同样需要建立自己的生态护城河。

云、边、端、车四位一体布局中的寒武纪优势

AI芯片龙头的优势,毋庸讳言。而寒武纪在最新的布局中,也显现出一家创业企业的独特优势。

在今年 7 月举办的 2021 世界人工智能大会上,寒武纪首次披露了控股子公司行歌科技的进展,并披露研发中的车载智能芯片关键数据——基于 7 纳米制程的车规级芯片,算力大于200TOPS,具备独立安全岛及成熟软件工具链。

据中国汽车工业协会数据, 2020 年中国汽车销量为2531. 1 万辆。假如未来 10 年汽车销量的规模继续维持在 2500 万辆左右,智能汽车渗透率能够达到50%,车载智能芯片单车价值达到 5000 元,那就是高达 625 亿元的市场规模。只是现在这一市场可能还不够大,但未来整个智能驾驶系统的市场规模一定会堪比手机SOC、云端AI芯片。

一方面,智能驾驶不仅是车载智能芯片的事情,未来的智能驾驶一定会涉及车路协同,通过路测的边缘端智能芯片实现实时收集、低延时传输道路与车辆、车辆之间的交互信息,将汽车本身获取不到的盲区、路侧、他车、超远距离、全路网实时信息告知汽车端,帮助单个汽车或者智能车队规划路线;边缘端传感器采集的许多数据还会回传至云端,利用云端智能芯片处理边缘端芯片难以处理的复杂训练、推理任务。

IDC半导体研究总监Michael J. Palma曾说:“在边缘系统中,神经网络做出的即时决策可以创造独特的价值,不受延迟和连接问题的约束——而这些问题对云解决方案来说是个挑战。”未来遍布路网的边缘端智能芯片,将成为智能驾驶完整系统不可或缺的组成部分。整个智能驾驶的实现,更需要云边端车四位一体的深度联动。

另一方面,寒武纪本身在云边端的AI处理器上已经有着有代表性的量产产品。 2016 年成立初期就以IP授权的形式打入高端智能手机终端市场,在终端智能处理器IP授权业务上一战成名之后,又迅速拓展云端业务,通过新业务提高了公司的核心竞争力和抗风险能力,成功规避了单一客户带来的波动影响。 2019 年底,寒武纪又发布了边缘AI系列芯片及加速卡产品,通过统一的软件开发平台,实现云边端无缝协同。

云边端一体化走向云边端车四位一体,对智能驾驶行业来说是一种未来的必然趋势,对寒武纪自身来说则是一个自然的发展过程。

寒武纪的“云边端车”处理器都是用统一的处理器架构和基础软件平台,这意味着开发者只要在某一端应用寒武纪的产品,其他端很容易就能实现互相兼容,大大减少不同平台的开发和应用迁移成本。

寒武纪“云边端车”的协同优势,在目前国内车载智能芯片厂家中是较为独特的。

首先就是设计经验直接复用。国内智能驾驶芯片企业一般采用 12 纳米、 14 纳米、 16 纳米制程居多,行歌科技却起步就要做 7 纳米制程、200 TOPS以上算力。这种大算力、先进制程芯片,没有过 7 纳米制程经验的AI芯片企业是很难操作的,行歌科技的优势就在于可以直接复用母公司寒武纪的 7 纳米芯片设计经验。

其次,寒武纪的云端AI芯片属于通用型AI芯片(非通用处理器),具有通用的AI软件栈,客户可以根据需要方便移植或开发自己的算法。从云端芯片到车载芯片,芯片上要移植新的智能驾驶算法,这种通用型就能够避免行歌科技重新花大量的时间和精力去做适配工作。

第三,在车载AI芯片的车规级要求上,虽然寒武纪此前没有做过车规级产品,但从工业级到车规级,更多区别在于车规级的温度、振动、侵蚀、电磁兼容、可靠性、一致性、产品生命周期等要求更严格,对芯片设计本身而言结构变化并不大,拓展车载芯片的难度并不会高于此前从终端拓展到云端、边缘端。

一家企业能够不断拓展新的领域,且新领域具有足够的市场空间,值得新入局者来此施展手脚,那么市场格局的新变化就颇值得关注。

据了解,市面上具有“云边端车”生态协同优势的玩家,其实只有两三家,寒武纪正是其中之一。芯片领域一位投资人认为,车载智能芯片这一赛道在巨头之外还是容得下五六家初创芯片公司,最终可能会有三家初创公司胜出,寒武纪或许也会是其中之一。

等待下一个必然中的爆发期

从 2016 年成立至今,寒武纪智能芯片的架构已经更迭了四代。

比如最新的第四代智能处理器架构MLUarch03,拥有新一代张量运算单元,内置Supercharger模块大幅提升各类卷积效率;采用全新的多算子硬件融合技术,在软件融合的基础上大幅减少算子执行时间;片上通讯带宽是上一代MLUarch02 的 2 倍、片上共享缓存容量最高是MLUarch02 的2. 75 倍。配合最新架构,寒武纪还推出全新MLUv03 指令集,更完备,更高效且向前兼容。

寒武纪智能芯片架构演进

图源:企业官网

以每一代的架构为基础,都可以开发出适合不同端的IP、芯片矩阵。而每一款芯片,又都会分成不同组件,比如按照十几个组件设立十几个研发小组,每个小组来做一个组件,最后把组件拼起来形成智能芯片。不同的小组可以根据项目需求,对组件进行多种组合、拼接,并实现不同芯片功能组件上重叠部分的高效复用。

一方面,这就使得云、边、端、车不同芯片拥有很多可以复用的组件与设计,让“云边端车”协同优势成为可能;另一方面,这也使得过去的积累不会因为业务线变化而浪费,哪怕是现在总营收占比已经很小的IP授权业务,对于其他覆盖面更多的业务线,仍然有着生态拓展、技术复用的价值,比如在边缘侧智能芯片设计上复用。

作为国内AI芯片领域的先发者,先发者总要先去踩坑,但走过的每一步,都算数。

寒武纪展示给外界的架构更迭,一代又一代,是清晰而确定的。但每一代架构更迭的背后,并不是一个重复造不同轮子的过程。

从思元 100 到思元 270 再到新品思元 370 的技术跃迁和时间线来看,芯片架构设计师刚完成这一代就要着手下一代,永远是滚动推进的过程。寒武纪芯片架构设计师需要一直关注国际最前沿的芯片设计、算法,让寒武纪的智能芯片能够高效适配未来可能的流行算法,但这也不意味着前一代架构就要立即被取代。事实上,这也是国际顶尖芯片企业所采用的研发策略。

在外界看来,一代接着一代是分段的。但对于寒武纪来说,每一代架构之间都是互相勾连、镶嵌、攒接的,虽然每更新一代处理能力提升、效率优化都很大,但代际之间并非替代关系,而是适配不同的市场,从而实现资源的最大化利用。比如思元 370 和思元 290 之间就不是替代的关系,因为前者主要是推理芯片,后者主要是训练芯片,两者是互补的关系。

AI芯片的构建很像搭积木,很多企业会使用ARM的内核,这相当于用乐高的积木搭建模型,巨头生产好了积木,企业只需要搭模型就好。但寒武纪用的是自内核架构、自指令集,相当于自己不仅要搭建模型还要生产积木,虽然拥有更高的自主性,但也增加了研发的成本。

最新公布的寒武纪三季报显示,前三季度公司主营收入2. 22 亿元,同比上升41.19%;归母净利润-62945. 85 万元,同比下降103.37%;前三季度研发费用4. 33 亿元,同比增长32.78%;销售毛利率为50.75%,属于芯片类企业正常水准。

研发费用上,尽管已经超过了营收,但在巨头同样投入很多研发的情况下,为了维持技术和产品的领先,寒武纪的研发仍然难以压缩。

如何看待寒武纪未来发展,其实和巨头能否通吃一切一样,是同一个问题的两个面。

如果未来巨头通吃一切,那创业企业自然都要消亡。而只要巨头无法通吃一切,AI芯片的市场份额中必然就会有头部创业企业的一份。

实际上,创业企业依然在不断涌入AI赛道、AI芯片赛道。

今年 3 月,全球电子技术知名媒体集团Aspencore发布的“中国IC设计 100 家排行榜”中,寒武纪入选AI芯片公司Top10。在美国著名半导体杂志《EETimes》发布的 2021 年“Silicon100”电子和半导体创业公司榜单,新上榜了 9 家中国企业。CB Insights最新的AI in Numbers报告也显示,今年第二季度AI初创公司获得的投资总量超过 200 亿美元,创历史新高。

在很多国内行业观察者看来AI芯片企业已经处于低谷之时,全球范围内对AI企业的看好与投资其实依然处于高峰期。初创AI芯片企业SambaNova6 月获得6. 76 亿美元投资,Graphcore、Groq、Scale AI等也都是AI芯片领域的热门企业。

尽管初创企业都会面对巨头英伟达的阴影,但目前市值已经突破 7000 亿美元的英伟达,在短短 5 年前其实还只是一家不到 500 亿美元市值的不被看好的衰落企业。哪怕英伟达这样的巨头,发展史也是波动起伏的历史,在熬死和打败其他的巨头和初创企业之后,等到了AI计算的大爆发,最终成为了一个目前任何人都无法绕过的巨头。

相比于巨头,寒武纪目前依然是一家低调的初创企业。思元 370 很早就开始设计, 2020 年三季度完成流片,今年二季度完成封装、测试,部分客户已完成测试、导入,据悉在语音、视觉等场景的性能表现超出客户预期,浪潮、阿里云、百度、招商银行等客户均给出了积极评价,但这些信息直到发布才告诉外界。

专业分工是成熟产业链的特征,只要寒武纪能够保持“理工男”的朴素作风,持续在架构保持前瞻性,市场就不缺机会。

巨头不可能吃掉所有市场,巨头不可能所有场景都自,巨头也不会购买竞对巨头的芯片产品。那么多初创企业进入AI芯片赛道,正是看中了巨头与巨头之间庞大的市场空间。

在AI芯片保持技术先进性的寒武纪,也会像等待到AI计算大爆炸的英伟达一样,遇到自己的爆发期。

正如寒武纪创始人陈天石所说:作为一家中立的芯片公司,我们走最正统的芯片设计公司的路径,把应用场景留给人工智能行业的客户,而我们自己做大家的垫脚石。

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,文章为企业广告宣传内容,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • 腾讯云服务器12.12限时秒杀-1核2G首年50元

    腾讯云服务器12.12多种机型限时抢购,1核2G服务器4.17元/月,2核4G服务器6.17元/月,专业技术7*24小时在线服务,腾讯云为企业和个人提供快捷,安全,稳定的云服务!

    广告
  • 寒武纪发布高管变动公告 公司新聘任两位副总经理

    寒武纪发布高级管理人员变动的公告,公告显示,经公司总经理提名、董事会提名委员会资格审查,公司于 2022 年 1 月 18 日召开第一届董事会第二十七次会议,经审议表决,同意聘任陈煜先生、曾洪博先生为公司副总经理...公告显示,公司独立董事对聘任上述高级管理人员发表了明确同意的独立意见,认为陈煜先生、曾洪博先生具备担任相应职务的专业素质和工作能力,符合任职资格,未发现存在《公司法》等法律法规及《公司章程》规定的不得担任高级管理人员的情形...

  • 寒武纪:预计全年营收同比显著增长45.99%到63.42%

    公告显示,寒武纪 2021 年度预计实现营业收入67, 000 万元到75, 000 万元,较 2020 年同期增长45.99%到63.42%...寒武纪也同期加大研发投入...另据公告显示,寒武纪还 2020 年底及 2021 年实施股权激励计划,预计 2021 年管理费用中股份支付费用为19, 800 万元到24, 200 万元,较上年同期股份支付费用1,185. 81 万元增加1,569.74%到1,940.80%...

  • 寒武纪入选机器之心2021最佳人工智能公司TOP30

    「AI中国」机器之心 2021 年度榜单正式揭晓,寒武纪成功入选最佳人工智能公司TOP30...最佳人工智能公司TOP30 榜单关注人工智能企业的商业模式成熟度及其主营业务在最近三年的表现...在AI芯片行业,寒武纪的实力有目共睹,此次寒武纪凭借其强大的技术研发能力及产品落地优势入选最佳人工智能公司TOP30 榜单,可谓实至名归!...

  • 硅谷的秘诀是什么 如何打造下一个硅谷

    自芯片问世以来,各国领导人一直尝试复制硅谷的高科技魔力,其中就包括法国前总统戴高乐和俄罗斯前总统梅德韦杰夫...即使在美国,一些政客也一直试图在打造另一个硅谷...这种说法忽视了历史,事实是,在推动硅谷、西雅图、波士顿和奥斯汀高科技产业增长方面,公共支出发挥了巨大作用...大量的联邦资金和合同,成为“硅谷之所以成为硅谷”的基础...使硅谷之所以成为硅谷的并非只有科技政策,社会支出同样重要...最近数年情况发生了变化...打造下一个硅谷的重心,由发展科技产业转向培育人才......

  • 嵌入式设备是勒索软件的下一个目标吗?

    2021年将被记住,因为这一年勒索软件团伙将注意力转向关键基础设施,尤其是围绕制造业、能源分配和食品生产的公司作为目标。仅仅是ColonialPipeline的勒索软件就导致了5500英里的管道关闭,因为人们担心对其IT网络的勒索软件攻击会蔓延到控制分配燃料的管道的操作网络。运营技术(OT)网络控制着对生产线、发电厂和能源供应的持续运营至关重要的设备,因此通常与公司面向互联网的IT网络相分离,以更好地隔离关键硬件,避免网络攻击。针对OT网络的成功攻击很少,但在Colonial勒索软件攻击之后,CISA警告说,关键基础设施所有者面临的威胁越

  • 虎符合约:元宇宙,市场的下一个风口

    一直以来,虎符合约都在时刻关注市场资金动向,以判断市场未来走向。无疑,如果说 2021 年是元宇宙的元年,恐怕无人会驳斥。无论是区块链行业的元宇宙势头火热,甚至连圈外互联网巨头也开始试图通过元宇宙实现弯道超车?2021 年 10 月底,社交巨头facebook官宣进军元宇宙,消息一出,让沉寂已久的互联网行业泛起 阵阵波澜,也撞击着股价背后成千上万投资者早已凉透的心。虎符合约发现,不仅仅只是公司名更换为Meta这么简单,从品牌

  • 达拉斯希望成为福特下一个自动驾驶汽车工厂的所在地

    达拉斯市议会成员将于周三就是否批准与福特公司的经济发展协议进行投票,希望能成为该汽车制造商下一个自动驾驶汽车工厂的所在地...福特公司是自动驾驶技术公司ArgoAI的投资者和客户,其正在与Argo公司合作,将自动驾驶技术商业化...为了达到协议的目的,福特公司需要创造至少250个新的就业机会,并在该地投资至少1.6亿美元,包括自动驾驶车队...然而,福特可能会看到在得克萨斯州建厂的好处,因为该州不要求运营无人驾驶自动驾驶汽车的许可...

  • 微软用687亿美元,炸开了下一个时代的大门

    对于这桩交易,市场的反应可能是最快的——截至发稿前,动视暴雪的股价已经大涨25.88%至82. 31 美元;微软股价下跌2.43%至302. 65 美元;索尼股价大跌7.20%至115. 8 美元;而其他游戏股则有不少应声上涨——比如任天堂上涨2.19%至58. 41 美元、卡普空上涨1.49%至10. 93 美元、腾讯上涨0.35%至454. 4 港元……对于接连数月走低的游戏股来说,这或许是一次转机......

  • 熟练劳动力短缺或可能成为芯片供应商要面临的下一个大问题

    在全球劳动力短缺的情况下,世界上最大的芯片制造商目前正在争夺技术人才以配备半导体生产设施并解决芯片限制问题。《华尔街日报》周日报道,全球芯片制造商越来越担心熟练工人的供应减少--这一问题因更广泛的劳动力短缺、电子产品需求的上升及各国政府竞相加强芯片制造能力而变得更加严重。一位芯片高管告诉该出版物,该行业目前正处于 “人才争夺战”阶段。尽管芯片制造设施高度自动化,但它们仍需要熟练工人来操作半导体制造过?

  • 研究人员将人工智能用于寻找下一个SARS-COV-2

    俄克拉荷马大学道奇家族文理学院的生物学副教授Daniel Becker在过去一年半的时间里一直在领导一项主动建模研究,以确定可能携带新冠病毒beta变异毒株的蝙蝠物种,包括但不限于类似SARS的病毒...在这项研究中,研究人员将携带新冠病毒beta变异毒株的蝙蝠宿主作为一个案例,研究如何动态地使用数据来比较和验证这些可能的贮藏所宿主的预测模型,这是一大类病毒,包括那些对SARS和COVID-19负责的病毒...研究人员发现,利用蝙蝠生态学和进化数据的模型在预测beta变异毒株的新宿主方面表现非常好......

这篇文章对你有价值吗?

  • 热门标签

热文

  • 3 天
  • 7天