首页 > 动态 > 关键词 > 鲲云科技最新资讯 > 正文

鲲云科技发布全球首款数据流AI芯片CAISA 打造更高算力性价比

2020-06-23 16:24 · 稿源:TechWeb.com.cn

【TechWeb】6月23日消息,鲲云科技今天正式发布全球首款数据流AI芯片CAISA,该芯片定位于高性能AI推理,目前已完成量产。

据介绍,鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了10倍。第三方测试数据显示仅用1/3的峰值算力,CAISA芯片可以实现英伟达同类产品最高3.91倍的实测性能。

鲲云科技成立于2016年,聚焦于基于数据流架构的定制AI计算引擎,其自主研发的CAISA架构已有近三十年技术积累。鲲云科技目前已经完成了天使轮,A轮及A+轮融资,并在深圳、山东、伦敦研发中心。

现在,具体来看看这款数据流AI芯片CAISA的性能表现。

超高芯片利用率,定制数据流芯片架构完成3.0升级

此次发布的CAISA芯片采用鲲云自研的定制数据流芯片架构CAISA 3.0,相较于上一代芯片架构,CAISA3.0在架构效率和实测性能方面有了大幅的提升,并在算子支持上更加通用,支持绝大多数神经网络模型快速实现检测、分类和语义分割部署。CAISA3.0在多引擎支持上提供了4倍更高的并行度选择,架构的可拓展性大大提高,在AI芯片内,每一个CAISA都可以同时处理AI工作负载,进一步提升了CAISA架构的性能,在峰值算力提升6倍的同时保持了高达95.4%的芯片利用率,实测性能线性提升。同时新一代CAISA架构对编译器RainBuilder的支持更加友好,软硬件协作进一步优化,在系统级别上为用户提供更好的端到端性能。

CAISA3.0架构图

CAISA3.0架构继续保持在数据流技术路线的全球领先地位,指令集架构采用冯诺依曼计算方式,通过指令执行次序控制计算顺序,并通过分离数据搬运与数据计算提供计算通用性。CAISA架构依托数据流流动次序控制计算次序,采用计算流和数据流重叠运行方式消除空闲计算单元,并采用动态配置方式保证对于人工智能算法的通用支持,突破指令集技术对于芯片算力的限制。此次升级,CAISA架构解决了数据流架构作为人工智能计算平台的三大核心挑战:

高算力性价比:在保持计算正确前提下,通过不断压缩每个空闲时钟推高芯片实测性能以接近芯片物理极限,让芯片内的每个时钟、每个计算单元都在执行有效计算; 高架构通用性:在保证每个算法在CAISA上运行能够实现高芯片利用率的同时,CAISA3.0架构通用支持所有主流CNN算法; 高软件易用性:通过专为CAISA定制的编译工具链实现算法端到端自动部署,用户无需底层数据流架构背景知识,简单两步即可实现算法迁移和部署,降低使用门槛。

具体来讲,鲲云CAISA3.0架构的三大技术突破主要通过以下的技术方式实现:

高算力性价比:时钟级准确的计算

CAISA3.0架构由数据流来驱动计算过程,无指令操作,可以实现时钟级准确的计算,最大限度的减少硬件计算资源的空闲时间。CAISA3.0架构通过数据计算与数据流动的重叠,压缩计算资源的每一个空闲时钟;通过算力资源的动态平衡,消除流水线的性能瓶颈;通过数据流的时空映射,最大化复用芯片内的数据流带宽,减少对外部存储带宽的需求。上述设计使CNN算法的计算数据在CAISA3.0内可以实现不间断的持续运算,最高可实现95.4%的芯片利用率,在同等峰值算力条件下,可获得相对于GPU 3倍以上的实测算力,从而为用户提供更高的算力性价比。

高架构通用性:流水线动态重组

CAISA3.0架构可以通过流水线动态重组实现对不同深度学习算法的高性能支持。通过CAISA架构层的数据流引擎、全局数据流网、全局数据流缓存,以及数据流引擎内部的人工智能算子模块、局部数据流网、局部数据流缓存的分层设计,在数据流配置器控制下,CAISA架构中的数据流连接关系和运行状态都可以被自动化动态配置,从而生成面向不同AI算法的高性能定制化流水线。在保证高性能的前提下,支持用户使用基于CAISA3.0架构的计算平台实现如目标检测、分类及语义分割等广泛的人工智能算法应用。

高软件易用性:算法端到端自动化部署

RainBuilder编译工具链

专为CAISA3.0架构配备的RainBuilder编译工具链支持从算法到芯片的端到端自动化部署,用户和开发者无需了解架构的底层硬件配置,简单两步即可实现算法快速迁移和部署。RainBuilder编译器可自动提取主流AI开发框架(TensorFlow,Caffe,Pytorch,ONNX等)中开发的深度学习算法的网络结构和参数信息,并面向CAISA结构进行优化;工具链中的运行时(Runtime)和驱动(Driver)模块负责硬件管理并为用户提供标准的API接口,运行时可以基于精确的CAISA性能模型,实现算法向CAISA架构的自动化映射,同时提供可以被高级语言直接调用的API接口;最底层的驱动可以实现对用户透明的硬件控制。RainBuilder工具链使用简单,部署方便,通用性强,可以让用户快速和低成本的部署和迁移已有算法到CAISA硬件平台上。

首款量产数据流AI芯片,CAISA带来AI芯片研发新方向

作为全球首款采用数据流技术的AI芯片,CAISA搭载了四个CAISA3.0引擎,具有超过1.6万个MAC(乘累加)单元,峰值性能可达10.9TOPs。该芯片采用28nm工艺,通过PCIe3.0×4接口与主处理器通信,同时具有双DDR通道,可为每个CAISA引擎提供超过340Gbps的带宽。

作为一款面向边缘和云端推理的人工智能芯片,CAISA可实现最高95.4%的芯片利用率,为客户提供更高的算力性价比。CAISA芯片具有良好的通用性,可支持所有常用AI算子,通过数据流网络中算子的不同配置和组合,CAISA芯片可支持绝大多数的CNN算法。针对CAISA芯片,鲲云提供RainBuilder3.0工具链,可实现推理模型在芯片上的端到端部署,使软件工程师可以方便的完成CAISA芯片在AI应用系统中的集成。

高算力性价比的AI计算平台星空加速卡系列产品发布

发布会上,鲲云科技创始人和CEO牛昕宇还发布了基于CAISA芯片的星空系列边缘和数据中心计算平台,X3加速卡和X9加速卡,并公布了由人工智能产业技术联盟(AIIA)测试的包括ResNet-50, YOLO v3等在内的主流深度学习网络的实测性能。

星空X3加速卡发布

星空X3加速卡是搭载单颗CAISA 芯片的数据流架构深度学习推断计算平台,为工业级半高半长单槽规格的PCIe板卡。得益于其轻量化的规格特点,X3加速卡可以与不同类型的计算机设备进行适配,包括个人电脑、工业计算机、网络视频录像机、工作站、服务器等,满足边缘和高性能场景中的AI计算需求。相较于英伟达边缘端旗舰产品Xavier,X3可实现1.48-4.12倍的实测性能提升。

*模型参考:https://github.com/pushyami/yolov3-caffe/blob/master/deploy.prototxt

星空X9加速卡发布

星空X9加速卡为搭载4颗CAISA 芯片的深度学习推断板卡,峰值性能43.6TOPS,主要满足高性能场景下的AI计算需求。同英伟达旗舰产品T4相对,X9在ResNet-50, YOLO v3等模型上的芯片利用率提升2.84-11.64倍。在实测性能方面,X9在ResNet50可达5240FPS,与T4性能接近,在YOLO v3、UNet Industrial等检测分割网络,实测性能相较T4有1.83-3.91倍性能提升。在达到最优实测性能下,X9处理延时相比于T4降低1.83-32倍。实测性能以及处理延时的大幅领先,让数据流架构为AI芯片的发展提供了提升峰值性能之外的另一条技术路线。

*模型参考:https://github.com/pushyami/yolov3-caffe/blob/master/deploy.prototxt

鲲云科技通过CAISA数据流架构提高芯片利用率,同样的实测性能,对芯片峰值算力的要求可大幅降低3-10倍,从而降低芯片的制造成本,为客户提供更高的算力性价比。目前星空X3加速卡已经实现量产,星空X9加速卡将于今年8月推出市场。鲲云科技成为国内首家在发布会现场披露Benchmark的AI芯片公司。

商业落地先行,鲲云加速卡实现多领域规模落地

作为技术驱动的AI芯片公司,鲲云科技自成立以来一直注重商业落地,目前鲲云科技已与多家行业巨头达成战略合作,成为英特尔全球旗舰FPGA合作伙伴,在技术培训、营销推广以及应用部署等方面进行合作;与浪潮、戴尔达成战略签约,在AI计算加速方面开展深入合作;与山东产业技术研究院共建山东产研鲲云人工智能研究院,推进人工智能芯片及应用技术的规模化落地。明星产品“星空”加速卡已在电力、教育、航空航天、智能制造、智慧城市等领域落地。自2016年成立至今,鲲云科技已经完成了天使轮,Pre-A轮及A轮融资,设有深圳、山东、伦敦研发中心。2018年成立人工智能创新应用研究院,定位于建立人工智能产业化技术平台,支持人工智能最新技术在各垂直领域快速实际落地,启动鲲云高校计划,开展人工智能课程培训和科研合作。除与Intel合作进行人工智能课程培训外,鲲云人工智能应用创新研究院已同帝国理工学院、哈尔滨工业大学、北京航空航天大学、天津大学、香港城市大学等成立联合实验室,在定制计算、AI芯片安全、工业智能等领域开展前沿研究合作。

  • 相关推荐
  • 大家在看
  • 光遇拯救一只被黑暗藤蔓困住的遥鲲攻略 遥鲲在哪拯救?

    光遇被困的遥鲲的任务很多玩家还不清楚去哪里拯救,所以现在就来为大家带来拯救一只被黑暗藤蔓困住的遥鲲的任务攻略,希望对大家有所帮助。

  • 光遇遥鲲速度刷新攻略 被黑暗藤蔓困住的遥鲲刷新技巧

    ​光遇中有每日任务被黑暗藤蔓困住的遥鲲,这个任务很多玩家还不清楚怎么等刷新,那么下面就来为大家分享一下遥鲲快速刷新的方法攻略。

  • 字节跳动全资收购容器平台才云科技

    DoNews 7月30日消息(记者 吴丽)7月30日,DoNews获悉,字节跳动将于近日完成对容器平台才云科技( Caicloud )的全资收购,收购完成后,才云科技的团队及业务将加入字节跳动火山引擎。才云科技 CEO 张鑫在公司全员信中表示:“在字节跳动完成收购后,才云科技团队及业务,将在对客户承诺不变、产品业务不变、组织架构不变的情况下,完整地加入字节跳动火山引擎。火山引擎将结合才云在业内领先的产品化能力、成熟的企业服务经验,着?

  • 字节跳动收购容器平台才云科技 后者团队将加入火山引擎

    7月30日消息,据悉,字节跳动将于近日完成对容器平台才云科技( Caicloud )的全资收购,收购完成后,才云科技的团队及业务,将加入字节跳动火山引擎。成立于2015年的才云科技,初始定位是提供 Docker+Kubernetes 管理平台的 PaaS 服务。目前,才云科技主要产品包括智能容器云平台 Caicloud Compass 、AI 中台 Caicloud Clever 以及端到端智能解决方案。商业模式主要是以私有云和混合云形式向客户提供基于容器架构的产品

  • 寒武纪上市 能否撑起中国AI芯片的一片天

    7月22日消息,国内AI芯片第一股寒武纪于20日正式登陆科创板,当日股价上涨229%。昨日,寒武纪股价午后较开盘价上涨30%,一度触发临时停牌,收盘股价报274元,市值逼近1100亿元。今天,截至收盘寒武纪股价再涨2.55%,股价突破280元,市值达1124亿元。上市三日,寒武纪股价已累计涨340%。头顶“AI芯片第一股”的光环,寒武纪受资本市场追捧的热度可见一斑。近几年,人工智能应用的兴起和CPU、GPU对智能算法处理的局限性?

  • AI芯片的十字路口:RISC-V能带来下一代芯片吗?

    在芯片领域,X86 架构可以说定义了PC时代;Arm则在移动端一枝独秀。但随着芯片自主化、定制化的需求增长,开源、高效的新兴架构RISC-V(第五代精简指令集架构)正在吸引大量关注,很可能在未来与X86、Arm呈现三足鼎立的格局。今年 6 月,苹果在WWDC大会上正式宣布将逐步转向自研Arm架构,打造更加高效、低能耗、适应自己的软硬件生态。这是未来趋势的一个注脚:越来越多的公司希望能有更适应自己产品和需求的独特芯片,而具有精简?

  • AI芯片第一股寒武纪今日申购 募资不及预期

    【TechWeb】7月8日消息,投资者今起可申购寒武纪股票。寒武纪申购代码787256,申购价格64.39元,单一账户申购上限0.6万股。按本次发行价格64.39元/股和4010万股的新股发行数量计算,预计寒武纪募集资金总额25.82亿元,而此前寒武纪招股书披露预计募集资金28.01亿元。此次募资不及预期。寒武纪战略配售投资者包含中信证券、联想北京、美的控股、OPPO移动、中证投资。寒武纪科技由陈天石和陈云霁联合创立于2016年,陈天石和陈云霁两

  • 台积电将建造超级计算AI芯片,加速晶片级计算

    【TechWeb】在过去的一年中,像Cerebras这样的公司已经成为使用晶圆级处理的头条新闻。台积电希望扩大其业务领域,并计划构建其InFO_SoW(晶圆上集成扇出硅)技术,以便将来构建超级计算机级AI处理器。台积电已经与Cerebras签订了建造晶圆级处理器的合同,但该公司也关注更广阔的市场,并相信晶圆级处理将证明对Cerebras以外的其他客户有吸引力。该公司表示将在16nm技术上构建这些芯片。首字母缩写词汤要了解台积电在这里构建的内

  • 华为周跃峰:华为数据存储的芯片、算法等已实现自研

    据每日经济新闻报道,华为数据存储与机器视觉产品线总裁周跃峰表示,华为所做的存储业务可以看作是从事数据房地产开发,因种种原因,“钢筋水泥”都得自己造。目前,华为数据存储的芯片、算法等已实现自研。

  • 我来数科:大数据+AI为客户利益开启双重护航

    用高水准的服务保障客户利益,获得客户的信任,这是在激烈市场竞争中企业生存的必由之路。不久前刚刚完成品牌升级的我来数科,不仅在品牌定位和战略重心上有了新的变化,在服务理念和服务技术上也对自己提出了更高的要求。我来数科将更加增强平台的技术属性,用大数据+AI为保障客户利益开启双重护航。从行业现状来看,野蛮生长的时代显然早已过去,技术和服务才是新时代金融企业发展的硬道理。据了解,升级后的我来数科提出了全新?

  • 360金融首席科学家张家兴:数据产生价值 AI与数据要一起建设

    在2020世界人工智能大会上,360金融首席科学家张家兴博士在企业级AI架构专场中发表金融领域的数据AI融合中台演讲,分享360金融在人工智能应用的实战经验。张家兴认为,“原本在金融里的决策是基于人的理性的决策,但随着人工智能的发展,我们逐渐转变为用机器学习模型做抉择。这种决策超越了人的理性,可以称为超理性决策,其特点是基于数据和不可解释,效果上优于人的理性决策。”据悉,目前市场上采取?

  • 云从科技发布“轻舟”平台:轻松搭建你想要的AI生态

    2020 年 7 月 9 日,世界人工智能大会云端峰会正式开幕。AI国家队、四小龙之一的云从科技在本届WAIC大会上举行新品发布会——“轻舟”平台及“千帆”合作伙伴计划。这是云从科技的新一代行业级人工智能产品和能力平台,为各行业用户深度赋能,提供适应多种需求的产业开发及生态搭建基础,将有效降低应用门槛、提升落地效率与质量。云从轻舟平台将更有效地促进AI与各行业的深度融合,加速AI的行业落地应用。对此,云从科技高级副总?

  • AI数据迈入场景化时代,头部企业云测数据重建产业模式

    中国AI数据服务行业正走入场景化以及精细化时代,在政策的进一步推动以及技术的进一步成熟下,人工智能产业落地速度明显提速,中国AI数据服务行业迎来巨大的发展浪潮。iiMedia Research(艾媒咨询)发布的《 2020 年中国AI数据服务行业研究报告》主要针对商业模式、应用范围、竞争格局等领域进行市场解读、企业研究以及未来趋势预测。 中国AI核心产业市场规模将超 1500 亿元, 数据服务发展潜力不断拓展 中国AI数据服务行业现如今发

  • 我国自研水陆两栖飞机“鲲龙”AG600成功实现海上首飞!

    据央视报道,今天,我国自主研制的大型灭火/水上救援水陆两栖飞机“鲲龙”AG600在山东青岛附近海域,成功实现海上首飞。作为我国首款自主研制的大型水陆两栖飞机,它既能在陆地起降

  • 买买买!苹果收购的AI初创公司比其它任何科技公司都多

    从 2010 年到 2019 年 9 月,总共有 635 起人工智能公司收购。从 2013 年到 2018 年,这类型收购增加了 6 倍,仅 2018 年就有 166 起收购,同比增长38%。对于苹果、谷歌和其他公司来说,这些购买几乎都是与新产品或新功能相关联。

  • 科大讯飞暑促即将开启 AI黑科技产品你Pick谁?

    伴随着高考结束,暑期正式开启,而这时候各大厂商暑促活动也随之启动。据悉,国内人工智能领军企业科大讯飞即将在全国线下门店开展暑促活动,其AI+办公、AI+生活与AI+学习这三大场景C端明星产品均参与进来。科大讯飞作为人工智能领军企业,其技术最新进展及应用受到广泛关注外,落地到C端的AI产品也同样备受瞩目。在刚刚过去的 618 大促中,科大讯飞逆势增长,2C整体表现强势,在京东、天猫、苏宁三大平台获 22 项冠军, 2020 年 6

  • 科技让世界更有“AI” 榕树贷款提供智能化信贷服务

    7 月 9 日上午, 2020 世界人工智能大会(WAIC)云端峰会在上海正式开幕,大会以“智联世界共同家园”为主题,主题论坛活动围绕“AI技术趋势”、“AI赋能经济”、“AI温暖家园”三大议题,集聚全球科学家、企业家及相关政府领导人,围绕智能领域的技术前沿、产业趋势和热点问题发表演讲和进行对话。 开幕式现场颁布了 2020 世界人工智能大会最高奖“SAIL 奖”(Super AI Leader,卓越人工智能引领者),会上还发布了新一批重要人?

  • 光遇7月17日每日任务全攻略 拯救遥鲲在云野重温记忆攻略

    光遇在7月17日这天开启了每日任务,其中就包括向一位朋友做个动作、在云野追逐散落的星光、拯救一只被黑暗藤蔓困住的遥鲲和在云野重温先祖的美好回忆,很多玩家还不清楚这些任务怎么做,下面就来为大家详细的介绍一下。

  • AI芯片第一股寒武纪将于7月20日登陆科创板

    【TechWeb】7月17日消息, 寒武纪昨日晚间发布公告,公司将于2020年7月20日在科创板上市,发行4010万股,发行价为64.39元。6月2日上交所披露,国内AI芯片独角兽公司中科寒武纪科技股份有限公司科创板首发过会。7月6日晚,寒武纪公告,确定科创板发行价格为64.39元/股。7月7日,寒武纪完成网上路演。7月8日,投资者将进行网上、网下申购。此次募集资金25.8亿元。此前寒武纪曾披露申请科创板上市拟融资28.01亿元,19亿元用于新一代?

  • 云从科技深耕商业 让AI重新定义汽车零售

    近日,由iDigital China举办,中国国际贸易促进委员会汽车行业分会战略支持的ADMIC汽车数字化&营销创新峰会暨金璨奖颁奖盛典在上海完美落幕。云从科技受邀出席了此次峰会,并荣获ADMIC金璨奖。基于长期的汽车垂直行业耕耘,备受行业关注的ADMIC年度金璨奖今年花落云从科技,荣获“年度优秀人工智能技术/平台”。这是对云从在汽车零售领域创新能力、行业影响力和业务价值的实力证明。此次峰会云集了沃尔沃、Jeep、保时捷、蔚来等国?

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议
  • 热门标签