首页 > 动态 > 关键词  > 阿里云最新资讯  > 正文

Graphcore宣布其IPU支持阿里云深度学习开放接口标准ODLA

2020-09-25 16:51 · 稿源: TechWeb.com.cn

【TechWeb】9月25日消息, 2020云栖大会上,阿里云宣布对行业开源业界首个深度学习开放接口标准ODLA(Open Deep Learning API)。阿里云在今年5月份的OCP全球峰会上首次对外公布ODLA接口标准,并宣布已率先在Graphcore等生态伙伴上获得支持。IPU是Graphcore为机器智能从零设计的AI处理器,通过ODLA接口,开发者可以在IPU上快速跑通AI Matrix的各类模型。

ODLA是一个为加速深度学习的统一异构硬件编程接口。ODLA规范了深度学习计算任务的定义和执行,实现上层应用和底层异构硬件平台的解耦,让AI异构计算更简单,实践代码“生成一次,随时链接,随处执行”的愿景。

Graphcore的联合创始人兼首席执行官Nigel Toon表示:“ODLA优雅地满足了Graphcore新用户的两个最大需求。一是他们希望轻松地将我们的技术集成到现有的数据中心,二是他们希望确保最终的设置在从各个组件到整个系统的每个层级都能得到高度优化。”

通过ODLA,在Graphcore IPU上技术适配和应用部署的工作量可以实现大幅度降低,且实现效率大幅提升。另外,通过ODLA可以更好的与AI计算框架进行软硬协同,快速利用现有的编译优化技术,达到最佳性能。对于异构任务,ODLA充当该系统范围通用语言与特定于架构的优化之间的接口或转换器,该优化可从Graphcore的IPU等设备实现最佳性能。

附 ODLA在2020云栖大会上宣布的主要特性:

•透明接口层,零损耗。

•接口抽象和统一,软硬件解耦:通过面向AI的多粒度算子抽象,定义统一的接口,解耦具体软硬件,平滑迁移业务;实现代码复用,提升开发和部署效率。

•多模态执行方式:支持多种执行模式,覆盖解释执行、编译执行、载入预编译代码等场景,兼容各种硬件的运行模式。

•AI全场景支持:支持推理和训练,适配云、边、端全场景AI业务;拥有广泛的算子定义和丰富的接口(设备管理、会话管理、执行管理、事件同步/异步、资源查询、性能监控等)。

•卓越的扩展性,支持AI芯片厂家独特属性和自定义算子。

举报

  • 相关推荐
  • 研究人员推出深度学习模型RECAST 改进地震预测

    来自加州伯克利分校、圣克鲁斯分校以及慕尼黑工业大学的研究人员发表论文,阐述了一种崭新的模型,将深度学习引入地震预测领域。该模型被命名为RECAST,相比自1988年问世以来改进有限的当前标准模型ETAS,RECAST可利用更大的数据集,提供更高的灵活性。你会看到它朝着正确的方向发展。

  • JoJoGAN:可一键生成艺术化面部图像的深度学习模型

    JoJoGAN是一个深度学习模型,该模型可以将普通的面部图像转化为艺术化的作品,无需专业艺术家或设计师的干预。这项技术可用于各种应用领域,包括艺术创作、虚拟角色设计、社交媒体滤镜和广告营销。它的技术细节和使用指南在文章中都得到了详细介绍,为感兴趣的用户提供了宝贵的资源。

  • 谷歌研究人员在 JAX 中引入了一个开源库 用于在球面上进行深度学习

    Google研究人员最近推出了一个基于JAX的开源库,旨在解决在球面上进行深度学习的挑战。传统的深度学习模型通常处理平面数据,例如图像,但科学应用中的数据通常是球面数据。3.这项研究有望在分子性质预测和气象预测等领域取得突破性进展,为医疗研究和气候分析提供有力支持。

  • DeepMind研究人员发现,深度学习模型在图像和音频压缩方面表现出色

    Google旗下的人工智能子公司DeepMind发布的一项研究表明,大型语言模型除了在文本数据处理方面表现出色之外具备出色的图像和音频数据压缩能力。这一发现为重新审视LLMs的潜力提供了新的角度。这表明LLMs的性能与数据集的大小有关,压缩率可以作为评估模型对数据集信息学习的指标。

  • srf-attention:一个提高深度学习模型训练效率的注意力机制

    注意力很有用,但计算成本很高。一旦训练完成,通过一些微调计算,您可以减少SRF注意力并消除对序列长度的依赖,从大大加快速度。它可以帮助研究人员和开发者更高效地构建和训练深度学习模型,提高模型的性能和效率。

  • 深度学习模型部署与优化:策略与实践;L40S与A100、H100的对比分析

    ★深度学习、机器学习、生成式AI、深度神经网络、抽象学习、Seq2Seq、VAE、GAN、GPT、BERT、预训练语言模型、Transformer、ChatGPT、GenAI、多模态大模型、视觉大模型、TensorFlow、PyTorch、Batchnorm、Scale、Crop算子、L40S、A100、H100、A800、H800随着生成式AI应用的迅猛发展,我们正处在前所未有的大爆发时代。四、性价比较根据SuperMicro的数据,L40S在性价比上相较于A100具有优势,为希望部署高效且具有竞争力的生成式人工智能解决方案的用户提供更多选择。在模型分发和运行过程中,提供全面的账号认证和日志审计功能,全方位保障模型和数据的安全性。

  • 阿里云向海外大模型开发者推出PAI灵骏智算、AIACC等服务

    在昨日的阿里云国际峰会上,阿里云宣布将向海外大模型开发者和企业提供一站式开发服务,包括模型训练、推理、部署等全流程的工程平台和智能算力,以满足国际市场对大模型开发服务的旺盛需求。“PAI灵骏智算服务”可为开发者和企业提供AI开发全流程的工程平台和智能算力,能稳定支撑多达10万亿参数的多模态大模型的低能耗训练。根据斯坦福DAWN深度学习基准测试,AIACC可将人工智能模型训练速度提高70%,推理速度提高三倍。

  • iPhone 15系列正式开放,USB-C接口可以兼容安卓线

    iPhone15系列的充电接口问题终于得到了确认,据充电头网最新消息,iPhone15系列的USB-C接口可以完全兼容其他设备的线材,包括安卓手机没有任何加密措施。这一消息对于许多用户来说无疑是一个好消息,尤其是那些需要同时使用多台设备的用户,他们现在出门再也不需要多带一根线了。可以预见,在今年的苹果春节贺岁短片中,iPhone15ProMax将会提供有史以来最强的画面体验。

  • 阿里云与长龙航空合作 打造航空大模型

    阿里云与长龙航空达成全面合作,共同打造航空大模型。根据长龙航空与阿里云合作协议,基于通义系列大模型产品,双方将共同打造应用于特殊旅客在线服务、手册智能查询、航变通知单自动生成等场景中的航空大模型。大模型将通过现有的航班计划表和保护方案实现秒级自动生成新的航变知单。

  • UCSD 研究人员开源Graphologue:将LLM文本响应转化为交互式图表

    大型语言模型如GPT-4因其生成各种用户查询的文本响应的能力变得极为流行。尽管它们具有强大的功能,但在有效传达复杂信息方面存在一些限制。Graphologue代表了使LLM互动更直观和有效的重大进步。