首页 > 传媒 > 关键词  > Ampere最新资讯  > 正文

Ampere 宣布将 AmpereOne® 系列处理器扩展至 256 核,并与高通在 CPU 和加速器领域展开合作

2024-05-21 10:17 · 稿源: 站长之家用户

AmpereOneRChip-1.jpg

新款 Ampere CPU 的性能将较市场上现有的 CPU 高出40%

中国北京,2024年5月20日 – Ampere Computing® 今天正式发布年度战略和产品路线图更新,重点介绍 Ampere 在可持续、有效能计算的云和人工智能计算方面的持续创新和发明。Ampere 还宣布正在与高通技术公司携手合作,双方将结合高通技术公司高性能、低功耗的 Qualcomm® Cloud AI100推理解决方案和 Ampere CPU,共同开发人工智能推理联合解决方案。

半导体行业资 深人士,Ampere 首席执行官 Renee James 表示,人工智能的发展带来了日益增长的电力需求和能源挑战,使 Ampere 围绕性能和能效的芯片设计方法比以往任何时候都更加受到业界关注。Renee James 表示:“Ampere 自六年前起就致力于高性能、高能效的芯片设计,因为我们坚信这是未来的发展方向。过去,低能耗往往与低性能同义,但是 Ampere 已经证明这并非事实。我们开创了计算效率的前沿,在有效计算环境中提供超越传统 CPU 的性能。”

Renee James 进一步强调了人工智能快速发展所带来的日益严重的问题:能源问题。她表示:“当前的发展道路并不可持续。我们坚信,未来的数据中心基础设施必须解决两大问题:一是如何通过升级计算来优化现有的风冷环境;二是如何构建符合电网供电能力的新型可持续数据中心。这正是 Ampere 力求实现的目标”。

Ampere 首席产品官 Jeff Wittich 介绍了公司的愿景——“人工智能计算(AI Compute)”,该愿景旨在将传统的云原生功能与人工智能深度融合。Jeff Wittich 表示:“Ampere CPU 能够运行各种工作负载——从最 流行的云原生应用程序到人工智能,包括与传统云原生应用程序集成的人工智能,例如数据处理、web 服务、媒体分发等。”

Renee James 和 Jeff Wittich 共同宣布,Ampere 将推出全新的 AmpereOne® 平台,该平台基于 N3工艺节点,配备12通道和256核 CPU。

Ampere2024年战略和产品路线图除了更新公司发展方向和愿景外,还包括:

Ampere 正在与高通技术公司合作,共同开发采用 Ampere CPU 和 Qualcomm Cloud AI100Ultra 的解决方案。该方案将解决业界最 大的生成式人工智能模型上的大语言模型(LLM)推理问题。

Ampere12通道平台进行扩展,搭载即将推出的256核 AmpereOne® CPU。该平台将采用与现有192核 AmpereOne® CPU 相同的风冷散热解决方案,其性能较市场上现有的 CPU 高出40%,且无需采用复杂的平台设计。Ampere 的192核12通道内存平台预计将在今年晚些时候推出。

Meta Llama3在基于 Ampere CPU 的 Oracle Cloud 上运行的更新。性能数据显示,在128核 Ampere® Altra® CPU 上运行 Llama3(无需 GPU 辅助),其性能可媲美 Nvidia A10GPU 与 x86CPU 的联合运算,但功耗仅为后者的三分之一。

宣布成立 UCIe 工作组,作为 AI 平台联盟(AI Platform Alliance)的重要组成部分。作为该联盟的一部分,Ampere 表示将利用开放接口技术来增强其 CPU 的灵活性,使其能够将其他客户 IP 整合到未来的 CPU 中。

提供了关于 AmpereOne® 性能以及 OEM 和 ODM 平台的新细节。AmpereOne® 在每瓦性能上继续保持领先地位,与业界某两款领先的传统 x86处理器相比,AmpereOne® 的每瓦性能分别高出50% 和15%。对于希望更新和整合旧基础设施以节省空间、预算和电力的数据中心而言,AmpereOne® 的每机架性能提升高达34%。

全新 AmpereOne® OEM 和 ODM 平台将在未来几个月内发货。

Ampere 宣布与 NETINT 推出联合解决方案,该方案采用 NETINT 的 Quadra T1U 视频处理芯片和 Ampere CPU,可同时对360个直播频道进行转码,并使用 OpenAI 的 Whisper 模型为40个流媒体提供多种语言的实时字幕。

除了内存标记(Memory Tagging)、QOS 强制(QOS Enforcement)和网格拥塞管理(Mesh Congestion Management)等现有功能外,Ampere 还推出了全新 FlexSKU 功能,该功能允许客户使用相同的 SKU 来处理横向扩展和纵向扩展用例。

关于 Ampere Computing

Ampere Computing 是一家现代化半导体企业,致力于塑造云计算的未来,并推出了世界上首 款云原生处理器。为可持续云而生,Ampere 云原生处理器兼具最 高性能和最 佳每瓦性能,助力加速多种云计算应用的交付,为云提供行业领先的性能、能效和可扩展性。

*关于性能声明的更多信息,请参阅此处的脚注。

Qualcomm Cloud AI 是 Qualcomm Technologies, Inc.和/或其子公司的产品。

Qualcomm 是Qualcomm Incorporated的商标或注册商标。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Joor:完美的日记应用,记录你的想法。

    Joor是一款日记应用,它允许用户写下自己的想法,并由应用自动处理其余部分。它提供了一个简洁的界面,让用户能够轻松地记录下自己的思考和灵感,同时可能还具备一些自动整理和回顾的功能。

  • Samba:高效无限上下文语言模型的官方实现

    Samba是一个简单而强大的混合模型,具有无限的上下文长度。它的架构非常简单:Samba = Mamba + MLP + 滑动窗口注意力 + 层级MLP堆叠。Samba-3.8B模型在Phi3数据集上训练了3.2万亿个token,主要基准测试(例如MMLU、GSM8K和HumanEval)上的表现大大超过了Phi3-mini。Samba还可以通过最少的指令调整实现完美的长上下文检索能力,同时保持与序列长度的线性复杂度。这使得Samba-3.8B-instruct在下游任务(如长上下文摘要)上表现出色。

  • TC-Bench:视频生成模型的时间组合性评估工具

    TC-Bench是一个专门用于评估视频生成模型的时间组合性的工具。它通过精心设计的文本提示、相应的真实视频以及强大的评估指标来衡量视频生成模型在不同时间点上新概念的出现及其关系转换的能力。TC-Bench不仅适用于文本条件模型,也适用于图像条件模型,能够进行生成性帧插值。该工具的开发旨在推动视频生成技术的发展,提高生成视频的质量和一致性。

  • Promptchains:智能AI工作流构建器,释放AI潜力。

    Promptchains是一个革命性的AI工作流构建器,旨在通过提示链技术解锁AI的潜力。它将复杂任务转化为智能解决方案,实现AI的承诺。产品通过组合AI提示和其他工具到工作流中,使企业能够轻松定制、保存、重用和分享。它超越了AI交互的新奇性,创造了能够与熟练的人类员工并肩工作的解决方案。

  • Sanctuary:个性化冥想引导,由AI驱动,提升专注力,减压助眠。

    Sanctuary是一款利用尖端AI技术为用户提供个性化冥想指导的应用程序。它通过智能学习用户偏好,提供每日更新的冥想内容,帮助用户改善专注力,减少压力,并促进更好的睡眠。该应用拥有超过10万次的个性化冥想创建记录,用户反馈显示,它简化了冥想过程,使冥想变得容易和可访问,对于缓解焦虑和整体压力水平有显著效果。

  • Partnerplace:合作伙伴管理工具,提升合作效率。

    Partnerplace是一款专为合作伙伴关系管理设计的在线工具,它通过自动化繁琐的任务,如佣金处理,帮助企业高效管理和发展合作伙伴网络。该工具支持定制化合作伙伴计划,实现品牌专业体验,并通过集中化平台提高工作效率。Partnerplace的价值观包括弹性、参与度和连接性,旨在为用户提供一个完全定制化的、参与性强的、连接销售团队和CRM系统的合作伙伴管理系统。

  • Depth Anything V2:先进的单目深度估计模型

    Depth Anything V2 是一个经过改进的单目深度估计模型,它通过使用合成图像和大量未标记的真实图像进行训练,提供了比前一版本更精细、更鲁棒的深度预测。该模型在效率和准确性方面都有显著提升,速度比基于Stable Diffusion的最新模型快10倍以上。

  • OTTO SEO by Search Atlas:革命性的AI SEO工具,简化SEO工作流程。

    OTTO SEO是Search Atlas推出的一款AI驱动的SEO工具,旨在通过自动化技术优化网站,提高SEO效率。它通过添加OTTO像素到网站,能够自动执行网页优化,包括技术修复、内容优化、反向链接建设和内容创作。OTTO SEO的主要优点在于节省时间、提高效率,并帮助营销团队或代理公司实现SEO策略的自动化和优化。

  • AI drafts by Help Scout:提升客服团队效率,实现个性化客户服务。

    Help Scout提供的AI客服平台,通过人工智能技术,帮助客服团队提升工作效率,减少重复性工作,让团队成员能够专注于更复杂和个性化的客户对话。平台特点包括无需编程即可使用、快速回复、提升客户满意度,以及通过AI生成回复草稿等。

  • OpenVLA:开源视觉-语言-动作模型,推动机器人操作技术发展。

    OpenVLA是一个具有7亿参数的开源视觉-语言-动作(VLA)模型,通过在Open X-Embodiment数据集上的970k机器人剧集进行预训练。该模型在通用机器人操作策略上设定了新的行业标准,支持开箱即用控制多个机器人,并且可以通过参数高效的微调快速适应新的机器人设置。OpenVLA的检查点和PyTorch训练流程完全开源,模型可以从HuggingFace下载并进行微调。

  • VideoLLaMA 2:视频理解领域的先进空间-时间建模与音频理解模型。

    VideoLLaMA 2 是一个针对视频理解任务优化的大规模语言模型,它通过先进的空间-时间建模和音频理解能力,提升了对视频内容的解析和理解。该模型在多选视频问答和视频字幕生成等任务上展现了卓越的性能。

  • HumanPlus:人类动作模仿与自主技能学习系统

    HumanPlus是一个研究项目,旨在通过模仿人类动作来训练人形机器人,从而实现自主技能学习。该项目通过模拟强化学习训练低级策略,并将这些策略应用到真实世界中,实现实时跟踪人类身体和手部动作。通过影子模仿技术,操作员可以远程操作机器人收集全身数据,用于学习不同任务。此外,通过行为克隆技术,机器人能够模仿人类技能,完成各种任务。

  • Jace:AI助手,助力高效营销与管理。

    Jace是一款商业领域的AI助手,专注于提升营销效率,无需专业技能即可轻松启动和管理营销活动。其主要优点包括创建针对性的营销活动、实时监控性能和随时优化。

  • ARC-AGI:人工智能通用推理测试集

    ARC-AGI是一个旨在测试人工智能系统是否具备类似人类一般流体智力的抽象和推理能力的数据集。它由400个训练任务和400个评估任务组成,每个任务都以JSON格式存储,包括输入输出对。该数据集可以作为人工智能基准测试、程序合成基准测试或心理测量智力测试。

  • PROTEUS:实时表情生成人类模型

    PROTEUS是Apparate Labs推出的一款下一代基础模型,用于实时表情生成人类。它采用先进的transformer架构的潜在扩散模型,创新的潜在空间设计实现了实时效率,并能通过进一步的架构和算法改进,达到每秒100帧以上视频流。PROTEUS旨在提供一种通过语音控制的视觉体现,为人工对话实体提供直观的接口,并且与多种大型语言模型兼容,可定制用于多种不同应用。

  • Warp:AI和协作工具重新定义的终端

    Warp是一款使用Rust语言编写的终端应用程序,它通过集成AI和协作工具,提供了现代化的编辑、命令生成、可复用工作流和知识共享等功能,旨在提升开发者的生产力。Warp的AI功能可以建议正确的命令或解答编程问题,同时保持请求的私密性和安全性。Warp Drive允许用户组织难以记忆的命令,提高个人和团队的效率。此外,Warp还提供了自定义主题和以隐私为设计原则的安全性。

  • TalkWithGemini:一键部署您的私人Gemini应用

    TalkWithGemini 是一款支持一键免费部署的跨平台应用,用户可以通过这个应用与 Gemini 模型进行交互,支持图片识别、语音对话等多模态交互方式,提高工作效率。

  • PowerInfer-2:专为智能手机设计的高效大型语言模型推理框架

    PowerInfer-2是一个为智能手机特别优化的推理框架,支持高达47B参数的MoE模型,实现了每秒11.68个token的推理速度,比其他框架快22倍。它通过异构计算和I/O-Compute流水线技术,显著减少了内存使用,并提高了推理速度。该框架适用于需要在移动设备上部署大型模型的场景,以增强数据隐私和性能。

  • emo-visual-data:表情包视觉标注数据集

    emo-visual-data 是一个公开的表情包视觉标注数据集,它通过使用 glm-4v 和 step-free-api 项目完成的视觉标注,收集了5329个表情包。这个数据集可以用于训练和测试多模态大模型,对于理解图像内容和文本描述之间的关系具有重要意义。

  • E3Gen:高效、表现力强、可编辑的数字头像生成

    E3Gen是一种新型的数字头像生成方法,能够实时生成高保真度的头像,具有详细的衣物褶皱,并支持多种视角和全身姿势的全面控制,以及属性转移和局部编辑。它通过将3D高斯编码到结构化的2D UV空间中,解决了3D高斯与当前生成流程不兼容的问题,并探索了在涉及多个主体的训练中3D高斯的表现力动画。

今日大家都在搜的词:

热文

  • 3 天
  • 7天