首页 > 业界 > 关键词  > Meta最新资讯  > 正文

​Meta 计划于今年部署自家 AI 芯片,减少对 Nvidia GPU 的依赖

2024-02-02 11:03 · 稿源:站长之家

划重点:

👉 Meta 计划在今年部署定制的第二代 AI 芯片,名为 "Artemis",用于其数据中心。

👉 新芯片将用于运行 AI 模型的 "推断",旨在减少对 Nvidia 芯片的依赖和控制 AI 工作负载的成本。

👉 Meta 首席执行官马克・扎克伯格最近宣布,他计划在今年底使用34万个 Nvidia H100GPU,总共约有60万个 GPU 用于运行和训练 AI 系统,使得 Meta 成为 Nvidia 除微软外最大的公开客户。

站长之家(ChinaZ.com) 2月2日 消息:社交媒体巨头 Meta 计划于今年在其数据中心部署一款定制的第二代 AI 芯片,代码名为 "Artemis"。

据路透社报道,新芯片将用于 Meta 的数据中心中的 "推断",即运行 AI 模型的过程。该举措的目标是减少对 Nvidia 芯片的依赖,并控制 AI 工作负载的成本。此外,Meta 还在其服务中提供生成式 AI 应用,并正在训练名为 Llama3的开源模型,旨在达到 GPT-4的水平。

大模型,芯片

图源备注:图片由AI生成,图片授权服务商Midjourney

Meta 首席执行官马克・扎克伯格最近宣布,他计划在今年底使用34万个 Nvidia H100GPU,总共约有60万个 GPU 用于运行和训练 AI 系统。这使得 Meta 成为 Nvidia 除微软外最大的公开客户。然而,随着更强大和更大规模的模型,AI 工作负载和成本不断增加。除了 Meta 外,OpenAI 和微软等公司也试图通过专有 AI 芯片和更高效的模型来打破这种成本螺旋。

在2023年5月,Meta 首次推出了名为 Meta Training and Inference Accelerator(MTIA)的新芯片系列,旨在加速并降低运行神经网络的成本。据官方公告,第一款芯片预计将在2025年投入使用,并在当时已在 Meta 的数据中心进行测试。据路透社报道,Artemis 已经是 MTIA 的更高级版本。

Meta 的这一举措表明他们希望通过自家 AI 芯片的部署来降低对 Nvidia 芯片的依赖,以及控制 AI 工作负载的成本。他们计划在今年将 Artemis 芯片投入生产,并表示:"我们认为我们自主开发的加速器与市面上可购买的 GPU 在 Meta 特定工作负载上提供了性能和效率的最佳组合。" 这一举措将为 Meta 带来更大的灵活性和自主性,同时也有望降低 AI 工作负载的成本。

举报

  • 相关推荐
  • 超擎速度!全国首批NVIDIA DGX Spark率先抵达超擎数智,现货在仓,交付启动

    10月19日,全国首批NVIDIA DGX Spark桌面级AI超算率先抵达超擎数智并开始交付。这款"全球最小AI超算"在发布72小时内落地中国市场,为企业和科研机构提供强劲算力。产品预装完整AI软件栈,实现开箱即用,配备详细快速指南和专业支持团队,助力开发者无缝对接顶尖计算能力,加速AI本地化开发创新。

  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

  • 颠覆Diffusion局限!Utopai双模型耦合架构,攻克AI影视长叙事核心难题

    Utopai Studios推出专为影视制作设计的AI模型与工作流,区别于主流视频生成模型,其核心能力在于理解剧本、规划镜头及生成场景,通过自回归模型负责叙事规划与一致性约束,扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题,提升制作效率与作品品质。目前工作流仅用于公司自有项目,强调AI作为创作者协作者的角色,并遵循行业道德与版权规范。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • PayInOne携智能AI招聘产品Foundire亮相进博会,创新科技步履不停

    第八届中国国际进口博览会于2025年11月5日至10日在上海成功举办。全球招聘与薪酬管理平台PayInOne在服务贸易展区亮相,重点展示其AI驱动的智能招聘平台Foundire,该平台通过人才画像匹配、自动化筛选及智能评估体系,显著提升跨境招聘效率与精准度。CEO林坦在专题演讲中强调AI技术正推动用工模式变革,助力企业实现全球化高效合规管理。展会期间,PayInOne联合多家生态伙伴举办多场活动,探讨企业出海机遇,并与政府、企业界嘉宾深入交流,巩固了其在全球人力资源服务领域的行业领导地位。

  • 进博会“全勤生”三星的AI全景图:AI Home中国首秀

    三星在进博会上首次展出AI+Home智能家庭解决方案,通过Bespoke AI、Vision AI和Galaxy AI三大模块,实现全场景智慧生活。AI正从"会语言"向"会行动"演进,软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势,打破端侧AI的性能、算力与存储"不可能三角",构建起覆盖手机、电视、家电的生态闭环。未来,AI将全面接管生活,让科技真正服务于人。

  • 菁彩Vivid搭载车量超百万,携手车企迎来车载应用新里程碑!

    2025年11月5日,世界超高清视频产业联盟在深圳举办UWA+峰会,宣布中国自主三维音频标准“菁彩声”(Audio Vivid)车载应用装机量突破100万台。该标准基于AI技术,支持7阶HOA渲染与128轨实时处理,解码延迟低于80ms,实现三维空间精准定位与“黄金听音位”个性化体验。已覆盖鸿蒙智行、奇瑞等十余家车企29款车型,获IEC国际标准认证,与Dolby AC-4等并列全球四大三维音频标准。通过构建“标准-内容-终端”生态,推动中国音频产业从技术领先迈向市场引领。

  • 平安云原生AI算力资源调度平台,荣获IDC “AI-就绪数字基础设施领军者优秀奖”

    近日,IDC公布2025年中国未来企业大奖获奖名单,平安科技打造的《云原生AI算力资源调度平台》创新项目荣获“AI就绪数字基础设施领军者优秀奖”。该平台通过统一资源池化管理、动态调度及GPU虚拟化等技术,显著提升资源利用率约30%,降低运营成本,并支持金融级高可用与弹性伸缩,助力企业高效应对AI推理与训练场景需求,体现了平安在AI基础设施构建与产业赋能方面的技术实力与国际认可。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 让AI为你打工有多爽?企业如何选对AI员工?尘锋AI员工,帮您真正复刻优秀员工!

    本文探讨2025年AI员工在各行业的广泛应用,强调其核心价值在于替代人工处理重复性、流程固定的工作,如客服、销售等,实现效率提升与成本优化。文章指出,企业选择AI员工需关注四个关键维度:技术专业度、系统开放性、安全合规性及服务可靠性,并以尘锋AI为例说明如何通过智能协作、数据整合推动业务增长。最终总结,雇佣AI员工是企业面向未来的战略布局,需选择匹配需求的可靠产品以构建竞争优势。

今日大家都在搜的词: