首页 > 业界 > 关键词  > 特斯拉最新资讯  > 正文

特斯拉发布D1 AI芯片:500亿晶体管、400W热设计功耗

2021-08-22 21:31 · 稿源: 快科技

近日的特斯拉AI日活动上,特斯拉公布了最新的AI训练芯片D1”,规模庞大,令人称奇。

该芯片采用台积电7nm工艺制造,核心面积达645平方毫米,仅次于NVIDIA Ampere架构的超级计算核心A100(826平方毫米)、AMD CDNA2架构的下代计算核心Arcturus(750平方毫米左右),集成了多达500亿个晶体管,相当于Intel Ponte Vecchio计算芯片的一半。

其内部走线,长度超过11英里,也就是大约18公里。

它集成了四个64位超标量CPU核心,拥有多达354个训练节点,特别用于88乘法,支持FP32、BFP64、CFP8、INT16、INT8等各种数据指令格式,都是AI训练相关的。

特斯拉称,D1芯片的FP32单精度浮点计算性能达22.6TFlops(每秒22.6万亿次),BF16/CFP8计算性能则可达362TFlops(每秒362万亿次)。

为了支撑AI训练的扩展性,它的互连带宽非常惊人,最高可达10TB/s,由多达576个通道组成,每个通道的带宽都有112Gbps。

而实现这一切,热设计功耗仅为400W。

特斯拉D1芯片可通过DIP(Dojo接口处理器)进行互连,25颗组成一个训练单元(Training Tile),而且多个训练单元可以继续互连,单个对外带宽高达36TB/s,每个方向都是9TB/s。

如此庞然大物,耗电量和发热都是相当可怕的,电流达18000A,覆盖一个长方体散热方案,散热能力高达15kW。

特斯拉展示了实验室内部的一个训练单元,运行频率2GHz,计算性能最高9PFlops(每秒9千万亿次)。

特斯拉还用D1芯片,打造了一台AI超级计算机ExaPOD”,配备120个训练单元、3000颗D1芯片、1062000个训练节点,FP16/CFP8训练性能峰值1.1EFlops(每秒110亿亿次计算)。

建成后,它将是世界上最快的AI超算,对比特斯拉现在基于NVIDIA方案的超算,成本差不多,但拥有4倍的性能、1.3倍的能效比、1/5的体积。

举报

  • 相关推荐
  • 购机选Intel还是AMD?终结选择困难!不同场景对比避坑攻略

    文章对比了英特尔酷睿Ultra 5 225H与AMD锐龙AI 9 H365处理器在大学生学习场景中的表现。测试显示,英特尔在续航和AI创作效率方面优势明显:图书馆场景下续航多50%,视频剪辑等AI任务处理速度快40%,且价格更低。结论指出,酷睿Ultra平台更适合需要长续航、高效AI应用且注重性价比的学生群体,是大学四年的明智选择。

  • 特斯拉自研AI5芯片完成设计评审 马斯克盛赞为“史诗级”产品

    特斯拉CEO马斯克近日在社交媒体上发文称,刚与特斯拉AI5芯片设计团队完成一场极为成功的设计评审,称该芯片将成为史诗级”产品,并透露紧随其后的AI6芯片有望成为迄今为止最出色的AI芯片”。 此前,马斯克已下令解散特斯拉内部的Dojo超级计算机团队,该项目负责人Peter Bannon(彼得班农)也将离职。马斯克在社交平台上解释称:特斯拉为两种截然不同的AI芯片设计共享资�

  • AI日报:生数科技上线Vidu Q1参考生图;字节跳动发布Seedream4.0;百度文心大模型X1.1发布

    本期AI日报聚焦多项AI技术突破与应用进展。生数科技推出Vidu Q1参考生图功能,支持多图输入与一致性生成;字节跳动发布Seedream4.0多模态图像创作模型,推理速度提升10倍;腾讯推出国内首款全形态AI编程工具CodeBuddy,编码效率提升40%;百度文心大模型X1.1升级深度学习能力;OpenAI支持AI动画长片《Critterz》制作;上海AI实验室发布XTuner V1训练引擎提升效率20%;谷歌AI搜索新增5种语言支持;我国发布30项人工智能和15项人形机器人国家标准,推动行业规范化发展。

  • 阿联酋部长在京见证|Klickl与Investopia开启全面战略合作

    2025年9月19日,阿联酋数字金融平台Klickl与阿联酋政府支持的全球投资平台Investopia在北京签署全面战略合作协议。双方将在金融科技、数字金融基础设施、绿色能源投资、跨境支付与资本对接等重点领域展开深度合作,推动中阿经贸合作从政策沟通迈向实体产业协同。Klickl将于2026年起成为Investopia全球战略合作伙伴,共同打造区域经济联动与全球共建的新里程碑。

  • 四方合力推进菁彩Vivid技术应用,引领电影产业视听体验革新

    中国电影科研所、华夏电影、UWA联盟与华为在国家电影局指导下,于9月9日签署战略合作协议,共同推进HDR Vivid技术标准体系建设。该合作将打通从技术标准到内容制作、发行放映的完整产业链,加速超高清视频技术在全行业落地应用,推动中国自主音视频技术标准走向国际,助力2035年电影强国建设目标。

  • 适配特斯拉 Model Y L!雷克沙 A50V让续航旅程更安心

    特斯拉Model Y L专为中国市场打造,是一款三排六座中大型SUV,凭借舒适性升级与强悍性能,成为家庭出行与长途自驾的热门选择。雷克沙JumpDrive A50V U盘为其量身定制,外观小巧,读写速度快,支持哨兵模式与循环录制,完美适配特斯拉车机系统,提供全天候行车记录保障,让驾驶更安心无忧。

  • 腾讯云联合IDC发布AI Infra报告:定义Gen Al时代智算新范式

    2025年腾讯全球数字生态大会于9月16-17日在深圳召开。在Infra+Agent专场,腾讯云与IDC联合发布《AI+Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告。报告指出,随着AI应用规模化落地,AI云基础设施正向核心智算设施演进,涵盖分布式底座、异构硬件、高性能软件和场景化方案四大维度。报告还提出六大演进趋势:架构重构、行业垂直化、算力智能化、安全能力提升、研发范式创新和服务化转型,并解析了腾讯云在交通、制造、医疗等领域的落地案例,为企业智能化转型提供实践指南。

  • SOCAMM2,江波龙正式发布!

    2025年开放数据中心大会(ODCC)于9月9日至11日在北京举行,主题为“拥抱AI变革,点燃算网引擎”。大会聚焦数据中心、算力、存储等领域,汇聚行业专家与企业代表。江波龙在会上发布基于LPDDR5/5x的创新企业级内存产品SOCAMM2,应对AI工作负载挑战;同时介绍AI存储技术如何优化系统性能,提升效率。SOCAMM2具有高带宽、低功耗特点,适用于HPC、AI集群等场景,与HBM互补提升整体算力。此外,江波龙推出智能存储解决方案,通过机器学习优化数据管理,增强可靠性和寿命预测,全面支持AI应用发展。

  • 不止于价格,DigitalOcean、AWS和Linode该选谁?

    本文对比了DigitalOcean、AWS和Linode三大海外云服务商,从定位、成本、易用性、GPU性能及本土化支持等维度分析其优劣势。DigitalOcean以开发者友好、简单易用和高性价比著称,适合初创企业和中小团队;AWS功能全面但复杂昂贵,适合大型企业;Linode性能稳定但生态有限。特别强调DigitalOcean通过卓普云提供本土化支持,解决支付、备案和技术响应等痛点,是中国企业出海的高效选择。

  • 特斯拉Model Y L开启全国首批交付:售价33.9万元起

    今日,特斯拉官方正式宣布,旗下大六座豪华纯电SUV——Model Y L正式开启全国首批交付,新车起售价定为33.9万元。Model Y L在延续现款Model Y经典设计的基础上,对车身尺寸进行了加长处理,并创新性地推出了六座版本,以满足更多家庭用户的出行需求。 具体来看,Model Y L的车身尺寸达到了长4976mm、宽1920mm、高1668mm,轴距更是延长至3040mm,成功跻身中大型SUV行列。与普通版相比�

今日大家都在搜的词: