AI推理芯片

据韩媒ZDNetKorea援引的消息透露，三星电子正计划利用其4nm工艺进行AI推理芯片Mach-1的原型试产，采用MPW方式。尽管三星已具备3nm代工技术，但出于项目执行稳定性的考虑，公司决定在Mach-1上采用更为成熟的4nm或5nm工艺。外界消息显示，三星在4月份发布了8个与Mach-1芯片相关的招聘岗位，显示了公司对该项目的重视。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“AI推理芯片”的相关热搜词：

相关“AI推理芯片” 的资讯516篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
三星计划使用4nm工艺生产AI推理芯片Mach-1预计年底前完成交付

据韩媒ZDNetKorea援引的消息透露，三星电子正计划利用其4nm工艺进行AI推理芯片Mach-1的原型试产，采用MPW方式。尽管三星已具备3nm代工技术，但出于项目执行稳定性的考虑，公司决定在Mach-1上采用更为成熟的4nm或5nm工艺。外界消息显示，三星在4月份发布了8个与Mach-1芯片相关的招聘岗位，显示了公司对该项目的重视。

三星电子 AI推理芯片 4nm工艺
荐 AI视野：英伟达推文生图模型ConsiStory；高度可控AI试衣OOTDiffusion；开发者推SoraWebui开源项目；Groq最快AI推理芯片成本推算高得离谱

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

ConsiStory
Groq最快AI推理芯片成本推算高得离谱运行LIama2得1171万美元

Groq公司推出了一款号称性价比高达英伟达GPU100倍的AI推理芯片，引起了广泛关注。运行其最快AI推理芯片LIama2所需的成本高达1171万美元，让业内人士开始对其效益进行热议。Groq推出的AI推理芯片在性能上取得了突破，但成本问题仍需解决。

Groq AI推理芯片 LIama2
AI视野：百度Apollo开放平台9.0发布；OpenAI公布ChatGPT安全框架；Etched AI推AI推理加速芯片Sohu；美图云修Pro版正式发布；Runway上线文字生成语音功能

百度发布Apollo开放平台9.0，全面升级自动驾驶开发领域，包括工程、算法和工具三方面，重构12万行代码，新增20万行。工程框架拆分成小软件包，提高灵活性;算法优化感知算法，支持4D毫米波雷达;工具升级包括高精地图、传感器标定等，提升Dreamview效率。项目网址:https://julian-parker.github.io/stemgen/论文网址:https://arxiv.org/abs/2312.08723👨‍�

Apollo
甩英伟达几百条街？Etched AI推AI推理加速芯片Sohu 将Transformer架构直接“烧录”到芯片中

美国芯片初创公司EtchedAI近日宣称，他们成功开创了一项新的技术，将Transformer架构直接“烧录”到了芯片中，创造出了世界上最强大的专门用于Transformer推理的服务器Sohu。这项技术可以运行万亿参数的模型，甩英伟达几百条街。这一突破性技术的问世，将为Transformer架构的应用带来新的可能性。

芯片
阿里第一款正式流片芯片！平头哥发布含光800：全球性能最高AI推理芯片

在上周举办的2019云栖大会上，阿里巴巴旗下平头哥半导体公司发布了阿里巴巴第一款芯片——含光800，号称全球最高性能AI推理芯片。

阿里阿里平头哥含光800
阿里巴巴发布最高性能AI推理芯片“含光800”

在9月25日的 2019 云栖大会上，阿里巴巴“平头哥”正式发布了最强AI芯片“含光800”，据介绍， 1 颗含光 800 的算力相当于 10 颗GPU，“含光800”集成达摩院的创新算法，深度优化CNN及视觉类算法，可大幅提升视觉计算效率。

阿里 AI AI芯片
阿里发布AI推理芯片——含光800 耗时1年半

今天， 2019 阿里云栖大会正式在杭州开幕。在会上，阿里巴巴正式对外发布全新的含光800AI芯片。据称，这是全球性能最高的AI推理芯片。

阿里巴巴含光800 AI
阿里巴巴发布含光800AI芯片，称全球性能最高AI推理芯片

9月25日杭州云栖大会上，阿里巴巴正式发布含光800AI芯片，官方称全球性能最高AI推理芯片。阿里巴巴集团CTO兼阿里云智能总裁张建锋表示“这是互联网公司研发的第一款芯片，这是万里长征第一步”，张建锋称，阿里巴巴有足够的能力去做传统公司的事情，“我们用一年半时间，就完成了芯片的制作。所以，阿里巴巴将成为软硬件一体化协同发展的公司”。

阿里巴巴含光800AI芯片 AI
fal官网体验入口生成式媒体模型AI推理工具使用地址

fal是一个生成式媒体平台，旨在为开发者提供最先进的生成式媒体模型，并通过fal的推理专家优化，实现闪电般快速的推理。该平台支持实时WebSocket推理基础设施，并提供私有部署选项，以最经济的方式根据使用量付费。开发者可通过fal灵活的计费方式，实现经济高效的生成式媒体应用。

fal
阿里云推出第八代企业级实例g8i AI推理性能提升7倍

阿里云推出了第八代企业级通用计算实例ECSg8i，采用了阿里云自研的「飞天CIPU」架构体系和第五代英特尔至强可扩展处理器。新款实例的整机性能最高提升85%，AI推理性能最高提升7倍，可以支持高达72B参数的大语言模型。阿里云表示，ECSg8i实例的强劲表现证明了以CPU为中心的计算体系同样具备加速AI推理的潜力，公共云不仅可以胜任超大规模的AI模型为AI应用加速落地提供了新的路径。
英特尔发布酷睿 Ultra 移动处理器：集成NPU AI引擎具备低延迟AI推理能力

英特尔正式发布了全新酷睿Ultra移动处理器，代号为MeteorLake。酷睿Ultra的设计目标是在能效、制造工艺和性能方面实现突破。它的AI性能在各个方面都遥遥领先竞品，比如在GIMPStableDiffusion中，性能提升达到了竞品的5.4倍。
NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

正在举行的微软Iginte全球技术大会上，微软发布一系列AI相关的全新优化模型、开发工具资源，帮助开发者更深入地释放硬件性能，拓展AI场景。尤是对于当下在AI领域占据绝对主导地位的NVIDIA来说，微软这次送上了一份大礼包，无论是面向OpenAIChatAPI的TensorRT-LLM封装接口是RTX驱动的性能改进DirectMLforLlama2，以及其他热门大语言模型，都可以在NVIDIA硬件上获得更好的加速和应用。目前已经有400多个合作伙伴发布了支持RTXGPU加速的AI应用、游戏随着模型易用性的不断提高，相信会有越来越多的AIGC功能出现在WindowsPC平台上。
Meta工程师称全球AI推理用电仅需新增两座核电站即可满足

Meta公司的生成式人工智能工程总监谢尔盖·埃杜诺夫在硅谷数字工人论坛上透露，为满足明年全球不断增长的人工智能应用推理需求，仅需新增两座核电站的发电量即可。埃杜诺夫表示，他仅通过简单的数学计算得出这个结果。但创新如Salesforce的Blib-2等仍在继续，或可通过提高效率绕开限制。
12nm媲美7nm！燧原科技发布带宽最大的云端AI推理卡

12月7日，AI创业公司燧原科技(Enflame)发布了第二代云端AI推理加速卡云燧i20”。这是继今年7月的云端AI训练加速卡云燧T20”之后，燧原科技新一代针对云端推理场景的AI加速产品。云燧i20最大亮点就是拥有迄今最大的AI加速卡存储带宽，通过HBM2e内存达到了819GB/s，可为云端推理业务提供高吞吐、低延时的性能。目前，以语音识别、图片识别、视频内容分析为主的感知类应用，内容推荐、欺诈交易拦截等决策类应用，在云端大部分都是以实

云燧i20 云燧i10 燧原科技
华为：ETC使用了华为AI推理和训练卡Atlas300

9月19日据科创板日报报道，华为Cloud & AI产品与服务总裁侯金龙今日在华为HC(全联接)大会上透露，ETC应用了AI推理和训练卡Atlas 300。华为Atlas智能计算平台基于华为昇腾系列AI处理器和业界主流异构计算部件。

华为 ETC AI
阿里发布首个知识引擎研究计划联合5大高校攻坚AI推理技术

在人工智能知识工程领域，产业界和学术界第一次联手发布了知识引擎研究计划。4月21日，阿里巴巴宣布联合清华大学、浙江大学、中国科学院自动化所、中科院软件所、苏州大学5所高校发布藏经阁（知识引擎）研究计划。该计划以结构化的形式描述客观世界中概念、实体及其之间的关系，将互联网信息内容表达成更接近人类认知世界的形式，从而使计算机具备类脑推理能力。同时，阿里还宣布打算用一年时间初步建成首个开放的知识引擎服务平台

阿里知识引擎
荐 AI视野：大模型最快推理芯片Groq登场；真人视频冒充Sora；Stable Diffusion WebUI Forge推出；字节辟谣推出中文版Sora

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

Groq
荐推理性能超H100十倍！21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」，2人公司估值3400万刀

【新智元导读】最近，两位哈佛辍学生共同创立的AI芯片公司，估值已达3400万美元，并计划明年交付一款名为「Sohu」的AI推理加速芯片——其LLM推理性能达到H100的10倍单价吞吐量更是高达140倍。像Pika一样的神级创业故事又要再次上演了?两位哈佛退学的年轻人，想要制造一款专用于大语言模型加速的AI加速器芯片，将于2024年第三季度交付，推理性能达H100的10倍。CerebrasSystems的CEO

AI芯片 H100
荐老黄深夜炸场，世界最强AI芯片H200震撼发布！性能飙升90%，Llama 2推理速度翻倍，大批超算中心来袭

【新智元导读】刚刚，英伟达发布了目前世界最强的AI芯片H200，性能较H100提升了60%到90%能和H100兼容。大科技公司们又要开始疯狂囤货了。我们能知道的是，等到明年第二季度H200上市，届时必将引发新的风暴。

H200
MLPerf放榜！AI芯片公司墨芯人工智能再夺MLPerf大模型推理三项冠军

最新MLPerf推理测试结果公布，墨芯人工智能再次夺冠，其S30计算卡在GPT-J大模型的单卡、4卡、8卡推理性能均位居第一。此前墨芯已在MLPerf上连续两届夺冠。MLPerf成绩是对墨芯产品实力的肯定，也印证稀疏计算将助力大模型算力实现根本性变革。

墨芯 AI芯片
IBM 研究人员推出用于深度学习推理的模拟 AI 芯片

IBM研究人员近日在《自然电子学》杂志上发表了一篇文章，介绍了一款用于深度学习推理的模拟人工智能芯片。该芯片采用模拟内存计算的方法，使用纳米级的相变存储器将突触权重存储为电导值。这一研究为未来实现软件等效的神经网络准确性奠定了基础。

AI芯片
高通推理计算AI芯片发布将人工智能专长拓展至云端

智能手机领域现在正在经兴起芯片AI化的浪潮，很多手机都搭载了AI芯片。在AI芯片的加持下，诸如AI美颜拍照、AI语音助手、安全支付等手机AI应用都能轻松实现，大大优化了智能手机的使用体验。高通作为移动芯片的领军者，在AI领域积累了深厚的技术和经验，骁龙AI芯片的广泛使用推动了近几年来AI功能在智能手机中的普及。高通在AI方面的布局由来已久，早在 2007 年，高通便开始探索面向计算机视觉和运动控制应用的机器学习脉冲神经方法

高通 AI芯片
DeepMind AI数学奥林匹克突破银牌标准，数学推理能力再提升

谷歌旗下的DeepMind团队近期在国际数学奥林匹克中取得了令人瞩目的成绩。DeepMind的两款人工智能模型——AlphaProof和AlphaGeometry2，成功解决了本年度比赛中的四个难题，达到了银牌水平。OpenAI正在开发名为“Strawberry”的新型AI模型，以显著提升AI的推理能力;Meta公司也推出了最新的AI模型Llama3.1，推动开源AI的发展。

DeepMind 人工智能模型数学推理
阿里云全面升级GPU云服务：AI大模型推理性能可提升100%

阿里云推出全面升级的GPU云服务，通过全新优化GPU套件，多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术，阿里云推出ACK云原生AI套件，帮助开发者及企业更高效地开发和部署AI应用，加速大模型应用落地。小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型，在阿里云上为消费者和客户提供丰富的AI应用服务。
AI+视频 | Nvidia 投资的AI公司，通过视频理解开创感知推理，获顶级风投5000万美元融资

在每天刷视频的时代，我们如何快速创作360度全方位理解的视频内容?TwelveLabs，一家旧金山初创公司，是由一支年轻的工程师团队JaeLee和AidenL创立，该产品可在视频中提取特定视频瞬间，包括视觉、音频、文本和上下文信息，以实现语义搜索、分析和洞察。该公司的愿景是创建用于多模式视频理解的基础设施，其自研模型可用于媒体分析并自动生成精彩片段。视频内容的深度分析和理解，将为我们打开一个全新的视角，让我们以前所未有的方式探索和理解世界。

视频内容理解语义搜索多模式视频理解
当《开心消消乐》遇上 AI 推理，我们找到了高质量关卡背后的原因！

随着AI热潮席卷各行各业，其落地应用已经成为企业技术研发升级的工作重心。人工智能应用的升级不仅需要软件层面的升级迭代需要大规模基础设施的支撑。英特尔与腾讯云的成果也将惠及更多游戏企业，持续为他们提供助力，满足轻资产、重人力类型的游戏厂商在激烈的竞争环境中降本增效的迫切需求。
荐最火AI角色扮演流量已达谷歌搜索20%！每秒处理2万推理请求，Transformer作者公开优化秘诀

什么AI应用每秒处理20000个AI推理请求，达到2024年谷歌搜索流量的1/5?答案是独角兽Character.ai，由Transformer作者NoamShazeer创办。沙哥公布了推理优化独门秘诀，迅速引起业界热议。最近有消息称，Meta与马斯克的𝕏都在争取与他们合作，把聊天机器人引入社交平台。

AI角色
荐 AI学会隐藏思维暗中推理！不依赖人类经验解决复杂任务，更黑箱了

AI做数学题，真正的思考居然是暗中“心算”的?纽约大学团队新研究发现，即使不让AI写步骤，全用无意义的“……”代替，在一些复杂任务上的表现也能大幅提升!一作JacabPfau表示:只要花费算力生成额外token就能带来优势，具体选择了什么token无关紧要。让Llama34M回答一个简单问题:自然常数e的前6位数字中，有几个大于5的?AI直接回答约等于瞎捣乱，只统计前6位数字居然统计出7�

AI
荐 AI日报：Model3模型重磅发布；阿里云全面支持Llama 3训练推理；Gorq推出iOS应用；批量去水印工具VSR来了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、BlockadeLabs发布全新模型Model3本文介绍了知名生成式AI平台BlockadeLabs发布的全新模型Model3，该模型实现了生成效果的质的提升，支持超高清8192x4096分辨率，提升了文本提示器描述生

Model3

热文

3 天
7天

AI推理芯片

与“AI推理芯片”的相关热搜词：

相关“AI推理芯片” 的资讯516篇

热文

站长商机