首页 > 业界 > 关键词  > Groq最新资讯  > 正文

Groq最快AI推理芯片成本推算高得离谱 运行LIama2得1171万美元

2024-02-21 14:38 · 稿源:站长之家

划重点:

- 💰 以1171万美元的成本运行 LIama2,引发热议

- 💻 Groq 的芯片性能高,但成本也随之增加

- 🔍 分析师对 Groq 成本和效益进行评估,与英伟达 GPU 进行对比

站长之家(ChinaZ.com)2月21日 消息:最近,Groq 公司推出了一款号称性价比高达英伟达 GPU100倍的 AI 推理芯片,引起了广泛关注。然而,运行其最快 AI 推理芯片 LIama2所需的成本高达1171万美元,让业内人士开始对其效益进行热议。网友们通过粗略估算发现,为了运行 LIama2,需要大约购买568块芯片,这一高昂的成本引发了许多讨论。

在成本问题上,与英伟达 GPU 进行对比也成为了焦点。据分析,为了运行单个 LLama70B 模型,需要购买约320张芯片,总成本约为1千万美元。相较之下,英伟达的 H100卡性能虽然一半于 Groq,但价格仅为30万美元,采购和运营成本更低。这些数据让人开始重新评估 Groq 芯片的性价比。

image.png

除了网友们的讨论,一些分析师也加入了对 Groq 芯片成本和效益的评估。根据其中一位分析师的计算,运行 LLaMA70b 模型需要572张芯片,每年电费将花费25.4万美元。相比之下,使用4张 H100卡可以实现 Groq 一半的性能,且采购和运营成本更低,这进一步凸显了 Groq 成本的挑战。

在这场关于 Groq 芯片成本和效益的讨论中,公司本身也积极参与。Groq 回应称,他们的目标客户不是单卡用户,且他们的芯片价格实惠高效,由于自主研发芯片到系统的整套流程,没有中间商。然而,对于 Groq 是否能撼动英伟达的地位,业内人士持观望态度,认为还需进一步观察。整体而言,Groq 推出的 AI 推理芯片在性能上取得了突破,但成本问题仍需解决。

项目入口:https://top.aibase.com/tool/groq

相关阅读:Groq大模型推理芯片每秒500tokens超越GPU,喊话三年超过英伟达

举报

  • 相关推荐
  • 当折叠屏遇上AI 探秘开发Samsung One UI 8的幕后故事

    三星One UI 8与Galaxy Z Fold7/Flip7同步亮相,深度融合折叠形态与AI技术,带来全新交互体验。通过与谷歌紧密合作,新系统首批预装Android 16,用户可提前体验最新功能。系统聚焦多模态AI、折叠屏优化UX及个性化设计,并强化安全防护。开发团队透露,三星与谷歌从早期规划便协同开发,实现高效多任务处理与创新功能,未来将继续深化AI生态合作。

  • 华为即将发布AI推理领域突破性成果:或能降低对HBM内存依赖

    华为将于8月12日在2025金融AI论坛发布AI推理领域突破性技术成果。该技术有望降低中国AI对HBM高带宽内存的依赖,提升大模型推理性能,完善国内AI生态。HBM作为3D堆叠DRAM方案,具有高带宽、低延迟等优势,是高端AI芯片标配,但面临产能紧张和美国出口限制。国内厂商正探索Chiplet封装、低参数优化等替代方案。

  • 华为发布AI推理技术UCM:降低HBM依赖 计划9月正式开源

    在2025金融AI推理应用落地与发展论坛上,华为重磅发布了其AI推理创新技术UCM(推理记忆数据管理器)。这项技术被业内视为有望重塑国内AI推理格局的关键突破。 UCM技术的核心在于其先进的KV Cache系统,通过融合多种缓存加速算法工具与精细的分级管理策略,高效处理推理过程中产生的大量记忆数据。这带来了多重显著优势:有效扩大上下文窗口,确保推理过程的高吞吐量与

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

  • 荣耀Magic V Flip2今日开售:售价5499元起

    影像能力堪称荣耀Magic V Flip2的一大亮点。作为行业首款2亿像素主摄小折叠,它也是小折叠品类中首款采用“端云结合”影像方案的机型,支持最高AIGC30倍变焦,同时还搭配一颗1200万像素超广角镜头,满足用户多样化的拍摄需求。 在耐用性上,荣耀Magic V Flip2升级超坚韧50m UTG玻璃,获得SGS高品质耐久折叠认证,可实现50万次耐久折叠,确保屏幕5年长效平整,让用户使用更安心�

  • 英伟达正研发新型AI芯片,微美全息(WIMI.US)携算力方案加入全球科技争霸赛

    马斯克终止Dojo超级计算机项目,耗资超十亿美元后转向斥资数十亿购买英伟达AI芯片。特斯拉计划到2025年底将H100芯片数量从3.5万增至8.5万块。英伟达凭借强大训练芯片性能占据市场主导,并正为中国市场开发基于Blackwell架构的新型AI芯片B30A和RTX6000D。全球AI推理芯片市场正经历爆发式增长,预计2023至2030年复合增长率超35%。微美全息等科技公司加大AI算力投入,推动边缘计算与A

  • AI产品栏目推荐:2025年值得关注的全球AI创新动态与前沿工具盘点

    AIbase是一个全球AI创新观察平台,收录了来自100多个国家和地区的2万多个AI产品。它提供实时更新、全球热门排行和精细筛选功能,帮助用户发现全球最新AI趋势。平台不仅展示产品信息,还提供技术说明、定价等详细数据,支持中文呈现,降低信息获取门槛。对投资者、研究人员和产品经理等不同用户群体都具有重要价值,是连接全球AI创新脉搏的重要枢纽。

  • AI模型库哪个好?2025年主流AI模型选型指南与API成本对比推荐

    AI时代企业核心挑战已从“能否做AI”转向“如何高效集成AI能力”。AI模型库通过聚合全球主流模型,提供透明化成本与能力信息,帮助企业实现快速原型验证、精准选型和成本优化。这种基础设施降低技术门槛,使非技术背景决策者也能深度参与技术选型,加速创新迭代并降低试错成本。

  • AI喜临门2025中报:一场关于战略转型的接力赛

    2025年上半年家居行业整体承压,营收利润双下滑,行业洗牌加速。喜临门等企业通过产品创新、渠道优化、拓展海外市场实现逆势增长,但多数企业仍面临地产低迷、同质化竞争及成本上升等挑战。行业需从传统制造向科技睡眠转型,构建以用户为核心的生态闭环,实现可持续发展。

  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

今日大家都在搜的词: