首页 > 业界 > 关键词  > Grok-3最新资讯  > 正文

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

2025-02-19 17:59 · 稿源: 新智元公众号

马斯克口中全世界最聪明大模型Grok-3,终于震撼登场!20万块GPU训出的模型,实属全球首次。果然,Grok-3已火速屠榜多个排行榜,击败o3-mini(high)和DeepSeek-R1。人类史上首个在20万块GPU上训出的模型终于问世!刚刚,马斯克带队三位xAI成员在线开启直播,官宣Grok-3全家桶——Gro

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • OpenAI急了?一再主张封杀Deepseek,还要求“开放版权”

    Deepseek成立于2023年,凭借创新的AI产品——尤其是其R1推理大模型——迅速在全球崭露头角。与OpenAI的ChatGPT等相比,Deepseek的产品价格极具竞争力。谷歌敦促美国政府增加对人工智能长期研究的投资,并提供公共数据集,以推动商业人工智能的发展——不是削减联邦开支。

  • 阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

    阿里Qwen团队正式发布他们最新的研究成果QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数的DeepSeek-R1媲美。QwQ-32B已在HuggingFace和ModelScope开源,大家也可通过QwenChat直接进行体验!

  • OpenAI最新15页报告:DeepSeek缩小,中美AI竞争差距

    全球最大金融媒体CNBC消息,OpenAI向特朗普政府提交了一份最新的15页报告,从监管政策、出口限制、AI基础设施等多个维度介绍了,美国该如何保持全球AI领导地位。特朗普上台后,立刻就废除了拜登时期发布的14110号非常严厉的AI监管命令,并要求在180天内提交一份有效的AI发展计划。OpenAI的整份报告都把DeepSeek当成中美AI竞争最重要的对手,所有建议策略也是围绕它来展开。

  • 32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero

    【新智元导读】HuggingFace的OpenR1重磅升级,7B击败Claude3.7Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试,以及模拟真实竞赛的提交策略优化,这款模型展现了惊艳的性能。结合来自数学和代码等多领域的奖励信号,并引入奖励模型来评分非推理数据。

  • DeepSeek V3“小版本更新”背后,V3R1正在融合成一个模型

    在R2和V4到来之前,DeepSeek先让我们看到了“V3Plus”。3月24日,DeepSeek一声不响的在Huggingface上发布了V3的“小版本”迭代“DeepSeek-V3-0324”。DeepSeek这开源的仗还会继续打下去,好戏还在后面。

  • 韩国要“复刻”Deepseek?韩专家:事俱备,只差GPU

    一边诋毁、一边又希望“复刻”……还真是辛苦啊!

  • 寻找DeepSeek梁文锋

    AI大模型DeepSeek凭借好用、开源、免费三大特点火爆全球,成为史上最快突破3000万日活跃用户的APP,如今当下各行各业都在被DeepSeek化。就是这样一家公司,在爆火之前,外界知之甚少,它极少出现在媒体报道、猎头招聘、同行调研之中,也从未像“AI六小龙”那样激起过市场的水花。但无论如何,DeepSeek打破巨头了在AI领域的叙事,现在投资人们迫切希望在下一个DeepSeek出现之�

  • 谷歌:我们的Gemma 3,单GPU便能媲美Deepseek

    在AI领域,“经济效益”一直是热门话题,在DeepSeek实现了令人瞠目的规模经济效益之后,谷歌也不甘落后地加紧了步伐。谷歌发布了他们最新的开源大型语言模型Gemma3。需要注意的是,竞争对手使用的H100芯片数量都是谷歌的估计,Deepseek仅披露了一个使用1814块英伟达性能稍弱的H800GPU芯片来作为R1模型提供服务的例子。

  • 老显卡也能用!美团开源首发INT8无损满血版DeepSeek R1

    日前美团技术团队宣布对DeepSeekR1进行了INT8精度量化,让DeepSeekR1可以在如A100等老型号GPU上进行部署。DeepSeekR1发布以后不少企业和个人都在尝试部署满血版本,但原生版本的模型权重为FP8数据格式,对GPU芯片类型有严格限制,仅能被英伟达新型GPU支持,其他型号GPU无法直接部署。目前量化代码已经发布在了开源LLM推理框架SGLang上,量化模型已经发布到了HuggingFace社区:https://huggingface.co/meituan/DeepSeek-R1-Block-INT8https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8对具体过程感兴趣的,可以查看官方技术报告。

  • 知情人士:微软开启AI反击战 测试DeepSeek等模型欲替代OpenAI

    当地时间3月7日,媒体报道称,自微软内部AI部门负责人MustafaSuleyman接手微软AI业务以来,其与OpenAI的合作并非一帆风顺。在去年秋天的一次视频会议上,Suleyman与OpenAI管理层因思维链”推理过程产生争执,最终愤怒地提前结束了通话。微软能否摆脱对OpenAI的依赖,打造真正具有竞争力的AI生态,这一答案可能要到MAI模型正式落地后才能见分晓。

热文

  • 3 天
  • 7天