首页 > AI头条  > 正文

DeepSeek R1来袭,Meta 高管都慌了

2025-01-24 16:46 · 来源: AIbase基地

近日,Meta 的工程师们在匿名社交平台 TeamBlind 上吐露心声,揭示了中国公司 DeepSeek 所研发的 AI 模型 R1所带来的巨大压力。DeepSeek 被认为是全球首个与 OpenAI 的 o1模型相提并论的开源 AI 模型,而与 OpenAI 相比,R1不仅开源程度更高,而且训练成本低得惊人,仅为550万美元。

image.png

相比之下,Meta 的高管年薪常常超过整个 DeepSeek V3的训练成本,这使得 Meta 的管理层倍感尴尬。

据内部消息透露,DeepSeek V3的出现已在去年令 Meta 感受到不小的压力。Meta 的工程师们正在加紧时间,努力分析 DeepSeek 的技术,希望能够尽快复制其中的关键技术。过去,全球的 AI 研究者们都在追逐美国的大模型,而如今,局势发生了变化,美国工程师们开始逆向工程中国的 AI 技术。

DeepSeek 不仅在基准测试中超过了 Meta 的 Llama4,而且在多个领域的表现上也令业界瞩目。DeepSeek 通过大规模强化学习(RL)和未经过监督微调(SFT)等技术,实现了极高的推理性能。这种技术自信让美国的部分网友开始反思中国在 AI 领域的迅速崛起。

划重点:

🌟 DeepSeek R1模型的训练成本仅为550万美元,性能可与 OpenAI 的 o1相媲美。  

👨‍💻 Meta 的高管薪资超过 DeepSeek 的训练成本,管理层对此感到压力巨大。  

📈 DeepSeek 的成功引发了美国科技公司的恐慌,挑战了美国在 AI 领域的主导地位。

  • 相关推荐
  • 《流浪地球3》自研AI问答应用WEi:基于DeepSeek R1开发

    快科技4月15日消息,今日,电影《流浪地球 3》官宣开机,导演郭帆,吴京、沈腾等主演参加开机仪式。在开机仪式上,吴京表示,希望自己在戏里能多演喜剧,沈腾多演动作戏。据新浪电影官微,《流浪地球3》开机现场还介绍了一位新同事”自主研发的专属AI问答应用WEi。WEi基于国产大模型DeepSeek R1开发,通过整合多元化知识库资源,包括在线信息源的专业资料、图像和影视�

  • DeepSeek带飞寒武纪

    寒武纪凭借AI芯片业务实现扭亏为盈,2024年首次实现上市后盈利,2025年Q1营收11.11亿元同比暴增4230%,净利润3.55亿元。这家曾连亏8年、累计亏损54亿元的"中国版英伟达",因美国对H20芯片出口管制获得市场红利,但客户集中度过高(前五大客户贡献94.63%营收)和现金流波动仍是隐忧。当前国产芯片迎来发展机遇,华为昇腾、壁仞等企业纷纷抢占市场,行业竞争日趋激烈。

  • DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型

    快科技4月30日消息,今日,DeepSeek 今日在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。据介绍,DeepSeek-Prover-V2-671B 其参数量达到6710亿,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多种计算精度,方便模型更快、更省资源地训练和部署。在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提

  • DeepSeek红利耗尽后,元宝拿什么和豆包斗?

    短短60天内,中国AI原生应用下载排行榜的位次排名,就三易其主。最新情况是,截至4月15日中午,中国区苹果应用商店免费APP下载排行榜上,豆包再次超越DeepSeek,位列第二,紧随其后的DeepSeek被挤到了第三的位置,腾讯元宝则滑落到了第七名。2月13日,作为首家在C端主力产品中接入DeepSeek-R1满血版的元宝,一度趁着DeepSeek东风崛起:3月3日力压DeepSeek和豆包,首度登顶。但好景�

  • 三星电视接入DeepSeek-R1 AI本土化交互能力再升级

    近日,三星电视正式接入DeepSeek-R1,AI能力进一步得到强化。据悉,用户无需复杂的操作步骤,唤醒智能语音助手三星小贝,在对应的语音助手对话页面内,即可便捷体验深度思考功能。三星电视融合DeepSeek大模型矩阵,通过强化学习、蒸馏技术等提升深度思考与推理能力,使得电视能够更准确地理解用户深层的意图和需求,为用户提供更流畅、更简单、更自然的交互与服务体�

  • AI进化论——音乐、绘画和舞蹈的DeepSeek时刻

    “昔者仓颉作书天雨粟,鬼夜哭”——人类掌握文字后,天地为之动容,因为属于人类的文明诞生了。“仓颉作书”出自西汉《淮南子》,距离人类掌握文字已经过去了千年。AI进化的答案,或许早就镌刻在人类文明的起点里。

  • DeepSeek爆火100天,大厂又找回初心了

    DeepSeek R1模型发布100天后,中国AI行业竞争格局被彻底重构。该模型3个月内用户突破1.9亿,成为国内最大AI原生应用。腾讯、百度等科技大厂纷纷接入,其中腾讯元宝APP借助DeepSeek流量一度登顶苹果应用下载榜。字节和阿里选择自研路线,字节推出"深度思考"功能,阿里则专注开源模型研发。随着DeepSeek热潮减退,豆包重回下载量榜首,元宝跌出前20。科技大厂在享受DeepSee

  • 深度deepin 23.1正式发布!AI默认引擎切换至DeepSeek、修复超百项问题

    快科技4月16日消息,今天,深度操作系统宣布,deepin 23.1版本已正式发布。此版本聚焦于解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本的重点改进包括内核优化、AI 默认引擎切换至DeepSeek、修复超百项用户反馈问题等,具体重点改进如下:硬件兼容性与内核优化:集成6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;?

  • 华为鸿蒙电脑接入DeepSeek:生产力更强

    官方介绍,鸿蒙电脑历经五年布局,集结10000多名顶尖工程师,联合20多家研究所,积累超2700项核心专利。

  • 142页长文揭秘DeepSeek-R1「思维大脑」,开启全新「思维链学」研究

    DeepSeek-R1是一款开创性的大型推理模型(LRM),其研究揭示了AI推理能力的质变。该模型通过多阶段训练流程,将推理过程内嵌于模型本身,实现了从"提示驱动"到"内生推理"的模式转变。研究团队通过142页报告详细分析了R1的思维链,发现其推理过程具有高度结构化特征,包含问题定义、绽放周期、重构周期和最终决策四个阶段。模型展现出类人推理能力,能通过分

今日大家都在搜的词: