首页 > AI头条  > 正文

DeepSeek R1来袭,Meta 高管都慌了

2025-01-24 16:46 · 来源: AIbase基地

近日,Meta 的工程师们在匿名社交平台 TeamBlind 上吐露心声,揭示了中国公司 DeepSeek 所研发的 AI 模型 R1所带来的巨大压力。DeepSeek 被认为是全球首个与 OpenAI 的 o1模型相提并论的开源 AI 模型,而与 OpenAI 相比,R1不仅开源程度更高,而且训练成本低得惊人,仅为550万美元。

image.png

相比之下,Meta 的高管年薪常常超过整个 DeepSeek V3的训练成本,这使得 Meta 的管理层倍感尴尬。

据内部消息透露,DeepSeek V3的出现已在去年令 Meta 感受到不小的压力。Meta 的工程师们正在加紧时间,努力分析 DeepSeek 的技术,希望能够尽快复制其中的关键技术。过去,全球的 AI 研究者们都在追逐美国的大模型,而如今,局势发生了变化,美国工程师们开始逆向工程中国的 AI 技术。

DeepSeek 不仅在基准测试中超过了 Meta 的 Llama4,而且在多个领域的表现上也令业界瞩目。DeepSeek 通过大规模强化学习(RL)和未经过监督微调(SFT)等技术,实现了极高的推理性能。这种技术自信让美国的部分网友开始反思中国在 AI 领域的迅速崛起。

划重点:

🌟 DeepSeek R1模型的训练成本仅为550万美元,性能可与 OpenAI 的 o1相媲美。  

👨‍💻 Meta 的高管薪资超过 DeepSeek 的训练成本,管理层对此感到压力巨大。  

📈 DeepSeek 的成功引发了美国科技公司的恐慌,挑战了美国在 AI 领域的主导地位。

  • 相关推荐
  • DeepSeek突发更新:不是V4但惊喜很多 编程实测来了

    DeepSeek于2月11日悄然更新模型,主要提升上下文能力至1M,可一次性处理《三体》三部曲等超长文本。官方强调这是最新模型,未命名特定子版本。实测显示其在编程、物理模拟等多方面能力均有提升,甚至超越此前所有版本达到SOTA水平。不过,新模型在部分具体问题(如50米距离洗车方式)上回答不一致,其是否为完整版尚不确定。

  • DeepSeek更新上下文达百万级token:可一次性处理超长文本

    DeepSeek近日在网页端及APP端完成版本更新,正式将上下文窗口扩展至1M(百万) Token,迎来对话容量的显著跃升。 相较于去年8月发布的DeepSeek V3.1所支持的128K上下文,新实装模型的上下文能力较两个月前更新的V3.2提升达八倍。 网友实测显示,DeepSeek已可一次性处理《三体》三部曲体量的超长文本,并在问答中明确表示其知识截止日期更新至2025年5月。

  • 为国产模型和国产芯片造“桥”:昇腾平台上的DeepSeek-OCR-2迁移实录

    文章讲述了使用智子芯元KernelCAT工具,将DeepSeek-OCR-2模型高效迁移至华为昇腾Atlas A2国产芯片的过程。传统迁移需人工处理代码依赖、环境配置和算子优化,耗时费力。而KernelCAT作为AI Agent,能自动分析代码、适配环境、生成补丁,并将通用计算逻辑替换为针对国产硬件的优化实现,最终将推理速度从15 tokens/s大幅提升至550.45 tokens/s,加速超35倍。这展现了未来开发范式:人类定义目标,AI自主解决路径,让开发者从底层适配的繁琐工作中解放出来。

  • Seedance 2.0模型怎么用?字节跳动Seedance 2.0入口在哪?

    字节跳动旗下即梦平台近日推出的新一代AI视频生成模型Seedance2.0,凭借多模态参考、生成与编辑融合等技术创新,迅速成为影视、广告及短视频创作领域的“现象级”工具。该模型支持同时上传图片、视频、音频等12类参考文件,可精准复刻运镜轨迹、动作细节与音乐氛围,生成15秒视频仅需约30积分,速度较前代提升超10倍,废片率大幅降低,被业内称为“AI视频创作的效率革

  • AI日报:字节发布Seedream5.0Lite;小红书不标AI将限流;美图开拍首批接入Seedance 2.0大模型

    本期AI日报涵盖多项重要动态:字节跳动发布具备视觉推理与实时联网能力的图像创作模型Seedream5.0Lite;小红书要求AI生成内容须显著标识;美图工具“开拍”接入Seedance 2.0大模型以提升视频创作效率;OpenAI在ChatGPT中上线广告业务以应对成本压力;OpenAI与Cerebras合作推出专为实时编程优化的GPT-5.3-Codex-Spark;蚂蚁集团开源全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T;Google发布在编程与科研领域实现突破的Gemini 3 Deep Think;同程旅行全面接入腾讯元宝,通过AI实现秒级行程规划与预订。

  • Seedance 2.0冲击波:一场从电商、游戏到影视的成本塌方

    当大洋彼岸的OpenAI 似乎按下了AI生成模型Sora的“暂停键”,中国的科技巨头却在这一领域发起了一场反攻。 日前,字节跳动最新AI视频生成模型Seedance2.0上线,凭借多模态输入、自运镜、一致性等优势迅速引爆了互联网。 游戏科学创始人冯骥在深度体验后,给出了极具分量的判断:“内容领域必将迎来史无前例的通货膨胀。” 冯骥的预言并非杞人忧天。 这种冲击波正迅速传

  • 马斯克感慨Seedance2.0发展快 此前已正式上线

    字节跳动旗下AI视频生成模型Seedance2.0开启小范围测试,凭借多模态输入、文本或图片生成电影级视频等功能引发热议。有网友利用其强大功能制作了阿姆斯特丹模拟器,生动再现了1670年纽约的城市风貌。与谷歌Genie3世界模型对比,Seedance2.0展现出独特优势,被评价为“准确描绘了1670年的城市景象”。这一成果赢得广泛赞誉,还吸引了马斯克的关注。目前,Seedance2.0已正式接入豆包App、电脑端和网页版,用户可便捷生成5秒或10秒视频作品,还可创建自己的视频分身,探索更多创意玩法。

  • 最近大火的Seedance 2.0能在豆包玩了!国内用户免费用

    字节跳动旗下重磅AI视频生成模型Seedance 2.0正式登陆豆包App,开启灰度测试。 国内被纳入测试的用户可免费体验这一爆款模型,无需额外付费,让普通人也能轻松玩转AI视频创作。 内测用户只需打开豆包,点击下方创作按钮进入视频生成功能,就能看到Seedance 2.0的选项。 该模型此前在即梦等平台灰度上线时,就已引爆AI视频圈,不仅获得《黑神话悟空》制作人冯骥等行业大�

  • 字节跳动即梦AI视频生成模型Seedance2.0怎么用?Seedance 2.0在哪?

    字节跳动旗下即梦平台近日正式上线新一代AI视频生成模型Seedance2.0,凭借多模态参考、高效创作与后期编辑融合等核心突破,成为影视、广告、短视频创作领域的焦点。该模型支持同时上传12个参考文件(图片、视频、音频),可精准复刻运镜逻辑、动作细节与音乐氛围,生成15秒视频仅需约30积分,较前代速度提升超10倍,显著降低废片率。

  • Seedance 2.0正式发布 字节跳动:还远不完美 生成结果仍存诸多瑕疵

    今日,豆包视频生成模型Seedance 2.0正式发布,并全面接入豆包和即梦产品,同时上线火山方舟体验中心。 目前,Seedance 2.0限制了真人图像/视频作为主体参考,如需使用真人作为主体参考,须经本人验证或取得授权。 据字节跳动介绍,为全面评估模型在多模态场景的综合能力,团队协同影视领域专家,建立覆盖音视频生成、参考及编辑场景的综合评测集及相关评测标准。

今日大家都在搜的词: