首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

2024-12-27 17:46 · 稿源:量子位公众号

DeepSeek新版模型正式发布,技术大佬们都转疯了!延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。怎么说呢,QLoRA一作的一个词评价就是:优雅。具体来说,DeepSeek V3是一个参数量为671B的MoE模型,激活37B,在14.8T高质量toke

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • DeepSeek突发更新:不是V4但惊喜很多 编程实测来了

    DeepSeek于2月11日悄然更新模型,主要提升上下文能力至1M,可一次性处理《三体》三部曲等超长文本。官方强调这是最新模型,未命名特定子版本。实测显示其在编程、物理模拟等多方面能力均有提升,甚至超越此前所有版本达到SOTA水平。不过,新模型在部分具体问题(如50米距离洗车方式)上回答不一致,其是否为完整版尚不确定。

  • DeepSeek更新上下文达百万级token:可一次性处理超长文本

    DeepSeek近日在网页端及APP端完成版本更新,正式将上下文窗口扩展至1M(百万) Token,迎来对话容量的显著跃升。 相较于去年8月发布的DeepSeek V3.1所支持的128K上下文,新实装模型的上下文能力较两个月前更新的V3.2提升达八倍。 网友实测显示,DeepSeek已可一次性处理《三体》三部曲体量的超长文本,并在问答中明确表示其知识截止日期更新至2025年5月。

  • 为国产模型和国产芯片造“桥”:昇腾平台上的DeepSeek-OCR-2迁移实录

    文章讲述了使用智子芯元KernelCAT工具,将DeepSeek-OCR-2模型高效迁移至华为昇腾Atlas A2国产芯片的过程。传统迁移需人工处理代码依赖、环境配置和算子优化,耗时费力。而KernelCAT作为AI Agent,能自动分析代码、适配环境、生成补丁,并将通用计算逻辑替换为针对国产硬件的优化实现,最终将推理速度从15 tokens/s大幅提升至550.45 tokens/s,加速超35倍。这展现了未来开发范式:人类定义目标,AI自主解决路径,让开发者从底层适配的繁琐工作中解放出来。

  • 2026 品牌新战场:如何用GEO品牌监控工具让 DeepSeek 们爱上你的品牌?

    面对 2026 年这场席卷全球的 AI 搜索浪潮,许多品牌公关(PR)和市场总监(CMO)正陷入一种集体焦虑:明明在搜索引擎里排名第一,为什么用户去问 DeepSeek、豆包或文心一言时,AI 却对你的品牌只字不提?或者更糟——AI 正在热情地推荐你的竞争对手。欢迎来到 GEO(Generative Engine Optimization,生成式引擎优化) 时代。如果你还在执着于传统的 SEO,那就像是在自动驾驶时代研究�

  • Seedance 2.0模型怎么用?字节跳动Seedance 2.0入口在哪?

    字节跳动旗下即梦平台近日推出的新一代AI视频生成模型Seedance2.0,凭借多模态参考、生成与编辑融合等技术创新,迅速成为影视、广告及短视频创作领域的“现象级”工具。该模型支持同时上传图片、视频、音频等12类参考文件,可精准复刻运镜轨迹、动作细节与音乐氛围,生成15秒视频仅需约30积分,速度较前代提升超10倍,废片率大幅降低,被业内称为“AI视频创作的效率革

  • Seedance 2.0冲击波:一场从电商、游戏到影视的成本塌方

    当大洋彼岸的OpenAI 似乎按下了AI生成模型Sora的“暂停键”,中国的科技巨头却在这一领域发起了一场反攻。 日前,字节跳动最新AI视频生成模型Seedance2.0上线,凭借多模态输入、自运镜、一致性等优势迅速引爆了互联网。 游戏科学创始人冯骥在深度体验后,给出了极具分量的判断:“内容领域必将迎来史无前例的通货膨胀。” 冯骥的预言并非杞人忧天。 这种冲击波正迅速传

  • 马斯克感慨Seedance2.0发展快 此前已正式上线

    字节跳动旗下AI视频生成模型Seedance2.0开启小范围测试,凭借多模态输入、文本或图片生成电影级视频等功能引发热议。有网友利用其强大功能制作了阿姆斯特丹模拟器,生动再现了1670年纽约的城市风貌。与谷歌Genie3世界模型对比,Seedance2.0展现出独特优势,被评价为“准确描绘了1670年的城市景象”。这一成果赢得广泛赞誉,还吸引了马斯克的关注。目前,Seedance2.0已正式接入豆包App、电脑端和网页版,用户可便捷生成5秒或10秒视频作品,还可创建自己的视频分身,探索更多创意玩法。

  • 最近大火的Seedance 2.0能在豆包玩了!国内用户免费用

    字节跳动旗下重磅AI视频生成模型Seedance 2.0正式登陆豆包App,开启灰度测试。 国内被纳入测试的用户可免费体验这一爆款模型,无需额外付费,让普通人也能轻松玩转AI视频创作。 内测用户只需打开豆包,点击下方创作按钮进入视频生成功能,就能看到Seedance 2.0的选项。 该模型此前在即梦等平台灰度上线时,就已引爆AI视频圈,不仅获得《黑神话悟空》制作人冯骥等行业大�

  • Seedance 2.0正式发布 字节跳动:还远不完美 生成结果仍存诸多瑕疵

    今日,豆包视频生成模型Seedance 2.0正式发布,并全面接入豆包和即梦产品,同时上线火山方舟体验中心。 目前,Seedance 2.0限制了真人图像/视频作为主体参考,如需使用真人作为主体参考,须经本人验证或取得授权。 据字节跳动介绍,为全面评估模型在多模态场景的综合能力,团队协同影视领域专家,建立覆盖音视频生成、参考及编辑场景的综合评测集及相关评测标准。

  • 字节跳动即梦AI视频生成模型Seedance2.0怎么用?Seedance 2.0在哪?

    字节跳动旗下即梦平台近日正式上线新一代AI视频生成模型Seedance2.0,凭借多模态参考、高效创作与后期编辑融合等核心突破,成为影视、广告、短视频创作领域的焦点。该模型支持同时上传12个参考文件(图片、视频、音频),可精准复刻运镜逻辑、动作细节与音乐氛围,生成15秒视频仅需约30积分,较前代速度提升超10倍,显著降低废片率。

今日大家都在搜的词: