首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型

2025-05-01 09:23 · 稿源: 快科技

快科技4月30日消息,今日,DeepSeek 今日在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型

据介绍,DeepSeek-Prover-V2-671B 其参数量达到6710亿,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多种计算精度,方便模型更快、更省资源地训练和部署。

在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。

同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

有网友分析,该模型被视为 Prover-V1.5的升级版,专注于形式化定理证明,专门用于攻克数学难题,擅长自动证明定理和复杂计算,类似于 AlphaGo 在围棋中的自我对弈方式。

接下来它的性能测试表现会如何,值得期待。

DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型

DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型

DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型

举报

  • 相关推荐
  • 秘塔AI也终于悄悄上线了DeepResearch。

    测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。

  • 华为全新FreeClip 2耳夹耳机首曝:最快9月发布 支持星闪

    日前,据数码博主定焦数码”爆料,华为全新耳夹耳机FreeClip 2预计9-10月发布。 该博主透露,华为FreeClip 2的C桥部分会有微调,整体设计变化不大,声场拓宽,将支持星闪功能。 据了解,2023年12月,华为发布首款开放式耳机FreeClip,售价1299元。

  • AI日报:GPT-5-Auto现身Mac客户端;阿里开源WebAgent项目WebShaper;腾讯推X-Omni多模态模型

    【AI日报】今日AI领域重要动态:1)阿里开源WebAgent项目WebShaper,GAIA评测超越Claude4-Sonnet;2)Moonvalley推出草图转视频功能,支持手绘生成电影级视频;3)腾讯X-Omni模型实现图文理解重大突破;4)百度搜索测试AI应用中心入口;5)Midjourney+新增个性化推荐功能;6)GPT-5或于2025年夏季发布;7)Ollama推出桌面客户端;8)OWL团队开源多智能体协作工具Eigent;9)OpenAI年收入激增至120亿美元;10)英伟达H20芯片因安全风险被约谈;11)万兴科技天幕2.0模型国内排名第四,与华为云共建AI视频实验室。

  • 荣耀MagicGUI大模型发布并开源!Magic V5首发搭载:跨应用/设备自动化

    该战略是荣耀新任CEO李健在3月的MWC 2025首次揭晓,是荣耀的全新人工智能战略计划,将从智能手机制造商向全球AI终端生态公司全面转型。 李健宣布,未来5年荣耀将投入100亿美元,与全球合作伙手共建AI设备生态。 分为三个实施阶段: 第一阶段是智慧手机,荣耀将与合作伙伴携手突破技术边界,共同创造代理型人工智能时代的新范式; 第二阶段是智慧生态系统,荣耀将打�

  • AI日报:字节发布同声传译模型Seed LiveInterpret 2.0;秘塔搜索API上线;Lovart AI正式版全球发布

    AI日报栏目报道了多项AI领域最新进展:1)字节跳动发布端到端同声传译模型Seed LiveInterpret 2.0,实现中英高质量实时翻译;2)秘塔搜索API上线,提供低价多模态搜索服务;3)Lovart AI正式版发布,作为首个AI设计Agent重塑创作流程;4)李沐团队推出Higgs Audio v2语音合成模型,融合千万小时训练数据;5)OpenAI开发Sora2视频生成模型,与谷歌Veo3展开竞争;6)OpenAI与Oracle合作扩展Stargate项目,�

  • 从AI耳机到智能伙伴:WISHEE联合阿里云,在WAIC带来“云+端”的智慧进化

    2025世界人工智能大会(WAIC)上,WISHEE+AI耳机凭借全球首创多模型架构(mMA)和全场景独立智能体设计成为焦点。该产品突破单一AI能力边界,动态调度DeepSeek、Minimax、通义千问等顶尖模型协同工作:深度推理、实时检索、创意生成各司其职。通过"云+端"融合重塑服务边界,实现脱离手机的独立智能体验——内置Personal OS系统,支持语音对话、周边推荐、音乐播放等功能。13.4mm进口桑蚕丝双振膜单元提供录音棚级音质,按住耳机即可随时开启语音交互。现场还演示了即将上线的全球翻译官和会议纪要功能,展现AI如何以"交响智慧"重塑工作与沟通本质。

  • AI日报:智谱AI重磅发布GLM-4.5;阿里开源Wan2.2;阶跃星辰推全新模型Step3

    【AI日报】本期重点内容:1.智谱AI发布开源大模型GLM-4.5,在推理、编码和智能体能力方面达到SOTA水平;2.阿里开源视频生成模型Wan2.2,采用MoE架构提升计算效率;3.阶跃星辰推出AI研究助手"阶跃深研",支持金融医疗等专业领域研究;4.微软Edge浏览器新增Copilot模式,提供智能搜索体验;5.Anthropic对Claude用户实施使用限制引发争议;6.阶跃星辰发布321B参数大模型Step3;7.蚂�

  • GPT-4.5和Claude4哪家强?一文看懂优劣差异,附最实用AI大模型对比工具!

    文章对比分析了GPT-4.5和Claude4两大AI模型的性能差异:GPT-4.5在响应速度、编程能力和生态开放度上占优,适合实时对话和内容创作;Claude4则在长文本处理(200k+上下文)、安全性和企业适配性方面表现突出。推荐使用AIbase的模型对比工具(https://model.aibase.com/zh/compar)进行多维度智能筛选,根据具体场景(如客服、写作、编程等)选择最适合的模型。核心结论:没有绝对优劣,�

  • 魔乐社区Modelers理事会添新成员,携手共筑开源AI新生态

    2025世界人工智能大会(WAIC)在上海开幕,魔乐社区Modelers理事会第二批14家成员单位正式发布,包括宝德计算机、九章云极等企业。这标志着该社区在构建开放协同的AI生态方面迈出重要一步。新成员涵盖芯片、算力、模型等全链路环节,推动开源生态从"技术聚合"向"价值共创"转型。社区通过开源协作模式,促进Qwen、DeepSeek等开源模型与多语种语料融合,实现技术�

  • 腾讯云GooseFS团队与厦门大学合作成果 AC-Cache入选 PPOPP

    腾讯云研发的AC-Cache内存缓存系统入选并行编程顶会PPOPP2025。该系统针对小型对象存储场景,通过感知访问关联性的创新设计,成功解决负载不均衡问题。实测显示,AC-Cache可降低80.2%尾部延迟,提升5倍以上访问吞吐量。该技术已开源并应用于腾讯云GooseFS产品,在手机制造、自动驾驶等领域取得显著成效:某手机厂商模型分发速度达300MB/s,带宽提升10倍;某车企训练效率提高30%,数据命中率超90%。AC-Cache的突破将助力企业突破存储性能瓶颈。