首页 > AI头条  > 正文

国家队下场!DeepSeek全系模型登陆国家超算平台

2025-02-05 14:32 · 来源: AIbase基地

近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入国家超算互联网平台(www.scnet.cn),在国产超智融合算力及全国一体化算力服务体系的支撑下,中国AI大模型产业迈出关键一步。

国家超算互联网平台目前已上线DeepSeek-R1模型的1.5B、7B、8B、14B版本,用户可通过扫码或网页端直接体验在线推理服务,无需本地部署。针对企业级需求,平台支持引入专有数据进行私有化模型定制开发,32B、70B等大参数版本也将于近期陆续开放。同步上线的还包括DeepSeek-V3、Coder系列、Math系列(7B)等垂直领域模型,覆盖代码生成、数学推理等多样化场景。

QQ20250205-143146.png

相较于海外大模型,DeepSeek系列通过算法优化显著降低计算资源消耗,结合国家超算平台“普惠易用、丰富好用”的算力调度能力,实现调用成本的大幅压缩。以DeepSeek-R1-Distill-Qwen-7B为例,其WebUI对话界面支持零门槛体验,而企业用户仅需通过API接口即可快速接入生产环境,形成从模型调用到私有化部署的完整链路。

分析人士指出,DeepSeek模型在超算平台的规模化落地,或将改变国内AI行业依赖海外闭源模型的现状。随着更多开发者基于国产算力底座训练、优化本土化模型,中国有望在AI技术应用层实现批量“弯道超车”,而这场由“神秘东方力量”驱动的求索浪潮,正在为全球AI竞争注入全新变量。

  • 相关推荐
  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • AI日报:京东物流推出超脑大模型2.0;DeepSeek V3.1终结版发布;Kimi 推出全新 Agent 模式

    本期AI日报聚焦多领域技术突破:京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”,推动物流行业迈向自主执行;DeepSeek推出V3.1终结版,修复漏洞并为V4架构铺路;Kimi上线Agent模式“OK Computer”,支持智能网站开发等复杂任务;ChatGPT新增个性化资讯功能,定制用户专属新闻;Exa Code发布代码索引工具,助力AI代理精准生成代码;Meta推出AI视频创作平台Vibes,简化短视频制作;蚂蚁数科发布隐私保护AI框架Gibbon,推理速度提升超百倍;OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平,覆盖九大行业44种职业。

  • 破解 AI “安全与性能” 难题!DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

    9月18日,华为全联接大会2025在上海开幕。会上,华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出,对有害言论、敏感内容等14个维度的防御成功率近100%,同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作,推动AI安全技术与产业生态协同发展,为我国人工智能高质量发展提供支撑。

  • 我国首个政务大模型安全国家标准发布 百度深度参与制定

    日前,我国首个针对政务大模型的安全国家标准《政务大模型应用安全规范》(下称《规范》)正式发布。百度作为核心参编单位,凭借其在人工智能安全及政务服务领域的深厚积累,深度参与了该标准的制定工作,为政务大模型的安全选用、部署运行、护栏建设和合规落地提供了专业支持。《规范》由国家工业信息安全发展研究中心牵头,联合百度等国内领先企业共同制定�

  • 小米17全系搭载全新M10屏幕发光技术

    小米17系列手机于9月23日正式发布,全系标配全新M10屏幕发光技术,采用国产新型红色发光材料,发光效率高达82.1cd/A,直逼行业最高水平。设计上采用超椭圆R角设计,边框窄至1.18mm,视觉震撼。标准版配备6.3英寸小尺寸直屏,重量仅191g,单手操作无压力。Pro和Pro+创新引入“妙享背屏”,支持自定义显示内容及自拍预览,提升便捷性与趣味性。核心配置首发骁龙8 Elite Gen5平台,安兔兔跑分突破400万,性能强劲。小米总裁卢伟冰透露背屏研发成本高达10亿元,彰显技术投入决心。

  • 响应国家AI+号召,开放微表情SDK

    近日,上海步施网络科技宣布对外开放微表情识别SDK,响应国家推动人工智能与实体经济深度融合的号召。该技术原仅用于内部项目,现面向各行业开放,助力产业智能化升级。微表情识别可捕捉人类瞬间流露的真实情绪,在医疗、教育、安防、商业等领域具有广泛应用前景。公司提供多种合作模式,支持本地化部署,确保数据安全。此举将促进AI技术创新,推动行业智能化发展。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

今日大家都在搜的词: