首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

只花了几个小时!国产壁仞GPU闪电支持DeepSeek

2025-02-05 21:00 · 稿源: 快科技
国产壁仞GPU助力<a href="//www.chinaz.com/tags/855878.shtml" target="_blank"><span>DeepSeek</span></a>,实现AI兼容性突破

国产壁仞GPU闪电支持DeepSeek,颠覆AI格局

2月5日,DeepSeek开源大模型震撼业界,其先进的技术引发了众多平台的积极响应。国产GPU阵营中,壁仞科技迅速跟进,成为少数同步高效适配国际、国内多模型的芯片平台之一。

壁仞科技凭借自主研发的壁砺系列GPU,仅用数小时便完成对DeepSeek R1全系列蒸馏模型的支持,包括从1.5B到70B各等级参数版本。这证明了国产芯片在复杂AI应用任务上的强大驾驭能力。

DeepSeek提供高效的模型蒸馏技术,可以将大规模模型的能力迁移至更小、更高效的版本。壁仞科技壁砺系列GPU在短时间内成功支持全系列蒸馏模型,彰显其在AI推理任务中的出色兼容性和易用性。

壁仞科技与战略伙伴联合,基于壁砺系列训推产品,全面适配与上线DeepSeek全系列模型,满足不同规模参数量模型的部署需求。

  • 轻量级模型(1.5B-8B):适用于智能终端和边缘计算设备,实现低延时实时推理。
  • 中大规模模型(14B-32B):服务于大规模企业级应用和高并发任务,满足数据安全与定制化需求。
  • 大规模模型(70B):依托云端超算集群,支撑前沿AI研究与复杂任务处理。

即日起,壁仞AI算力平台正式上线DeepSeek R1蒸馏模型推理服务,全球开发者可云端体验1.5B、7B、8B、14B、32B、70B全系列模型服务,体验地址为:https://sgc.birentech.com:1443/

该服务具备零部署成本和多场景覆盖两大核心优势,为AI应用开发提供了更便利、更高效的平台。

只花了几个小时!国产壁仞GPU闪电支持DeepSeek

举报

  • 相关推荐
  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • AI日报:京东物流推出超脑大模型2.0;DeepSeek V3.1终结版发布;Kimi 推出全新 Agent 模式

    本期AI日报聚焦多领域技术突破:京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”,推动物流行业迈向自主执行;DeepSeek推出V3.1终结版,修复漏洞并为V4架构铺路;Kimi上线Agent模式“OK Computer”,支持智能网站开发等复杂任务;ChatGPT新增个性化资讯功能,定制用户专属新闻;Exa Code发布代码索引工具,助力AI代理精准生成代码;Meta推出AI视频创作平台Vibes,简化短视频制作;蚂蚁数科发布隐私保护AI框架Gibbon,推理速度提升超百倍;OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平,覆盖九大行业44种职业。

  • 破解 AI “安全与性能” 难题!DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

    9月18日,华为全联接大会2025在上海开幕。会上,华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出,对有害言论、敏感内容等14个维度的防御成功率近100%,同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作,推动AI安全技术与产业生态协同发展,为我国人工智能高质量发展提供支撑。

  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • 没想到,音频大模型开源最彻底的,居然是小红书

    不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商在七八月接连开源33款、31款各类型大模型。 这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域,而音频生成占比很小。

  • 当智驾遇上国庆,亿万克提供高效数字底座!

    本文探讨智能驾驶技术发展现状与挑战。随着L4/L5级自动驾驶需求增长,行业面临云端算力不足、运维复杂、系统扩展难等痛点。亿万万构建了以边缘计算节点、GPU计算节点和分布式存储系统为核心的数字平台解决方案:边缘节点处理实时任务,GPU服务器提供高性能计算,分布式存储实现数据统一管理。该平台支持机器视觉、深度学习等应用,助力企业构建稳定高效的智能驾驶基础设施。

  • 纸嫁衣如何借助Sigmob实现IAA广告变现的高效平衡?

    随着中国游戏市场发展,移动解谜游戏成为重要娱乐方式。《纸嫁衣》系列凭借传统文化融合与沉浸式体验成为国产解谜游戏代表IP。其采用IAA商业模式,核心挑战在于平衡广告体验与剧情沉浸感。团队与Sigmob长期合作,通过精细化运营实现用户体感与广告收益双赢。具体策略包括:用户行为驱动的广告触发机制、智能投放技术优化填充率与eCPM、分阶段动态调优策略(冷启动期快速扩量、成长期构建用户特征库、成熟期结合频控提升收益)。合作使广告收益稳步增长,CPM持续提升,为解谜类游戏商业化提供了“场景化+轻量级+用户主动型”广告设计的新思路,未来将继续探索多元化变现模式。

今日大家都在搜的词: