首页 > AI头条  > 正文

​DeepSeek关联公司 发布大语言模型创新部署专利,推动 AI 技术新发展

2025-08-01 15:27 · 来源: AIbase基地

近日,DeepSeek 的关联公司 —— 杭州深度求索人工智能基础技术研究有限公司,公开了一项名为 “一种大语言模型的部署方法及系统” 的专利。这项专利的公布,标志着该公司在人工智能领域的又一重要进展,尤其是在大语言模型的部署方面。

DeepSeek

图源备注:图片由AI生成,图片授权服务商Midjourney

根据专利的摘要,该发明主要涉及到人工智能的核心技术。其创新之处在于将大语言模型的两个关键阶段 —— 预填充阶段和解码阶段,分别部署在高性能计算能力和大内存的机器上。这种分布式的部署方式能够有效均衡负载任务,最大限度地利用硬件资源。通过减少闲置的计算能力,该方法不仅降低了整体的延迟,还显著提高了系统的吞吐量。

在当前的 AI 技术发展中,系统的扩展性和容错性显得尤为重要。DeepSeek 的这一专利,正是通过优化资源配置,增强了系统在面对不同工作负载时的适应能力。这种创新部署方法,预示着未来的 AI 模型将更高效、更智能,有望为各类应用场景提供更好的支持。

值得一提的是,DeepSeek-V3作为该公司的核心产品之一,其强大的 Mixture-of-Experts (MoE) 语言模型,拥有671B 个参数,每个 token 的激活参数达到37B。这一技术的进步,无疑将推动 AI 技术的普及和应用,助力各行各业的数字化转型。

划重点:

🌟 DeepSeek 发布新专利,创新部署大语言模型的方法,提高系统性能。  

🚀 分布式部署实现硬件资源的最大化利用,减少整体延迟。  

📈 增强系统的扩展性和容错性,助力未来 AI 技术的发展。

  • 相关推荐
  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • 破解 AI “安全与性能” 难题!DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

    9月18日,华为全联接大会2025在上海开幕。会上,华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出,对有害言论、敏感内容等14个维度的防御成功率近100%,同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作,推动AI安全技术与产业生态协同发展,为我国人工智能高质量发展提供支撑。

  • AI日报:京东物流推出超脑大模型2.0;DeepSeek V3.1终结版发布;Kimi 推出全新 Agent 模式

    本期AI日报聚焦多领域技术突破:京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”,推动物流行业迈向自主执行;DeepSeek推出V3.1终结版,修复漏洞并为V4架构铺路;Kimi上线Agent模式“OK Computer”,支持智能网站开发等复杂任务;ChatGPT新增个性化资讯功能,定制用户专属新闻;Exa Code发布代码索引工具,助力AI代理精准生成代码;Meta推出AI视频创作平台Vibes,简化短视频制作;蚂蚁数科发布隐私保护AI框架Gibbon,推理速度提升超百倍;OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平,覆盖九大行业44种职业。

  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • 2025第八届工业互联网创新发展大会即将启幕

    2025年10月24日,湖北黄石将举办第八届工业互联网创新发展大会。作为老工业基地转型代表,黄石近年以工业互联网为主线,聚焦中小企业数字化转型,已培育36个国家级试点示范和200余项省级荣誉。本届大会以“AI融合+数智新生”为主题,设置“1+3+3”活动矩阵,涵盖开幕式、专题论坛及三大展区,推动人工智能与工业互联网深度融合,助力制造业升级和中小企业提质增效。大会旨在打造全国工业数智转型交流高地,并首次联动启动国家级中小企业数字化试点,标志着黄石产业数字化进入新阶段。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • 宜享花依托AI与大数据技术,推动消费金融合规创新与服务提质

    宜人智科旗下品牌宜享花以人工智能与大数据技术为核心驱动力,构建覆盖全链路的一体化智能服务体系。平台在严格合规框架下,深度融合金融机构与多元场景资源,为消费者提供精准、安全的金融支持,并通过科技创新持续优化风控能力与服务体验。宜享花高度重视合规经营,建立覆盖业务全流程的个人信息保护机制,自主研发“Hawkeye反欺诈管理系统”有效识别并拦截欺诈行为。同时,平台发布《消费者权益保护2024年度报告》,建立六大消保评审维度,强化事前审查与专项检查机制。通过AI技术打造高效、智能的客户服务体系,累计提供智能客服超490万次,智能客服分流率达52%。未来,宜享花将持续深化科技应用,筑牢智能风控防线,完善消费者权益保护,为经济高质量发展注入科技金融新动能。

  • 从边陲到前沿:麒麟软件推动新疆数字化与民族语言信息化

    1955年10月1日新疆维吾尔自治区成立,开启发展新篇章。70年来,新疆各族人民生活水平显著提升,社会事业全面进步,生态环境持续改善。麒麟软件作为国产操作系统核心力量,深度参与新疆数字化建设,覆盖党政、金融、交通、通信、教育等领域,支撑超70家厅局单位及14个地州市用户。其银河麒麟操作系统在维哈柯文等多民族语言版本持续升级,集成智能输入与AI助手,优化本地化体验,助力民族地区信息化发展。未来,麒麟软件将持续以技术创新服务新疆现代化建设,推动区域高质量发展。

今日大家都在搜的词: