DeepSeek深度求索发布开源代码大模型DeepSeek Coder

2023-11-06 08:23 · 稿源：站长之家

站长之家(ChinaZ.com) 11月6日消息:DeepSeek（深度求索）是一个专注于探索 AGI（通用人工智能）本质的团队，最近发布了开源的代码大模型 DeepSeek Coder。

DeepSeek Coder 是一个智能代码助手，可以生成各种代码，包括贪吃蛇游戏、2048游戏、测试样例、修 bug、SQL 查询等。DeepSeek Coder 还在国际权威数据集的测试中表现出色，领先其他开源模型。

微信截图_20231106082504.png

目前，DeepSeek Coder 已经开放内测，并且全系列模型已经在 Hugging Face 和 GitHub 上开源。

DeepSeek Coder 的训练过程包括数据处理和模型训练，通过预训练和指令调优得到最终模型。DeepSeek 致力于探索 AGI 的本质，未来还将推出更多研究成果。

项目地址：https://github.com/deepseek-ai/DeepSeek-Coder

（举报）

相关推荐

关键词：

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

2025年9月29日，深度求索公司发布新一代模型架构DeepSeek-V3.2，引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本，在V3.1-Terminus基础上引入稀疏注意力机制，优化长文本训练和推理效率。目前官方应用端已同步更新，API大幅降价。此次模型体积达671GB，下载需8-10小时。业内专家指出，此次快速适配表明双方早有深度技术协�

DeepSeek-V3.2 大模型架构稀疏注意力机制
DeepSeek-V3.2-Exp正式发布

DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp，该模型基于V3.1-Terminus升级，引入创新的稀疏注意力机制DSA，首次实现细粒度稀疏注意力，在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面，官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整：输入缓存0.2元、输入未缓存2元、输出3元，开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

DeepSeek-V3.2-Exp 稀疏注意力机制 DSA
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
霍涛推动开放战略落地，白山云接入快手KAT-Coder赋能开发者

白山云科技与快手StreamLake合作，在其“白山智算”平台上线闭源编程大模型KAT-Coder。该模型在SWE-Bench测试中解决率达73.4%，性能媲美全球顶尖模型，支持端到端代码生成。白山云通过“顶尖模型能力+全球边缘算力”整合，为开发者提供低于300ms超低延时代码生成服务，仅需一行代码即可调用，大幅降低AI开发门槛。此次合作是白山云完善AI工具链布局的关键一步，未来将持续深化开放协作，优化模型与边缘算力服务模式。

白山智算 KAT-Coder AI技术
荐AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机器人DR02发布；谷歌Chrome即将引入Gemini新功能

快手开源72B代码模型KAT-Dev在SWE-Bench测试中准确率达74.6%，创国产AI编程里程碑；杭州云深处推出全球首款IP66防护全候作业机器人DR02；谷歌Chrome将集成Gemini引发隐私担忧；学者指控苹果使用盗版书籍训练AI，版权争议再起；Liquid AI发布高效稀疏激活模型LFM2-8B-A1B；苹果拟收购Prompt AI布局智能家居视觉技术；AI伴侣应用泄露4300万条用户隐私对话；西湖大学DeepScientist显著提升科研效率。

AI日报快手72B代码模型 KAT-Dev
DeepSeek更新至V3.1 Terminus版本：两大升级

9月22日，深度求索宣布DeepSeek V3.1已更新至Terminus版本，官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上，针对用户反馈进行改进：优化语言一致性，缓解中英文混杂、异常字符等问题；提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定，各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

DeepSeek V3.1 Terminus版本
荐AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

本期AI日报聚焦多领域技术突破：京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”，推动物流行业迈向自主执行；DeepSeek推出V3.1终结版，修复漏洞并为V4架构铺路；Kimi上线Agent模式“OK Computer”，支持智能网站开发等复杂任务；ChatGPT新增个性化资讯功能，定制用户专属新闻；Exa Code发布代码索引工具，助力AI代理精准生成代码；Meta推出AI视频创作平台Vibes，简化短视频制作；蚂蚁数科发布隐私保护AI框架Gibbon，推理速度提升超百倍；OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平，覆盖九大行业44种职业。

京东物流超脑大模型2.0 异狼具身智能机械臂系统
1299元华为FreeClip 2耳夹耳机预售卖爆：1小时总量突破80000台

华为FreeClip 2耳夹耳机10月14日开启预售，20日正式开售，售价1299元。预售1小时销量突破8万台。提供丹宁蓝、摩登黑、羽纱白三色，采用玲珑方盒设计。耳机采用亲肤液态材质，柔软度提升25%，单耳仅重5.1克，支持IP57防尘防水。搭载自研超澎湃双引擎单元，响度和低音动力均提升100%，并配备第三代音频芯片及NPU AI处理器，算力提升10倍。支持实时动态降噪、三麦克风通话降噪、高清空间音频及鸿蒙AI助手。单耳续航9小时，整机达38小时。

华为FreeClip 2 耳夹耳机
OPPO ColorOS 16发布：Find X9等机型将全球首发

10月15日，OPPO正式发布ColorOS 16系统，由Find X9系列、一加15、一加Ace6及OPPO Pad5等机型首发。系统在流畅度、AI功能和生态互联实现重大突破：三大引擎提升流畅度，系统重载流畅度提升37%，功耗降低13%；新增一键闪记、智能场景识别等便捷功能；小布助手升级，提供个性化推荐；AI实景对话支持声纹识别；生态互联打通与Apple Watch壁垒，实现跨设备信息显示与操作迁移，全面提升用户体验。

ColorOS16 OPPO Find
简化版Model Y将便宜约10%！特斯拉发布Model 3/Y Standard标准版

特斯拉在北美推出两款低价入门车型：Model Y标准版起售价39990美元，较原版降价5000美元；Model 3标准版起售价36990美元，降价5500美元。两款车型均为后驱设计，但续航、配置大幅精简：Model Y续航降至321英里，移除全景天窗、氛围灯等功能；Model 3音响系统减配至7个扬声器，取消方向盘电动调节等。特斯拉曾计划推出2.5万美元平价电动车，但已被叫停，资源转向自动驾驶领域。目前中国市场是否引入新车尚未确认。

特斯拉 Model Y

今日大家都在搜的词：

热文

3 天
7天

DeepSeek深度求索发布开源代码大模型DeepSeek Coder

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

DeepSeek-V3.2-Exp正式发布

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

霍涛推动开放战略落地，白山云接入快手KAT-Coder赋能开发者

荐AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机器人DR02发布；谷歌Chrome即将引入Gemini新功能

DeepSeek更新至V3.1 Terminus版本：两大升级

荐AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

1299元华为FreeClip 2耳夹耳机预售卖爆：1小时总量突破80000台

OPPO ColorOS 16发布：Find X9等机型将全球首发

简化版Model Y将便宜约10%！特斯拉发布Model 3/Y Standard标准版

今日大家都在搜的词：

热文

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

王腾首次回应下一步计划：称在考虑些创业项目

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

王腾发文祝REDMI K90 Pro Max大卖王化回复“拥抱”表情

华为nova Flip S小折叠手机开启预售：3488元起

红魔11 Pro系列发布：4999元起首发风水双冷散热

苹果iPhone Air国行版今日预售：售价7999元起支持eSIM

OPPO Find X9预订量刷新Find系列历史最高纪录

微信员工回应好友互删后互动清除：并非新版本特性

微信回应人去世了朋友圈会消失吗：长时间不使用账号已不再回收

京东回应下场造车：不直接涉及制造三方联合推出

AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球

小米推出短剧App围观短剧：主打无广告免费看

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

王腾首次回应下一步计划：称在考虑些创业项目

站长商机