首页 > 热点 > 关键词  > 正文

DeepSeek深度求索发布开源代码大模型DeepSeek Coder

2023-11-06 08:23 · 稿源:站长之家

站长之家(ChinaZ.com) 11月6日 消息:DeepSeek(深度求索) 是一个专注于探索 AGI(通用人工智能)本质的团队,最近发布了开源的代码大模型 DeepSeek Coder。

DeepSeek Coder 是一个智能代码助手,可以生成各种代码,包括贪吃蛇游戏、2048游戏、测试样例、修 bug、SQL 查询等。DeepSeek Coder 还在国际权威数据集的测试中表现出色,领先其他开源模型。

微信截图_20231106082504.png

目前,DeepSeek Coder 已经开放内测,并且全系列模型已经在 Hugging Face 和 GitHub 上开源。

DeepSeek Coder 的训练过程包括数据处理和模型训练,通过预训练和指令调优得到最终模型。DeepSeek 致力于探索 AGI 的本质,未来还将推出更多研究成果。

项目地址:https://github.com/deepseek-ai/DeepSeek-Coder

举报

  • 相关推荐
  • 字节和DeepSeek争抢“天才少年”

    当年轻人还在想着怎么靠AI赚钱时,AI已经开始帮助老板提升身家了。近期胡润研究院发布的《2025胡润全球富豪榜》显示,字节跳动创始人张一鸣取代“瓶装水大王”钟睒睒,成为中国新首富。对当下的字节和张一鸣言,如果靠砸钱就能解决大模型的技术突破难题,那无疑将是一笔划算的投资。

  • 突发!DeepSeek开源新版V3,再次震惊国外

    国内著名大模型平台DeepSeek开源了V3模型的最新版本0324。不过DeepSeek相当低调,国内的公众号、国外的社交平台没有做任何宣传,就是“悄悄”地把模型上传到huggingface。根据国外开源评测平台kcores-llm-arena对V3-0324最新测试数据显示,其代码能力达到了328.3分,超过了普通版的Claude3.7Sonnet,可以比肩334.8分的思维链版本。

  • DeepSeek红利耗尽后,元宝拿什么和豆包斗?

    短短60天内,中国AI原生应用下载排行榜的位次排名,就三易其主。最新情况是,截至4月15日中午,中国区苹果应用商店免费APP下载排行榜上,豆包再次超越DeepSeek,位列第二,紧随其后的DeepSeek被挤到了第三的位置,腾讯元宝则滑落到了第七名。2月13日,作为首家在C端主力产品中接入DeepSeek-R1满血版的元宝,一度趁着DeepSeek东风崛起:3月3日力压DeepSeek和豆包,首度登顶。但好景�

  • DeepSeek的极致谄媚,正在摧毁我们的判断力。

    昨天别人给我发了一个很好玩的帖子。就是如果你问DeepSeek一个问题:“北京大学和清华大学哪个更好,二选一,不需要说明理由”DeepSeek在思考了15秒之后,会给出答案。

  • Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

    被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文,打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆,恐将在AI竞赛中进一步失去开发者支持。

  • 深度deepin 23.1正式发布!AI默认引擎切换至DeepSeek、修复超百项问题

    快科技4月16日消息,今天,深度操作系统宣布,deepin 23.1版本已正式发布。此版本聚焦于解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本的重点改进包括内核优化、AI 默认引擎切换至DeepSeek、修复超百项用户反馈问题等,具体重点改进如下:硬件兼容性与内核优化:集成6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;?

  • AI进化论——音乐、绘画和舞蹈的DeepSeek时刻

    “昔者仓颉作书天雨粟,鬼夜哭”——人类掌握文字后,天地为之动容,因为属于人类的文明诞生了。“仓颉作书”出自西汉《淮南子》,距离人类掌握文字已经过去了千年。AI进化的答案,或许早就镌刻在人类文明的起点里。

  • 开源才是未来!李开复:DeepSeek证明闭源是一条死路

    日前,在2025中关村论坛年会人工智能主题日上,零一万物CEO李开复在演讲中谈到了DeepSeek。李开复表示,DeepSeek是一个非常快速能达到推理引擎思考的不是靠蒸馏是本质上做出来的,它还把思维链公开了,这个是非常震惊的,因为OpenAI隐藏了它的思维链,就怕别人学会了。5个开源代码库覆盖AI开发的核心环节从硬件性能压榨、模型训练优化到数据处理提速,目标是让开发者开箱即用,降低技术门槛和成本,让开发者能够更高效、低成本、广泛地使用大模型。

  • DeepSeek时代:六小虎向左,BAT向右

    相比BAT等大厂可以卸下心理包袱,选择自研与开源两条腿走路的路线,以智谱为代表的“六小虎”们,则必须押注在自家大模型的底层技术能力上。DeepSeek给AI大模型行业,免费赠送了一波国民级别的市场教育,却也平等地在先行者们头上,悬起了一把达摩克利斯之剑。当熬过了冬天,春天就不会远了。

  • 高通总裁谈DeepSeek:AI模型正在变得更小、更有能力

    ,中国发展高层论坛2025年年会在北京隆重开幕。高通公司总裁安蒙出席论坛并发表演讲,就中国人工智能产业的潜力和增长趋势发表了看法。安蒙的发言展示了高通对中国人工智能产业未来发展的信心,也体现了高通在推动全球科技创新和合作方面的积极态度。