首页 > 热点 > 关键词  > 正文

GLM技术团队宣布代码模型CodeGeeX2-6B开源

2023-07-26 08:56 · 稿源:站长之家

站长之家(ChinaZ.com)7月26日 消息:GLM技术团队宣布,「代码生成模型 CodeGeeX2-6B」正式开源。

CodeGeeX2是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2架构注入代码实现。得益于 ChatGLM2的更优性能,CodeGeeX2-6B 在多项指标上取得了较大的性能提升。与150亿参数的 StarCoder-15B 相比,CodeGeeX2-6B 凭借60亿参数便具备了近10% 的优势。

微信截图_20230726085841.png

具体特性如下:

更强大的代码能力:基于 ChatGLM2-6B 基座语言模型,CodeGeeX2-6B 进一步经过了600B 代码数据预训练,相比一代模型,在代码能力上全面提升,HumanEval-X 评测集的六种编程语言均大幅提升 (Python +57%, C++ +71%, Java +54%, JavaScript +83%, Go +56%, Rust +321%),在Python上达到35.9% 的 Pass@1一次通过率,超越规模更大的 StarCoder-15B。

优秀的模型特性:继承 ChatGLM2-6B 模型特性,CodeGeeX2-6B 更好支持中英文输入,支持最大8192序列长度,推理速度较一代 CodeGeeX-13B 大幅提升,量化后仅需6GB显存即可运行,支持轻量级本地化部署。

更全面的AI编程助手:CodeGeeX插件(VS Code, Jetbrains)后端升级,支持超过100种编程语言,新增上下文补全、跨文件补全等实用功能。结合 Ask CodeGeeX 交互式AI编程助手,支持中英文对话解决各种编程问题,包括且不限于代码解释、代码翻译、代码纠错、文档生成等,帮助程序员更高效开发。

更开放的协议:CodeGeeX2-6B 权重对学术研究完全开放。

代码地址:https://github.com/THUDM/CodeGeeX2

举报

  • 相关推荐
  • 苹果代码泄密:iOS 26.4、iOS 27新功能揭晓

    苹果今天推送了iOS 26.2的正式版,这次很反常,以往一般都是周二的凌晨发布新版本。 这次不仅在周末推送,而且与上次的RC2候选版本是同一周发布,这种情况以往非常罕见。 除了iOS 26.2正式版之外,还有媒体通过新系统泄露的代码,发现了接下来的更新计划,包括iOS 26.4、iOS 27的新功能。 根据报道,苹果对iOS 26.4的计划如下: -推出由苹果智能(Apple Intelligence)驱动的改进

  • AI日报:Kling 2.6将发布;千问APP推学习大模型;Z-Image-Turbo-Fun-Controlnet-Union 开源

    本期AI日报聚焦多领域AI进展:Kling 2.6发布,支持音频同步生成,AI视频进入有声时代;千问APP推出学习大模型,提升拍照答疑与作业批改能力;阿里通义实验室开源图像生成模型,实现精准控制;豆包手机助手遭遇微信登录异常,凸显生态兼容挑战;米哈游推出带猫语特色的AI聊天模型AnuNeko;亚马逊云科技发布三款新型AI智能体,其中Kiro可自主编程数日;IDC报告预测具身智能�

  • AI日报:蚂蚁推灵光网页版AI助手;智谱开源GLM-4.6V系列;谷歌Mixboard重磅升级

    本期AI日报聚焦多项AI领域进展:智谱开源GLM-4.6V系列模型,提供强大多模态处理能力;蚂蚁集团推出灵光网页版AI助手,支持快速生成应用;谷歌Mixboard集成自研图像模型,提升创意生产效率;抖音李亮强调AI手机助手需用户授权,与隐私无关。此外,上海交大发布全球首款光子芯片垂直大模型LightSeek,研发效率提升7倍;谷歌Doppl推出AI购物发现功能;智谱开源AutoGLM,推动手机端AI Agent发展;OpenAI与德国电信合作部署企业版ChatGPT,助力欧洲电信行业数字化转型。

  • 声网对话式 AI Studio 零代码也能快速开发对话式 Agent

    声网在RTE2025大会上发布对话式AI Studio 1.0,定位“零代码生产级智能体工厂”,旨在降低开发门槛。平台通过可视化编排、模块化设计及生态资源整合,让非技术用户也能快速打造专属智能体。它提供场景化模板与插件商店,覆盖智能客服、情感陪伴等热门场景,并支持第三方资源一键集成。平台还与模型评测平台联动,为用户推荐最优模型组合。新增的AI外呼功能支持SIP接入与PSTN连接,便于企业部署智能外呼/内呼。目前产品已上线,新用户可获免费体验包,助力企业低成本快速落地项目。

  • DeepSeek同时发布两个正式版模型:DeepSeek-V3.2系列发布

    今日,DeepSeek正式推出V3.2系列模型,包含标准版DeepSeek-V3.2与长思考增强版DeepSeek-V3.2-Speciale。此次更新不仅在推理性能上实现重大突破,更通过创新性技术架构重新定义了开源模型的能力边界。 目前,官方网页端、移动应用及API服务已全面升级至V3.2标准版,而Speciale版本则以临时API形式开放供学术研究使用。 DeepSeek-V3.2在平衡推理效率与输出质量方面

  • 真我16 Pro系列官宣:全球首发LumaColor影像技术

    真我宣布与莱茵TV合作建立LumaColor影像实验室,即将登场的真我16 Pro系列将全球首发LumaColor影像技术。 真我介绍,LumaColor影像技术由真我和莱茵TV联合研发,基于这项先进的影像技术,真我16 Pro系列将带来标杆级的人像拍摄体验,能拍出肤色自然、光影层次分明、氛围感十足的人像作品,让画面更具真实感与情感张力。 具体来看,LumaColor采用了行业首创的光色协同处理方案,

  • 易鑫开源汽车金融业首个Agentic大模型,加速AI生态共建

    易鑫集团(02858.HK)宣布开源其自主研发的Agentic大模型YiXin-Agentic-Qwen3-14B,成为汽车金融行业首个开源此类模型的企业。该模型基于通义千问Qwen3-14B深度优化,具备卓越推理、复杂任务处理及多方协作的智能体能力,在多项性能测试中位列榜首,推理成本较行业平均水平降低三分之一。模型搭载金融领域专属知识体系与工具集,覆盖语音交互、车辆评估、风控、欺诈识别等功能,形成全链路智能支撑体系。易鑫提出“底座开放-社区共建-能力迭代-企业部署-生态繁荣”的开源共建模式,通过提供低代码私有化模板,帮助企业快速落地AI应用。此次开源与之前发布的行业首个开源推理大模型YiXin-Distill-Qwen-72B形成“垂直底座+Agentic大脑”双轮技术矩阵,填补了汽车金融领域专业开源AI工具链的空白。

  • AI日报:快手可灵 2.6 全量上线;字节Seedream 4.5发布;DeepSeek连发两款新模型

    本文汇总了AI领域最新动态:快手可灵2.6上线,实现“音画同出”生成视频;字节跳动发布Seedream4.5,提升多图一致性生成;豆包助手回应权限争议并下线微信操作功能;智源研究院推出多模态世界模型Emu3.5,可预测真实世界状态;研究揭示AI模型能发现并利用智能合约漏洞;小米公布AI战略,押注“AI+物理世界”融合;谷歌发布Workspace Studio,助力企业构建AI代理;DeepSeek同步上线V3.2与Speciale两款新模型,展示开源实力。

  • 行业首家!易鑫正式开源Agentic大模型,定义汽车金融AI新范式

    易鑫宣布开源自主Agentic大模型YiXin-Agentic-Qwen3-14B,成为汽车金融行业首个开源此类模型的企业。该模型基于Qwen3-14B,参数规模140亿,通过多阶段训练体系深度优化,在智能体协作、函数调用、推理等能力上可比肩参数200B以上的商用大模型。多项专业评测显示,其在金融专业知识理解方面显著优于DeepSeek V3.1、Kimi-K2等主流模型,并在智能体工具使用任务中同样表现卓越,位居同尺寸模型性能测试首位。该模型既展现出强劲的专业理解力与协作推理能力,又兼具高实用性与经济效益,将为汽车金融及各类专业场景提供高效、可靠的智能引擎。易鑫以技术创新为核心驱动力,持续引领行业迈向智能化转型。

  • V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

    ​就在上周,OpenAI前首席科学家、现SSI CEO Ilya Sutskever在最新播客访谈中抛出一个重磅观点,过去五年的“age of scaling”正在走到头,预训练数据是有限的,单纯用更多GPU堆更大模型,哪怕再放大100倍,也未必能带来质变。所以我们又回到了以研究为核心的时代,只不过这次有了巨大的算力”,这一表态被视作对Scaling Law撞墙论的强力佐证。 然而仅过了几天,12月1日,DeepSeek用V3

今日大家都在搜的词: