首页 > 业界 > 关键词  > 正文

蚂蚁集团开源代码大模型CodeFuse-CodeLlama-34B 4bits量化版本

2023-09-27 15:59 · 稿源:站长之家

站长之家(ChinaZ.com)9月27日 消息:近日,蚂蚁集团代码大模型CodeFuse-CodeLlama-34B4bits量化版本发布。

CodeFuse-CodeLlama-34B-4bits是CodeFuse-CodeLlama-34B模型的4bits量化版本,后者是通过QLoRA对基座模型CodeLlama-34b-Python进行多代码任务微调而得到的代码大模型,模型输入长度为4K。

经4bits量化后,CodeFuse-CodeLlama-34B-4bits可用单张A10(24GB显存)或者RTX4090(24GB显存)加载,同时,量化后的模型在Humaneval pass@1指标上仍取得了73.8%的表现。

微信截图_20230927155613.png

据悉,CodeFuse是蚂蚁自研的代码生成专属大模型,根据开发者的输入提供智能建议和实时支持,帮助开发者自动生成代码、自动增加注释,自动生成测试用例,修复和优化代码等,以提升研发效率。

CodeFuse-CodeLlama-34B4bits项目地址:

https://modelscope.cn/models/codefuse-ai/CodeFuse-CodeLlama-34B-4bits/summary

举报

  • 相关推荐
  • AI日报:MiniMax公布上市后首份财报;千问开源Qwen3.5小型模型系列;Claude Code官方语音模式上线

    本期AI日报涵盖多项重要动态:MiniMax发布上市后首份财报,展示其AI平台战略进展;阿里通义千问开源Qwen3.5小型模型系列,支持多模态处理,适用于边缘设备;Google NotebookLM上线信息图自定义样式功能,简化知识可视化流程;Claude Code推出语音模式,提升编程协作效率;疑似GPT-5.4细节泄露,或具备超长上下文和状态化能力;Zopia实现多智能体协作自动化视频制作;QM发布2025年AI应用榜,豆包、DeepSeek、元宝等位列前五;DeepSeek V4 Lite凭借2000亿参数展现顶尖性能,成为国产模型新标杆。整体显示AI技术正快速向多模态、轻量化、场景化方向演进。

  • 对标Claude Code Security,安恒恒脑安全智能体硬核实现0day漏洞复现与超量挖掘

    近日,Anthropic公司推出的Claude Code Security工具引发网络安全行业热议。国内安恒信息迅速行动,其自研的恒脑安全智能体开启对标验证工作,成功复现了Claude Code Security披露的3个0day漏洞,并精准还原了每个漏洞的攻击链与触发路径。更值得关注的是,恒脑安全智能体在后续深度审计中,额外挖掘出10个全新的0day高危漏洞,分布于Ghostscript和OpenSC两大核心项目。此次对标验证不仅全面检验了恒脑安全智能体的技术实力,更是国内AI安全技术与国际顶尖水平同台竞技的重要实践,为中国数字安全产业发展注入了强劲动力。

  • AI日报:谷歌发布Gemini3.1Pro;Claude Code远程控制功能上线;Qwen3.5开源家族新增多款模型

    本期AI日报汇总了人工智能领域的最新动态。谷歌发布Gemini 3.1 Pro,推理能力显著提升,多项基准测试超越GPT-4o。Anthropic为Claude Code推出“远程控制”功能,实现移动设备无缝管理电脑编码任务。OpenAI发布深度融合推理能力的编程模型GPT-5.3-Codex。通义千问Qwen3.5开源家族新增多款模型并上线托管服务。Meta开源GPU集群监控工具GCM,精准定位硬件故障。Anthropic发布企业级插件,将Claude深度集成至Office全家桶。谷歌AI虚拟形象支持24种语言,提升跨语言沟通效率。阿里云Coding Plan推出低价订阅服务,降低开发者使用成本。

  • Claude Code怎么用?数眼智能接入Claude Code完整安装配置教程

    本文介绍了Anthropic推出的命令行AI编程助手Claude Code的安装与配置方法。主要内容包括:系统要求Node.js 18+及相应操作系统;安装步骤涵盖Node.js、Git和Claude Code本身;环境变量配置需设置API认证令牌和服务地址。文章还详细说明了在VS Code中安装扩展版本的方法,以及如何自定义API接入第三方模型服务。最后针对常见问题如API密钥无效、网络连接失败等提供了解决方案。

  • TECNO于 MWC 2026发布CAMON 50系列,官宣与Tonino Lamborghini重磅合作

    TECNO在MWC 2026期间举办生态发布会,推出全新影像旗舰手机CAMON 50系列,并宣布与意大利传奇设计品牌Tonino Lamborghini达成重磅合作。CAMON 50系列主打高性能影像,深度融合高端硬件与AI处理能力,搭载全新AI RAW 2.0图像引擎及行业首创的AI Auto Zoom等功能,在DXOMARK测试中获得优异评分。同时,TECNO与Tonino Lamborghini将共同探索科技与美学的融合,并联合发布了限量版水冷主机、全金属5G手机等多款AIoT生态产品,致力于为用户提供更实用、可及的AI体验。

  • 实测OpenClaw中文版Molili自定义大模型:这才是真·AI智能体

    本文介绍了OpenClaw中文版Molili,一款能真正执行任务的桌面AI智能体。它解决了传统AI“只会说不会做”的痛点,通过微信等平台直接下达指令,即可自动操作电脑完成查找文件、发送文档等任务。核心亮点包括:支持自定义接入各类大模型,打破模型绑定;提供8000+现成技能,覆盖办公、编程、生活等场景;注重安全与隐私,设有操作权限管控和本地数据处理机制;对中文指令和国产生态有深度优化。

  • AI日报:多模态大模型DeepSeek V4即将发布;谷歌即将停用Gemini 3 Pro Preview;微软推出AI软件组合

    本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。

  • OpenClaw中文版Molili开放自定义大模型接入 国产AI智能体再突破

    3月5日,OpenClaw中文版Molili正式上线自定义接入大模型功能。该产品以极致自由度、全链路本土化适配与零门槛操作为特点,为个人及企业用户提供全新AI自动化解决方案,推动桌面AI智能体从“对话交互”向“落地执行”深度转型。核心亮点包括自定义大模型接入、全场景使用自由,支持企业无缝接入私有模型,个人用户可自主选择偏好模型,打破传统AI工具模型绑定限制。产品突破“重对话、轻执行”行业痛点,实现真实电脑端操作,覆盖文件处理、信息搜索等重复性任务,支持微信、钉钉等多平台远程指挥,并搭载8000+技能矩阵,全方位保障用户隐私与数据安全。

  • 小鹏X9第二代VLA版本大定占比超80%:创版本占比新纪录

    今天,小鹏汽车官方公布了一组数据:在3月2日第二代VLA智能驾驶系统发布后,小鹏X9第二代VLA版本的大定占比直接超过了80%,刷新了该车型的版本占比新纪录。 第二代VLA作为开启L4时代的物理世界大模型,去掉了传统智驾系统中感知-决策-控制”的繁琐转译环节,实现了从视觉信号到车辆动作的端到端直接输出。

  • AI日报:MiniMax发布Expert 2.0与云端助手MaxClaw;DeepSeek V4 细节曝光;肯德基AI 点餐助手接入通义千问

    本期AI日报聚焦多款AI产品动态:MiniMax发布Expert 2.0与云端助手MaxClaw,降低专业AI Agent开发门槛;DeepSeek V4细节曝光,具备万亿参数与原生多模态能力;肯德基接入通义千问推出AI点餐助手“小K”;华强北AI眼镜在美销量暴涨;Perplexity发布通用AI代理Computer,集成多模型协同工作;三星Galaxy S26系列手机AI功能全面升级;三七互娱“小七大模型”深度落地游戏出海等场景。整体呈现AI

今日大家都在搜的词: