首页 > 业界 > 关键词  > 正文

蚂蚁集团开源代码大模型CodeFuse-CodeLlama-34B 4bits量化版本

2023-09-27 15:59 · 稿源:站长之家

站长之家(ChinaZ.com)9月27日 消息:近日,蚂蚁集团代码大模型CodeFuse-CodeLlama-34B4bits量化版本发布。

CodeFuse-CodeLlama-34B-4bits是CodeFuse-CodeLlama-34B模型的4bits量化版本,后者是通过QLoRA对基座模型CodeLlama-34b-Python进行多代码任务微调而得到的代码大模型,模型输入长度为4K。

经4bits量化后,CodeFuse-CodeLlama-34B-4bits可用单张A10(24GB显存)或者RTX4090(24GB显存)加载,同时,量化后的模型在Humaneval pass@1指标上仍取得了73.8%的表现。

微信截图_20230927155613.png

据悉,CodeFuse是蚂蚁自研的代码生成专属大模型,根据开发者的输入提供智能建议和实时支持,帮助开发者自动生成代码、自动增加注释,自动生成测试用例,修复和优化代码等,以提升研发效率。

CodeFuse-CodeLlama-34B4bits项目地址:

https://modelscope.cn/models/codefuse-ai/CodeFuse-CodeLlama-34B-4bits/summary

举报

  • 相关推荐
  • MCP服务库完整指南:如何选择最适合的Model Context Protocol服务

    本文介绍了MCP(Model Context Protocol)作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展,选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值:提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务,初创公司可侧重简便性,大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展,并推荐使用专业对比平台(如mcp.aibase.cn)辅助决策。

  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • 剪辑师的移动工作站!荣耀MagicBook Pro 14酷睿U9版:4K剪辑无压力

    荣耀MagicBook Pro14酷睿U9-285H版在轻薄与性能间实现完美平衡。搭载英特尔酷睿Ultra 9 285H处理器和锐炫Arc 140T核显,多核性能强劲,视频剪辑流畅高效。配备32GB大内存和高速硬盘,支持复杂多任务处理。14.6英寸3.1K OLED屏幕色彩精准,散热系统优秀,续航长达12小时,适合移动办公和专业创作。

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • ColorOS 16 Beta开启尝鲜招募 首批机型含一加13等

    今日,ColorOS开启Beta测试版本招募,数码博主数码闲聊站”透露,此次Beta测试为全新ColorOS 16。 本次招募首批机型为一加13、一加13T、OPPO Find X8系列、OPPOFind N5,每款机型均招募300人,符合机型条件的可在8月12日17:00之前报名。

  • EBC金融集团CEO接受央视连线:美国关税难阻中国半导体崛起

    白宫今年发起新一轮贸易战以平衡国内通胀和财政赤字。虽与主要贸易伙伴达成框架协议,但具体领域仍在加码政策。特朗普计划对钢铁和半导体征收关税,半导体税率或达200-300%,先低后高以吸引建厂后大幅提税。美股半导体企业普跌,行业高度依赖全球化,如光刻机来自荷兰,高端晶圆生产依赖台积电和三星。专家称若脱离全球化基础,欧盟难实现20%本土利润率,并预测美国关税无法阻挡中国半导体快速发展。贸易阴云加剧资产表现分化,EBC金融集团引入ETF等多元资产,助投资者分散组合以平抑波动,凭借全球视野帮助交易者驾驭市场机遇。

  • WEEX亮相0xConnect线下活动,深化全球化布局与行业伙伴交流

    WEEX交易所受邀出席圣彼得堡0xConnect线下活动,与全球加密品牌共同探讨行业趋势并拓展合作机会。该活动聚集了来自交易所、公链项目、钱包及投资机构的代表,通过面对面交流碰撞出新的合作火花。WEEX团队借此机会向与会者介绍了平台在合规建设、资金安全和用户体验方面的价值理念,展示了打造安全透明交易环境的品牌承诺。未来WEEX将继续参与全球行业活动,以开放姿态推动加密生态健康发展。

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • 王宁掏出迷你版LABUBU

    “这周就要发布Mini版LABUBU,以前可能大家是挂在包上,可能从下周开始,大家甚至可以挂在手机上,它的使用场景会更多,相信它会是一个超级受欢迎的爆款。” 8月20日,在泡泡玛特2025年中期业绩发布会上,泡泡玛特董事长兼CEO王宁化身“带货博主”,从胸前西装口袋中拿出了一个Mini版LABUBU介绍道。 这款即将登场的 Mini 版 LABUBU 仅有掌心大小,延续了LABUBU标志性的搪胶毛�

今日大家都在搜的词: