首页 > 业界 > 关键词  > GraniteCode最新资讯  > 正文

IBM 发布开源模型 Granite Code,在编程任务中超过谷歌模型

2024-05-13 09:25 · 稿源:站长之家

划重点:

🔍 IBM 发布了一套名为 "Granite Code" 的专门用于编程的模型,这些模型在基准测试中超过了一些较大的开源竞争对手,并旨在帮助企业完成各种软件开发任务。

🔍 Granite Code 模型包括基础模型和指导模型,每种模型都有4个不同规模的变种,参数从30亿到340亿不等,通过对比评估表现出色。

🔍 IBM 计划定期更新这些模型,并很快推出具有更大上下文窗口和针对 Python 和 Java 的专业化版本。

站长之家(ChinaZ.com) 5月13日 消息:IBM 最近发布了一组名为 "Granite Code" 的开源型,旨在帮助企业完成各种软件开发任务,并在基准测试中表现出色。这些模型不仅过了一些较大的开源竞争对手,而且在编程任务中展现出了强大的性能。

Granite Code 型分为基础模型和指导模型,每种模型都有四个不同规模的变种,参数数量从30到340亿不等。这些模型的上下文窗口相对较短,例如,其中一个模型的上下文窗口只有128K,这限制了其在包含特定文档或自己的代码库等提示信息时的有效性。不过,IBM 目正在开发具有更大上下文窗口的版本。

image.png

基础模型的训练分为两个阶段。第一阶段使用自116种编程语言的3-4万亿个标记进行训练,以建立广泛的理解能力。在第阶段,这些模型使用来自高质量代码和自然语言数据的5000亿个标记进行进一步训练,以强逻辑推理能力。

指导模型是通过对基础模型进行改进而创建的,改进方法包括筛选提交记录、自然语言指令记录和合成生成的代码数据集。

在包括代码合成、调试、解释、编辑、学推理等多个基准测试中,Granite Code 模型在各个规模和基准测试中表现出色,常常超过开源模型两倍以上的大小。例如,在 HumanEvalPack 基准测试中,Granite-8B-Code-Base 的平均得为33.2%,超过谷歌最佳表现的 CodeGemma-8B 模型的21.3%,尽管 Granite-8-Code-Base 所使用的标记数量明显较少。

这些模型的大部分训练数据来自一个清理过的 GitHub 集 StarCoderData 和其他公开可用的代码库。这一点非常重要,因为目前有一些关于其他代码型(包括 GitHub 本身)涉嫌侵犯训练数据版权的诉讼。

IBM 计划定期更新这些模型,很快将推出具有更大上下文窗口以及针对 Python 和 Java 的专业化版本。这些模型已经在 Hugging FaceGitHub 上可用,并且也是 IBM 的 watsonx 企业平台的一部分。

IBM 的 Granite Code 是一专门用于编程的开源模型,它们在基准测试中表现优异,同时具有较少的参数数量。些模型的特点包括灵活的规模选择、基于广泛训练数据的逻辑推理能力和良好的性能未来,IBM 还计划不断改进和更新这些模型,以满足不同编程任务的需求。

产品入口:https://top.aibase.com/tool/granite-code-models

举报

  • 相关推荐
  • iSlide 上线 macOS 插件版,进一步完善 AI 时代的 PPT 制作体验

    iSlide推出macOS插件版,直接嵌入PowerPoint,实现AI生成PPT、模板资源、图示图表及设计排版等功能的原生融合。这解决了Mac用户需在多个工具间切换的痛点,提供从内容生成到视觉呈现的一体化高效工作流,覆盖模板、图示、图片等核心资源场景,并配备矩阵布局等设计工具,显著提升PPT制作效率与专业度。

  • 牛客AI Coding考试正式上线!重写技术招聘标准

    AI时代下,技术岗评估标准已从“编码与发现bug的能力”转向“AI协作下的工程能力”。企业若沿用旧评估方式,会面临面试合格者实际交付不稳、沟通成本高、工程难闭环等问题。牛客推出的AI+Coding考试,通过模拟真实研发协作环境,从需求理解、任务拆解、AI协同、结果校验到风险识别,全面评估候选人能力。考试采用“结果+过程”双维度模型,结果分聚焦任务完成度,过程分评估AI对话质量和Token效率,确保考核科学性和可解释性,帮助企业精准识别真正能干的AI协作型技术人才。

  • RingConn Gen 3发布:以血管健康AI洞察,定义智能戒指新品类

    5月5日,全球智能戒指领导品牌RingConn发布年度旗舰新品RingConn Gen3血管健康AI智能戒指。该产品以长期血管健康洞察为核心突破,搭载AI震动提醒、超长续航及多维度健康监测能力,通过个性化基线模型和深度学习算法,实现从单点测量到长期趋势管理的跃升,为用户提供无感、连续、智能的慢病防控新方案。

  • AI日报:DeepSeek识图模式灰测;小红书成立AI一级部门;阿里发布程序员“数字分身”QoderWake

    本期AI日报涵盖8大热点:1. DeepSeek开启多模态识图灰度测试,视觉理解能力落地;2. 文心一言5.1预览版上线LMSYS,全球排名第13;3. 小红书成立AI一级部门“Dots”及海外团队;4. Chrome发布Prompt API,浏览器原生AI时代来临;5. 阿里发布QoderWake,实现代码修复全流程无人值守;6. 蚂蚁集团开源万亿级大模型Ling-2.6-1T;7. 巨日禄与火山引擎合作,AI短剧进入工业化时代;8. Gemini迎史诗级更新,一键生成Office文档。

  • 想给孩子报 C++ 课程?这几家少儿编程机构值得优先考虑

    C++是NOI及CSP-J/S唯一指定编程语言,也是培养青少年高阶计算思维的核心载体。2025年少儿C++培训市场规模突破62亿元,同比增长47%,但具备专业赛训能力的机构不足10%。本文从课程体系专业性、师资竞赛背景、赛事成果真实性、赛训服务完善度四个维度,筛选出4家具备高阶教学能力的机构:核桃编程、学而思素养、猿编程、高途编程。家长应避开海外低含金量赛事陷阱,以CCF官方可查赛事成绩为唯一评判标准,结合孩子年龄、基础与升学规划综合选择。

  • 造一台AI PC=跑一遍AI基建——重新认识“创新的联想”

    联想在2026年4月22日发布ThinkPad新品及天禧AI生态,提出“超级个体”概念,即个体×ThinkPad×天禧AI=超级个体。文章从四个工序解析AI+PC的制造:大脑(天禧AI3.7的端云混合架构)、产线(天津工厂60%自动化率,每9秒下线一台)、神经(iChain供应链智能体覆盖90%部门)、地基(生态级零碳工厂和海神液冷技术)。联想通过自研技术整合算法、芯片、供应链和能耗,让AI+PC成为用户不在时也能工作的“分身”,体现中国创新的另一种形态——工程纪律与产品落地。

  • 出门问问发布AI原生协作平台CodeBanana,AI重写组织进化

    4月21日,出门问问在京发布《超级组织》战略,推出企业级AI原生协作平台CodeBanana。该平台基于李志飞与高佳合著的同名著作,提出“超级个体能力×协同机制=超级组织”公式,旨在解决AI时代“个体越强,系统越堵”的“幽灵效率”陷阱。CodeBanana以“项目”为核心,融合群聊、Agent与独立工作空间,实现沟通与执行的实时同步,支持A2A跨项目协作与Skill技能复用。平台强调人机协同,通过Team Agent与Private Ask模式平衡效率与安全,为企业提供从“以人为核心”向“智能体协同”跃迁的完整路径。

  • 最懂购物的AI,竟然会劝你别买了?

    ​过去买一支电动牙刷,我们可能要搜索、筛选、看参数、翻评价、比价格、凑满减。现在这个复杂的购物过程,压缩成了与AI的一段对话。 5月11日,阿里巴巴宣布千问与淘宝全面打通。以往我们想象过AI电商的样子,如今购物入口、决策方式和交易流程都开始被AI重写。 你可以在千问内完成从找东西、挑东西、下单、付款到查快递的全流程;也可以在淘宝App内点击底部“消息

  • AI日报:快手拟分拆可灵AI独立融资;360升级“安全龙虾”平台;网信办要求AI生成视频必须标注

    快手拟分拆可灵AI独立融资,估值200亿美元剑指明年IPO,其年化营收已破3亿美元,覆盖C端订阅与B端API调用,全球创作者超6000万。网信办发布短视频标注新规,要求平台为AI生成及虚构内容提供六类必选标签,强化存量视频追溯补标,推动产业合规。小米自研大模型MiMo获国际认可,百度发布Ernie5.1预训练成本骤降94%,性能挺进全球Search排行前四。360升级“安全龙虾”平台,10分钟可自建专家智能体;Claude Code推出Agent View统管后台AI任务。宇树科技发布全球首款量产载人变形机甲GD01,起售价390万元。谷歌地图深度集成Gemini,CarPlay导航将进入对话时代。

  • 李飞飞押注的AI游戏平台火了!Astrocade融资5600万美元

    美国AI社交游戏平台Astrocade宣布完成5600万美元A B轮融资,其中,B轮由红杉资本领投,A轮由Sea Capital领投,英伟达、谷歌AI Futures Fund等机构也参与投资。 与传统游戏开发需要程序、美术、策划团队不同,Astrocade主打自然语言生成游戏”。用户只需输入一句话,例如做一个太空飞船射击游戏”,AI便能自动生成场景、角色、玩法以及基础交互逻辑,整个过程几乎不需要代码能力。

今日大家都在搜的词: