首页 > 业界 > 关键词  > GraniteCode最新资讯  > 正文

IBM 发布开源模型 Granite Code,在编程任务中超过谷歌模型

2024-05-13 09:25 · 稿源:站长之家

划重点:

🔍 IBM 发布了一套名为 "Granite Code" 的专门用于编程的模型,这些模型在基准测试中超过了一些较大的开源竞争对手,并旨在帮助企业完成各种软件开发任务。

🔍 Granite Code 模型包括基础模型和指导模型,每种模型都有4个不同规模的变种,参数从30亿到340亿不等,通过对比评估表现出色。

🔍 IBM 计划定期更新这些模型,并很快推出具有更大上下文窗口和针对 Python 和 Java 的专业化版本。

站长之家(ChinaZ.com) 5月13日 消息:IBM 最近发布了一组名为 "Granite Code" 的开源型,旨在帮助企业完成各种软件开发任务,并在基准测试中表现出色。这些模型不仅过了一些较大的开源竞争对手,而且在编程任务中展现出了强大的性能。

Granite Code 型分为基础模型和指导模型,每种模型都有四个不同规模的变种,参数数量从30到340亿不等。这些模型的上下文窗口相对较短,例如,其中一个模型的上下文窗口只有128K,这限制了其在包含特定文档或自己的代码库等提示信息时的有效性。不过,IBM 目正在开发具有更大上下文窗口的版本。

image.png

基础模型的训练分为两个阶段。第一阶段使用自116种编程语言的3-4万亿个标记进行训练,以建立广泛的理解能力。在第阶段,这些模型使用来自高质量代码和自然语言数据的5000亿个标记进行进一步训练,以强逻辑推理能力。

指导模型是通过对基础模型进行改进而创建的,改进方法包括筛选提交记录、自然语言指令记录和合成生成的代码数据集。

在包括代码合成、调试、解释、编辑、学推理等多个基准测试中,Granite Code 模型在各个规模和基准测试中表现出色,常常超过开源模型两倍以上的大小。例如,在 HumanEvalPack 基准测试中,Granite-8B-Code-Base 的平均得为33.2%,超过谷歌最佳表现的 CodeGemma-8B 模型的21.3%,尽管 Granite-8-Code-Base 所使用的标记数量明显较少。

这些模型的大部分训练数据来自一个清理过的 GitHub 集 StarCoderData 和其他公开可用的代码库。这一点非常重要,因为目前有一些关于其他代码型(包括 GitHub 本身)涉嫌侵犯训练数据版权的诉讼。

IBM 计划定期更新这些模型,很快将推出具有更大上下文窗口以及针对 Python 和 Java 的专业化版本。这些模型已经在 Hugging FaceGitHub 上可用,并且也是 IBM 的 watsonx 企业平台的一部分。

IBM 的 Granite Code 是一专门用于编程的开源模型,它们在基准测试中表现优异,同时具有较少的参数数量。些模型的特点包括灵活的规模选择、基于广泛训练数据的逻辑推理能力和良好的性能未来,IBM 还计划不断改进和更新这些模型,以满足不同编程任务的需求。

产品入口:https://top.aibase.com/tool/granite-code-models

举报

  • 相关推荐
  • 大家在看
  • 论文猫:AI一键论文生成工具

    论文猫是一个专业的AI论文写作服务平台,提供一键生成论文的服务。它采用最新的AI技术,结合大量文献数据,生成高质量的论文,同时支持用户自定义修改,确保论文的原创性和查重率低于15%。该平台以学生和研究人员为主要目标群体,提供快速、便捷、经济的论文写作解决方案。

  • Final Cut Pro:专业视频编辑软件,提升工作流效率。

    Final Cut Pro 是 Apple 推出的专业视频编辑软件,适用于 iPad 和 Mac 设备。最新版本利用了 M4 芯片的强大性能,提供了更快的渲染速度和对 ProRes RAW 视频流的增强支持。新增的 AI 功能,包括“优化光线和颜色”和“流畅慢动作”,以及改进的素材管理工具,极大地提升了视频编辑的效率和质量。

  • RTranslator:开源实时翻译应用,支持多语种对话。

    RTranslator 是全球首款开源的实时翻译应用,专为 Android 设计,支持多种语言的实时对话翻译。它利用 Meta 的 NLLB 和 OpenAI 的 Whisper 模型,实现高质量的翻译和语音识别,保护用户隐私,且支持离线使用。

  • GenAI Handbook:现代人工智能系统学习指南。

    GenAI Handbook 是一个旨在为学习现代人工智能系统的关键概念提供指导的手册。它由 William Brown 编写,目的是整理互联网上分散的高质量解释资源,形成一个教科书风格的呈现,作为达到个人与人工智能相关的学习目标的路线图。该手册面向具有技术背景的人群,无论是出于好奇还是潜在的职业发展,都可以通过它来了解人工智能的最新创新。

  • IMS-Toucan:多语言可控文本到语音合成工具包

    IMS-Toucan是由德国斯图加特大学自然语言处理研究所开发的多语言且可控的文本到语音合成工具包。它使用纯Python和PyTorch构建,以保持简单、易于上手,同时尽可能强大。该工具包支持教学、训练和使用最前沿的语音合成模型,具有高度的灵活性和可定制性,适用于教育和研究领域。

  • Florence-2:一种统一的视觉任务基础模型。

    Florence-2是一个新型的视觉基础模型,它通过统一的、基于提示的表示方式,能够处理多种计算机视觉和视觉-语言任务。它设计为接受文本提示作为任务指令,并以文本形式生成期望的结果,无论是图像描述、目标检测、定位还是分割。这种多任务学习设置需要大规模、高质量的注释数据。为此,我们共同开发了FLD-5B,它包含了54亿个综合视觉注释,涵盖1.26亿张图像,使用了自动化图像注释和模型细化的迭代策略。我们采用了序列到序列的结构来训练Florence-2,以执行多样化和全面的视觉任务。广泛的评估表明,Florence-2是一个强大的视觉基础模型竞争者,具有前所未有的零样本和微调能力。

  • Ritt:文件管理革新,标签树助力高效组织

    Ritt是一款创新的文件管理桌面客户端,通过标签树技术,帮助用户以前所未有的速度和精确度组织和检索图片、视频和其他文件。它具有易用的标签系统、标签交集搜索、云同步、高级搜索、链接创建、AI自动标签等先进功能,极大提升了用户的专注度、效率和清晰度。Ritt注重用户隐私,不收集任何用户信息或数据。

  • Summit:您的AI生活教练,全天候帮助您组织和跟踪目标。

    Summit是一款AI生活教练应用程序,旨在帮助用户组织和跟踪个人和职业目标,通过AI技术将大目标分解为可实现的里程碑和习惯。它提供全天候的问责伙伴服务,用户可以通过短信与教练交流,并通过集成功能轻松跟踪进度。Summit还允许用户自定义教练风格,从严格的爱之教官到富有同情心的朋友,以满足不同用户的需求。此外,Summit还提供了如生活轮盘等有趣的功能,帮助用户洞察需要关注的目标。

  • Choosy Chat:为你最难的问题提供答案。

    Choosy Chat是一个智能聊天平台,它通过集成多个先进的AI模型,包括OpenAI GPT-4o、Google Gemini Pro 1.5和Anthropic Claude 3,为用户提供最准确的答案。它能够处理复杂的查询,包括最新知识、产品规格列表、优化代码以及解决逻辑难题等。

  • Claude 3.5 Sonnet:智能AI模型,提供高效、低成本的智能服务。

    Claude 3.5 Sonnet是Anthropic公司推出的一款AI模型,它在智能、速度和成本之间取得了显著的平衡。此模型在研究生级推理、本科生级知识以及编程熟练度方面设立了新的行业基准,特别擅长理解细微差别、幽默和复杂指令,并能以自然、亲切的语调撰写高质量内容。此外,它在视觉推理、图表解读和图像文字转录方面也表现出色,是零售、物流和金融服务等行业的理想选择。

  • 知网CNKI AI 学术研究助手:CNKI AI 学术研究助手是基于 AI 技术的智能化学术研究助手,实现问答式增强检索和生成式知识服务。

    CNKI AI 学术研究助手是同方知网结合 AI 技术推出的全新智能化服务,能够简化繁复的检索与研究流程,提供快速的问答式检索和智能创作辅助。该产品背景信息丰富,定位于提升学术研究效率。

  • Augie.Studio:轻松创建引人入胜的社交视频内容

    Augie是一个用户友好、直观且全面的视频制作平台,专为营销人员设计,无需专业技能即可快速创建视频。它提供了超过100万件商业许可的素材库和编辑工具,支持基于文本的搜索,帮助用户高效地完成视频制作流程。Augie还具备内容生成功能,可以自动生成用户所需的视频素材,并通过直观的编辑工具简化编辑过程。

  • LibreChat.ai:一站式AI聊天平台,自由定制,支持多种AI服务。

    LibreChat是一个免费、开源的AI聊天平台,提供广泛的定制选项,支持众多AI提供商、服务和集成。它以熟悉的界面,创新的增强功能,服务于所有AI对话,满足您所需的用户数量。

  • Genspark:AI代理引擎,提供个性化信息搜索体验。

    Genspark是一个AI代理引擎,它通过一个多代理框架提供个性化的信息搜索体验。与传统搜索引擎不同,Genspark的AI代理能够实时生成新的、定制的Sparkpages页面,直接满足用户的查询需求,从多个相关来源综合内容,提供高质量、无偏见的信息。

  • ShareGPT4Video:提升视频理解和生成的AI模型。

    ShareGPT4Video系列旨在通过密集且精确的字幕来促进大型视频-语言模型(LVLMs)的视频理解以及文本到视频模型(T2VMs)的视频生成。该系列包括:1) ShareGPT4Video,40K GPT4V注释的密集视频字幕,通过精心设计的数据过滤和注释策略开发而成。2) ShareCaptioner-Video,一个高效且功能强大的任意视频字幕模型,由其注释的4.8M高质量美学视频。3) ShareGPT4Video-8B,一个简单但卓越的LVLM,其在三个先进的视频基准测试中达到了最佳性能。

  • PixelProse:大规模图像描述数据集,提供超过16M的合成图像描述。

    PixelProse是一个由tomg-group-umd创建的大规模数据集,它利用先进的视觉-语言模型Gemini 1.0 Pro Vision生成了超过1600万个详细的图像描述。这个数据集对于开发和改进图像到文本的转换技术具有重要意义,可以用于图像描述生成、视觉问答等任务。

  • GPTCommit:自动化生成Git提交信息的脚本工具。

    GPTCommit是一个利用OpenAI的GPT-4o模型来分析代码变更并自动生成提交信息的自动化Git提交工具。它简化了代码提交流程,通过智能分析代码变更,快速生成合适的提交信息,提高开发效率。

  • DeepFuze:革命性深度学习工具,用于面部转换和视频生成。

    DeepFuze是与ComfyUI无缝集成的先进深度学习工具,用于革新面部转换、lipsyncing、视频生成、声音克隆和lipsync翻译。利用先进的算法,DeepFuze使用户能够以无与伦比的真实性结合音频和视频,确保完美的面部动作同步。这一创新解决方案非常适合内容创作者、动画师、开发者以及任何希望以先进的AI驱动功能提升其视频编辑项目的人士。

  • TikTok Symphony:创意AI套件,简化TikTok内容创作。

    TikTok Symphony是一个由生成性AI驱动的全新创意解决方案套件,旨在简化营销人员和创作者在TikTok上的内容创作旅程。通过将人类想象力与AI驱动的效率相结合,TikTok Symphony使各种规模的企业、创作者和代理机构能够提升内容创作水平,提高生产力,并发现有价值的洞察。

  • Moatless Tools:使用大型语言模型编辑大型代码库的工具。

    Moatless Tools 是一个业余项目,作者在这里尝试一些关于如何使用大型语言模型(LLMs)来编辑大型现有代码库的想法。项目认为,构建好工具以插入正确的上下文到提示中并处理响应,比依赖代理推理解决方案更为关键。

今日大家都在搜的词: