首页 > AI头条  > 正文

超越Gemma2!​IBM发布Granite3.1模型:支持128K上下文长度

2024-12-19 09:49 · 来源: AIbase基地

IBM 正式发布了其新一代开源大语言模型 Granite3.1,力图在企业级 AI 领域占据领先地位。这一系列模型具备128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。

image.png

IBM 声称,Granite8B Instruct 模型在相同规模的开源竞争对手中表现最佳,包括 Meta 的 Llama3.1、Qwen2.5和谷歌的 Gemma2。

image.png

Granite3.1模型的发布是在 IBM 快速迭代 Granite 系列的背景下进行的,早在10月份就推出了 Granite3.0。IBM 透露,其与生成 AI 相关的业务收入已达到20亿美元。新版本的核心理念是将更多功能集成到更小的模型中,以便企业用户能够更轻松地运行和更具成本效益。

IBM 研究部副总裁大卫・考克斯(David Cox)表示,Granite 模型广泛应用于 IBM 内部产品、咨询服务以及客户服务,同时也以开源形式发布,因此需要在各个方面都达到高水平。模型的性能评估不仅仅依赖于速度,还包括效率,帮助用户在获取结果时节省时间。

在上下文长度方面,Granite3.1的提升尤为明显,从初版的4K 扩展至128K,这对企业 AI 用户尤为重要,尤其是在检索增强生成(RAG)和智能代理 AI 方面。延长的上下文长度允许模型处理更长的文档、日志和对话,使其更好地理解和响应复杂查询。

IBM 还推出了一系列嵌入模型,以加快数据转换为向量的过程。其中 Granite-Embedding-30M-English 模型的查询时间为0.16秒,速度优于竞争对手的产品。为了实现 Granite3.1的性能提升,IBM 在多阶段训练流程和高质量训练数据的使用上进行了创新。

image.png

在幻觉检测方面,Granite3.1模型将幻觉保护集成到了模型内部,能够自我检测并减少错误输出。这种内置检测功能优化了整体效率,减少了推理调用次数。

当前,Granite3.1模型已向企业用户免费开放,并通过 IBM 的 Watsonx 企业 AI 服务提供。未来,IBM 计划保持快速更新的节奏,Granite3.2将于2025年初推出多模态功能。

官方博客:https://www.ibm.com/new/announcements/ibm-granite-3-1-powerful-performance-long-context-and-more

划重点:  

🌟 IBM 推出 Granite3.1模型,旨在开源大语言模型市场占据领先地位。  

💡 新模型支持128K 上下文长度,显著提升了处理能力与效率。  

🚀 幻觉检测功能被集成到模型中,优化了整体性能和准确性。

  • 相关推荐
  • AI日报:京东物流推出超脑大模型2.0;DeepSeek V3.1终结版发布;Kimi 推出全新 Agent 模式

    本期AI日报聚焦多领域技术突破:京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”,推动物流行业迈向自主执行;DeepSeek推出V3.1终结版,修复漏洞并为V4架构铺路;Kimi上线Agent模式“OK Computer”,支持智能网站开发等复杂任务;ChatGPT新增个性化资讯功能,定制用户专属新闻;Exa Code发布代码索引工具,助力AI代理精准生成代码;Meta推出AI视频创作平台Vibes,简化短视频制作;蚂蚁数科发布隐私保护AI框架Gibbon,推理速度提升超百倍;OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平,覆盖九大行业44种职业。

  • 挑战最强标准版!真我GT8搭载2K直屏+骁龙8E:跑分破332万

    真我GT8系列将于10月发布,含标准版与Pro版。Pro版配备2K直屏、大R角设计、金属中框及3D超薄屏下指纹;标准版搭载骁龙8 Elite芯片。全系采用2K 144Hz苍睐屏,支持高刷新率与精准触控,峰值亮度达7000nit。安兔兔跑分332万,可流畅运行《原神》等大型游戏。首发真彩护眼低蓝光技术,提升色彩精准度64.8%,支持全亮度DC调光,兼顾性能与视觉体验。

  • 易鑫发布Agentic大模型,破解汽车金融风控与效率痛点

    9月12日,易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”,成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出,易鑫以AI为核心驱动力,通过自研大模型“智鑫多维”等技术,显著提升风控水平与融资通过率,推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构,服务覆盖牧民、基层员工等多元群体,体现技术普惠价值。未来将持续加大科技创新投入,深化国内普惠金融服务,并探索技术出海,助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可,更反映出行业正加速拥抱智能化变革。

  • 2199元起!小米平板8发布:11.2英寸3.2K最好LCD屏

    小米平板8采用全金属一体化机身设计,厚度仅5.75mm(柔光版5.8mm),重量485g(柔光版494g)。标配9200mAh大容量电池,支持45W快充、22.5W有线反充。 它还搭载第四代骁龙8s处理器,配备最新一代Wi-F7,带来更快更稳的网络体验。 全面支持苹果生态,文件、图片一键互传。 后置1300万像素摄像头,前置800万像素摄像头,支持人脸识别解锁,不支持指纹识别。 此外,小米平板8还在平�

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 小米开启澎湃OS 3 Beta版最新招募:支持小米14、K70等机型

    小米澎湃OS 3 Beta版于9月24日启动招募,覆盖MIX Fold 4、MIX Flip、小米14 Ultra、14 Pro及钛金属版(卫星通讯)、小米14、Redmi K70系列四款机型和小米平板6S Pro 12.4共12款设备。招募采用分批推送机制,每机型设两批次,首批满员后启动第二批,入选用户优先获得更新。正式版将于10月15日推送,逐步扩大覆盖。该系统基于自研底层内核,通过深度优化微架构流水线,精准识别CPU空转,配合一体化调频技术,整体任务执行效率提升19%,带来更流畅体验。此次招募既为用户提供抢先体验机会,也通过反馈助力系统优化,强化小米生态竞争力。

  • 超越RGB的全局高色域有多狠?2025最值得期待的电视技术还得看SQD-Mini LED

    TCL最新发布的SQD-Mini LED技术突破行业十年色域瓶颈,实现100% BT.2020全局高色域,结合超级量子点与超强控光技术,解决了传统RGB-Mini LED色彩纯度不足、串色等问题。搭载该技术的X11L电视以万象分区精准控光提升对比度,色彩还原精准、过渡自然,树立了"光色双绝"新标杆,推动高端电视画质进入新纪元。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

今日大家都在搜的词: