首页 > AI头条  > 正文

IBM 发布 Granite4.0Nano 系列:为边缘 AI 量身打造的小型开源模型

2025-10-30 14:52 · 来源: AIbase基地

近日,IBM AI 团队推出了 Granite4.0Nano 系列,这是一个专为本地和边缘推理而设计的小型模型家族,旨在为企业提供更强的控制能力和开源许可。该系列包含8个模型,分为350M 和约1B 两种规模,采用混合 SSM 和变换器架构,支持基本和指令两种模式,所有模型均在 Apache2.0许可下发布,且能够在 vLLM、llama.cpp 和 MLX 等流行运行时环境中原生运行。

Granite4.0Nano 系列包括四条模型线及其基础版本。其中,Granite4.0H1B 采用混合 SSM 架构,参数数量约为1.5B;而 Granite4.0H350M 同样采用混合方法,参数数量为350M。为了确保最大的运行时兼容性,IBM 还提供了 Granite4.01B 和 Granite4.0350M 的变换器版本。

这些 H 变体模型交替使用 SSM 层和变换器层设计,这种混合结构在内存增长方面相较于纯变换器有显著优势,同时保持了变换器模块的通用性。Granite4.0Nano 模型没有采用减少数据管道,而是遵循与大规模 Granite4.0模型相同的训练方法,使用超过15万亿个标记进行训练,并经过指令调整,以提高工具使用和指令遵循能力。

image.png

IBM 还将 Granite4.0Nano 与其他同类模型进行了比较,包括 Qwen、Gemma 和 LiquidAI LFM,结果显示在通用知识、数学、代码及安全性等领域,Granite4.0Nano 的表现显著提升。此外,该系列模型在代理任务上也在 IFEval 和伯克利函数调用排行榜第3版中表现出色。

这些模型经过 ISO42001认证,并且以加密签名的形式发布,确保了企业级使用所需的可追溯性和治理能力。用户可以通过 Hugging Face 和 IBM watsonx.ai 访问这些模型,并在边缘、本地和浏览器级别上进行部署,帮助早期 AI 工程师和软件团队更好地实现项目。

huggingface:https://huggingface.co/collections/ibm-granite/granite-40-nano-language-models

划重点:  

🔹 IBM 发布了 Granite4.0Nano 系列,包含8个模型,适用于边缘 AI 推理。  

🔹 该系列模型基于超过15万亿个标记进行训练,确保了性能的继承性。  

🔹 所有模型均经过 ISO42001认证,并具有企业级治理能力,支持多种运行环境。

  • 相关推荐
  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 卢伟冰:REDMI K系列持续向上 Turbo系列会逐步接棒K系列

    小米集团总裁卢伟冰转发博主对Redmi K90 Pro的评测,称K系列将通过科技创新持续提升体验,Turbo系列将逐步接棒。Redmi产品经理表示Turbo系列将在性能和性价比上带来惊喜。今年1月发布的Turbo 4起售价1999元,4月发布的Turbo 4 Pro同样1999元起。卢伟冰强调,随着小米高端化发展,K系列定位将持续上探,去年独立的Turbo系列正是为承接K系列上移后的定位空间。据悉,Redmi Turbo 5将于今年第四季度登场,首发联发科天玑8500,定位高性能、长续航,并升级金属中框和大R角设计,质感大幅提升。

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • AI日报:豆包推全自动多人配音系统;Adobe Firefly Image 5重磅升级;Soul语音模型SoulX-Podcast发布

    本期AI日报聚焦多项技术突破:豆包推出全自动有声剧系统,实现98%角色识别准确率;Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成;Soul发布90分钟无中断播客生成模型;360推出全球首款L2-L4全栈智能平台;IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面,移动端AI用户突破7亿,豆包领跑原生应用;PayPal与OpenAI合作使ChatGPT集成支付功能;谷歌推出AI营销工具Pomelli,可基于URL自动生成营销内容。

  • AI日报:腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新;阿里夸克AI眼镜开启预售

    本文汇总近期AI领域重要动态:月之暗面再获数亿美元融资,显示资本对国产大模型的信心;Anthropic为Claude推出记忆功能,兼顾个性化与隐私保护;中科大与字节发布MoGA长视频生成模型,实现分钟级高质量生成;腾讯ima2.0升级任务模式,可自主拆解复杂流程;阿里夸克AI眼镜开启预售,融合拍摄与智能功能;微软Copilot新增群聊、记忆与Edge AI模式;Opera推出深度研究代理ODRA提升�

  • 小米手表S4系列推送澎湃OS 3正式版:eSIM版、运动版等五款在列

    10月29日,小米手表S4系列开启澎湃OS 3正式版推送。用户可通过小米运动健康App升级,升级包下载后将自动推送至手表,完成升级并重启。官方提醒确保手表电量在20%以上,升级过程需保持与手机连接,建议将手表放在手机附近并保持App前台运行。此次推送覆盖S4 Sport、S4、S4 eSIM等多款型号。澎湃OS 3于10月15日首批推送,正逐步覆盖更多机型。

  • 24天超长续航!REDMI Watch 6官宣:与K90系列同台发布

    Redmi Watch 6于10月23日与K90系列同台发布。外观延续方形表盘,边框从圆润改为直角倒角,视觉更轻薄;表冠上移,新增独立按键,布局类似Apple Watch。配备2.07英寸AMOLED大屏,支持彩色AOD显示,采用高强铝中框,内置小米澎湃OS 3,续航长达24天。预计搭载玄戒T1芯片,集成CPU、GPU及小米自研4G基带,支持4G eSIM独立通信,性能提升35%,功耗显著降低。

  • 微算法科技(NASDAQ MLGO)研发基于AI的动态权重学习模型,开启区块链账户关联分析智能新时代

    微算法科技(NASDAQ MLGO)推出基于AI的动态权重学习模型,解决区块链账户关联分析中传统静态模型难以适应业务快速变化的问题。该模型采用分层架构,结合注意力机制LSTM、联邦学习等技术,实时捕捉交易模式演变,动态调整账户关联权重。在分片效率、风险控制、DeFi资源分配等领域应用效果显著,提升交易处理速度与欺诈识别率。未来计划融合多模态数据,探索量子机器学习,打造自适应区块链网络的智能图谱引擎。

  • IBM发布2025年第三季度业绩报告

    IBM发布2025年第三季度业绩报告,营收达163亿美元,同比增长9%。各业务线实现加速增长,其中软件业务营收增长10%,基础设施业务增长17%。AI业务规模超95亿美元,推动运营效率提升。公司上调全年营收和自由现金流预期,预计自由现金流将超140亿美元。第三季度自由现金流为24亿美元,并通过派发股息向股东返还16亿美元。

今日大家都在搜的词: