首页 > AI头条  > 正文

微软推出新型语言模型 BitNet b1.58 2B4T,仅占用0.4GB内存

2025-04-18 09:41 · 来源: AIbase基地

近日,微软研究团队正式发布了一款名为 BitNet b1.582B4T 的开源大型语言模型。这款模型拥有20亿参数,采用了独特的1.58位低精度架构进行原生训练,与传统的训练后量化方式相比,BitNet 在计算资源的需求上有了显著的降低。根据微软的介绍,该模型在非嵌入内存占用方面仅为0.4GB,远低于市场上其他同类产品,如 Gemma-31B 的1.4GB 和 MiniCPM2B 的4.8GB。

QQ_1744940438793.png

BitNet 的高效性能源于其创新的架构设计。模型放弃了传统的16位数值,而是采用了定制的 BitLinear 层,限制权重为 -1、0和 +1三种状态,形成了三值系统,这使得每个权重仅需约1.58位的信息存储。此外,层间的激活值则采用8位整数进行量化,从而形成了 W1.58A8的配置。微软还对 Transformer 架构进行了调整,引入了平方 ReLU 激活函数、标准旋转位置嵌入(RoPE)和 subln 归一化,以确保低位训练的稳定性。

QQ_1744940395825.png

在开发过程中,BitNet 经历了三个阶段:首先以4万亿 token 的网络数据、代码和合成数学数据集进行预训练;接着通过公开及合成指令数据集进行监督微调;最后采用直接偏好优化(DPO)方法,利用 UltraFeedback 等数据集提升模型的对话能力和安全性。

微软的测试结果显示,BitNet 在 GSM8K(数学)和 PIQA(物理常识)等基准测试中的表现非常出色,整体性能与主流的1B-2B 参数全精度模型相当,同时在能耗(每 token 消耗0.028焦耳)和 CPU 解码延迟(29毫秒)上具备明显的优势。

尽管 BitNet 展现出巨大的潜力,但其高效性依赖于微软提供的专用 C++ 框架 bitnet.cpp。常见的工具如 Hugging Face transformers 库无法完全体现其速度与能耗的优势。微软未来还计划优化 GPU 和 NPU 的支持,扩展上下文窗口至4096token,并探索更大规模的模型及多语言功能。现如今,BitNet b1.582B4T 已经以 MIT 许可证在 Hugging Face 平台发布,供广大开发者和研究人员进行测试和应用。

论文:https://arxiv.org/html/2504.12285v1

huggingface:https://huggingface.co/microsoft/bitnet-b1.58-2B-4T

划重点:  

🌟 该模型具有20亿参数,内存占用仅为0.4GB,显著低于同类产品。  

🔧 采用创新架构,放弃传统16位数值,使用1.58位低精度存储权重。  

🚀 已经在 Hugging Face 发布,微软计划进一步优化模型功能与性能。

  • 相关推荐
  • Create2025百度AI开发者大会举行 文心4.5 Turbo、X1 Turbo发布

    百度在武汉举办Create2025+AI开发者大会,李彦宏强调AI应用创造价值的关键。他指出当前AI模型迭代加速,MCP成为行业标准,但开发者担忧应用快速过时。李彦宏建议开发者选对场景和基础模型,并学习调优方法。百度发布文心大模型4.5 Turbo和X1 Turbo,价格大幅下降80%和50%,性能提升且成本更低,为开发者提供更实惠高效的工具选择。

  • AMD RX 9060 XT 8GB不会取消!与16GB版本还是同天

    快科技5月2日消息,根据最新消息,AMD仍将推出8GB版本的Radeon RX 9060 XT显卡,并且该版本将与16GB版本在同一天上市。此前,市场上曾有传闻称AMD可能会取消8GB版本的RX 9060 XT,或者仅为其分配有限的产能,但根据BenchLife的报道,这些传闻并不属实。BenchLife指出,AMD不太可能在产品尚未推出之前就停止供货或取消,因为其AIB合作伙伴已经备货并开始生产。因此在开卖初期,RX 9060 XT的16GB和8GB版本都会同时出现在市场上。不过,后续AIB合作伙伴会根据市场销售情况对产品进行调整,预计16GB版本的市场需求可能会大于8GB版本。从市场反

  • Create2025百度AI开发者大会上热搜 4.5Turbo、X1Turbo发布

    百度在武汉举办2025AI开发者大会,正式发布文心大模型4.5Turbo和X1Turbo两大版本。4.5Turbo在多模态处理能力上实现突破,支持文本、图像、语音跨模态交互,调用成本较前代直降80%,仅为竞品价格的40%。X1Turbo强化深度推理能力,价格较上代降50%,成本仅占竞品的25%。两款产品围绕"多模态、强推理、低成本"三大特性展开,其中4.5Turbo提升逻辑推理与代码生成效率,X1Turbo支持多步骤复杂推理和跨工具调用能力。百度此次定价策略极具竞争力,4.5Turbo成本降至行业主流水平的1/5,瞄准中小企业及个人开发者;X1Turbo虽定位高端,但成本仅为竞品1/4,主要面向科研机构、金融分析等高要求领域。

  • 一加平板2 Pro跑分出炉:骁龙8至尊版芯片+16GB内存

    快科技4月18日消息,据xpertpick报道,一加平板2Pro的GeekBench跑分已经现身,6.3.0版本单核成绩为3091分,多核成绩为9638分。搭载主频4.32GHz的高通芯片,并配备Adreno830GPU,也就是骁龙8至尊版,运行安卓15系统,配备16GB内存。此前博主数码闲聊站曾爆料,该机是上半年唯二的骁龙8至尊版平板,另一款来自OPPO。据爆料,一加平板2Pro整体定位偏向游戏体验,性能方面拉满,搭载骁龙8至

  • 苹果最良心的一次:iPhone 17有望全系标配12GB内存

    据郭明錤最新分析报告,iPhone 17系列(包括Air、Pro和Pro Max)将全系搭载12GB内存,标准版也有望配备12GB内存,但苹果正评估供应链能否满足需求,预计5月最终确定。若实现,这将是苹果近年来最大幅度升级,从全系8GB直接跨越到12GB。升级主因是Apple Intelligence功能需求,iPhone 16系列因AI功能至少需8GB内存,而iPhone 17的AI功能要求更高。目前手机AI分云端和本地两种,本地AI需更大内存支持。值得注意的是,明年的iPhone 17e(SE系列继任者)仍将保持8GB内存配置。

  • 苹果史上最大!曝iPhone 17 Pro升级12GB内存:三星主供

    快科技6月6日报道,苹果将在iPhone 17系列首次配备12GB内存,显著提升多任务处理和AI能力。其中iPhone 17 Air/Pro/Pro Max三款机型配备12GB内存,标准版仍为8GB。三星成为主要供应商,获得70%订单,剩余30%由SK海力士和美光承接。12GB内存成本比8GB高约50%,苹果引入三家供应商以增强议价优势。iPhone 17/17 Air搭载A19芯片,Pro系列采用A19 Pro芯片,均采用台积电3nm N3P工艺,性能提升5%,功耗降低5-10%。该系列预计9月发布。

  • 曝iPhone 17系列大规模上12GB内存:跟上安卓步伐

    据爆料,iPhone 17系列将全面搭载Apple Intelligence人工智能功能,标配12GB内存,采用台积电N3P工艺的A19 Pro芯片,性能显著提升。iPhone 18系列将首次配备6通道LPDDR5X大内存。相比当前iPhone 16系列的8GB内存,苹果正加速追赶安卓旗舰机型16-24GB的配置。为支持端侧AI部署,大内存成为刚需。A19 Pro基于台积电第三代3nm工艺N3P打造,晶体密度更高,能效比进一步提升。苹果正通过硬件升级确保AI时代的用户体验。

  • 郭明錤:iPhone17有望全系配12GB内存!但,有个前提……

    据供应链分析师郭明錤透露,苹果计划在iPhone 17系列中推出超薄设计的"iPhone 17 Air",厚度仅5.5毫米,配备12GB RAM,与Pro机型配置相同。这款新机将取代Plus版本,定位高端产品线。基础款iPhone 17也可能升级至12GB RAM,但需视供应链情况而定。内存提升将支持iOS 19的新功能,特别是外接显示器时的多任务处理体验。这一升级虽会提高成本,但能让苹果在高端市场竞争中更具�

  • iQOO Z10 Turbo系列官宣将于428日发布

    iQOO正式发布全新Z10 Turbo系列手机,包含标准版与Pro版,搭载天玑8400处理器,Pro版配备第四代骁龙8S芯片。新机在性能、续航及设计上均有显著提升,尤其标准版预计采用满血版8400处理器,带来更强体验。该系列通过vivo蓝绿合作与ARM深度协作,实现性能极致释放,在屏幕体验与稳定性上表现更加优异,适合日常使用或大型游戏,同时延续家族“万窗”设计理念。

  • REDMI Turbo 4 Pro哈利·波特版官宣424日发布

    Redmi宣布将于4月24日发布Turbo4 Pro哈利波特联名款手机,这是双方第三次深度合作。该机采用红蓝配色后盖,融入哈利波特系列标志性角色元素,设计充满魔法世界魅力。硬件方面搭载骁龙8s Gen3芯片、6.83英寸1.5K直屏、5000万双摄组合及7550mAh电池+90W快充,性能配置与普通版保持一致。这款定制机型通过精细工艺处理,既致敬原著又满足用户个性化需求,被粉丝誉为"最有诚意的定制版手机"。

今日大家都在搜的词: