首页 > AI头条  > 正文

谷歌发布 Gemma 3 QAT 模型:一张3090显卡也能轻松驾驭

2025-04-21 12:00 · 来源: AIbase基地

谷歌近期推出了 Gemma3系列的全新版本,这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后,谷歌便发布了经过量化感知训练(QAT)优化的 Gemma3,旨在显著降低内存需求的同时,保持模型的高质量。

具体来说,经过 QAT 优化的 Gemma327B 模型,其显存需求从54GB 大幅降低到14.1GB,意味着用户现在可以在 NVIDIA RTX3090等消费级 GPU 上本地运行这一大型模型。通过简单的测试,配备 RTX3070的机器也能运行 Gemma3的12B 版本,尽管其 token 输出速度稍显不足,但整体性能仍在可接受范围之内。

image.png

QAT 的神奇之处在于,它在训练过程中直接融入量化操作,与传统的训练完成后再进行量化的方法不同。这种方法能够有效模拟低精度运算,从而在后续量化为更小版本时,尽量减少性能损失。谷歌进行了约5000步的 QAT 训练,成功将困惑度下降了54%,这让模型在小型设备上也能保持较高的运行效果。

image.png

现在,Gemma3的不同版本都可以在各类 GPU 上运行。以 Gemma327B 为例,只需单张 NVIDIA RTX3090(24GB VRAM)便能轻松实现本地运行,而 Gemma312B 则可以在 NVIDIA RTX4060等更轻便的设备上高效执行。这种模型的降维设计使得更多用户能够体验到强大的 AI 功能,甚至在资源有限的系统上(如手机)也能获得支持。

谷歌还与多个开发者工具合作,提供用户无缝体验的方式,如 Ollama、LM Studio 和 MLX 等工具都已支持 Gemma3QAT 模型的使用。值得一提的是,许多用户对此表示极大的兴奋,纷纷表示希望谷歌进一步探索更高效的量化技术。

  • 相关推荐
  • 能理解海豚声音!谷歌开发全新AI模型DolphinGemma

    快科技4月15日消息,谷歌公布了一款名为DolphinGemma”的大型语言模型,旨在帮助科学家理解海豚的声音,并生成类似海豚的声音序列。研究人员预计在未来几个月内测试DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)发声系统,以探索是否能够翻译并模仿海豚的声音,进而实现与海豚的某种对话”。海豚是地球上最聪明且最善于沟通的动物之一,其社交互动极其复杂�

  • 谷歌发布新一代推理模型Gemini2.5:单次可处理百万token

    谷歌正式推出Gemini2.5系列。作为该系列的首发版本,实验版Gemini2.5Pro在多项基准测试中均达到最先进水平,并以显著优势登顶LMArena排行榜首位。?在不采用多数投票等增加计算成本的测试阶段技术情况下?,该模型已在GPQA与2025年AIME等数学与科学类基准测试中排名榜首。

  • 超过ChatGPT、Deepseek?谷歌发布 Gemini 2.5 Flash AI 模型

    新版AI模型缩短了响应时间,节约了运算成本;还推出了新的AI芯片“Ironwood”。谷歌发布了新的AI模型“Gemini2.5Flash”,据称,这款AI模型的性能比OpenAI和DeepSeek的AI产品“更高效”。谷歌计划在三星今年上半年推出的AI伴侣机器人Ballie上搭载生成式AI模型。

  • 谷歌Gemini整合Veo 2视频生成模型,8秒720P视频轻松搞定

    谷歌宣布又有一款 AI 模型将加入 Gemini,但这次它不仅仅是一个聊天机器人。

  • 12针供电接口惹祸!RTX 5090与电源两头烧熔:两万多的显卡直接报废

    近日,一位Reddit用户分享了其微星RTX5090GamingTRIOOC显卡和配套电源因12VHPWR供电接口烧毁的惨状。该用户表示,其使用的是海盗船SF1000L电源附赠的原厂线材,未超频的情况下,显卡和电源两端的12针接口均出现塑料鼓包、金属针脚熔毁的情况,价值约2900美元的旗舰显卡就此报废。最新的12V-2x6接口虽然在一定程度上确保了更好的接触,但仍无法完全避免电流集中在少数针脚的情况。

  • 刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

    OpenAI发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数,并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能,图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著,开发者可通过API实现更多创意场景。新模型在�

  • 谷歌版MCP”来了,开源A2A,不同厂商Agent也能协作

    “谷歌版MCP”来了!谷歌推出A2A协议,即Agent2Agent,能让AIAgent在不同生态系统间安全协作无需考虑框架或供应商。不同平台构建的AIAgent之间可以进行通信、发现彼此的能力、协商任务并开展协作,企业可通过专业Agent团队处理复杂工作流。从各大厂最近动作来看,芜湖,不愧是Agent元年。

  • 刘亦菲亲临智界发布会现场爆火:门票炒至千元一张

    快科技4月17日消息,在今晚的智界品牌之夜活动上,因知名演员刘亦菲作为特邀嘉宾出席,活动未办先热。而此次发布会的门票也在二手平台被炒至千元高价,标价主要集中在900元-1500元区间,甚至还有卖家声称售卖工作证入场名额”。而一些粉丝为近距离互动不惜豪掷万元求购前排席位。有卖家表示,主要是因为刘亦菲的出席,许多人才愿意付费购买门票。据悉,场外黄牛在活动前两日便加价兜售邀请函,部分未能入场的粉丝在场馆外开启云追星模式,举着应援牌与场内直播画面合影。不得不说,刘亦菲的加入不仅为原本枯燥的发布会增添了更多乐趣,也?

  • 阿里在画一张什么样的AI蓝图?

    最近聊AI离不开阿里。继宣布未来3年投资3800亿元,用以AI和云计算的基础设施建设后,阿里有了新的AI传言。这样的阿里,确实让人忍不住拍手叫好。

  • AI牌局上,快手打出一张

    2025年前三个月,全球资本市场“东升西降”。外界担忧美国经济将陷入衰退,华尔街投行纷纷看多中国资产、重估中国公司,资金从西半球向东半球涌动。推动AI大模型走向新线城市、田间地头的中国互联网公司们,也将获得更宽阔肥沃的商业土壤,并在“东升西降”的全球资本流动中,吸纳更多投资者的“投票”。

今日大家都在搜的词: