谷歌发布 Gemma 3 QAT 模型：一张3090显卡也能轻松驾驭

2025-04-21 12:00 · 来源： AIbase基地

谷歌近期推出了 Gemma3系列的全新版本，这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后，谷歌便发布了经过量化感知训练（QAT）优化的 Gemma3，旨在显著降低内存需求的同时，保持模型的高质量。

具体来说，经过 QAT 优化的 Gemma327B 模型，其显存需求从54GB 大幅降低到14.1GB，意味着用户现在可以在 NVIDIA RTX3090等消费级 GPU 上本地运行这一大型模型。通过简单的测试，配备 RTX3070的机器也能运行 Gemma3的12B 版本，尽管其 token 输出速度稍显不足，但整体性能仍在可接受范围之内。

QAT 的神奇之处在于，它在训练过程中直接融入量化操作，与传统的训练完成后再进行量化的方法不同。这种方法能够有效模拟低精度运算，从而在后续量化为更小版本时，尽量减少性能损失。谷歌进行了约5000步的 QAT 训练，成功将困惑度下降了54%，这让模型在小型设备上也能保持较高的运行效果。

现在，Gemma3的不同版本都可以在各类 GPU 上运行。以 Gemma327B 为例，只需单张 NVIDIA RTX3090（24GB VRAM）便能轻松实现本地运行，而 Gemma312B 则可以在 NVIDIA RTX4060等更轻便的设备上高效执行。这种模型的降维设计使得更多用户能够体验到强大的 AI 功能，甚至在资源有限的系统上(如手机)也能获得支持。

谷歌还与多个开发者工具合作，提供用户无缝体验的方式，如 Ollama、LM Studio 和 MLX 等工具都已支持 Gemma3QAT 模型的使用。值得一提的是，许多用户对此表示极大的兴奋，纷纷表示希望谷歌进一步探索更高效的量化技术。

相关推荐

荐AI日报：MiniMax推视频生成模型Hailuo 02；Cursor Pro取消500次请求限制；谷歌发布AI模型 Gemini 2.5 Flash-Lite

本文汇总了AI领域最新动态：1)Cursor Pro取消500次请求限制；2)稀宇科技推出视频生成模型Hailuo02；3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite；4)科大讯飞星火X1升级版7月上线；5)腾讯元宝推出AI编程模式；6)OpenAI将下架GPT-4.5 API；7)苹果Speech API转录速度超Whisper 55%；8)百度推出数字人互动直播间；9)Meta曾试图高薪挖角OpenAI人才；10)Krea1公测开放，解决"AI感"问题；11)特斯拉Grok车载AI助手即将上线；12)谷歌Gemini新增视频分析功能。

人工智能开发者技术趋势
荐一张小卡片敢卖999？原来是智能体AI硬件

智能体AI硬件，长啥样?出门问问发布了其全球首款智能体AI硬件——TicNote。 TicNote是一个“随身AI思考伙伴”，支持录音转写、翻译、总结、问答，还能陪你聊天对话。而且外观只有卡片大小，厚度仅3mm，可以通过磁吸保护套贴到手机背面，非常方便携带。 TicNote今年4月在海外上市，之后便备受好评，现在国内版也正式上线了。

智能体AI TicNote 出门问问
荐AI日报：MiniMax发布视频智能体Hailuo Agent；昆仑万维开源 Skywork-SWE-32B；B站接入Qwen 3等模型

本期AI日报聚焦多项AI领域创新：1)MiniMax推出视频Agent工具，支持文本生成高清视频及人脸驱动；2)昆仑万维开源Skywork-SWE-32B模型，提升软件工程任务表现；3)B站接入通义千问模型，推出数据分析智能体InsightAgent；4)ChatGPT深度整合Gmail与日历功能；5)腾讯云发布全链路AI开发平台"AI Builder"；6)HeyGen推出UGC广告数字人功能；7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态，展现AI技术快速发展的多元应用与潜在影响。

AI日报视频生成人工智能
性能超OpenAI、Gemini！月之暗面发布首个自主强化学习Agent

月之暗面（Moonshot AI）正式推出其首款Agent产品Kimi-Researcher（深度研究），并已启动小范围灰度测试。该产品基于端到端自主强化学习（end-to-end agentic RL）技术打造，在HLE测试中表现优异，性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research，并与Gemini-Pro的Deep Research Agent持平。 Kimi-Researcher 是一款高度自主的智能研究助手，能够独立规划任务流程并交付完整结果。与其他Agent不�

月之暗面 Kimi-Researcher 智能研究助手
荐AI日报：豆包大模型1.6发布；OpenAI推o3-pro模型、o3价格暴降80%；Figma官方MCP重磅上线

【AI日报】今日AI领域重要动态：1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro，性能显著提升；2)OpenAI推出o3-pro模型，专注可靠性但响应较慢；3)Figma推出Dev Mode MCP服务，实现设计到代码一键转换；4)Krea AI发布图像生成模型Krea1，解决传统AI绘图问题；5)火山引擎豆包日调用量突破16.4万亿次；6)法国Mistral发布推理模型Magistral；7)苹果系统整合ChatGPT图像生成功能；8)OpenAI大幅下调o3价格80%并推出o3-pro；9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15；10)阿里开源MaskSearch框架，提升AI解决复杂问题能力。

人工智能 AI产品视频生成
谷歌推出终端AI编程工具Gemini CLI Gemini CLI安装使用教程一览

近日，谷歌在AI编程领域推出了一款备受瞩目的终端AI编程工具——Gemini CLI。这款免费开源的工具一经发布，便在开发者群体中引发了广泛关注，其强大的功能和免费开源的特性，使其在众多同类产品中脱颖而出，甚至让一些竞争对手如Claude Code相形见绌。如果您对AI编程工具感兴趣，想要了解更多类似的产品，可以访问 [AIbase - 智能匹配最适合您的AI产品和网站]（https://top.aiba

Gemini CLI AI编程工具
90后小伙拍下1300年荔枝树采摘权产量在800斤左右

近日，山东潍坊的90后韩先生做出了一件让人意想不到的事——他在某平台花费13101元，拍下了一棵拥有1300年树龄的唐朝荔枝树的采摘权。这棵古荔枝树来自素有“中国荔枝之乡”之称的广西灵山。据灵山千年荔枝园负责人介绍，园内千年荔枝树达200多棵，此次被韩先生拍下采摘权的这棵1300年古树，产量约有800斤。每年都有众多游客慕名前往荔枝园，这棵千年古树的荔枝往往

潍坊荔枝树古树采摘权千年荔枝体验
同档长焦之王！vivo S30发布：2294.15元起

今日晚间，vivo S30正式发布。售价方面，12GB 256GB售价2294.15元，12GB 512GB售价2549.15元；16GB 512GB售价2804.15元，以上均是国补后的价格，提供可可黑、柠檬黄、薄荷青和桃桃粉四种配色。

vivo S30 智能手机
翻遍全网不如问问小艺：轻松get父亲节送礼推荐

父亲节将至，文章围绕送礼难题给出实用建议。针对父亲节礼物选择困难，推荐通过智能设备获取个性化建议，兼顾实用性与心意。鸿蒙系统智能助手可推荐衣物、鲜花、养生方案等礼物类型，还能提供送花品种建议（如向日葵象征健康活力）。此外，智能助手还能解答父亲养生问题，从饮食调理到运动保健给出专业建议。文章还推荐了《曾国藩家书》等经典书籍和《父亲》�

父亲节礼物智能助手个性化推荐
荣耀MagicPad 3入网：13英寸LCD大屏+骁龙8 Gen3

荣耀旗下一款型号为CGA-W00的新机获得认证，支持66W快充，爆料称该机正式命名为荣耀MagicPad3。预计该机会与荣耀Magic V5同台发布，在本月下旬正式登场。

荣耀MagicPad3 66W快充骁龙8Gen3

今日大家都在搜的词：

热文

3 天
7天

谷歌发布 Gemma 3 QAT 模型：一张3090显卡也能轻松驾驭

荐AI日报：MiniMax推视频生成模型Hailuo 02；Cursor Pro取消500次请求限制；谷歌发布AI模型 Gemini 2.5 Flash-Lite

荐一张小卡片敢卖999？原来是智能体AI硬件

荐AI日报：MiniMax发布视频智能体Hailuo Agent；昆仑万维开源 Skywork-SWE-32B；B站接入Qwen 3等模型

性能超OpenAI、Gemini！月之暗面发布首个自主强化学习Agent

荐AI日报：豆包大模型1.6发布；OpenAI推o3-pro模型、o3价格暴降80%；Figma官方MCP重磅上线

谷歌推出终端AI编程工具Gemini CLI Gemini CLI安装使用教程一览

90后小伙拍下1300年荔枝树采摘权产量在800斤左右

同档长焦之王！vivo S30发布：2294.15元起

翻遍全网不如问问小艺：轻松get父亲节送礼推荐

荣耀MagicPad 3入网：13英寸LCD大屏+骁龙8 Gen3

今日大家都在搜的词：

热文

小米股票上热搜：盘中股价突破60港元创历史新高

小米YU7 3分钟大定突破200000台雷军：YU7订单要高于SU7

京东回应外卖员帮扔垃圾每单0.5元：小范围测试未正式上线

荣耀正式启动A股IPO 获上市辅导备案

2025新财富500创富榜发布：张一鸣问鼎首富梁文锋进前十

小米预告AI眼镜雷军：自带小爱同学啥都能直接问

小米MIX Flip 2外观公布：配备骁龙8至尊版、5165mAh电池

小米股票上热搜：盘中股价突破60港元创历史新高

中消协发倡议抵制极端吃播：平台应严格识别、及时下架

苹果官网首次支持国补目前仅限北京收货地址及上海线下购买

罗永浩回应为何总能融到钱并回击谩骂

红米REDMI K80 至尊版手机发布：售价 2599 元起

雷军称YU7定价合理：希望大家猜测YU7价格要讲科学

小米YU7 3分钟大定突破200000台雷军：YU7订单要高于SU7

站长商机