首页 > AI头条  > 正文

谷歌发布Gemma 4,E2B架构让手机本地跑AI现质变

2026-06-03 14:27 · 来源: AIbase基地

开源大模型生态迎来底层架构的重大突破。谷歌Google DeepMind日前正式发布了其有史以来最强大的开放模型 Gemma4。尽管该模型在参数规模上与上一代持平,依然维持在约300亿左右,但其“单位参数的智能密度”实现了大幅飞跃,在多项核心任务上的性能表现已经能够匹敌一年半前的顶尖闭源大模型。

此次 Gemma4最引人注目的技术创新在于引入了全新的“E2B”(参数卸载)架构。在传统的 Transformer 架构中,庞大的嵌入层往往会占用海量的显存空间。而新架构巧妙地在每一层中加入了嵌入表,利用查找表机制代替了繁重的全矩阵乘法计算。以其中一款50亿参数的模型为例,在 E2B 架构的加持下,实际需要加载到 GPU 显存中的“有效参数”仅为20亿,其余30亿参数可以安全地卸载到 CPU 甚至磁盘中。这意味着该模型仅需2GB 显存便能实现极速推理,彻底突破了移动端、智能手机和树莓派等端侧设备的部署瓶颈。

作为一次极具雄心的复杂发布,Google DeepMind团队协调了包括 Hugging Face、llama.cpp、Ollama、英伟达和 AMD 在内的近50个外部合作伙伴。目前,Gemma4已实现与 Android Studio 的深度集成,开发者在 Agent 模式下无需将任何代码上传至云端 API,即可在本地离线环境下安全地调用 AI 编写 Android 代码,极大满足了职场对数据隐私和离线办公的刚性需求。

在多模态与核心体验层面,Gemma4承袭了与 Gemini3相同的研究成果。即使是2B 或4B 规模的端侧小模型,也已具备出色的多语言(支持140种语言)和多模态理解力,能够轻松驾驭语音识别、语音提问以及30到60秒的短视频分析。尽管目前该模型在知识储备的绝对体量上与大模型仍有差距,且在文本扩散(Diffusion Transformer)等前沿实验性探索和专家混合模型(MoE)的微调上仍面临行业公认的挑战,但其展现出的高密度智能已不容小觑。

随着大模型开箱即用能力的增强,垂直领域的开发生态正经历深刻的重构,纯粹的传统微调热度正在逐步退烧。面向未来,Google DeepMind方面做出了一个里程碑式的预判:在未来的1到2年内,用户的智能手机上将能够直接在本地流畅运行相当于 Gemini3Pro 级别性能的强悍模型。届时,绝大多数复杂的智能体代理任务将在设备端直接完成,无需依赖云端算力,这无疑将为下一代消费级应用集成与用户体验带来颠覆性的变革。

  • 相关推荐
  • AI日报:小米开源AI编程助手MiMo Code;京东MALL首批人形机器人上岗;谷歌发布DiffusionGemma

    AI日报今日要点:小米开源终端AI编程助手MiMo Code,内置免费多模态模型;京东MALL首批人形机器人上岗,优必选助力618智慧零售;苹果Xcode 27原生集成Gemini,提升AI编程效率;谷歌发布实验性开源模型DiffusionGemma,采用文本扩散架构提速推理;微软因数据隐私担忧禁用员工使用Claude Fable 5;谷歌升级NotebookLM,引入Gemini 3.5 Flash与独立云计算机;华纳音乐收购Sureel AI,构建版权防护�

  • 谷歌推出Gemini Go:2GB内存手机也能跑大模型

    谷歌为Android Go系统推出全新Gemini Go AI助手,专为内存超2GB的低配设备设计。该精简版大模型取代Google Assistant Go,用户无需下载独立应用,长按Home键或电源键即可唤醒。它支持拨打电话、发短信、查询地图、搜索餐厅、设置闹钟等日常功能,还能上传文档和照片以提供更自然的对话体验。目前,Gemini Go已开始分阶段向符合条件的设备推送。

  • HDC2026:新架构新小艺,助力生态伙伴抢占Agent时代新流量

    6月12日,华为开发者大会2026在东莞举行,鸿蒙智能带来小艺全新升级:发布Harmony Intelligence全面向Agent架构演进及HMAF 2.0框架,实现“意图即服务”。新小艺基于Agentic自演进架构,深度融合HarmonyOS成为系统智慧大脑,具备强大意图理解和服务分发能力,可跨设备协同完成复杂任务。目前小艺日唤醒超30亿次,日均Agent分发量提升4.5倍,已成为1.8亿用户日常和鸿蒙生态服务分发的智能中枢。同时发布《鸿蒙智能安全白皮书》,通过HPIC系统确保端云隐私安全。

  • 合十思维发布物界OS双脑架构具身系统及全尺寸双足人形机器人Humanoid-X 探索物理AI落地路径

    合十思维发布全尺寸双足人形机器人Humanoid-X及底层“物界OS双脑架构”,通过仿脑感知与智脑逻辑结合,以行为树(BTS)和脉冲神经网络(SNN)实现低算力、高泛化的物理认知,并具备语义控制能力。硬件采用差速锁齿轮结构控制成本。商业化方面,已通过物界OS赋能机场导览、清洁机器人实现8000万营收,并与HCR慧辰股份合作推进物流、制造等行业应用。公司定位“为服务而工作”,计划覆盖清洁、养老等场景,构建全栈通用具身操作系统平台。

  • AI日报:谷歌发布最強模型Gemini 3.5 Flash;阿里云“千问云”上线;苹果AI辅助功能升级

    本期AI日报聚焦六大热点:谷歌发布性能与效率显著提升的Gemini 3.5 Flash模型并免费开放;阿里云推出面向Agent时代的“千问云”平台,重构大模型服务链路;谷歌与三星联合推出两款集成Gemini的智能眼镜;苹果推出Apple Intelligence驱动的AI辅助功能及Vision Pro眼控轮椅;谷歌发布多模态交互模型Gemini Omni;通义实验室发布Qwen3.7-Max模型,采用正交解耦技术,多项评测国内第一。

  • 从“能对话”到“能干活”:腾讯云发布AI Agent技术栈,多家企业验证规模化落地

    6月5日,腾讯云发布AI Agent技术栈,从底层运行时到上层接口全面开放,助力企业级Agent落地。该技术栈基于“Agent=Model+Harness”公式,由五大模块构成:底层Agent Runtime提供毫秒级弹性沙箱,中层ClawPro解决多租户管理与Token管控,上层Cloud Agent提供PaaS接口。目前已在SaaS、电商、社交等场景落地,如财税SaaS平台慧算账将ClawPro嵌入企业微信,单个会计服务能力从200-300家提升至400-500家。EC等5家企业分享实战经验,EC半年内单月Token消耗突破100亿,花椒直播实现全员Agent与业务Skill化,群核科技以3D空间大模型构建视频Agent,APUS推出企业级Agent平台,自如聚焦C端找房复杂语义识别。企业关注焦点从“模型有多强”转向“运行有多稳”。

  • 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计

    腾讯云在2026 AI产业应用大会上发布CodeBuddy+ Security,结合自研AI深度审计引擎与静态分析工具Xcheck,解决AI时代漏洞激增及传统代码审计瓶颈。该产品采用“双引擎协同+工程化约束”策略,通过AI引擎专攻深层逻辑漏洞,Xcheck处理已知特征漏洞,并引入独立二次校验和PoC验证,确保漏洞真实可修复。目前已在NVIDIA、Google等主流项目中发现并协助修复多个有效漏洞,并逐步接入腾讯内部发布流水线,面向企业开放试用。

  • AI日报:美图秀秀入局微信AI生态:千问发布全周期高考志愿填报Agent;美团 AI 浏览器Tabbit 1.0 正式上线

    【AI日报】今日AI领域热点:1. 微信开放AI生态,美图秀秀、京东、美团、滴滴等首批接入;2. 阿里千问发布国内首个全周期高考志愿填报Agent;3. 美团推出AI浏览器Tabbit 1.0,主打智能体任务执行;4. iPhone国行升级iOS 27后推出AI壁纸扩图功能;5. 讯飞星火医疗大模型V3.5正式亮相;6. Anthropic发布第五代Claude系列模型Fable5和Mythos5;7. 谷歌发布Gemini 3.5实时语音翻译模型;8. 谷歌将向所有用户免费开放AI模式“交互式图表”功能。

  • AIBase推出“GEO排名监控”工具 福建AI搜索GEO优化推荐榜

    想象一下,你花了很多精力运营社交媒体、投放广告、维护官网,结果用户转向AI助手寻求建议时,你的品牌却从未出现在那些自然流畅的推荐语里。更令人困惑的是,你甚至无法确定问题出在哪里——是AI没听过你?还是听到了却觉得不值得提? 这不是假设。随着生成式AI成为新的信息门户,品牌的“AI可见度”正在成为一个全新的、独立的竞争维度。而要管理它,首先需要测�

  • 厦门AI搜索GEO优化公司哪家好?福建GEO优化公司推荐

    ​在ChatGPT、DeepSeek、豆包等生成式AI席卷全球的今天,一个关键问题正摆在所有品牌营销者面前:当用户越来越习惯“问AI”而不是“搜网页”时,你的品牌还在被看见吗? 这引出了一个全新的概念——GEO。GEO,全称为Generative Engine Optimization,即生成式引擎优化。它是指针对生成式AI搜索引擎(如DeepSeek、豆包、通义千问等)进行的品牌可见度优化。与传统SEO关注网页链接排名不�

今日大家都在搜的词: