首页 > 业界 > 关键词  > Gemma最新资讯  > 正文

Google扩充Gemma开源家族:推出CodeGemma和RecurrentGemma模型

2024-04-10 16:21 · 稿源:站长之家

站长之家(ChinaZ.com)4月10日 消息:近日,Google宣布扩充其Gemma开源家族,推出了两个新的模型:CodeGemma和RecurrentGemma。这两个模型的推出旨在进一步提升Gemma家族在自然语言处理领域的能力。

image.png

CodeGemma是专注于代码完成和代码生成任务的模型。它具备出色的数学和逻辑推理能力,能够在处理编程问题时表现出色。这一特性使得CodeGemma在编程辅助工具和自动化代码生成方面具有广泛的应用前景。

RecurrentGemma则是一个为研究实验优化的高效架构。它利用循环神经网络和局部注意力来提高内存效率,从而大幅降低内存使用、提高吞吐量并推动研究创新。这一模型的推出将为研究人员提供一个更加高效的工具,有助于推动自然语言处理领域的研究进展。

除了推出新的模型,Google还更新了其开源Gemma模型,发布了Gemma1.1版本。这一更新将进一步优化模型的性能,为用户提供更好的使用体验。

模型下载:

https://huggingface.co/google/gemma-1.1-2b-it

https://huggingface.co/google/gemma-1.1-7b-it

举报

  • 相关推荐
  • 技术研讨 | 小渔夫受邀出席“GEO大会暨Semrush排行榜大会”

    2025年11月21日,Semrush与Cross Border Digital在深圳联合主办“GEO大会暨Semrush排行榜大会”。小渔夫作为中国外贸GEO智能营销代表受邀出席,与Google、Semrush等行业专家探讨AI时代全球营销演进路径。大会聚焦SEO与GEO融合、AI营销、大语言模型策略等议题,小渔夫强调GEO是品牌出海核心战场,提出以“AI+数据”双轮驱动,助力客户在生成式AI浪潮中占据推荐位,实现从“被看到”到“被信任”的跨越。此次交流为其GEO智能营销系统与AI产品矩阵提供关键迭代方向,未来将持续深化创新,做中国品牌出海的“AI引航员”。

  • 千问爆火、Gemini 3翻身,阿里和谷歌的同题异解

    全球AI To C的市场局势,似乎悄然发生了转变。 以OpenAI、DeepSeek等为代表的AI创业公司,凭借着对大模型技术能力的突破,在AI To C的应用市场中占据着领导者地位。 与之相对的,是原本在移动互联网时代的大厂们,如谷歌、阿里巴巴等,似乎在过去这段时间中,C端的AI应用远未达到预期。 但最近,不管是谷歌,还是阿里,都凭借着AI打了一场漂亮的“翻身仗”。

  • AI日报:阿里开源Z-Image图像模型;夸克AI眼镜发布;Opera Neon 浏览器升级

    本期AI日报聚焦多项技术突破:阿里巴巴开源轻量图像模型Z-Image,以6B参数实现高效生成;夸克AI眼镜通过硬件升级优化体验;Opera Neon浏览器集成Gemini3,支持文档自动化编辑;清华大学发布AI教育应用指导原则,规范学术使用;DeepMind推出Gemini 3 Pro系统指令,提升任务可靠性;Adobe推出Project Graph重塑创意流程;Trae SOLO中国版新增多任务编程功能;巨人网络联合高校发布多模态生�

  • V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

    ​就在上周,OpenAI前首席科学家、现SSI CEO Ilya Sutskever在最新播客访谈中抛出一个重磅观点,过去五年的“age of scaling”正在走到头,预训练数据是有限的,单纯用更多GPU堆更大模型,哪怕再放大100倍,也未必能带来质变。所以我们又回到了以研究为核心的时代,只不过这次有了巨大的算力”,这一表态被视作对Scaling Law撞墙论的强力佐证。 然而仅过了几天,12月1日,DeepSeek用V3

  • AI日报:Kling 2.6将发布;千问APP推学习大模型;Z-Image-Turbo-Fun-Controlnet-Union 开源

    本期AI日报聚焦多领域AI进展:Kling 2.6发布,支持音频同步生成,AI视频进入有声时代;千问APP推出学习大模型,提升拍照答疑与作业批改能力;阿里通义实验室开源图像生成模型,实现精准控制;豆包手机助手遭遇微信登录异常,凸显生态兼容挑战;米哈游推出带猫语特色的AI聊天模型AnuNeko;亚马逊云科技发布三款新型AI智能体,其中Kiro可自主编程数日;IDC报告预测具身智能�

  • 超越Gemini3、GPT5.1!阿里千问登顶空间推理全球冠军

    今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。 SpatialBench榜单显示,Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5和12.9分,领先于Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5等海外顶尖模型。

  • AI日报:可灵Avatar 2.0 上线;谷歌推出Gemini 3 Deep Think模式;阿里云析言 XiYan-SQL 强势夺冠

    本期AI日报聚焦多项AI技术突破:Kling AI Avatar 2.0上线,实现数字人表情动作智能生成;谷歌推出Gemini 3 Deep Think模式,显著提升AI推理能力;微软发布轻量级实时语音模型VibeVoice 0.5B;OpenAI最强编码模型GPT-5.1-CodexMax全面接入API;阿里云“析言 XiYan-SQL”在SQL诊断评测中夺冠。此外,豆包助手调整AI操作能力,谷歌将展示Android XR平台更新。

  • 通用医学影像大模型iMedImage赋能临床多场景应用

    第五届全国医院智能化建设大会将于2025年11月在成都召开,聚焦智慧护理、智能数据中心等方向。德适生物协办的医学影像AI分论坛上,宋宁教授发布通用医学影像大模型iMedImage™,实现从图像到决策的一体化闭环,覆盖筛查—诊断—治疗全周期管理。其应用案例显示:染色体核型分析系统准确率达99.86%,宫颈超声早产风险评估等前沿领域成效显著。模型可扩展至26个专科、4000种疾病场景,助力精准诊疗。国家政策提出2030年二级以上医院普及影像AI辅助诊断,德适生物将持续推动多模态数据融合与临床创新。

  • 易鑫开源汽车金融业首个Agentic大模型,加速AI生态共建

    易鑫集团(02858.HK)宣布开源其自主研发的Agentic大模型YiXin-Agentic-Qwen3-14B,成为汽车金融行业首个开源此类模型的企业。该模型基于通义千问Qwen3-14B深度优化,具备卓越推理、复杂任务处理及多方协作的智能体能力,在多项性能测试中位列榜首,推理成本较行业平均水平降低三分之一。模型搭载金融领域专属知识体系与工具集,覆盖语音交互、车辆评估、风控、欺诈识别等功能,形成全链路智能支撑体系。易鑫提出“底座开放-社区共建-能力迭代-企业部署-生态繁荣”的开源共建模式,通过提供低代码私有化模板,帮助企业快速落地AI应用。此次开源与之前发布的行业首个开源推理大模型YiXin-Distill-Qwen-72B形成“垂直底座+Agentic大脑”双轮技术矩阵,填补了汽车金融领域专业开源AI工具链的空白。

  • 实测Gemini 3 Pro - 此即未来。

    经过238天等待,Gemini 3 Pro正式上线。在多项基准测试中表现惊人:Humanity's Last Exam测试达45.8%,Math Arena Apex获23.4分,ScreenSpot-Pro界面识别达72.7%。其前端代码能力尤为突出,仅用几十秒就能生成完整网页音乐播放器、像素画板,甚至成功复刻出可运行的Web OS系统。目前该模型在各大竞技场排行榜均位列第一,堪称2025年最具突破性的大模型。

今日大家都在搜的词: