首页 > AI头条  > 正文

​谷歌新发布Gemini-Exp-1206模型横扫对手,超越ChatGPT成为AI新王

2024-12-09 10:39 · 来源: AIbase基地

谷歌在生成 AI 领域的最新尝试引起了广泛关注。经过几个月的平淡表现后,谷歌 Gemini 迅速走上了快车道,推出了新的实验性语言模型 ——Gemini-Exp-1206。根据最新的 ChatArena 排行榜显示,这款模型在众多竞争对手中脱颖而出,成为了生成 AI 的领跑者。

image.png

Gemini-Exp-1206在 LMArena 上获得了最高的 Arena Score,达到了1379分,略高于 ChatGPT-4.0的1366分。这一得分表明,Gemini-Exp-1206在多项评估中表现出色,展现了其卓越的综合能力。此外,与之前的 Gemini-Exp-1114相比,新模型也显示出更强的性能。

image.png

那么,什么是 LMArena 呢?LMArena,也称为 Chatbot Arena,是一个用于评估大型语言模型的开源平台。这个平台由 LMSYS 和加州大学伯克利分校 SkyLab 共同开发,旨在通过实时测试和直接比较,支持社区对 LLM 性能的评估。

在排行榜中,Arena Score 代表了模型在多种任务中的平均表现,分数越高表示能力越强。尽管 GeminiExp-1206的分数高于 ChatGPT-4.0,但在投票数量上,ChatGPT-4.0依然遥遥领先,共获得了21,929票,而 Gemini-Exp-1206则收获了5052票。较高的投票数通常意味着更高的可靠性,因为这表明该模型经过了更广泛的测试。

另外,95% 置信区间的数据显示,Gemini 的 CI 为 ±10/-5,而 ChatGPT 的 CI 为 ±4/-5。这表明 Gemini 的平均得分更高,但 ChatGPT-4.0在性能稳定性方面表现更佳。

值得一提的是,Gemini 实验模型是尖端的原型设计,旨在进行测试和反馈。这些模型为开发者提供了提前体验谷歌最新 AI 进展的机会,同时展示了持续的创新。然而,这些实验模型是临时性的,可能随时更换,并不适合用于生产环境。

如果您想要免费使用 Gemini-Exp-1206,只需前往谷歌 AI Studio,登录后选择创建提示,并在设置中将模型更改为 Gemini Experimental1206,即可开始聊天。

image.png

尽管 Gemini-Exp-1206的结果相当引人注目,但仍需记住其实验性质。未来的潜力还需时间来揭示,业界期待着这一强劲竞争者的稳定发布。

项目入口:https://ai.google.dev/gemini-api/docs/models/experimental-models?hl=zh-cn

划重点:

🌟 Gemini-Exp-1206在 LMArena 排行榜上取得了1379的高分,超越了 ChatGPT-4.0的1366分。  

🗳️ ChatGPT-4.0获得的投票数达到21,929票,明显高于 Gemini-Exp-1206的5052票,显示出其可靠性。  

🔍 Gemini 实验模型为开发者提供了前所未有的 AI 体验机会,但仍处于测试阶段,不适合生产使用。

  • 相关推荐
  • AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

    本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • 小平板元年,华为MatePad Mini创出一片蓝海

    2012年,天才乔布斯去世一年后,接任苹果CEO的库克捧出了两款“很不乔布斯”的产品——大屏手机iPhone6和7英寸的iPad mini。 这两款差异化的产品形态,都是库克希望弥补的市场空白。比如,虽然乔布斯认为10英寸就是平板电脑尺寸的下限,更小的屏幕会让用户难以操控。但库克却觉得,小尺寸平板不仅在硬件配置上超越手机,它还具备易于携带的特点,将成为移动办公的利器�

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • 自研遇阻!苹果考虑用谷歌Gemini升级Siri

    苹果正与谷歌就使用Gemini AI引擎为新一代Siri提供技术支持进行初步谈判,这一动向表明苹果可能进一步将人工智能能力外包,成为其AI战略的关键一步。 据知情人士透露,这家iPhone制造商近期已与Alphabet旗下谷歌接触,商讨合作构建一款定制化AI模型,以用于明年预计推出的新版本Siri。 谷歌目前已开始训练一款可在苹果服务器上运行的模型。苹果在生成式人工智能领域起步�

  • iPad mini对比完败!华为MatePad Mini明天发布 价格曝光 或3999元起

    明天华为要举行新品发布会,除了新的三折叠屏手机外,还有MatePad Mini。 现在,有博主曝光了华为MatePad Mini不同内存版本的价格,具体来说:12GB 256GB售价为3999元;12GB 512GB售价为4499元;12GB 512GB柔光版售价为4999元。 汇总之前曝光的消息,华为MatePad Mini将推出多个版本,包括标准版、柔光版(配备防眩光屏幕,适合手写笔创作)、插卡版(支持5G网络和通话功能)、read版”(�

  • 轻巧新境界,智慧随心至——华为MatePad Mini 8.8英寸正式发布

    华为于2025年9月4日发布全新HUAWEI MatePad Mini平板,主打8.8英寸轻薄设计,仅重255g、厚5.1mm。搭载鸿蒙5.1系统,支持插卡通话和蜂窝网络,配备柔性OLED全面屏,峰值亮度达1800nits。内置6400mAh电池,支持66W快充。提供办公、阅读、创作等多场景体验,售价3999元起,9月12日正式开售。

  • 华为MatePad Mini官宣9月4日发布

    今日,华为正式对外宣布,其首款旗舰小平板——华为MatePad Mini将于9月4日震撼登场,官方Slogan定为“超强,超Mini”,预示着这款新品将在性能与便携性上实现双重突破。 此前,知名数码博主“数码闲聊站”已提前透露,华为MatePad小平板已顺利入网,并定位为全能轻薄型设备。据进一步爆料,该机将采用8.8英寸小尺寸机身设计,搭配16:9比例的OLED屏幕,为用户带来极致的视觉

  • 当GPT-5遇上Gemini 2.5,谁更适合你的业务?这份对比报告说了算

    某跨境电商CTO复盘会上展示:GPT-5 Standard处理百万级商品描述时,费用比Gemini 2.5 Flash-Lite高35%,响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试,提供透明价格拆解和性能雷达图,帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%,而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价,生成定制化决策报告,用数据替代经验主义,提升技术选型效率。

  • 比iPad mini更胜一筹!华为MatePad Mini包装盒曝光:8.8寸屏的手机 或卖4K起

    明天除了Mate XTs亮相外,还有MatePad Mini,而它到底算是平板还是手机呢? 现在有博主晒出了MatePad Mini外包装盒,从产品名称上看,华为给它定位是手机(数字移动电话机)。 对于这款新机,今天我们也报道了相关内容,比如曝光的价格是:12GB 256GB售价为3999元;12GB 512GB售价为4499元;12GB 512GB柔光版售价为4999元。

今日大家都在搜的词: