首页 > 业界 > 关键词  > Gemini最新资讯  > 正文

谷歌被打脸!Gemini Pro被证实和GPT3.5差距不大

2023-12-25 10:08 · 稿源:站长之家

要点:

  • 在CMU的研究中,Gemini Pro被与GPT-3.5和Mistral8×7B进行了深入的比较,结果显示GPT-3.5在多个任务上几乎全面优于Gemini Pro,但差距不大。

  • 通过测试任务包括基于知识的问答、通用推理、数学问题、代码生成等领域,Gemini Pro在某些任务上表现较差,但在特定任务中超越了GPT-3.5。

  • 文章强调Gemini Pro是多模态的,通过视频、文本和图像训练,而GPT-3.5Turbo和GPT-4Turbo主要基于文本,Mixtral是开源竞争对手。

站长之家(ChinaZ.com)12月25日 消息:谷歌最新发布的Gemini Pro自发布以来备受瞩目,谷歌声称其优于GPT-3.5。然而,CMU的研究通过深入的实验对比,展示了GPT-3.5在多个任务上的全面优势。Gemini Pro虽然在某些任务上稍显不足,但整体表现与GPT-3.5相近,为大模型领域的竞争增添了新的火花。

image.png

论文地址:https://arxiv.org/pdf/2312.11444.pdf

研究涉及了基于知识的问答、通用推理、数学问题、代码生成等多个领域。在基于知识的问答任务中,Gemini Pro在一些子任务上落后于GPT-3.5,尤其在多选题答案输出中显示了一定的偏见。通用推理测试中,Gemini Pro的精度略低于GPT-3.5Turbo,尤其在处理较长、复杂问题时表现不佳,而GPT-4Turbo则表现更为稳健。

数学问题领域的测试包括小学数学基准、稳健推理能力、不同语言模式和问题类型等。Gemini Pro在某些任务上略显不足,特别是在多样化的语言模式任务中,表现较GPT-3.5Turbo稍逊。在代码生成方面,Gemini Pro在两项任务上的表现均低于GPT-3.5Turbo,与GPT-4Turbo相比则差距更大。

总体而言,Gemini Pro作为多模态模型,尽管在某些任务上稍显不足,但在特定领域表现出色,超越了GPT-3.5。然而,在大多数测试中,GPT-3.5Turbo仍然保持领先地位,证明其在开源模型中的卓越性能。这一研究为科技领域的大模型竞争提供了客观中立的第三方对比,为未来的模型发展提供了有益的参考。

举报

  • 相关推荐
  • AI日报:快手KAT-Dev代码模型开源登顶;全球首款IP66防护人形机器人DR02发布;谷歌Chrome即将引入Gemini新功能

    快手开源72B代码模型KAT-Dev在SWE-Bench测试中准确率达74.6%,创国产AI编程里程碑;杭州云深处推出全球首款IP66防护全候作业机器人DR02;谷歌Chrome将集成Gemini引发隐私担忧;学者指控苹果使用盗版书籍训练AI,版权争议再起;Liquid AI发布高效稀疏激活模型LFM2-8B-A1B;苹果拟收购Prompt AI布局智能家居视觉技术;AI伴侣应用泄露4300万条用户隐私对话;西湖大学DeepScientist显著提升科研效率。

  • 华为MatePad mini劲敌!苹果iPad mini 8要来了:A19 Pro+OLED屏

    苹果iPad mini系列称霸了多年的小平板,这两年迎来了很多新玩家的挑战,前不久发布的华为MatePad mini就是最具竞争力的一款,凭借着超轻薄、SIM卡等配置收到很多用户青睐。 现在苹果的新一代应战者iPad mini 8也要来了,新品将会在明年上半年发布,起售价维持在499美元。 根据泄露的代码显示,iPad Mini 8(代号J510/J511)预计搭载A19 Pro芯片,大概率是与iPhone Air同款的阉割版

  • 影像等升级无短板!黄韬:X300系列是vivo 30周年的诚意之作 没mini版

    下周一vivo就要发布X300系列,对于这款重磅旗舰,vivo产品副总裁黄韬也是刚刚给出了更多的信息。 下周一要发布的vivo X300系列,是vivo 30周年的诚意之作。产品的爆料已经不少,但还有一个非常关键的点,本来没打算讲的,但这段时间,看到很多媒体和网友都在讨论,那今天就由我来给大家爆料一下。X300系列,没有X300!” 黄韬重申,X300在蓝厂内部的定位

  • 央视深度揭秘:最值得买的RGB-Mini LED电视海信U7S Pro,硬实力来自中国芯

    海信发布RGB-Mini LED电视U7S Pro,采用RGB三原色背光技术,无需荧光粉二次转换,实现更高色彩纯度和亮度,画面通透真实。搭载自研信芯AI画质芯片H7,支持行业最高3×10240分区控制,结合黑曜屏Ultra双层降反技术,反光率仅1.28%。具备4K 170Hz高刷,游戏体验流畅。新品预售价15999元起,预存1000元抵2000元,享能效补贴。

  • iPhone 17 Pro mini首曝:4.7英寸屏 未能上市

    9月24日有博主爆料,苹果曾计划推出4.7英寸iPhone 17 Pro mini,但在DVT阶段取消开发。该机型设计类似iPhone 17 Pro,采用横向矩阵相机和铝合金一体化机身,但工程师认为其外观“荒谬”。苹果曾尝试小屏路线,iPhone 12/13系列推出mini版本但销量未达预期,iPhone 14起以Plus替代mini,然而Plus销量同样不佳。从iPhone 17系列开始,苹果新增主打轻薄的Air机型,Plus系列正式退出市场。

  • TCL华星助力产业规范,《Mini LED室内商用显示屏》团体标准重磅发布

    2025年7月15日,《Mini LED室内商用显示屏》团体标准正式发布,标志着Mini LED技术从分散发展迈向统一规范的关键跨越。该标准由深圳照明与显示工程行业协会等机构牵头,汇聚近50家产业链企业智慧,构建了科学、系统的质量评估与性能规范体系。通过明确产品定义、分类维度、性能指标升级及检测方法,重点解决行业长期存在的技术指标不统一、质量参差不齐等痛点。标准实施将推动产业链协同,预计带动市场规模年增速超30%,助力企业提升高端产品竞争力,并为客户采购提供清晰依据,促进Mini LED在会议大屏、数字标牌等商用场景加速落地,引领产业向更高一致性、更低功耗演进。

  • ​名创优品MINISO叶国富:坚持自有IP与全球化布局,构建新消费市场

    名创优品2025年第二季度及上半年财报显示,公司业绩全面增长。总营收达49.7亿元,同比增长23.1%;毛利率提升至44.3%。非国际财务报告准则下净利润为6.9亿元,增长10.6%。通过IP生态建设、渠道升级与全球化战略,中国及海外市场同店销售稳步增长,海外营收增幅达28.6%。门店扩张持续推进,全球零售网络新增124家。“开好店、开大店”策略成效显著,MINISO LAND等新业态单店效益突出。同时,公司宣布派发中期股息,并加大股份回购,强化股东回报。未来将持续深化全球布局,推动高质量增长。

  • 超越RGB的全局高色域有多狠?2025最值得期待的电视技术还得看SQD-Mini LED

    TCL最新发布的SQD-Mini LED技术突破行业十年色域瓶颈,实现100% BT.2020全局高色域,结合超级量子点与超强控光技术,解决了传统RGB-Mini LED色彩纯度不足、串色等问题。搭载该技术的X11L电视以万象分区精准控光提升对比度,色彩还原精准、过渡自然,树立了"光色双绝"新标杆,推动高端电视画质进入新纪元。

  • 小米电视S Pro Mini LED 2026发布:售价5199元起

    9月25日,小米电视S Pro Mini LED 2026正式发布,提供65、75、85、98英寸四种尺寸,满足多样化需求。新品搭载9655旗舰芯片,配备4GB+64GB存储组合,运行澎湃OS 3系统。屏幕采用Mini LED技术,峰值亮度达5200nits,支持4K 165Hz原生刷新率及330Hz竞技模式,具备VRR、FreeSync Premium Pro认证。音频方面配备2.1.2声道设计,支持杜比全景声。外观采用超窄边框,接口丰富,包括HDMI 2.1×3等。雷军特别推荐85英寸版本,称其适合大多数家庭。各尺寸首销价与零售价有差异,如65英寸首销5199元,零售6499元。

  • 3299元起 华为MatePad mini悦读版开售 能打电话的小平板

    华为MatePad Mini悦读版今日开售,提供常规屏和柔光屏两个版本,售价3299元起,仅限华为体验店等线下渠道销售。相比标准版,该版本不支持北斗卫星功能,芯片从麒麟9010降至9010B,核心数减少,USB接口从3.0降为2.0,但其他参数如屏幕尺寸、电池、摄像头等保持一致。亮点包括8.8英寸柔性OLED全面屏、1800nits峰值亮度,柔光屏版售价3799元,采用创新光学膜材降低闪烁干扰,并通过德国莱茵与SGS护眼认证。此外,该平板支持通话与蜂窝网络,可插卡使用,配备听筒及智能来电识别功能,前置3200万像素、后置5000万像素主摄,内置6400mAh电池并支持66W快充。

今日大家都在搜的词:

热文

  • 3 天
  • 7天