首页 > 业界 > 关键词  > Gemini最新资讯  > 正文

研究人员发现,谷歌Gemini表现不如GPT-3.5 Turbo

2023-12-20 09:47 · 稿源:站长之家

站长之家(ChinaZ.com)12月20日 消息:在近期的一项研究中,来自卡内基梅隆大学和BerriAI的研究团队对Google Gemini Pro进行了深入的评估,并发现其在多项任务中表现不如OpenAI的GPT-3.5Turbo。这一发现无疑是对Google在生成式人工智能领域与OpenAI竞争的雄心的一次沉重打击。

Bard,Gemini Pro,Google DeepMind,人工智能,AI

Gemini Pro 与 GPT-3.5Turbo 对比

Gemini Pro是Google公司最新推出的大型语言模型(LLM),其在演示视频中展示了其强大的功能。然而,研究团队发现Gemini Pro在多数任务上的表现不如OpenAI的老款GPT-3.5Turbo。这一结论令Google研究人员感到挫败,尤其是考虑到他们在Gemini的开发上投入了大量时间和精力。

尽管Gemini Pro的表现不佳,Google仍然保持乐观态度,表示他们即将推出更强大的版本Gemini Ultra,预计将于2024年初问世。据Google的内部研究称,Gemini Ultra在性能上超过了GPT-4。然而,这一消息并未能完全抚平研究结果给公司带来的打击。

研究方法与测试结果

研究团队在LiteLLM平台上测试了四个不同的LLM:Google Gemini Pro、OpenAI GPT-3.5Turbo、GPT-4Turbo和法国初创公司Mistral最新推出的Mixtral8x7B。测试内容涵盖了STEM、人文和社会科学领域的57个多项选择问题,以及一些与通用推理、数学和编程相关的任务。

研究结果显示,在多项选择问题的测试中,Gemini Pro的准确性低于GPT-3.5Turbo和GPT-4Turbo。Gemini Pro在人类性、形式逻辑、初等数学和专业医学等领域的表现较差,其中一部分原因是Gemini在某些问题上拒绝回答,声称由于安全和内容限制无法遵循。然而,在安全和高中微观经济学等领域,Gemini Pro的表现略优于GPT-3.5Turbo,但进步有限。

Gemini在语言翻译领域表现出色,优于GPT-3.5Turbo和GPT-4Turbo。然而,研究指出,Gemini Pro在某些语言对中阻止回应的情况下表现不佳,这暗示了一种过于激进的内容审查/安全系统。

对Google AI雄心和用户的影响

研究结果明显对Google在生成式人工智能领域与OpenAI竞争的雄心构成了打击。由于更强大的Gemini Ultra模型要到明年初才会发布,这可能意味着Google在AI性能上将至少在未来一段时间内落后于竞争对手。尽管如此,研究也显示,Mistral公司的Mixtral8x7B模型在大多数方面的表现也不如GPT-3.5Turbo,为Google在AI领域带来一丝希望。

尽管Gemini在某些方面表现出色,但研究结果让人难以忽视OpenAI目前在消费者和企业面向的生成式人工智能领域的领先地位。随着Gemini Ultra的推出,Google可能会迎头赶上,但目前GPT-4仍然是首选,至少直到Gemini Ultra在新的一年发布。

举报

  • 相关推荐
  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • OPPO K13 Turbo发布:国补后售价1529.15元起

    核心配置方面,该机配备6.8英寸LTPS直屏,搭载联发科天玑8450处理器,形成7000mAh巨型电池与80W闪充的续航组合。影像系统采用前置1600万像素镜头与后置5000万+200万双摄组合,满足多场景拍摄需求。 防护性能实现行业首创:OPPO K13Turbo成为首款通过IPX9高压高温水柱、IPX8长时间浸泡、IPX6多方向喷水三项顶级防水认证的风冷手机,重新划定手机防护标准。工业设计上,新一代高强度�

  • OPPO要“冻住”SoC!K13 Turbo打造散热套装:液冷、风冷一起上

    OPPO K13 Turbo系列将于7月21日14:30发布,新机最大的特点就是自带风冷,是OPPO首次配备内置风扇。 风扇,位于主摄下方可以快速带走内部热量,在游戏时能够呈现更稳定持久的高帧率表现。 值得注意的是,OPPO甚至还打造了水冷系统,将推出疾风散热超级套装,包括有一款散热手机壳和磁吸散热背夹。

  • 美女产品经理实测OPPO K13 Turbo吹蜡烛:火焰瞬间被吹灭

    今天下午,OPPO K13 Turbo系列正式亮相,该机首发搭载史上最强手机风冷散热技术OPPO疾风散热引擎。 为了验证OPPO K13 Turbo系列的强大风量,OPPO产品经理鳃鳃现场测试手机吹蜡烛。 经实测,友商同类型产品风量少,没有吹灭蜡烛,但是K13 Turbo系列凭借超大风量,可以轻松吹灭一排蜡烛,领先行业。

  • OPPO K13 Turbo首发疾风散热引擎:史上最强风冷散热技术

    今天下午,OPPO K13 Turbo系列正式亮相,该机首发搭载史上最强手机风冷散热技术OPPO疾风散热引擎,实现手机散热能力的革命性跃迁。 OPPO产品经理介绍,被动散热最强理论值能做到79mA/℃,而OPPO疾风散热引擎散热能力达到92mA/℃,捅破手机散热天花板。 据悉,OPPO K13 Turbo系列创新打造L型风道,垂直进风、喷气出风,有效降低风道风阻,提升总体风量。 它采用13片超薄0.1mm鳍片�

  • 349元 OPPO K13 Turbo散热超级套装发布:液冷+风冷给手机“冻”感冒

    OPPO发布K13 Turbo系列手机及配套疾风散热超级套装,套装售价299元起。该散热套装采用微泵循环液冷+27W冰翼风冷磁吸散热方案,通过全面散热片、微泵驱动液冷及磁吸连接的风冷散热器实现均衡降温,官方称背夹单体最高降温33℃。相比传统散热方式,该套装能精准覆盖主板等发热区域,厚度仅23.5mm,重量82g,并设计有循环液流观察窗。

  • 王腾:REDMI Turbo 4 Pro非常成功 很多友商都在关注

    REDMI总经理王腾发文表示,REDMI上半年发布的Turbo 4 Pro非常成功,受到了广大用户的喜爱,也收到了很多友商的关注。 据悉,REDMI Turbo 4 Pro于4月份发布,首发起售价是1999元,该机上市不到一个月累计销量突破100万台,成为行业内最火的Turbo手机。 随着REDMI Turbo系列的热销,各大品牌纷纷推出Turbo系列手机,主打高性能,对此王腾表示,领先的一种体现就是被模仿,说明REDMI这几�

  • OPPO K13 Turbo系列真机亮相:自带风扇+RGB

    OPPO K13 Turbo系列真机已经现身在bilibili world《胜利女神:NIKKE》展区。 从图片来看,OPPO K13 Turbo系列系列后摄区域有点类似一加13T,采用了矩形金属方案,主摄下方就是散热风扇,同时外圈还自带RGB等效。 这个设计方案可以明显看出,该机是主打电竞体验。 风扇模组采用电镀镍工艺,放弃普通喷涂,带来更好的防水、防锈效果,并且号称风力提升120%,从而实现更强、更持久�

  • OPPO K13 Turbo系列外观公布:自带RGB风扇 EVA初号机配色

    OPPO今天正式公布了OPPO K13 Turbo系列新机外观,展示了新机的风扇等外观细节,以及全新配色。 该机后摄模组造型比较简洁,只有主摄和下放的风扇凸起,风扇外圈自带RGB灯效。

  • 首款满级防水风冷手机!OPPO K13 Turbo系列实测 风扇能水洗了

    OPPO K13 Turbo系列将于7月21日发布,这是OPPO首款内置主动散热风扇的手机。 根据OPPO最新预热,OPPO K13 Turbo系列支持IPX9IPX8IPX6防水,号称首个满级防水风冷散热手机。 今日,OPPO K系列产品经理鳃鳃晒出新机在水下开启风扇的测试视频,即使在水中,风扇也能正常工作,水从两个风口排出。