首页 > 业界 > 关键词  > Bard最新资讯  > 正文

谷歌的Bard在聊天机器人排名中击败了GPT-4

2024-02-01 11:47 · 稿源:站长之家

**划重点:**

1. 🚀 Bard的Gemini Pro版本在LMSYS聊天机器人榜上超越了GPT-4,标志着聊天机器人领域的重大变革。

2. 📈 Bard现在是LMSYS榜上第二高分的聊天机器人,正在迎头赶上保持冠军的GPT-4Turbo。

3. 💡 Bard的崛起得益于搭载谷歌最新的Gemini Pro大型多模态模型,成为该榜上第二个获得超过1200分的模型。

站长之家(ChinaZ.com)2月1日 消息:谷歌的Bard最近通过其Gemini Pro版本在LMSYS聊天机器人榜上超越了OpenAI的GPT-4,标志着聊天机器人领域的一次显著变革。这款更新使得Bard成为LMSYS榜上第二高分的聊天机器人,逐渐摆脱了OpenAI在聊天机器人领域的主导地位。

image.png

在LMSYS Chatbot Arena Leaderboard上,Bard成功超越了GPT-4,目前正迅速追赶保持冠军的GPT-4Turbo。长期以来,GPT-4Turbo和GPT-4一直紧握榜单前两名,而Bard的崛起得益于其搭载谷歌新的Gemini Pro大型多模态模型。

LMSYS Org创建了Chatbot Arena Leaderboard,该组织是由加州大学伯克利分校与加州大学圣迭戈分校以及卡内基梅隆大学合作成立的大型模型系统组织。他们表示,Bard在排行榜上的飙升是一个“显著的成就”。

Chatbot Arena是一个用于大型语言模型的基准平台,采用“匿名、随机的众包方式进行战斗”。排名基于Elo评分系统,这在国际象棋和其他竞技游戏中被广泛使用。

由Gemini Pro驱动的Bard是该榜上第二个达到1200分以上的模型。Bard的崛起是谷歌更新了支持聊天机器人的基础模型的结果。去年12月,谷歌推出了Gemini,并为Bard推出了初始版本Gemini Pro,预计将很快发布更大规模的版本Gemini Ultra。

Bard还成功击败了Claude的所有版本,Gemini Pro Dev API版本的排名甚至超过了Anthropic的Claude2.1和GPT3.5Turbo。LMSYS表示:“比赛变得前所未有地激烈!非常期待看到Bard + Gemini Ultra版本的未来。”

对于谷歌而言,这次在榜单上的崛起是一个受欢迎的喘息。在经历了起伏不定的开始后,Bard通过定期更新不断增强,现在已经整合到其他谷歌应用程序,如YouTube和Docs中。

最近,Reddit用户告诉谷歌,他们希望Bard更像ChatGPT,谷歌产品经理询问了他们的愿望清单。用户要求有专门的移动应用程序、自定义指令和图像生成,其中一些建议已经在实施中。

OpenAI的GPT-4一直在模型榜单上居高不下,牢牢占据斯坦福大学HELM Leaderboard的第一名,而GPT-4Turbo则居于第二位。曾经为Bard提供动力的PaLM2在HELM排行榜上表现不佳,被来自AI初创公司Writer的Palmyra X V3超越,成为排行榜上最高得分的非OpenAI模型。

举报

  • 相关推荐
  • 从“形态自由”到场景适配智元灵犀X2-N重塑机器人移动边界

    上海智元公司7月7日发布灵犀X2-N人形机器人,创新采用轮足双形态自由切换技术,突破传统机器人移动方式局限。该机器人能在1秒内完成形态转换:足式状态下可稳定负重12公斤上下台阶;轮式模式下能高效穿越复杂地形。六自由度机械腿结构配合平滑步态控制,确保切换快速稳定。产品线覆盖办公、展览等多场景需求,价格从十几万至三四十万元不等。这一突破性设计推动人形机器人从"能移动"向"会适应"跨越,为行业发展提供新技术范式。

  • 中科新松推人形机器人双机,自主移动+柔顺控制赋能智造升级

    2025年机器人赛道持续升温,中科新松推出两款人形机器人"睿可MR73A"和"睿可MR73B"。MR73A侧重交互与灵巧操作,具备27个自由度的双臂系统,支持语音交互和AI视觉技术;MR73B聚焦高效物流搬运,具备智能升降和自主导航能力。两款产品突破传统工业机器人局限,强调移动性、环境感知与人机协作,瞄准工业4.0柔性制造和商业服务场景。中科新松通过核心技术平台实�

  • 聚焦AI新赛道,elexcon深圳国际电子展暨嵌入式展设 AI 机器人专区

    2025年深圳国际电子展暨嵌入式展(ELEXCON)将于8月26-28日举办,聚焦"All for AI, All for GREEN"主题。展会特设AI机器人专区,汇聚越疆、大疆等400+产业链企业,展示从芯片到整机的全产业链技术。同期举办第七届中国嵌入式技术大会,探讨具身机器人嵌入式系统等前沿议题。预计吸引600+机器人领域决策者参与,覆盖AI芯片、汽车电子等热点领域。依托深圳电子产业集群优势,展会将成为行业技术交流与资源对接的重要平台。

  • 智元发布新款人形机器人产品灵犀X2-N

    智元机器人发布灵犀X2-N机器人,实现科幻电影中的"变形"功能。该机器人可在轮式与足式间无缝切换:足式模式下稳健行走,能应对复杂地形并负重12斤;轮式模式下快速移动,轻松通过狭窄空间。这种"无痕变形"技术不仅是技术突破,更为机器人应用场景开辟新可能,堪称机器人界的"变形大师"。

  • AI日报:B站或将推“代号H” AI创作工具;智元发布哪吒机器人灵犀X2-N;宇树科技冲刺科创板IPO

    【AI日报】今日AI领域重要动态:1)B站将推出"代号H"AI创作工具,助力视频博主提升效率;2)智元发布双形态机器人"灵犀X2-N",展现强大适应性;3)宇树科技冲刺科创板IPO,获阿里腾讯投资,估值达120亿;4)开源多模态大模型EarthMind发布,革新地球观测数据分析;5)Gemini CLI更新,新增音视频处理与隐私保护功能;6)开源AI助手Glass上线,智能记录生活点滴;7)Claude将发布Neptune v3模型,数学能力突出;8)OpenAI宣布GPT-5将整合多种模型,实现全新突破。

  • 李想:理想汽车是自己最后一次创业 目标是成为机器人企业

    在参加央视《对话》节目录制后,理想汽车CEO李想在网络社交平台谈到,未来我们就盯着一件事:AI硬件终端做出像iPhone那样颠覆性的产品。” 李想坦言,理想汽车是自己的最后一次创业,我们最终一定不是个标准的汽车企业,如果按照我的定义,我们会是个空间机器人企业。” 他表示,创业不是紧绷着硬熬,而是越做越知道怎么抓重点。

  • OPPO K13 Turbo系列真机亮相:自带风扇+RGB

    OPPO K13 Turbo系列真机已经现身在bilibili world《胜利女神:NIKKE》展区。 从图片来看,OPPO K13 Turbo系列系列后摄区域有点类似一加13T,采用了矩形金属方案,主摄下方就是散热风扇,同时外圈还自带RGB等效。 这个设计方案可以明显看出,该机是主打电竞体验。 风扇模组采用电镀镍工艺,放弃普通喷涂,带来更好的防水、防锈效果,并且号称风力提升120%,从而实现更强、更持久�

  • 除烟味空气净化器十大排名,精致除烟味机器

    文章介绍了空气净化器在去除烟味方面的重要性,并提供了选购指南。重点分析了高效除烟味净化器的核心技术:HEPA滤网过滤微小颗粒、活性炭滤网吸附有害气体和异味,部分高端产品还具备分解技术。推荐了十款优质除烟味空气净化器品牌,包括英国斯帝沃(高效净化二手烟)、飞利浦(活性炭圆柱体设计)、莱特艾尔(智能检测调节)等,强调选购时需结合房间大小、预算等实际需求。

  • 微信iOS又有新功能 聊天终于能发实况图片了

    日前,微信iOS版又迎来新功能与好友聊天支持发送实况照片,目前为灰度测试阶段。 据了解,使用该功能需要将微信iOS更新至8.0.61版本及以上,默认实况为关闭状态,发送照片时点击进入大图预览页面可手动开启单个照片的实况开关。

  • OPPO首款内置风扇手机!OPPO K13 Turbo跑分出炉:确认骁龙8s Gen4

    这款新机还有一个非常重要的亮点内置风扇手机,这也是OPPO首款自带风扇的手机。 该机后置主摄下方有一个风扇开孔,可以迅速散发内部热量。 风扇模组采用电镀镍工艺,放弃普通喷涂,带来更好的防水、防锈效果,并且号称风力提升120%,从而实现更强、更持久的游戏性能。 第四代骁龙8s的性能大家已经在测试中看到了,采用4nm打造,全大核方案,安兔兔跑分能突破240万�