OpenAI不服GPT-4被Bard反超推出模型GPT-4-0125-preview

2024-01-31 09:37 · 稿源：站长之家

要点:
1. 谷歌的Chatbot Arena排行榜显示，新版Bard超越了GPT-4，引发网友质疑，因为Bard搭载了新版大模型Gemini Pro-scale，具备联网功能。
2. 网友对在排行榜中混合在线和离线大模型表示不满，Imsys官方回应称排行榜是实时的，如果联网能提升用户体验，将予以体现。
3. OpenAI的最新模型GPT-4-0125-preview已入场竞技场，等待用户投票。Bard超越GPT-4的情况引起了科技圈的广泛关注。

站长之家（ChinaZ.com）1月31日消息:最新的Chatbot Arena排行榜显示，Bard成功超越了GPT-4，成为第二名，仅次于GPT-4Turbo。这一消息引发了科技圈的热议和关注。

谷歌AI掌门人Jeff Dean透露，Bard之所以性能大幅提升，是因为搭载了新版大模型Gemini Pro-scale。然而，网友对此产生不满，认为Bard的联网功能使比赛不公平。

网友质疑在同一个排行榜中混合在线和离线大模型是否公平。Hugging Face的Omar Sanseviero也表示可以向lmsys提交具有搜索功能的Mixtral。Imsys官方回应称排行榜是实时的，联网是否提升用户体验将会考虑。

面对质疑，OpenAI迅速回应，推出了最新模型GPT-4-0125-preview，并已入场竞技场等待用户投票。这一举动旨在向科技圈展示OpenAI对于用户意见的重视和积极响应。

事件的发展令整个科技圈对排行榜和大模型的未来充满期待。GPT-4的最新版本加入竞技场，引发了更多关注和猜测。在竞技场的投票结果将对模型的排名产生重要影响，进一步引发行业内的关注和辩论。

（举报）

相关推荐

关键词：

性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

百度发布超轻量级文字识别模型PP-OCRv5，仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型，尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别，适用于教育、医疗、法律等多行业数字化需求，累计下载量超900万，是GitHub上唯一Star数超5万的中国OCR项目。

PP-OCRv5 轻量级OCR 文字识别模型
OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

OpenAI宣布推出新一代AI编程模型GPT-5-Codex，其最大亮点是创新的动态时间分配系统。不同于传统AI追求秒级响应”，该模型可根据任务复杂度灵活调整处理时长，从数秒到7小时不等，以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称，传统模型在任务初期即固定计算资源，而GPT-5-Codex能实时评估需求：动态决定加速推进、暂停语法核�

GPT-5-Codex 动态时间分配 AI编程模型
HTTP 402与微支付：一段沉睡三十年的代码，在AI时代觉醒

30年前HTTP 402协议因交易成本高、体验割裂和技术缺失而失败，如今AI时代带来消费原子化、决策流线化和主体去人化三大变革，使微支付成为可能。AI代理通过钱包身份、风控机制和无缝支付协议实现高频小额交易，重构互联网经济逻辑，让HTTP 402从理想变为AI经济的支付基石。

HTTP402 微支付 Roy
百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

今天，在WAVE SUMMIT深度学习开发者大会2025上，百度文心大模型X1.1正式发布，在事实性、指令遵循、智能体等能力上均提升显著。百度王海峰介绍，文心大模型X1是基于文心大模型4.5训练而来的深度思考模型，升级后的X1.1主要采用了迭代式混合强化学习训练框架。一方面通过混合强化学习，同时提升通用任务和智能体任务的效果；另一方面通过自蒸馏数据的迭代式生产及训练

百度文心大模型深度学习智能体
AI员工正在赋能千行百业，企业在选择AI员工时，应该重点对比这4项重要能力！

国务院发布《关于深入实施“人工智能+”行动的意见》，明确AI与实体经济、社会各领域深度融合成为国家战略。文章指出企业应重点考察AI员工的业务适配性、执行能力、系统对接能力和持续进化能力，选择能深度理解行业逻辑、完成真实任务、无缝对接现有系统并持续学习的AI工具，以提升效率、解放人力，把握智能化转型机遇。

人工智能+ AI技术智能终端
荐AI日报：快手推出AI视频制作助手Kwali；字节跳动推出USO模型；OpenAI推出ChatGPT开发者模式

本文介绍了AI日报栏目，聚焦AI领域最新动态。快手推出Kwali视频助手，简化视频制作流程；字节跳动发布USO模型，解决图像生成中风格与主题的矛盾；微软推出Copilot Audio音频模式，提供个性化语音交互；Stability AI升级Stable Audio 2.5，支持高质量音频生成；阿联酋推出开源大模型K2 Think，拥有320亿参数；微信上线智能回复功能，提升公众号运营效率；OpenAI推出ChatGPT开发者模式，支持AI控制外部工具；字节跳动Seed团队发布AgentGym-RL框架，提升语言模型决策能力；月之暗面开源Checkpoint Engine中间件，优化LLM推理效率；B站开源IndexTTS-2.0文本转语音系统，支持情感与时长控制；Replit推出Agent 3编程助手，自主性提升10倍。

AI视频制作快手Kwali 多Agent框架
OpenAI发布语音模型GPT-realtim：具备情感感知能力多语言无缝切换

OpenAI正式发布语音模型GPT-realtime。据介绍，GPT-realtime是一款专注于语音AI Agent的多模态模型，能够生成高度自然流畅的语音，精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解，并可结合语音或文本对话使用，非常适合应用于客服、教育、金融、医疗等领域，用于构建高质量的语音智能体。官方表示，新模型在复杂指令遵循、工具精确调用以及生成更自然、�

语音模型 GPT-realtime 多模态模型
魅族StarV Snap AI拍照眼镜发布：售价1999 元起

今日下午魅族22新品发布会上，一款名为StarV Snap的AI拍摄眼镜成为全场焦点。这款突破传统智能眼镜形态的产品以39克超轻人因工学设计惊艳亮相，通过50项人体工程学优化实现重量均匀分散，彻底解决"丑、重、硌"的行业痛点，鼻梁、耳部无压迫感的设计支持全天候舒适佩戴。外观采用经典框型设计，磨砂质感镜框不仅时尚百搭适配多种脸型，更具备防指纹沾染特性，
“无人测试”新趋势：2025服贸会公布领先AI测试平台——Testin XAgent

在数字化浪潮下，软件质量成为企业核心竞争力。传统测试依赖人工，面临效率瓶颈、覆盖局限和技术门槛三大痛点。AI技术正推动测试从自动化向智能化变革。Testin云测发布新一代AI智能测试系统Testin+XAgent，融合大语言模型和智能体技术，实现自然语言驱动测试、高精度视觉识别、全自动API测试和自主探索式测试，重塑测试流程。该系统代表软件测试向“无人测试”升级，助力中国技术出海，彰显AI+测试的全球竞争力。

软件测试 AI智能测试无人测试
腾讯云TencentOS Server AI发布，为千行百业打造安全可靠的国产化数字底座

腾讯云在2025全球数字生态大会上推出国内独家“OS+AI”解决方案TencentOS Server AI，旨在打造安全可靠的企业级服务器Linux操作系统。该系统通过AI技术优化算力调度与资源管理，显著提升大语言模型推理性能，在智能客服场景中吞吐性能提升超100%。同时支持GPU虚拟化与资源隔离，已帮助客户节约60%硬件成本。目前已在金融、政务等行业规模化应用，成为国产操作系统标杆。

OS+AI TencentOS Server

今日大家都在搜的词：

热文

3 天
7天

OpenAI不服GPT-4被Bard反超推出模型GPT-4-0125-preview

性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

HTTP 402与微支付：一段沉睡三十年的代码，在AI时代觉醒

百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

AI员工正在赋能千行百业，企业在选择AI员工时，应该重点对比这4项重要能力！

荐AI日报：快手推出AI视频制作助手Kwali；字节跳动推出USO模型；OpenAI推出ChatGPT开发者模式

OpenAI发布语音模型GPT-realtim：具备情感感知能力多语言无缝切换

魅族StarV Snap AI拍照眼镜发布：售价1999 元起

“无人测试”新趋势：2025服贸会公布领先AI测试平台——Testin XAgent

腾讯云TencentOS Server AI发布，为千行百业打造安全可靠的国产化数字底座

今日大家都在搜的词：

热文

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型；

小米召回116887辆SU7电动汽车：将OTA升级消除安全隐患

iPhone17 Pro Max续航实测夺冠 iPhone Air表现不俗

卢伟冰：9月19日将直播在线解答小米17系列17个问题

小米发布REDMI 15R 5G手机：售价1099元起搭载6000mAh电池

苹果承诺修复iPhone17拍照黑色方块、白色曲线等问题

雷军回应小米召回11.7万辆SU7：将为用户带来更多期待功能

苹果 iPhone 17/Pro 系列今日发售多维度升级

鸿蒙智行秋季发布会定档9月23日：尚界H5、新问界M7来了

上市没几天iPhone 17已跌破发售价部分机型降幅高达千元

小米17 Pro Max官宣雷军：全面对标iPhone 正面迎战

小米17 Pro系列外观公布：搭载“妙享背屏”

小米16改名小米17 本月发布：现已上架开启预约

AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型

小米手机官博头像上热搜：泄密17 Pro系列或配备背屏

小米17官宣本月发布卢伟冰称有信心直面iPhone17

AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

尚界H5小订突破10万台预售16.98万起

站长商机

OpenAI不服GPT-4被Bard反超 推出模型GPT-4-0125-preview

今日大家都在搜的词：

热文

站长商机

OpenAI不服GPT-4被Bard反超推出模型GPT-4-0125-preview