首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI开启调查:GPT-4o及4o-mini模型性能下降

2025-01-20 16:11 · 稿源: 快科技

据报道,OpenAI发布事故报告,指出其GPT-4o和4o-mini模型当前遇到性能下降问题,正在进行调查,将尽快公布最新进展。

科研人员最近推出名为LONGPROC的基准测试工具,用于评估模型处理长上下文复杂信息并生成相应响应的能力。

测试结果令人惊讶:尽管GPT-4o等知名模型在常规长上下文回忆基准测试中表现出色,但它们在处理复杂的长文本生成任务方面仍有明显的改进空间。

OpenAI ChatGPT,人工智能,AI

具体来说,所有参测模型声称其上下文窗口大小超过 32K tokens,但实际情况却不同。开源模型在处理仅 2K tokens的任务时就表现不佳,而闭源模型(例如 GPT-4o)在处理 8K tokens任务时性能也明显下降。

以 GPT-4o为例,当要求它生成详细的行程计划时,即使提供了明确的时间节点和直飞航班信息,模型的输出结果中仍出现了不存在的航班信息,即出现了“幻觉”现象。

测试还表明,即使是最先进的模型在生成连贯且冗长的内容方面仍有很大的提升空间。尤其是在需要输出 8k tokens的任务中,即使是参数庞大的先进模型也无法避免出现问题,这可能预示着大型语言模型(LLM)研究未来的一个有潜力的方向。

举报

  • 相关推荐
  • AI日报:豆包披露付费订阅方案;OpenAI发布GPT-5.5Instant;苹果手机支持第三方AI模型

    今日AI领域动态:豆包推出月费68-500元三档付费订阅,推进商业化;OpenAI发布GPT-5.5 Instant,取代5.3成为ChatGPT默认模型;苹果iOS 27或支持第三方AI模型,打破封闭生态;淘宝“答题免单”上线,首次加入AI试穿玩法;魔形智能完成数亿元Pre-A轮融资,布局Token基础设施;谷歌神秘项目“Remy”曝光,打造24小时AI助教;谷歌推出Gemini Ultra Lite新订阅服务,填补中高端市场空白;ChatGPT上线广告主平台,AI商业化迎来分水岭。

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • OpenAI正式发布GPT-5.5:运算速度更快 Token成本大降

    OpenAI正式发布新一代大语言模型GPT-5.5,公司称该模型是其迄今为止智能程度最高、使用体验最为直观的版本。 OpenAI联合创始人兼总裁格雷格布罗克曼表示:相比GPT-5.4,GPT-5.5运算速度更快、逻辑更精准,且消耗的词元(Token)更少。让企业和普通用户都能用上更前沿的 AI 能力,正是我们的目标之一。” 据介绍,GPT-5.5适用场景广泛,既涵盖智能体编程、知识处理等企业级基础

  • AI新王诞生!Anthropic估值冲爆1.2万亿 首次反超OpenAI

    长期笼罩在OpenAI阴影下的二号选手”Anthropic,近期在链上Pre-IPO市场的隐含估值骤然飙升至1.2万亿美元(约合人民币8.7万亿元)。 若Anthropic以这一估值顺利完成首次公开募股,它将直接跃升为全球第11大上市公司,缔造商业史上的新神话。 最新链上Pre-IPO交易数据显示,短短七天内,Anthropic估值暴涨20%,单周涨幅已相当于一家头部上市公司的体量。而自2025年10月以来,其估值曲

  • 人声接近真人!OpenAI一口气更新三款超强语音AI

    OpenAI正式宣布对其实时API接口进行重大升级,一次性推出三款全新高阶语音智能模型,全面强化AI在实时听觉、口语交互、翻译与转录方面的能力,并大幅降低企业开发智能语音应用的技术门槛。 本次更新的核心产品包括:GPT-Realtime-2、实时翻译模型以及实时转写模型。其中,GPT-Realtime-2搭载了GPT-5级别的推理能力,人声仿真度进一步提升。 相比前代产品,它能够更精准地理�

  • AI日报:OpenAI发布三款实时语音模型;苹果首款AI硬件曝光;美团入局AI社交赛道

    今日AI热点:OpenAI发布三款实时语音模型,覆盖推理对话、翻译和转录场景;苹果首款AI硬件AirPods进入DVT阶段,内置摄像头;宇树科技UniStore平台开放,开启人形机器人应用商店时代;阶跃星辰完成25亿美元融资,冲刺香港IPO;美团推出首个数字生命共生社区“鲸游”公测;OpenAI推出GPT-5.5-Cyber预览版,专攻网络安全;Mozilla借助AI发现Firefox 271个安全漏洞;OpenAI发布Codex Chrome扩展,优化浏览器工作流。

  • AI日报:GPT5.6开始内测;阿里2026财年Q4财报AI收入激增;MiniMax Agent正式更名Mavis

    今日AI领域动态:OpenAI与Anthropic展开AI编程工具补贴大战,GPT-5.6已内测,开发者受益;阿里巴巴发布财报,AI云业务爆发,百炼平台ARR将破百亿;MiniMax升级Agent产品为Mavis,支持多智能体协作;腾讯辟谣姚顺雨离职传言;谷歌与SpaceX合作开发太空太阳能数据中心;Anthropic提升Claude Code额度50%;Meta推出WhatsApp AI隐身模式;OpenAI回应供应链攻击,称未发现用户数据泄露。

  • OpenAI憋不住了要造手机!背后原因曝光:不想再给苹果谷歌白打工

    估值超8000亿元的AI大模型巨头OpenAI计划自研AI手机,预计2028年量产,由立讯精密制造,正与联发科、高通合作研发处理器。 消息一出,立讯精密股价大涨超9%,创历史新高。 OpenAI CEO奥尔特曼也表示,当前需重新思考操作系统与界面设计,打造适配智能体的互联网协议。 为何大模型企业纷纷下场造机?核心原因直指不想再被苹果、谷歌卡脖子”。 首先,摆脱第三方终端依赖

  • WiFi会让记忆力下降系谣言 医生:记忆力差怪错对象了

    “晚上睡觉一定要关Wi-Fi,不然辐射会影响大脑,记忆力会下降。”——都2026年了,这句话居然还有人信。 这说法每隔几年就会冒出来一次,翻来覆去地辟谣,翻来覆去地传。今天再讲一遍:Wi-Fi辐射,真的不影响记忆力。 先说清楚,Wi-Fi路由器工作时产生的辐射,属于非电离辐射。这个“非”字是关键。医院里拍X光、做CT,那是电离辐射——能量高,能穿透人体,可能破坏�

  • OpenAI智能体手机冲击明年量产 目标两年出货3000万部

    知名科技分析师郭明錤透露,OpenAI正在加速推进其AI智能体手机项目,最新目标是在2027年上半年实现量产。这一进度比外界预期的更早。 郭明錤表示,项目提速的潜在驱动因素包括:为年末可能的 IPO 叙事提供支撑,以及 AI 智能体手机领域的竞争日益激烈。若进展顺利,这款设备在2027至2028年的合计出货量有望接近3000万部。 在硬件配置上,该设备将采用双NPU架构,用于异构A

今日大家都在搜的词: