GPT-4变笨引爆舆论！文本代码质量都下降，OpenAI刚刚回应了降本减料质疑

2023-06-02 13:48 · 稿源：量子位公众号

大模型天花板GPT-4，它是不是……变笨了?先是少数用户提出质疑，随后大量网友表示自己也注意到了，还贴出不少证据。有人反馈，把GPT-4的3小时25条对话额度一口气用完了，都没解决自己的代码问题。无奈切换到GPT-3.5，反倒解决了。总结下大家的反馈，最主要的几种表现有:以前GPT-4

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

2025年9月29日，深度求索公司发布新一代模型架构DeepSeek-V3.2，引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本，在V3.1-Terminus基础上引入稀疏注意力机制，优化长文本训练和推理效率。目前官方应用端已同步更新，API大幅降价。此次模型体积达671GB，下载需8-10小时。业内专家指出，此次快速适配表明双方早有深度技术协�

DeepSeek-V3.2 大模型架构稀疏注意力机制
OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

OpenAI宣布推出新一代AI编程模型GPT-5-Codex，其最大亮点是创新的动态时间分配系统。不同于传统AI追求秒级响应”，该模型可根据任务复杂度灵活调整处理时长，从数秒到7小时不等，以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称，传统模型在任务初期即固定计算资源，而GPT-5-Codex能实时评估需求：动态决定加速推进、暂停语法核�

GPT-5-Codex 动态时间分配 AI编程模型
微信员工回应新iPhone提示空间不足：代码Bug所致

iPhone 17系列开售后，用户转移微信聊天记录时出现异常提示“设备空间不足”，但实际手机仍有1.29TB可用空间。微信员工“客村小蒋”回应称这是代码Bug，因缓存机制导致开机5分钟内接口返回错误数据。用户只需正常使用手机5分钟后即可恢复正常。该事件提醒用户关注微信聊天记录及缓存对设备空间的影响，同时期待微信团队尽快修复Bug。

微信聊天记录 iPhone17 数据迁移
PUBG绝地求生饥狂险境突围模式上线！活动一览+攻略技巧分析！

《绝地求生》将于10月2日强势回归“饥荒险境突围”困难模式，活动持续至10月14日。通关可获得幸运宝箱及赫斯珀里亚行动宝箱奖励。攻略建议提前收集物资，优先合成汤姆逊/S12K及扩容弹匣，利用工作台制作装备。需启动所有发电机并找到出口才能通关，每局物资可保留。推荐使用加速器优化游戏体验，避免服务器拥堵。

PUBG 绝地求生险境突围模式
新iPhone导入微信聊天记录提示空间不足微信员工：代码存Bug

iPhone 17系列开售后，用户转移微信聊天记录时出现“设备空间不足”错误，实际手机仍有1.29TB可用。微信员工承认代码存在Bug，因系统接口缓存机制导致，开机5分钟后可自动恢复正常。此外，微信聊天记录仅本地存储，长期积累占用空间大，群聊自动下载功能及临时缓存未定期清理也会加剧空间消耗。

iPhone 17 微信Bug
HTTP 402与微支付：一段沉睡三十年的代码，在AI时代觉醒

30年前HTTP 402协议因交易成本高、体验割裂和技术缺失而失败，如今AI时代带来消费原子化、决策流线化和主体去人化三大变革，使微支付成为可能。AI代理通过钱包身份、风控机制和无缝支付协议实现高频小额交易，重构互联网经济逻辑，让HTTP 402从理想变为AI经济的支付基石。

HTTP402 微支付 Roy
StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

StarRocks Connect 2025峰会圆满落幕，聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家，分享StarRocks在复杂业务场景中的实践，探讨技术演进方向。从性能引擎到AI原生平台，StarRocks 4.0将支持多智能体协作框架，提升数据分析效率。多家企业展示应用案例，覆盖电商、金融、旅游等领域，验证了其高性能与成本优势。开源精神推动技术创新，共同探索数据智能的无限可能。

StarRocks 数据分析 AI
美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

9月23日，美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时，性能更强大、更专业，在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平（SOTA），部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力，扩展了形式化定理证明能力，成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出，多项基准测试成绩领先开源及闭源顶尖模型，已在HuggingFace、Github全面开源。

高效推理模型 LongCat-Flash-Thinking 开源模型
Qwen3-Max成阿里通义“地表最强”：性能超GPT5 数学推理直接满分

9月24日，2025云栖大会开幕，阿里通义千问旗舰模型Qwen3-Max重磅亮相，性能超越GPT-5、Claude+Opus 4等，跻身全球前三。该模型包含指令和推理两大版本，预训练数据量达36T tokens，总参数超万亿，具备极强编程和工具调用能力。在SWE-Bench测试中，指令版斩获69.6分全球第一；Tau2-Bench工具调用测试达74.8分，超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分，国内首次突破。通义千问系列已实现全尺寸覆盖，包含三百多个模型。即日起，用户可在QwenChat免费体验Qwen3-Max，或通过阿里云百炼平台调用API服务。

云栖大会 Qwen3-Max 通义千问
Matrixport 于 Token2049 新加坡期间举办 DAT 高峰论坛，聚焦下一轮市场周期话语权

在2025年TOKEN2049新加坡峰会期间，Matrixport举办闭门论坛探讨数字资产财库战略。与会专家一致认为，DAT正从风控工具升级为机构战略核心，预计将形成寡头主导格局。Matrixport通过一站式解决方案推动行业标准化，其管理的DATCO持仓规模突破千亿美元。论坛凸显DAT作为华尔街资本入局加密市场的重要通道，未来将在全球金融体系中扮演关键角色。

数字资产加密市场财库管理

今日大家都在搜的词：

热文

3 天
7天

GPT-4变笨引爆舆论！文本代码质量都下降，OpenAI刚刚回应了降本减料质疑

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

微信员工回应新iPhone提示空间不足：代码Bug所致

PUBG绝地求生饥狂险境突围模式上线！活动一览+攻略技巧分析！

新iPhone导入微信聊天记录提示空间不足微信员工：代码存Bug

HTTP 402与微支付：一段沉睡三十年的代码，在AI时代觉醒

StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

Qwen3-Max成阿里通义“地表最强”：性能超GPT5 数学推理直接满分

Matrixport 于 Token2049 新加坡期间举办 DAT 高峰论坛，聚焦下一轮市场周期话语权

今日大家都在搜的词：

热文

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

小米回应“小米汽车突然自己开走”：排除车辆质量问题

小米17 1TB版明日开售售价5299元

苹果iOS18.7.1正式版更新发布重要安全修复

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

罗永浩替小米说公道话：海报小字是行业陋习

腾讯QQ闪传功能上线支持单文件最大10GB传输

苹果iOS 26.0.1正式版发布：修复iPhone 17系列Wi-Fi、拍照等Bu

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

OPPO Find X9系列定档：10月16日发布

鸿蒙智行享界S9T上市13天大定破 15000 台

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

站长商机