OpenAI CEO曾称 GPT-2“非常糟糕”，现在对该版本“情有独钟”

2024-04-30 17:39 · 稿源：站长之家

划重点:
⭐️ OpenAI CEO Sam Altman 对 GPT-2表达了喜爱之情，尽管之前曾批评早期模型。
⭐️ GPT-5即将推出，Altman 认为将会有显著改进。
⭐️ GPT 系列模型自 GPT-1至 GPT-4的发展历程和功能特点。

站长之家（ChinaZ.com）4月30日消息:OpenAI 首席执行官 Sam Altman 近日表达了对 GPT-2语言模型的喜爱之情，尽管他此前批评了早期模型，但他对即将推出的 GPT-5充满期待。Altman 在社交平台上承认，他 “确实对 GPT-2有一种软肋”。

今年早些时候，Altman 在接受韩国《每日经济新闻》采访时表示:“GPT-2非常糟糕。GPT-3还算糟糕。GPT-4也不太好。但 GPT-5将会很好。” Altman 是在今年1月加在瑞士达沃斯举行的世界经济论坛时接受的采访。据《福布斯》报道，自8年推出 GPT-1以来，OpenAI 一直在不断改进其 GPT 模型。去年3月出了最新版本 GPT-4，预计 GPT-5将于今年晚些时候发布。

GPT 模型的发展历如下:

- GPT-1:2018年6月推出，包含1.17亿个参数，为当前 ChatGPT 版本定了基础。它展示了无监督学习在理解语言方面的有效性，使用书籍作为训练材料，预测句子中的下一个单词。

- GPT-2:这个模型于2019年2月推，拥有15亿个参数，被宣称是重大进步。它在文本生成方面取得了显著进展，能够生成连贯的多段内容。但由于对其潜在误用的担忧，GPT-2并没有立即向公开放。

- GPT-3:2020年6月推出的 GPT-3标志着一个重大进步。这个模型训练了1750亿个参数，彻底改变了文本生成的方式。其先进的功能被广泛应，包括起草电子邮件、撰写文章、创作诗歌，甚至生成编程代码。稍后发布的更新版本 GPT-3.5在2022年11月向公众开放。

- GPT-4:去年3月推出的 GPT - 目前仅适用于 ChatGPT Plus 订户。它具有新的图像和文本理解功能，较低的危险输出可能性，能够跟随用户意图以及实时搜索互联网的能力。

- GPT-5:即推出的模型预计将比其前身 GPT-4有显著改进，后者遇到了性能挑战。这一即将推出的模型计划在夏季发布，一些企业客户已经得到了其功能的预览。一首席执行官形容它为 “真的很好，比较显著提高”。

以上是 OpenAI GPT 模型的发展历程，展示了从 GPT-1到即将推出的 GPT-5各个版本的功能特点和改进之处。

（举报）

相关推荐

关键词：

OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

OpenAI宣布推出新一代AI编程模型GPT-5-Codex，其最大亮点是创新的动态时间分配系统。不同于传统AI追求秒级响应”，该模型可根据任务复杂度灵活调整处理时长，从数秒到7小时不等，以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称，传统模型在任务初期即固定计算资源，而GPT-5-Codex能实时评估需求：动态决定加速推进、暂停语法核�

GPT-5-Codex 动态时间分配 AI编程模型
性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

百度发布超轻量级文字识别模型PP-OCRv5，仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型，尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别，适用于教育、医疗、法律等多行业数字化需求，累计下载量超900万，是GitHub上唯一Star数超5万的中国OCR项目。

PP-OCRv5 轻量级OCR 文字识别模型
美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

9月23日，美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时，性能更强大、更专业，在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平（SOTA），部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力，扩展了形式化定理证明能力，成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出，多项基准测试成绩领先开源及闭源顶尖模型，已在HuggingFace、Github全面开源。

高效推理模型 LongCat-Flash-Thinking 开源模型
赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

全球老龄化加速，大脑健康成为焦点。9月16日是中国脑健康日，9月21日是世界阿尔茨海默病日。数据显示，2020至2023年全球60岁以上人口增长40%，达14亿；中国60岁以上人口超3亿，占比22%。阿尔茨海默病带来的经济负担约占GDP的1.47%。科学界正探索维持大脑年轻态的机制，企业合作举办高峰论坛，专家分享前沿研究成果，强调40-60岁是干预黄金窗口期。复合维生素矿物质等营养干预手段显示认知改善潜力，未来需跨学科协作推动大脑抗衰研究普及。

脑健康阿尔茨海默病老龄化
Qwen3-Max成阿里通义“地表最强”：性能超GPT5 数学推理直接满分

9月24日，2025云栖大会开幕，阿里通义千问旗舰模型Qwen3-Max重磅亮相，性能超越GPT-5、Claude+Opus 4等，跻身全球前三。该模型包含指令和推理两大版本，预训练数据量达36T tokens，总参数超万亿，具备极强编程和工具调用能力。在SWE-Bench测试中，指令版斩获69.6分全球第一；Tau2-Bench工具调用测试达74.8分，超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分，国内首次突破。通义千问系列已实现全尺寸覆盖，包含三百多个模型。即日起，用户可在QwenChat免费体验Qwen3-Max，或通过阿里云百炼平台调用API服务。

云栖大会 Qwen3-Max 通义千问
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

StarRocks Connect 2025峰会圆满落幕，聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家，分享StarRocks在复杂业务场景中的实践，探讨技术演进方向。从性能引擎到AI原生平台，StarRocks 4.0将支持多智能体协作框架，提升数据分析效率。多家企业展示应用案例，覆盖电商、金融、旅游等领域，验证了其高性能与成本优势。开源精神推动技术创新，共同探索数据智能的无限可能。

StarRocks 数据分析 AI
Matrixport 于 Token2049 新加坡期间举办 DAT 高峰论坛，聚焦下一轮市场周期话语权

在2025年TOKEN2049新加坡峰会期间，Matrixport举办闭门论坛探讨数字资产财库战略。与会专家一致认为，DAT正从风控工具升级为机构战略核心，预计将形成寡头主导格局。Matrixport通过一站式解决方案推动行业标准化，其管理的DATCO持仓规模突破千亿美元。论坛凸显DAT作为华尔街资本入局加密市场的重要通道，未来将在全球金融体系中扮演关键角色。

数字资产加密市场财库管理
荐AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推最新视频生成模型可灵2.5Turbo

近日AI领域迎来多项重要更新：阿里夸克发布AI创作平台“造点”，整合通义万相Wan2.5与Midjourney V7，支持音画同步视频生成；Wan2.5-Preview实现多模态输入与电影级视频同步生成，提升视觉创作能力；可灵AI推出视频生成模型2.5Turbo并降价30%，降低使用门槛；阿里通义推出Qwen3-ASR-Toolkit，实现小时级音视频转录；谷歌相册AI编辑功能扩展至安卓用户，支持语音修图；谷歌Mixboard工具助力创意设计，生成情绪板；Qwen发布Qwen3-Max模型，在代码生成与智能体能力表现突出；Figma推出MCP服务器，实现设计到代码的一键转换，提升开发效率。

AI创作平台通义万相音画同步
曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

苹果公司正在开发一款类似ChatGPT的手机应用“Veritas”，用于内部测试明年将推出的新版Siri。该应用可快速评估Siri新功能，包括搜索个人数据、执行App内操作（如编辑照片）等。虽然不面向消费者发布，但该工具标志着苹果对Siri的全面升级已进入新阶段，旨在帮助员工高效完成测试。

苹果 Siri ChatGPT

今日大家都在搜的词：

热文

3 天
7天

OpenAI CEO曾称 GPT-2“非常糟糕”，现在对该版本“情有独钟”

OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

Qwen3-Max成阿里通义“地表最强”：性能超GPT5 数学推理直接满分

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

StarRocks Connect 2025 圆满落幕：AI Native 时代，数据分析未来已来

Matrixport 于 Token2049 新加坡期间举办 DAT 高峰论坛，聚焦下一轮市场周期话语权

荐AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推最新视频生成模型可灵2.5Turbo

曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

今日大家都在搜的词：

热文

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

马斯克个人财富达5000亿美元特斯拉市值飙升助力

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

苹果iOS18.7.1正式版更新发布重要安全修复

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

罗永浩替小米说公道话：海报小字是行业陋习

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

iPhone调休闹钟上热搜苹果客服回应：需手动设置

腾讯QQ闪传功能上线支持单文件最大10GB传输

站长商机