首页 > 热点 > 关键词  > 正文

OpenAI正式发布GPT-5模型 网友:写作像诗人

2025-08-08 08:37 · 稿源:站长之家

站长之家(ChinaZ.com) 8月8日 消息:北京时间今日凌晨,OpenAI在直播活动中正式推出新一代人工智能模型GPT-5,宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域,实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)形容,与GPT-5交互如同与各领域专家对话,其多维度能力突破将重塑人机协作模式。

分层开放策略满足多元需求

GPT-5将于本周四启动全球用户分批推送,免费用户与付费用户均可体验基础功能,其中付费用户享有更高使用限额。Pro订阅用户可无限调用GPT-5及专属版本GPT-5Pro,Plus用户则默认将其作为日常问题处理模型,其使用频次显著高于免费层级。OpenAI透露,未来计划将多版本功能整合至单一模型,当前通过"智能高效模型+深度推理模型(GPT-5thinking)+实时路由器"的架构实现动态调度——系统可根据对话复杂度、工具需求及用户意图,自动匹配最优模型,超出限额时则启用精简版维持服务连续性。

OpenAI正式发布GPT- 5 模型:面向所有用户开放 更像人类专家

OpenAI正式发布GPT- 5 模型:面向所有用户开放 更像人类专家

基准测试全面领跑 核心场景突破显著

在公开的基准测试中,GPT-5展现跨越式进步:数学(AIME2025无工具得分94.6%)、真实世界编程(SWE-bench Verified74.9%)、多模态理解(MMMU84.2%)及健康咨询(HealthBench Hard46.2%)等领域均刷新行业纪录。其核心升级体现在三大场景:

  1. 编程领域:作为"史上最强编程模型",GPT-5可基于单条提示生成交互式网站、应用程序及游戏,在复杂前端设计与大型代码库调试任务中效率提升40%,支持实时错误检测与自动化修复。
  2. 创意写作:通过结构化模糊处理技术,模型能将碎片化创意转化为兼具文学深度与节奏感的完整作品,在学术论文、营销文案等日常任务中表现更贴近人类作家。
  3. 健康咨询:HealthBench测试得分较前代提升27%,模型可主动识别潜在健康风险并提出追问,结合用户背景、地理位置提供个性化建议,但OpenAI强调其"无法替代专业医疗诊断"。

Pro版本定义复杂任务新标杆

针对高阶需求推出的GPT-5Pro,在GPQA钻石级推理测试中取得88.4%无工具得分,较前代提升12%。该版本采用"扩展推理+高效并行计算"架构,思考时间延长3倍,在科学、数学、编程等领域的专家级评估中,67.8%的案例被判定优于人类初级研究员水平。OpenAI披露,GPT-5Pro已替代原o3-Pro模型,成为复杂逻辑推理、跨学科问题解决的首选工具,其错误率较前代降低22%,尤其在需要长期上下文记忆的任务中表现稳定。

此次发布标志着OpenAI从"通用能力覆盖"向"垂直领域精耕"的战略转型。随着GPT-5逐步接入企业服务与开发平台,人工智能在专业领域的实用价值或将迎来新一轮爆发期。

举报

  • 相关推荐
  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 你信吗!肯德基保密54年的炸鸡配方将被公开:网友质疑或是公关噱头

    肯德基非洲分公司宣布将于10月8日公开其保密54年的炸鸡配方,引发全球关注。该配方仅由极少数高层知晓,此前仅透露由11种香料混合而成。肯德基总部尚未回应。网友质疑这可能是营销噱头,猜测公开内容或为"加一勺爱心,撒一把耐心"等概念性表述。公司在X平台的官方账号仅关注11人,其中7人名字含"草本香料"相关词汇,被指刻意营造神秘感。

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • 技术经理人慕课课程正式发布

    为加快培育高水平技术经理人队伍,推动科技成果转化和产业化,技术经理人慕课课程近日正式发布。该课程由中国科协科学技术创新部委托、科技部科技评估中心统筹制作,基于我国首套初、中、高级技术经理人培训教材精心打造,为技术转移从业者及相关人员提供科学、系统、便捷的在线学习资源。课程紧扣《职业分类大典》中技术经理人的职业要求及能力评价规范,与教材紧密适配,形成“教材+慕课”协同互补的梯度式学习体系,助力学员循序渐进提升专业水平。授课师资汇聚权威专家和行业精英,通过动画演示、案例模拟等多样化手段,将知识产权证券化、技术并购重组等复杂业务流程可视化,增强学习效果。课程内容聚焦传统产业转型升级、战略性新兴产业培育等方向,深度剖析真实案例,帮助学员精准把握技术发展趋势,提升解决实际问题的能力。目前课程已在“科创中国”和“技术经理人公共服务平台”同步上线,未来还将持续推出实训案例课程,全方位助力技术经理人成长。

  • 人在工位心已飞走 网友:今天只有一个状态 等放假

    国庆中秋连休8天假期前夕,职场人普遍进入"等放假"状态,网友调侃"人在工位心已飞"。9月30日下午至10月1日上午迎来出京高峰,北京地铁4号线、7号线等多条线路延长运营。全国铁路预计发送旅客150万人次,其中北京地区占比超50%,主要前往上海、哈尔滨、沈阳等方向。多地交通枢纽已出现明显客流增长,周边路网压力集中。

  • 网友雨中邂逅“山中精灵” 一只岩羊静立岩壁

    近日,四川地区接连上演雨中与“山中精灵”的奇妙邂逅,引发网友广泛关注与热议。 在阴雨连绵的天气里,一位网友于莲宝叶则徒步时,意外偶遇一只静立岩壁的岩羊。镜头中,这只身披灰蓝皮毛的生灵,身姿矫健地立于崖边,在雨雾缭绕的山景映衬下,宛如神秘的“山中精灵”。它沉稳的神态与朦胧的山景形成强烈反差,目击者称

  • 游客在大草原点外卖 骑手小哥飞马追车送达 网友:遇到了真骑手 不白来

    10月1日,锡林郭勒草原上演独特外卖配送:美团骑手小哥策马扬鞭,疾驰追赶游客车辆送餐。视频显示,游客在辽阔草原自驾时兴起点单,骑手为及时送达,纵马奔腾速度竟快过汽车,令游客惊叹"遇见真骑手"。这展现草原旅游别具一格,连广袤无垠的草场也成了外卖配送范围,体验绝了!

  • 定了!WIKO Hi MateBook 14明日正式发布,圆键盘+旗舰屏这次全齐了

    WIKO Hi MateBook 14将于9月26日发布,核心亮点包括:配备2.8K OLED高刷触控屏,搭载英特尔酷睿Ultra 7处理器,性能强劲。键盘采用独特的“波点艺术”设计,兼具复古美感与辨识度。官方强调其定价将远低于万元级别,主打高性价比。结合跨端互联、多屏协同等智慧生态功能,这款轻薄本有望成为下半年市场的黑马。

今日大家都在搜的词: