OpenAI发布旗舰大模型GPT-4o：免费试用价格五折速度提高一倍

2024-05-14 07:47 · 稿源：站长之家

GPT-4o具体特性一览:

GPT-4o模型发布:OpenAI发布了GPT-4o模型，其中"o"代表Omni，意为全能。该模型能够接受文本、音频和图像的任意组合作为输入，并生成相应的文本、音频和图像输出。
免费开放:GPT-4o的所有能力将免费向所有用户开放，但新语音模式会在未来几周内优先对ChatGPT Plus会员开放。
API开放:GPT-4o向开发者开放了API，与GPT-4Turbo相比，价格减半，速度提升2倍，速率限制高出5倍。
零延迟实时语音交互:能够进行自然、真实、富有情感的语音交互。
视觉传达内容:通过摄像头视觉传达内容，解决数学题和解析图形报表。
编程助手:提供实时编程辅助，提高编程效率。
视频通话情绪分析:能够实时分析面部情绪。
同声传译:支持多国语言的同声传译。
性能提升:GPT-4o在文本、推理和编码智能方面达到了GPT-4Turbo级别的性能，并在多语言、音频和视觉能力上设定了新的标准。

站长之家（ChinaZ.com）5月14日消息:今日凌晨，OpenAI发布了最新旗舰大模型GPT-4o。这款全能AI不仅免费可用，而且具备横跨听图片、看图片、说图片的多项能力，为用户带来如视频电话般丝滑流畅的交流体验。

微信截图_20240514073937.png

OpenAI表示，GPT-4o不仅在功能上有所突破，更令人惊喜的是，它将向所有用户免费开放，包括之前仅为ChatGPT Plus会员提供的功能。此外，GPT-4o的新语音模式将在接下来的几周内首先对会员用户开放试用。

微信截图_20240514074728.png

据悉，GPT-4o（“o”代表“omni”）凭借其Omni(全能)之名，展现了其惊人的实力。无论是文本、音频还是图像，GPT-4o都能轻松处理，并生成相应的输出。更为令人震撼的是，它能在极短的时间内对音频输入做出反应，其速度之快几乎与人类对话中的反应一致。

微信截图_20240514075140.png

首先，GPT-4o实现了零延迟的实时语音交互，其表现自然、真实，充满情感。在演示中，当演示者表现出紧张情绪时，GPT-4o能够迅速识别并给予安慰和指导。此外，GPT-4o还能够根据要求调整语气和音调，甚至在被要求时，能够以机器人的声音或唱歌的形式来讲述故事。

与之前的模型相比，GPT-3.5和GPT-4在语音模式下的平均延迟时间分别为2.8秒和5.4秒，这无疑会影响对话的流畅性。而GPT-4o则无需先将语音转录为文本，因此能够更直接地理解和响应语音中的语气、音调等信息。

微信截图_20240514082057.png

除了语音交互，GPT-4o还能通过视觉和语音的结合进行多模态交互。例如，在发布会上，OpenAI展示了GPT-4o如何通过摄像头视觉解析图形报表，帮助用户解决数学问题。

微信截图_20240514081928.png

在编程辅助方面，GPT-4o的实时交互能力也得到了显著提升。它能够实时检查代码，解释代码的功能，并指导用户如何调整代码以获得期望的结果。

此外，GPT-4o还能够进行视频通话，并实时分析面部情绪。在演示中，GPT-4o能够准确地识别并响应演示者的情绪状态。

在语言能力方面，GPT-4o支持超过50种语言，并在质量和速度上都有所提升。在官方演示中，GPT-4o成功实现了英语和西班牙语之间的实时同声传译。

尽管GPT-4o在人机交互方面取得了革命性的进步，但它并不是GPT-5。OpenAI的首席技术官Mira Murati在直播中提到，GPT-4o是GPT-4模型的一个迭代版本，它在文本、语音和视觉方面的能力都有所提升。

OpenAI的首席执行官Sam Altman也表示，GPT-4o是一个"原生多模态"模型，它在文本、视觉和音频方面进行了端到端的训练，所有输入和输出都由同一个神经网络处理。

微信截图_20240514080127.png

GPT-4o的强大不仅体现在其全面的能力上，更在于其高效的API服务。为了让更多用户能够轻松使用GPT-4o，OpenAI提供了价格打五折、速度提高一倍、单位时间调用次数增加五倍的API服务。这无疑将极大推动GPT-4o在各行各业的应用和发展。

最后，OpenAI 还宣布将推出 ChatGPT 桌面版应用程序，首先向 Plus 用户推出 macOS 应用，未来计划推出 Windows 版本。

（举报）

相关推荐

关键词：

哪里找最新AI工具官网？如何快速对比ChatGPT替代品？AI工具导航指南 - AIbase

文章探讨了在AI工具爆炸式增长的时代，用户面临的信息过载和筛选困难问题。主要内容包括：1）AI领域迭代速度远超传统软件，个人追踪信息效率低下且容易错过关键更新；2）AIbase.cn平台致力于解决这一问题，通过聚合主流AI工具、严格审核信息来源、持续更新行业动态；3）平台提供多维对比功能，结构化呈现工具参数，帮助用户快速定位适合需求的解决方案；4）建议用户定期浏览平台资讯栏目，善用搜索筛选功能，通过对比视图做出明智选择。核心价值在于降低信息筛选成本，让用户更高效地获取有价值的AI工具和前沿资讯。

AI工具导航信息筛选参数对比
荐AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发布全新语音模型GPT-Realtime

AI日报栏目每日提供人工智能领域热点内容，聚焦开发者，帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括：MiniMax海螺AI首尾帧功能上线；元石科技发布问小白5挑战GPT-5；OpenAI推出语音模型GPT-Realtime；谷歌Gemini AI优化表格处理；腾讯黑科技实现AI配音；百度计划培养千万AI人才；MathGPT.ai反作弊功能推广；苹果Xcode集成Claude Sonnet4；微软发布自研AI模型MAI系列；xAI推出高效编码模型Grok Code Fast1；SuperCLUE多模态评测Gemini-2.5-Pro居首；9月1日起AI内容标识新规实施，违规将承担法律风险。

AI 人工智能技术趋势
ChatGPT语音模式增添新功能：可调语速支持0.5到2.0倍速

OpenAI为其ChatGPT网页应用的语音模式推出新功能，加入语音速度”调节与自定义指令前缀”，同时配合此前升级的模型选择器，进一步提升用户体验。新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速，范围从0.5倍速到2.0倍速，不过该功能目前仍处于隐藏状态，尚未正式开放。自定义指令前缀”功能则允许语音模式记住用户的特定要求，避免重复输入。系统明确�

ChatGPT 语音模式自定义指令
健合旗下Swisse PLUS携手TEDx举办抗衰沙龙，发布NAD+新生瓶系列

《全球抗衰老市场研究报告》显示，2024年全球抗衰老产品市场规模达2662亿美元。高端消费群体需求从粗放式营养补充转向精准干预，推动行业向细胞级解决方案升级。Swisse PLUS与TEDx合作举办主题沙龙，发布NAD+新生瓶系列，汇聚专家学者探讨细胞抗衰科学路径，倡导建立个人健康管理系统，实现精准抗衰与主动健康管理。

抗衰老市场细胞级营养 NAD+新生瓶
OpenAI CEO：GPT-6将具备个性化记忆记住用户偏好习惯

OpenAI的首席执行官萨姆奥尔特曼（Sam Altman）在近日的一次专访中，透露了下一代大模GPT-6的最新进展。他表示，GPT-6 的开发正在积极推进中，其发布节奏将比从GPT-4到GPT-5的周期更快。奥尔特曼特别强调，GPT-6将不再局限于单纯回答问题，而是朝着与用户深度适配”的方向演进。他举例描述

GPT-6 OpenAI 萨姆奥尔特曼
ChatGPT 5更新：三种模式可选 4o重新回归

OpenAI首席执行官Sam Altman在社交媒体上宣布，ChatGPT 5正式推出三种可选模式：自动（Auto）、快速（Fast）和思考（Thinking）。

ChatGPT 5 OpenAI
OpenAI的开源模型现已在IBM watsonx.ai上提供

OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B，允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台，采用专家混合架构，支持本地或云端部署，不受商业用途限制。模型具备高透明度，输出完整推理链，在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态，IBM强调其开放战略，为企业提供灵活、安全的AI开发选择。

OpenAI模型 IBM watsonx.ai
GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

OpenAI发布最强AI模型GPT-5，但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降，且官方突然下架GPT-4o等8个旧模型，导致付费用户抗议。部分用户对旧版产生情感依赖，认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升，但交互体验明显退步。CEO承认低估用户对旧版的喜爱，承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减，面临数据质量和算力成本限制。总体而言，GPT-5在技术指标进步的同时，牺牲了情感交互体验。

GPT-5发布 OpenAI AI模型淘汰
ChatGPT安全漏洞被曝光：无需点击即可盗用户数据！

据媒体报道，近日，OpenAI旗下连接器（Connectors）被曝存在安全漏洞。据悉，用户无需点击，攻击者就能从ChatGPT连接的第三方应用窃取敏感数据，甚至窃取API密钥。

OpenAI安全漏洞 ChatGPT数据泄露零点击攻击
云原生API安全获认可，绿盟科技入选 Gartner®《Hype Cycle™ for APIs, 2025》

近日，Gartner发布《Hype Cycle™ for APIs，2025》报告，绿盟科技凭借云原生API安全方案入选API威胁防护领域代表厂商。该方案针对云原生环境下的API全流量防护，适配容器化、微服务架构等特性，解决东西向流量防护难题，已在金融行业试点应用，帮助用户构建稳定可靠的云原生API安全防护体系，保障核心业务数据机密性、完整性与可用性。

API安全云原生绿盟科技

今日大家都在搜的词：

热文

3 天
7天

OpenAI发布旗舰大模型GPT-4o：免费试用价格五折速度提高一倍

哪里找最新AI工具官网？如何快速对比ChatGPT替代品？AI工具导航指南 - AIbase

荐AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发布全新语音模型GPT-Realtime

ChatGPT语音模式增添新功能：可调语速支持0.5到2.0倍速

健合旗下Swisse PLUS携手TEDx举办抗衰沙龙，发布NAD+新生瓶系列

OpenAI CEO：GPT-6将具备个性化记忆记住用户偏好习惯

ChatGPT 5更新：三种模式可选 4o重新回归

OpenAI的开源模型现已在IBM watsonx.ai上提供

GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

ChatGPT安全漏洞被曝光：无需点击即可盗用户数据！

云原生API安全获认可，绿盟科技入选 Gartner®《Hype Cycle™ for APIs, 2025》

今日大家都在搜的词：

热文

华为MatePad Mini官宣9月4日发布

今日七夕节微信 520 元大额红包限时上线

史上最大Mate！华为智慧屏MateTV将于9月4日发布

AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发

华为上半年营收4270亿元同比增长3.95%：净利润371.95亿元

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

迷你LABUBU开售后卖爆多平台已售罄：电商平台销量破百万

小米回应升级Beta后手机很烫：系统编译致短期功耗增加

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

今日七夕节微信 520 元大额红包限时上线

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

何小鹏回应小鹏命名：称有人说小鹏改名销量翻倍

站长商机

OpenAI发布旗舰大模型GPT-4o：免费试用 价格五折速度提高一倍

今日大家都在搜的词：

热文

站长商机

OpenAI发布旗舰大模型GPT-4o：免费试用价格五折速度提高一倍