首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI发布GPT-4o:可免费开放使用 语音对话媲美真人

2024-05-14 08:17 · 稿源: 快科技

**OpenAI 推出 GPT-4o,引领多模态模型的新时代**

在 OpenAI 备受期待的发布会上,全新升级的 GPT-4o 正式亮相,其名称中的 "o" 代表 "omni",意为 "全能",旨在突破语言理解的界限。

GPT-4o 拥有卓越的能力,能够同时处理音频、视觉和文本信息,熟练掌握超过 50 种语言,并大幅提升推理速度和准确性。

在语音交互方面,GPT-4o 实现质的飞跃,反应时间仅为 232 毫秒,打破了传统语音助手的限制,能够实时打断和响应,媲美人类自然的对话节奏。

此外,GPT-4o 具备强大的多模态处理能力,可同时接受文本、音频和图像输入,输出任意组合的文本、音频和图像,实现人机交互的全面升级。

值得一提的是,GPT-4o 将向免费用户开放,但数量有限。为了满足更多用户的需求,OpenAI 还推出了相应 API,价格仅为 GPT-4-turbo 的一半,但速度却提升了两倍,速率限制也提高了五倍。

GPT-4o 的发布标志着多模态模型发展的新里程碑,其强大的能力将推动人工智能在各个领域的应用。官方表示,GPT-4o 将在未来几周内陆续开放使用。

此外,OpenAI 还推出了 ChatGPT 的桌面版应用,目前仅适用于 MacOS,Windows 版本稍后将发布。

举报

  • 相关推荐
  • 马斯克:Grok 5模型有望实现通用人工智能的突破

    马斯克旗下xAI公司正研发Grok 5模型,有望实现通用人工智能(AGI)重大突破。该模型采用全新架构设计,预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃,被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

  • 每日互动参与发起《人工智能安全行业自律倡议》 守护人工智能产业可持续发展

    9月17日,2025年国家网络安全宣传周人工智能安全治理分论坛在昆明召开,会上正式发布《人工智能安全行业自律倡议》。该倡议由中国网络空间安全协会联合多家科研院所、互联网头部企业、网络安全厂商及人工智能企业共同发起,提出筑牢安全根基、强化技管结合、深化协同共治等七方面共识,旨在推动构建可控、可信、可靠的人工智能产业生态,为全球人工智能治理贡献中国智慧。

  • 市值一日暴增近3000亿港元,阿里迈向超级人工智能之路

    9月24日,阿里巴巴股价创下四年新高,单日涨超9%,市值达到约3.32万亿港元,一日增加近3000亿港元。 引爆股价的,是阿里集团每年一度的云栖大会。在会上,阿里释放多条重磅消息,尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后,阿里的股价表现就出现了明显的拉升。

  • 十方融海:以开源生态为基,绘就“人工智能 +”产业融合新蓝图

    国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI技术与产业深度融合。深圳企业十方融海凭借AI大模型研发、产品创新及开源生态构建等领域的卓越实践,成为行业先锋。其开源模型如OpenBuddy、小智AI等突破传统技术局限,实现多模态交互与跨领域知识融合,覆盖教育、办公、养老、文体等多元场景。通过开放共享模式,十方融海有效降低AI应用门槛,激发行业创新活力,助力我国人工智能产业迈向新征程。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • 人机共生 · 智启未来——2025高交会亚洲人工智能与机器人产业链展主题发布

    2025高交会机器人展以“人机共生·智启未来”为主题,聚焦人工智能与机器人产业的爆发式发展。展会覆盖工业制造、医疗康复、公共服务等全产业链,汇聚宇树科技、优必选、赛博格等顶尖企业,展示人形机器人、仿生机器人及核心零部件最新成果。机器人正从工具转变为人类伙伴,推动新质生产力发展,开启人机协作新篇章。

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 普适性覆盖人工智能典型场景 寒武纪产品技术优势凸显

    中科寒武纪科技预计2025年全年实现营业收入50亿至70亿元。公司已全面掌握智能芯片及基础系统软件研发核心技术,截至2025年6月30日,累计获授权专利1599项。2025年上半年,公司实现营业收入28.81亿元,同比增长4347.82%,净利润扭亏为盈。寒武纪持续优化智能处理器微架构及指令集,新一代产品将提升编程灵活性、易用性、性能及能效。高盛维持对公司的积极看法,上调12个月目标价至2104元,并调高2030年预期EBITDA及企业价值倍数。

  • 祝贺!诺云荣登“人工智能+”新质生产力领航企业百强!

    2025年9月8日,国务院发布人工智能发展指导意见后,诺云凭借AI营销创新实践入选“人工智能+新质生产力百强榜单”,成为河南唯一入选企业。作为数字化营销技术服务商,诺云提供企业直播SaaS系统与私域运营工具,覆盖电商直播、企业培训等全场景需求。已服务超20万家企业,覆盖3亿用户,拓展至零售、教育等150多个行业,客户包括携程、华为等头部机构。诺云将持续深化AI技术应用,激发新质生产力潜能。

今日大家都在搜的词: