**OpenAI 推出 GPT-4o,引领多模态模型的新时代**
在 OpenAI 备受期待的发布会上,全新升级的 GPT-4o 正式亮相,其名称中的 "o" 代表 "omni",意为 "全能",旨在突破语言理解的界限。
GPT-4o 拥有卓越的能力,能够同时处理音频、视觉和文本信息,熟练掌握超过 50 种语言,并大幅提升推理速度和准确性。
在语音交互方面,GPT-4o 实现质的飞跃,反应时间仅为 232 毫秒,打破了传统语音助手的限制,能够实时打断和响应,媲美人类自然的对话节奏。
此外,GPT-4o 具备强大的多模态处理能力,可同时接受文本、音频和图像输入,输出任意组合的文本、音频和图像,实现人机交互的全面升级。
值得一提的是,GPT-4o 将向免费用户开放,但数量有限。为了满足更多用户的需求,OpenAI 还推出了相应 API,价格仅为 GPT-4-turbo 的一半,但速度却提升了两倍,速率限制也提高了五倍。
GPT-4o 的发布标志着多模态模型发展的新里程碑,其强大的能力将推动人工智能在各个领域的应用。官方表示,GPT-4o 将在未来几周内陆续开放使用。
此外,OpenAI 还推出了 ChatGPT 的桌面版应用,目前仅适用于 MacOS,Windows 版本稍后将发布。
(举报)