首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI或将推出多模态模型GPT-Vision和Gobi,与谷歌Gemini竞争

2023-09-20 11:42 · 稿源:站长之家

文章概要:

OpenAI 正准备推出 GPT-4的图像理解,这是一种名为“GPT-Vision”的多模态功能,以使该模型得到更广泛的应用,以与谷歌计划的 Gemini 多模态 AI 模型竞争。

此功能可以为 GPT-4启用新的基于图像的应用程序,例如生成与图像匹配的文本。

OpenAI 还在开发一种新的 AI 模型,代号为“Gobi”,该模型从一开始就被设计为多模式,并有可能成为 GPT-5。

站长之家(ChinaZ.com) 9月20日 消息:谷歌即将发布 Gemini,这是一种多模态语言模型,可能会挑战 OpenAI 的 GPT-4的领导地位。

但据报道 OpenAI 正在准备做出适当的回应,该公司计划通过引入名为“GPT-Vision”的图像理解功能来应对Gemini的竞争。

据《The Information》报道,GPT-4的图像理解功能将被命名为“GPT-Vision”。这一多模态功能最初是在GPT-4发布会上介绍的,并成为了演示的焦点之一。GPT-4展示了基于网页绘图生成网页代码的能力,但一般用户尚无法获得这一图像理解功能。据称,主要是OpenAI担心该功能可能被滥用,例如用于面部识别等用途,因此对其进行了限制。

OpenAI,ChatGPT,人工智能,AI

GPT-Vision的推出将使GPT-4具备更广泛的图像应用能力,例如生成与图像内容相关的文本。这将为用户提供更多创造性的应用可能性,也能够满足多样化的需求。

另外,还有传闻称OpenAI正在开发DALL-E3,并有可能将其集成到GPT-4中。与GPT-Vision的发布相结合,这意味着OpenAI正不断拓展GPT-4的功能,尤其是在图像处理领域。DALL-E3生成的第一批图像据称已经取得了显著的进步,这将进一步提升GPT-4的吸引力。

OpenAI计划在11月6日举行的OpenAI一日开发者大会上宣布GPT-4的新功能。尽管OpenAI首席执行官Sam Altman没有透露太多细节,但他表示将会有“伟大的东西”,这引发了广泛的期待。

The Information还报道称,OpenAI 还在考虑一种新的 AI 模型,代号为“Gobi”,该模型从一开始就被设计为多模态。Gobi的训练还没有开始,有机会成为GPT-5。

举报

  • 相关推荐
  • 迭代大幅放缓!苹果新款Vision Pro被曝最快2028年推出

    知名爆料人古尔曼透露,苹果下一代Vision Pro头显预计最快推迟至2028年发布,产品更新周期大幅拉长,现有机型将在较长时间内维持现状。 消息称,苹果目前的研发重心已全面转移,优先推进AI智能吊坠、支持摄像功能的AirPods两款新品,同时秘密研发AR智能眼镜,高端混合现实头显的迭代工作暂时被搁置。 尽管新款产品迟迟未能更新,苹果官方承诺将持续为在售的Vision Pro提�

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • AI日报:豆包披露付费订阅方案;OpenAI发布GPT-5.5Instant;苹果手机支持第三方AI模型

    今日AI领域动态:豆包推出月费68-500元三档付费订阅,推进商业化;OpenAI发布GPT-5.5 Instant,取代5.3成为ChatGPT默认模型;苹果iOS 27或支持第三方AI模型,打破封闭生态;淘宝“答题免单”上线,首次加入AI试穿玩法;魔形智能完成数亿元Pre-A轮融资,布局Token基础设施;谷歌神秘项目“Remy”曝光,打造24小时AI助教;谷歌推出Gemini Ultra Lite新订阅服务,填补中高端市场空白;ChatGPT上线广告主平台,AI商业化迎来分水岭。

  • 人声接近真人!OpenAI一口气更新三款超强语音AI

    OpenAI正式宣布对其实时API接口进行重大升级,一次性推出三款全新高阶语音智能模型,全面强化AI在实时听觉、口语交互、翻译与转录方面的能力,并大幅降低企业开发智能语音应用的技术门槛。 本次更新的核心产品包括:GPT-Realtime-2、实时翻译模型以及实时转写模型。其中,GPT-Realtime-2搭载了GPT-5级别的推理能力,人声仿真度进一步提升。 相比前代产品,它能够更精准地理�

  • AI新王诞生!Anthropic估值冲爆1.2万亿 首次反超OpenAI

    长期笼罩在OpenAI阴影下的二号选手”Anthropic,近期在链上Pre-IPO市场的隐含估值骤然飙升至1.2万亿美元(约合人民币8.7万亿元)。 若Anthropic以这一估值顺利完成首次公开募股,它将直接跃升为全球第11大上市公司,缔造商业史上的新神话。 最新链上Pre-IPO交易数据显示,短短七天内,Anthropic估值暴涨20%,单周涨幅已相当于一家头部上市公司的体量。而自2025年10月以来,其估值曲

  • AI日报:OpenAI发布三款实时语音模型;苹果首款AI硬件曝光;美团入局AI社交赛道

    今日AI热点:OpenAI发布三款实时语音模型,覆盖推理对话、翻译和转录场景;苹果首款AI硬件AirPods进入DVT阶段,内置摄像头;宇树科技UniStore平台开放,开启人形机器人应用商店时代;阶跃星辰完成25亿美元融资,冲刺香港IPO;美团推出首个数字生命共生社区“鲸游”公测;OpenAI推出GPT-5.5-Cyber预览版,专攻网络安全;Mozilla借助AI发现Firefox 271个安全漏洞;OpenAI发布Codex Chrome扩展,优化浏览器工作流。

  • 小米Vision GT合金车模开售 售价199元

    今日上午10点,小米官方正式上架开售了一款备受瞩目的新品——小米Vision GT合金车模,定价亲民,仅为199元,将概念超跑的魅力浓缩于掌心之中。 这款车模严格遵循实车1:43的比例进行复刻,精准捕捉了Vision GT“由风塑形”的独特设计理念,将其精髓完美呈现。从侧面观赏,水滴形座舱与镂空车身结构精致入微,车身线条经拆件还原后显得干净利落,尽显未来超跑之风范。

  • 专为游戏造的超跑!小米Vision GT登场:仿真测试气动效率高达4.1

    今日,2026北京国际汽车展览会开幕,小米首款概念超跑Vision GT实车在车展亮相。 小米推出的Vision Gran Turismo(Vision GT)纯电概念超跑,是小米受邀参与经典赛车游戏《Gran Turismo》Vision Gran Turismo 项目打造的车型,也是该项目历史上首个中国品牌概念车。根据官方公布的仿真测试数据,其风阻系数Cd为0.29,可产生1.2吨下压力,空气动力学效率达4.1。 该车还采用了创新的反升力体

  • OpenAI正式发布GPT-5.5:运算速度更快 Token成本大降

    OpenAI正式发布新一代大语言模型GPT-5.5,公司称该模型是其迄今为止智能程度最高、使用体验最为直观的版本。 OpenAI联合创始人兼总裁格雷格布罗克曼表示:相比GPT-5.4,GPT-5.5运算速度更快、逻辑更精准,且消耗的词元(Token)更少。让企业和普通用户都能用上更前沿的 AI 能力,正是我们的目标之一。” 据介绍,GPT-5.5适用场景广泛,既涵盖智能体编程、知识处理等企业级基础

  • OpenAI憋不住了要造手机!背后原因曝光:不想再给苹果谷歌白打工

    估值超8000亿元的AI大模型巨头OpenAI计划自研AI手机,预计2028年量产,由立讯精密制造,正与联发科、高通合作研发处理器。 消息一出,立讯精密股价大涨超9%,创历史新高。 OpenAI CEO奥尔特曼也表示,当前需重新思考操作系统与界面设计,打造适配智能体的互联网协议。 为何大模型企业纷纷下场造机?核心原因直指不想再被苹果、谷歌卡脖子”。 首先,摆脱第三方终端依赖

今日大家都在搜的词: