首页 > 业界 > 关键词  > 正文

OpenAI多模态AI系统GPT-Vision即将推出 与谷歌Gemini竞争

2023-09-19 14:50 · 稿源:站长之家

站长之家(ChinaZ.com) 9月19日 消息:据The Information报道,知情人士透露,鉴于谷歌上周开始向部分企业测试其多模态大模型Gemini,OpenAI希望抢占先机,推出自己的多模态AI系统。

OpenAI在3月份推出语言模型GPT-4时曾预览了多模态功能,但至今仅向为盲人提供服务的Be My Eyes公司开放。六个月过后,OpenAI准备大范围推出这款名为GPT-Vision的多模态系统。

gpt-4,OpenAI,ChatGPT Plus,人工智能

OpenAI之所以耽搁这么长时间,主要是担心新功能可能被不法分子滥用,例如自动识别验证码冒充人类,或者面部识别跟踪他人。不过OpenAI工程师似乎已解决围绕这项新技术的法律顾虑。当询问谷歌采取了哪些措施防止Gemini被滥用时,谷歌发言人提到该公司在7月做出负责任AI开发的承诺。

在GPT-Vision之后,OpenAI可能推出更强大的多模态模型代号Gobi。不同于GPT-4,Gobi从一开始就是作为多模态模型进行训练,但此模型似乎还未开始训练。

OpenAI积极推进多模态AI的商业化,与谷歌Gemini形成直接竞争,这标志着多模态AI进入实质应用阶段。业内人士认为,图像生成等视觉能力将增强AI系统的商业价值,OpenAI的GPT-Vision具有与谷歌抗衡的实力。AI领域两大巨头互相竞争有利于行业技术进步,消费者也将从中受益。

举报

  • 相关推荐
  • 三星于 IFA 2025 推出 Vision AI 伴侣,开启 AI 驱动的显示新时代

    三星电子在IFA2025展会上推出Vision+AI伴侣,通过生成式AI技术赋能电视与显示器产品。该技术整合升级版Bixby语音助手,实现自然对话交互,提供个性化内容推荐和场景化智能服务。Vision+AI伴侣突破传统电视功能边界,支持多设备智能联动,覆盖影视、艺术、美食等多领域内容交互。该方案将于2023年9月下旬通过软件更新在韩国、北美及部分欧洲市场首发,后续逐步推广至全球。

  • 小度发布多模态智能摄像机,AI大模型重塑家庭看护体验

    小度科技推出首款多模态智能摄像机C800,搭载800万像素4K超清摄像头,支持AI大模型技术。该产品不仅能实现高清监控,还具备智能行为识别、语音交互等功能,可自定义看护提醒。结合视觉与语音交互,支持复杂语义查询和家庭设备联动,扩展智能家居应用场景。目前产品已全网发售,年底还将推出三摄版本,持续探索AI硬件创新。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • 小平板元年,华为MatePad Mini创出一片蓝海

    2012年,天才乔布斯去世一年后,接任苹果CEO的库克捧出了两款“很不乔布斯”的产品——大屏手机iPhone6和7英寸的iPad mini。 这两款差异化的产品形态,都是库克希望弥补的市场空白。比如,虽然乔布斯认为10英寸就是平板电脑尺寸的下限,更小的屏幕会让用户难以操控。但库克却觉得,小尺寸平板不仅在硬件配置上超越手机,它还具备易于携带的特点,将成为移动办公的利器�

  • 赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

    全球老龄化加速,大脑健康成为焦点。9月16日是中国脑健康日,9月21日是世界阿尔茨海默病日。数据显示,2020至2023年全球60岁以上人口增长40%,达14亿;中国60岁以上人口超3亿,占比22%。阿尔茨海默病带来的经济负担约占GDP的1.47%。科学界正探索维持大脑年轻态的机制,企业合作举办高峰论坛,专家分享前沿研究成果,强调40-60岁是干预黄金窗口期。复合维生素矿物质等营养干预手段显示认知改善潜力,未来需跨学科协作推动大脑抗衰研究普及。

  • 华为MatePad mini今日首销:3299元起

    今日上午10:08,华为年度旗舰平板MatePad Mini正式开启首销,起售价定为3299元。这款被誉为“大手机 小平板”的8.8英寸设备,凭借其独特定位与全能配置,成为今年平板市场中最受瞩目的新品之一。 MatePad Mini的最大亮点在于其突破性支持5G插卡功能,并内置听筒可实现通话,官方在发布会上直言其“手机平板二合一”的跨界属性。整机厚度仅5.1毫米,重量仅255克,轻薄设计便于

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型;迪士尼将起诉MiniMax

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、版权、开发工具等领域的快速演进与应用创新。

  • 自研遇阻!苹果考虑用谷歌Gemini升级Siri

    苹果正与谷歌就使用Gemini AI引擎为新一代Siri提供技术支持进行初步谈判,这一动向表明苹果可能进一步将人工智能能力外包,成为其AI战略的关键一步。 据知情人士透露,这家iPhone制造商近期已与Alphabet旗下谷歌接触,商讨合作构建一款定制化AI模型,以用于明年预计推出的新版本Siri。 谷歌目前已开始训练一款可在苹果服务器上运行的模型。苹果在生成式人工智能领域起步�

  • 领先行业不止一代!继UX后,海信再推RGB-Mini LED新品U7S Pro

    海信在2025年柏林消费电子展上全球首秀RGB-Mini LED电视U7S Pro,搭载全新“双芯”组合,实现100% BT.2020色域、100%色纯度及低蓝光护眼等优势。该产品覆盖75/85/100英寸三种规格,9月底量产上市。海信通过自研RGB-Mini LED发光芯片和信芯AI画质芯片H7,突破行业技术瓶颈,推动RGB-Mini LED从技术引领迈向全民共享,标志着全球显示正式进入RGB-Mini LED时代。

今日大家都在搜的词: