首页 > 业界 > 关键词  > GPT-4o最新资讯  > 正文

GPT-4o被全球网友玩坏了 谷歌:终究是错付了!

2024-05-16 11:57 · 稿源:站长之家

站长之家(ChinaZ.com)5月16日 消息:在社交软件上,OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入,并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。GPT-4o的免费特性更是让其成为了互联网上的新宠。

在5月14日的官方演示中,GPT-4o展现出了令人印象深刻的性能,其响应音频输入的速度甚至与人类相媲美。网友们已经迫不及待地开始尝试这款AI的多种功能,从生成图表和统计分析到创建3D模型的STL文件,GPT-4o都能在极短的时间内完成。

GPT-4o的应用场景多种多样,网友们的创意层出不穷。例如,有网友使用GPT-4o解答了著名的“爱因斯坦谜题”,展示了其强大的逻辑推理能力。此外,还有网友利用GPT-4o开发了自动选股器,将复杂的选股指标自动改写成选股器,并输出图表和数据归档,极大地提高了效率。

GPT-4o的纸质原型转录功能也受到了网友的好评。有网友尝试将手写的原型转录为电脑内的初始HTML,GPT-4o不仅准确地完成了任务,还保持了数据结构变化时的HTML更新。此外,GPT-4o的OCR(光学字符识别)能力也得到了认可,它能够识别并吐出连人类都难以辨认的图像中的内容。

image.png

以下是GPT-4o的一些亮点功能:

  • 多模态输入输出:GPT-4o能够接受文字、音频、图像的任意组合作为输入,并生成相应的文字、音频、图像输出。

  • 逻辑能力测试:GPT-4o成功解答了被称为“爱因斯坦谜题”的逻辑题,展示了其出色的逻辑推理能力。

  • 自动选股器:尽管OpenAI表明GPT不能用于选股,但网友使用GPT-4o创建了一个自动选股器,并能输出图表和数据归档。

  • 纸质原型转录:网友利用GPT-4o将纸质原型转录为电脑内的初始HTML,大大节省了开发时间。

  • OCR能力:GPT-4o展现了其强大的光学字符识别(OCR)能力,能够识别复杂图像中的文字。

4ee917337ff15f4f8b63a61a60ee5fea.png

图片来自推特博主:JerLin

在GPT-4o发布的同时,谷歌也推出了自己的大模型产品Project Astra。尽管Project Astra同样具备强大的功能,但有专家指出,谷歌的产品在多模态输出方面仍有待提高。虽然OpenAI和谷歌都先后推出重磅产品,但这波比拼,谷歌可以说是一点好处都没捞着,直接被OpenAI“艳压”了。

与此同时,马斯克旗下的xAI公司推出的Grok模型在某些测试中表现超过了GPT-4o,比如它正确回答了Ilya离开公司的问题。而OpenAI自己的大模型未能提供正确响应。

举报

  • 相关推荐
  • Qwen用开源逆袭GPT的故事,千问APP要再干一遍

    Qwen模型逆袭GPT的策略,阿里准备再用一次。 2018年,OpenAI发布了自己的第一个模型GPT1,占据了技术先机,随后变得越来越封闭。在大洋彼岸,阿里几乎同一时间着手大模型研究,到2023年推出“通义千问”时,则选择了一条完全不同的路径:直接开源模型,允许开发者免费使用、改进和集成。 这个策略让Qwen逐步积累起规模,做到了如今全球开发者基于它发布了17万个衍生模型�

  • OpenAI发布GPT-5.1:情商大涨 本周开始推送

    OpenAI正式推出GPT-5.1模型,以“智商与情商深度融合”为核心亮点。新模型优化推理能力,强化情绪价值与个性化交互,包含Instant与Thinking两大核心版本:Instant首次引入自适应推理功能,针对复杂任务延长思考时间,简单问题保持极速响应;Thinking版本智能分配思考时长,提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型,支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度,防范拟人化风险。付费用户可保留旧版三个月过渡期。

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • 50人团队、1亿美元ARR,AI PPT还在续写“神话”?

    AI 生成 PPT 可以说是去年的热门赛道,尤记得关于这类产品是否具有真正竞争力的热烈讨论,而2025年9月份的数据显示,赛道头部的明星创企 Gamma 却已经默默接近3000万的访问量。并且,今天官宣了由 a16z 领投的6800万美元 B 轮融资,融资后估值达到21亿美元。 而不仅 Gamma,根据 AI 产品榜数据,9月份,AIPPT 赛道的 Top3产品流量平均涨幅30%+,更有一款

  • 智检加速:AI云测试如何为香港企业 IT 项目减负40%人力成本

    香港企业在App研发中面临高昂人力成本与复杂技术栈挑战,导致测试效率低、交付缓慢。Testin云测通过AI驱动的自动化测试方案,整合云端资源与专业服务,实现降本增效:硬件投入优化50%,人力成本降低40%;AI脚本生成技术提升测试效率60%,支持跨平台复用;精准OCR识别助力迭代周期缩短50%。聚焦金融、政企、交通等重点行业,提供符合国际标准的安全测试保障,助力企业从人力密集型向技术密集型转型,以更高质量、更快速度赢得市场竞争。

  • 第49家零售店来了!苹果北京大兴Apple Store官宣12月6日开业

    今日,苹果宣布,北京荟聚Apple Store将于12月6日上午10:00开业。 新店位于北京市大兴区欣宁街15号北京荟聚一层,是苹果在北京的第6家、中国大陆第49家零售店。

  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • TME们的黄金时代,迎来AI终结者

    过去十年,中国与全球的音乐流媒体平台都在同一套逻辑下运行:依赖庞大的版权曲库、依赖订阅制、依赖“以版权为护城河”的内容供给方式,稳稳地坐在产业链的中心位置。 无论是 TME,还是网易云,平台之间的竞争从本质上都不是产品之争,而是版权之争——谁拥有更完整的曲库、谁能锁定更多独家资源,谁就拥有更牢固的用户粘性。 然而,随着AI音乐过去一年里爆发式

今日大家都在搜的词: