首页 > 业界 > 关键词  > GPT-4o最新资讯  > 正文

外媒如何报道GPT-4o,有没有“炸裂”?

2024-05-15 17:31 · 稿源: 三言Pro公众号

声明:本文来自于微信公众号 三言Pro(微信号:sycaijing),作者:DorAemon,授权站长之家转载发布。

今日凌晨,OpenAI宣布推出GPT-4o。该模型是GPT-4型号的更新版本,将向免费客户开放。

据介绍,GPT-4o(“o”代表“omni”)。它可以实现文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。且有诸多惊艳应用:

这确实是一项很棒的更新升级,推动了人工智能技术进一步发展。

但是,今天笔者想说的并不是ChatGPT-4o有多厉害,而是部分国内自媒体/媒体和国外媒体对此事报道上的态度差异。

图片

网友拼图

是的,你没猜错,ChatGPT-4o一发布,各个自媒体、朋友圈再次“炸裂!震撼!颠覆世界!”了。

每次一出什么新技术,朋友圈、平台上就充斥着各种“xxx颠覆世界、炸裂、重磅”的骇人标题,但过不了多久一切又归于平静,仿佛什么都没发生过。

那么,这次ChatGPT-4o是不是那么“炸裂”、外媒报道此事又是什么样的态度呢?

外媒:中性介绍为主,标题无"炸裂"

图片

图片

既然ChatGPT-4o是美国公司推出的产品,就先来看看外媒态度。

说实话,笔者翻了很多页外媒新闻,只感觉俩字:无聊。

因为绝大多数外媒,对ChatGPT-4o的标题都很中性,没有"amazing"等主观词汇,只是正常表达OpenAI今天推出了新版本。

图片

再来看外媒报道的内容,笔者查看了数十篇发现, 所有外媒针对ChatGPT-4o的报道内容,都是客观描述这款大模型的性能、作用,也没有提及“如何颠覆世界”这种论调。

国内互联网:炸裂、颠覆世界、王炸……

图片

再来看国内媒体对GPT-4o的报道标题,动不动就是“改写历史、世界上最强大的、重磅发布、OpenAI的一小步、人类AI助理的一大步、全才、颠覆世界、深夜炸场、王炸、彻底改变人类”的描述。

在内容方面,这些标题耸人听闻的文章中,其实也都是单纯介绍ChatGPT-4o的能力,能够实现什么样的功能。

但刨根问底,到底怎么就“炸裂、颠覆世界……”了,并没有相关描述。

但同样是这些媒体,介绍国内大模型的文章中,几乎很少看到标题“震惊体”,内容严肃的多,和介绍OpenAI产品态度有明显区别。

SORA发布后同样“炸裂”

图片

图片

之前OpenAI推出的文生视频大模型SORA也是一样,在国内互联网上就是“爆火、炸裂、干翻抖音们”;但是在外媒标题中,就各种“平平无奇”,鲜有情绪化表达。

如果只看国内互联网内容,SORA也好,ChatGPT-4o也好,仿佛一瞬间我们的生活就被彻底改变,然而,事实是还没等SORA干翻抖音们,其就被爆出存在人工特效

所以,被国内自媒体吹上天的ChatGPT-4o,真的很“炸裂”吗?

关注度并没有很高

今天,金沙江创业投资基金主管合伙人朱啸虎评价称,大模型技术迭代曲线明显放缓;开始卷免费,说明GPT用户和收入增长已经碰到瓶颈,不深度绑定大厂的模型公司基本已经出局。第三,应用会迅速爆发,推理成本再降一个数量级就会普及出现AI时代的国民应用。

出门问问创始人兼CEO李志飞今日发文表示:“人机交互这个渣男,因为GPT-4o的出现,有望真的重新做人,开启下一波的科技、应用、和商业模式的革命,期待下一个十年。”

这两位的评价,仔细品的话,也没有“炸裂感”。

此外,还有件令笔者觉得有意思的是,今天在看网友对ChatGPT-4o的观点时发现,竟然关注度并没有想象的那么高,至少远没有到“炸裂”程度。

图片

图片

图片

图片

图片

图片

很多博主发文介绍ChatGPT-4o体验很好很厉害,但是评论量却寥寥无几;还有网友更是调侃“改变世界几次了”,看来不止一人和笔者同感。

图片

图片

图片

图片

这种热度退却是明显能够对比出来的,前不久SORA问世时,跟AI有关的话题、博文下,讨论量都非常大,热度大大超过ChatGPT-4o。

GPT-4o真的颠覆世界,是王炸吗?

客观地说,GPT-4o功能更丰富、性能更强大不假。

图片

图片

比如它可以辅助孩子写作业;

图片

帮助盲人打车等;但要说是所谓“颠覆世界、炸裂、改变人类”这种程度,有些为时尚早。

AI技术尚在发展当中,纵使其已经取得了令人眼前一亮的成绩,能够提高部分人群的生产力水平,但要到彻底改变世界、改变一切的时代,还需时间发展。

如同电灯被发明出来时,并不是立刻就推动人类进入电力工业时代,也需要不断改进、普及,才能应用。

而国内媒体动辄“炸裂、颠覆世界”的标题,有“标题党”的成分,是追求点击、阅读量的结果。

回顾这几年互联网科技圈的类似事件,从区块链、到元宇宙、到大模型,每次都无一例外的宣传“大变革”来临,但实际上我们的生活并没那么快改变吧?

从技术上来讲,一位深度AI用户向笔者表示,GPT-4o算不上炸裂或颠覆,因为谷歌的Gemini也有相关功能,且文档、音频、图片、视频分析也很强大,当然4o这次的推理能力比以前强很多。

还有一位朋友谈炸裂的标准,一是引发不同领域关注讨论,二是关注点上超乎常规印象或原有边界。4o的发布,其实仍然是对多模态的分析能力,表现在输入和输出的响应速度更快,接近人类,很难说突破了原有边界。

主要是炸裂频次太高,并没有贬低相关媒体的意思,他们还是很专业的。也很敬业,凌晨1点开始守着发布会,通宵写稿子,很拼。当你早上醒来的时候,他们的图文、视频已经赶出来了。

当然,每个人对炸裂有不同的理解,没有对错。如果有个等级,"惊艳->炸裂->颠覆"三个词的顺序会不会更合理?

几个小时后的凌晨,谷歌也将举办开发者大会,AI也是重点,你觉得还会炸裂吗?

举报

  • 相关推荐
  • 大家在看
  • I2VEdit:一种基于图像到视频扩散模型的视频编辑技术

    I2VEdit是一种创新的视频编辑技术,通过预训练的图像到视频模型,将单一帧的编辑扩展到整个视频。这项技术能够适应性地保持源视频的视觉和运动完整性,并有效处理全局编辑、局部编辑以及适度的形状变化,这是现有方法所不能实现的。I2VEdit的核心包括两个主要过程:粗略运动提取和外观细化,通过粗粒度注意力匹配进行精确调整。此外,还引入了跳过间隔策略,以减轻多个视频片段自动回归生成过程中的质量下降。实验结果表明,I2VEdit在细粒度视频编辑方面的优越性能,证明了其能够产生高质量、时间一致的输出。

  • Samba-1 Turbo:高效能的AI模型选择与应用平台

    Samba-1 Turbo是一个提供AI模型选择和应用的平台,它允许开发者通过免费的开发者推理服务来试用、比较和评估Samba-1中各种专家模型。此外,平台还提供一些构建在Samba-1之上的演示业务应用程序,以及开源语言专家SambaLingo。Samba-1 Turbo旨在为开发者提供强大的工具,以简化AI模型的集成和应用过程。

  • StreamV2V:实时视频到视频翻译的扩散模型

    StreamV2V是一个扩散模型,它通过用户提示实现了实时的视频到视频(V2V)翻译。与传统的批处理方法不同,StreamV2V采用流式处理方式,能够处理无限帧的视频。它的核心是维护一个特征库,该库存储了过去帧的信息。对于新进来的帧,StreamV2V通过扩展自注意力和直接特征融合技术,将相似的过去特征直接融合到输出中。特征库通过合并存储的和新的特征不断更新,保持紧凑且信息丰富。StreamV2V以其适应性和效率脱颖而出,无需微调即可与图像扩散模型无缝集成。

  • OpenCompass 2.0 Large Language Model Leaderboard:大型语言模型排行榜,实时评估模型性能。

    OpenCompass 2.0是一个专注于大型语言模型性能评估的平台。它使用多个闭源数据集进行多维度评估,为模型提供整体平均分和专业技能分数。该平台通过实时更新排行榜,帮助开发者和研究人员了解不同模型在语言、知识、推理、数学和编程等方面的性能表现。

  • 甲骨文AI协同平台:数字化甲骨文研究与共享平台

    甲骨文AI协同平台是一个专注于甲骨文研究的数字化平台,集成了甲骨文全信息著录库、甲骨文总字表、数字工具箱等资源,通过AI技术辅助甲骨文的释读、研究和教育传播。平台汇聚了众多博物馆、专家学者以及社会各界人士的共同努力,旨在推动甲骨文研究的深入发展和甲骨文化的传承。

  • Cantor:创新的多模态链式思维框架,提升视觉推理能力

    Cantor是一个多模态链式思维(CoT)框架,它通过感知决策架构,将视觉上下文获取与逻辑推理相结合,解决复杂的视觉推理任务。Cantor首先作为一个决策生成器,整合视觉输入来分析图像和问题,确保与实际情境更紧密的对齐。此外,Cantor利用大型语言模型(MLLMs)的高级认知功能,作为多面专家,推导出更高层次的信息,增强CoT生成过程。Cantor在两个复杂的视觉推理数据集上进行了广泛的实验,证明了所提出框架的有效性,无需微调或真实理由,就显著提高了多模态CoT性能。

  • SuperCLUE:领先的AI评测基准,衡量和比较AI模型性能。

    SuperCLUE是一个用于评估和比较大型语言模型性能的在线平台。它提供了多种任务和排行榜,旨在为AI研究者和开发者提供一个标准化的测试环境。SuperCLUE支持各种AI应用场景,包括数学推理、代码生成、超长文本处理等,能够帮助用户准确评估模型在不同任务上的表现和能力。

  • Berkeley Function-Calling Leaderboard:评估大型语言模型调用函数能力的排行榜

    Berkeley Function-Calling Leaderboard(伯克利函数调用排行榜)是一个专门用来评估大型语言模型(LLMs)准确调用函数(或工具)能力的在线平台。该排行榜基于真实世界数据,定期更新,提供了一个衡量和比较不同模型在特定编程任务上表现的基准。它对于开发者、研究人员以及对AI编程能力有兴趣的用户来说是一个宝贵的资源。

  • OpenAI & other LLM API Pricing Calculator:AI项目成本计算器,比较不同AI模型的成本。

    OpenAI和其他大型语言模型(LLM)API的成本计算器,帮助企业和开发者评估和比较不同AI模型在项目中的成本。该工具提供了包括OpenAI、Azure、Anthropic、Llama 3、Google Gemini、Mistral和Cohere等在内的多个模型的价格计算。它基于输入的token数、输出的token数和API调用次数来计算成本。

  • Clay Filter AI:将您的角色照片转换成粘土动画风格的图像

    粘土 AI 是一款 AI 工具,可以将照片转换成粘土动画风格的图像。通过分析面部特征,生成逼真的效果,提供灵活的编辑功能。价格定位为免费使用。使用比较简单,上传你的照片并提交,稍等10-20 秒可以获得粘土动画风格的图像。

  • TopMixLabs:在线AI视频动画生成工具

    TopMixLabs 是一个 AI 动画制作工具,通过上传图片,用户可以轻松地将图像转换为专业级动画,适用于各种规模的企业,提升品牌形象。使用简单,只需要4张照片,上传稍等10 -20分钟左右,即可以生成高质量的动画,生成的动画支持下载mp4格式,而且在平台上创建的动画用于个人和商业目的。

  • StartKit.AI:快速搭建AI创业项目

    StartKit.AI是一个旨在帮助开发者快速构建AI项目的在线平台。它提供了一个包含所有所需功能来发布SaaS产品的AI样板,无需AI经验即可使用。该平台由James和Danielle开发,他们拥有超过10年的SaaS产品开发经验,并成功运营着AI产品Ellie。StartKit.AI集成了30多个模块和超过8000行代码,提供了先进的AI特性,如聊天、图像、文本、语音、翻译和内容审核等。此外,它还包括了OpenAI的所有功能,并支持创建自己的ChatGPT克隆体。产品定位于帮助开发者快速启动AI项目,保持技术领先,并支持通过Stripe进行产品变现。

  • Cressi:AI驱动的个性化购物助手

    Cressi是一个由AI驱动的个性化购物助手,旨在通过分析用户的搜索历史、兴趣、联系人和日历等信息,提供定制化的购物建议。Cressi不仅能够理解用户的偏好,而且能够随着用户生活方式的变化而不断进化,提供真正人性化的购物体验。Cressi致力于使购物更加个性化、高客户满意度,并减少浪费,以实现更有意义和可持续的购物方式。

  • Decks:一款专业的笔记应用,助你快速掌握任何学科

    Decks是一款专为学习设计的应用,它通过创新的笔记方式帮助用户更快地掌握知识。用户可以免费开始使用,并在14天后选择月度或年度订阅。Decks提供每月8美元或每年79美元的订阅选项。

  • AutoPilotI18n:AI驱动的国际化工具 简化i18n流程。

    AutoPilotI18n 是一款利用 AI 技术提供精确翻译的国际化工具,可自动化翻译任务,简化 i18n 流程。其主要优点在于精确翻译、多框架支持、高效工作流程,适用于 React、Vue、Angular 等。AutoPilotI18n 定价透明,提供免费和付费版本。

  • Docu Dig:AI驱动的智能文档搜索与洞察

    Docu Dig是一个利用尖端AI技术提供安全、高效的文档内容搜索和洞察的商业解决方案。它通过先进的加密技术保护数据安全,提供上下文智能搜索,与传统搜索方法相比,能够提供更准确的文档洞察,提高团队效率,并改善信息获取。此外,它还支持团队协作,允许团队成员在共享文档上协作,提高工作效率。适用于需要处理大量文档的行业,如法律、医疗和金融领域。

  • V-Express:生成受控于参考图像、音频和V-Kps序列的头像视频。

    V-Express是一个由腾讯AI实验室开发的头像视频生成模型,它通过一系列渐进式丢弃操作平衡不同的控制信号,使得生成的视频能够同时考虑姿态、输入图像和音频。该模型特别针对音频信号较弱的情况进行了优化,解决了在控制信号强度不同的情况下生成头像视频的挑战。

  • Frontly:无代码构建AI驱动的应用程序

    Frontly 是一个创新的平台,它允许用户通过简单的拖放操作和AI技术,无需编程知识即可创建功能强大的应用程序。它的主要优点在于快速开发、高度定制化和易于使用,非常适合初创公司、中型企业以及需要快速迭代和测试新想法的团队。

  • Roadway:为增长营销量身定制的分析和自动化平台

    Roadway是一个专注于增长营销的分析和自动化平台,旨在帮助企业快速、高效地扩大收入增长。它通过数据驱动的分析和洞察自动化,帮助企业专注于关键的增长指标和杠杆。Roadway提供了一个个性化的增长营销助手,使用AI技术进行自动化的指标和漏斗分析,并提供定制化的行动建议。此外,它还允许用户通过自助服务分析,快速创建仪表板、报告,并做出数据驱动的决策。Roadway的分析是仓库原生的,可以快速连接数据仓库中的基本表格,创建关键指标和增长杠杆的语义层。

  • Tykr:股票筛选和教育平台一体化,助您自信管理投资。

    Tykr是一个结合了股票筛选器和教育平台的应用程序,旨在帮助用户自信地管理自己的投资。自2020年以来,Tykr通过其产品、服务和教育帮助成千上万的投资者做出更好的投资决策。

今日大家都在搜的词: