GPT-4o成全球网友新玩具，秒秒钟纸质原型转录初始HTML，网友：谷歌你是一点流量摊不上啊

2024-05-16 13:48 · 稿源：量子位公众号

声明:本文来自于微信公众号量子位（ID:QbitAI），作者:衡宇，授权站长之家转载发布。

好啊，不愧是OpenAI最新旗舰，打开各个社交软件，GPT-4o的上手测试都唰唰唰往我首页推。

请!看!

这，就是用上GPT-4o，花不到30s时间，通过单个prompt把一个电子表格中的内容生成了完整的图表和统计分析。

在过去，在Excel里做这玩意儿，不得花咱打工人好一阵子时间?

而下面这张图，是网友花了不到20s，用GPT-4o创建出的一张四腿桌子的3D模型的STL文件。

牛哇牛哇!

毕竟GPT-4o能力横跨听、说、看，主要是，它还免费啊!

就跟网友总结的一样，现在，每个用户都可以通过AI和简单的Prompt来生成非常了不起的东西。

不过，关于“如何生成复杂结构的东西”，还需要再摸索摸索。

一起来看，网友们都在怎么忘我地狂玩儿GPT-4o吧——

狂玩GPT-4o

在一年一度的谷歌 I/O 开发者大会前24小时，OpenAI突袭发布了GPT-4o。

“o”是Omni的缩写，意为“全能”。

敢起这么个名字，是因为GPT-4o接受文字、音频、图像的任意组合作为输入，并生成文字、音频、图像输出。

在5月14日的OpenAI官方演示中，用起来非常丝滑，甚至响应音频输入的速度赶上了人类。

抱着“我不信除非我试试”的态度，网友已经玩疯了。

爱因斯坦谜题

先声明，这个所谓的“爱因斯坦谜题”，很像咱小时候做的奥数题，是用来测试大模型逻辑能力的。

题目背景是这样的:

在一条街上，有五座房子，喷了五种颜色。每座房子里住着不同国籍的人。每个人喝不同的饮料，抽不同品牌的香烟，养不同的宠物。

提示:

（1）英国人住红色房子。

（2）瑞典人养狗。

（3）丹麦人喝茶。

（4）绿色房子在白色房子左面隔壁。

（5）绿色房子主人喝咖啡。

（6）抽Pall Mall香烟的人养鸟。

（7）黄色房子主人抽Dun Hill香烟。

（8）住在中间房子的人喝牛奶。

（9）挪威人住第一间房。

（10）抽 Blends香烟的人住在养猫的人隔壁。

（11）养马的人住抽Dun Hill香烟的人隔壁。

（12）抽 Blue Master的人喝啤酒。

（13）德国人抽 Prince香烟。

（14）挪威人住蓝色房子隔壁。

（15）抽 Blends香烟的人有一个喝水的邻居。

问题来了，谁养鱼?谁住蓝色房子?

前几天，网友在lmsys测试i-am-gpt2-bot（就是在大模型竞技场大杀特杀的神秘GPT-2）时，还没办法解答爱因斯坦谜题——而且也没有任何其他AI可以搞定这个问题。

但上手一试，GPT-4o光速回答对了。

大家可以自己动手测一下（手动狗头）。

自动选股器

前脚刚看到OpenAI说了，GPT不能用来选股，没有啥参考意义。

后脚就有网友在推特上发布了实现的GPT-4o自动选股器，并配文:强得可怕!

具体来说，他用GPT-4o实现了将两百多行选股指标自动改写成自动选股器、输出图表和数据归档。

图片来自推特博主：JerLin

而且只需1轮交互就能完成较为满意的效果，效率暴打GPT-4（哦?我揍前代我自己）

据他说，用GPT-4搞这玩意，需要反反复复修改，而且处理100行以上的代码非常低效。

对此，网友的评价非常精辟:

如果能100%预测那真的是完美!但如果预测不对那不如别预测……

纸质原型转录初始HTML

也有网友尝试利用GPT-4o，把写在纸上的原型转录为电脑内的初始HTML。

他白纸黑字是这么写的:

然后把这张图喂给了GPT-4o。

然后GPT-4o说:

然后就得到了:

网友本人对吐出的这个结果非常满意，他激动地在推特写下:

就像我们正在进行一场超越世界的对话，这真是Soooooo Cool～

不止他一个，另外有网友在Hacker News上表示，自己也能用GPT各个版本将原始动态数据动态转换为漂亮的HTML布局。

这样来制作低流量页面，如更改/审核日志，能节省大量的开发时间，还能在数据结构发生变化时保持HTML更新。

不过尝试并不是回回奏效，因为GPT-4-Turbo有时几乎完全忽略了上下文和说明。

OCR

不过，有网友表示对GPT-4o的OCR能力也有点牛气在身上的

事情是这样的，他扔给了GPT-4o一张这个图。

怎么说呢，确实密密麻麻，公司Logo又有图像又有文字，人类肉眼看都有点吃力。

GPT-4o的结果把测试者本人惊到了，他说:“它不断吐出连人类都难以识别的图中的内容。”

围观网友纷纷跟帖留言，不外乎是“将来，使用它的人和不使用它的人之间的工作似乎会有很大的区别”“如果您跟不上先进技术，您就会落后”之类的话。

拳打Google，但被马斯克脚踢?

OpenAI出手再次惊艳世界，谷歌果然坐不住了。

在今日凌晨的发布会上，谷歌带来了Project Astra，它家的最新大模型产品。

和GPT-4o一样，Project Astra能写会听会看会说，也能几乎没有延迟地和人类畅快交流。

不过英伟达科学家Jim Fan老师率先出来点评了一番:

首先，谷歌看起来似乎是多模态输入，但不是多模态输出。

谷歌旗下的图像生成模型Imagen-3以及音乐生成模型仍然作为独立组件，没有融合到当中去。

他提到自己的观点，那就是融合所有模态于一体是不可避免的未来趋势，当然了，还有一些他认为不可缺失的细节，具体如下。

启用诸如“使用更机械化的声音”“说话速度加快2倍”“迭代编辑此图像”和“生成一致的漫画”等任务选项;
不会丢失跨模式的信息，例如情感和背景声音。
开辟新的上下文功能，您可以教模型通过少量示例以新颖的方式组合不同的感官。

对比之下，GPT-4o做得不是完美，但大体上是正确的。

而谷歌呢?

Jim Fan老师不愧是老冲浪选手了，他说，谷歌做对的一件事是，“他们终于开始努力把AI集成到搜索框中”。

还有网友真上手了谷歌新鲜出炉的Project Astra，发了个横向评测视频:

内容我们听了，大体是说，他个人感觉谷歌发布会上的Demo展示环节不太好，他自己和另外三个人去摊位试玩了Project Astra，也只能玩儿2分钟左右。

玩下来的感受，就是大写的“谷歌打的是没准备好的仗”。

排在他前面的测试玩家让Project Astra对着一个事物讲一个故事，Astra信誓旦旦答应说好，然后就没有然后了……

不过让Astra识别画出来的帆船和笑脸，它还是能够胜任的。

相比较而言，他认为GPT-4o更丝滑，不过因为他还没自己上手过GPT-4o，所以不多妄作评价了。

大家的试玩狂欢中，还有一个戏剧性的事情。

那就是马斯克旗下大模型公司xAI的Grok，正确回答了Ilya离开公司的问题。

而OpenAI自己的大模型未能提供正确响应。

网友故意郑重其事地宣布:

突发事件!xAI的Grok1.0击败OpenAI新推出的GPT-4o。

当然了，这必须归功于xAI背后拥有推特（X）上的实时数据/帖子/新闻，没有什么比这更快、更丰富、更真实了。

还有个有意思的是，Hacker News上大家发起了一个神奇的讨论。

有人亮出了一个链接，跳转的是一个2021年发布的打油诗数据集Needle in a Needlestack（只能说世界之大无奇不有），称他坚信GPT-4o训练时，用了里面的数据，

事情的起因是这样的——

Needle in a Needlestack用于衡量大模型对上下文窗口中的信息的关注程度，包含数千首打油诗的提示，该提示询问有关特定位置的一首打油诗的问题。

简单来说就是一个有点意思版本的大海捞针。

不过目前而言，还没有谁家的大模型在这个测试中表现惊艳。

然而，GPT-4o却取得了突破!

这是一个接近完美的表现。

于是网友就开始激情讨论，OpenAI做了啥，让GPT-4o的表现从GPT-4-Turbo大幅跃升。

最主要的观点就如贴主所说，绝对是OpenAI用了Needle in a Needlestack来训练自己，不然数据集背后团队出来解释解释，是怎么检查并确保数据集没有被任何大模型用来作训练呢?

当然了，也有人发出了此前已经有的声音（我们在3月参加月之暗面发布会，以及采访上海人工智能实验室的领军科学家林达华都听过类似的发言）:

大海捞针测试对模型实际的长上下文功能的了解非常有限。

它之所以被广泛使用，是因为早期的模型在这方面表现很糟糕，而且很容易测试。

事实上，大多数最新模型现在在这一项任务上做得相当不错。

不过这次多了一点信息增量，不少人认为，大模型在执行超过32k tokens的长上下文时，进行任何复杂操作的能力都会大幅下降。

最后话说回来，OpenAI真的是人干事?

在谷歌 I/O 开发者大会前贴脸输出GPT新功能，等谷歌发布会结束立马又带来了重磅消息，沉寂半年之久的OpenAI首席科学家Ilya，真的如众人猜测那样官宣离职。

好消息:

Ilya还活着。

坏消息:

谷歌，你是一点流量都摊不上啊……

（举报）

相关推荐
大家在看

关键词：

GPT-4o

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
GPT-4o被全球网友玩坏了谷歌：终究是错付了！

在社交软件上，OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入，并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。OpenAI自己的大模型未能提供正确响应。

GPT-4o AI头条
GPT-4o再秀神操作，“复现”OpenAI总裁讲课，网友当真了

DALL-E!OpenAI总裁兼联合创始人Greg再次大秀GPT-4o操作，结果网友直接缅怀DALL-E。有使用过GPT-4o的朋友吗?欢迎在评论区分享你们的体验。

GPT-4o OpenAI
GPT4o将免费使用！OpenAI发布GPT-4o

OpenAI宣布，其最新旗舰生成式AI模型GPT-4o即将亮相，并将于未来数周内分阶段集成至OpenAI的系列产品中。令人兴奋的是，GPT-4o将免费对所有用户开放，无需任何付费门槛。新的界面设计将让用户可以更加专注于与模型的协作无需在意界面本身。

OpenAI GPT-4o 人工智能
荐AI日报：抖音测试AI购物小助手；GPT-4o再秀神操作惊呆网友；华为“天生会画”App发布；小米大模型通过备案

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、抖音试水AI电商测试AI购物小助手抖音电商正在测试首款面向C端的AI电商服务“AI购物小助手”，旨在为用户带来个性化购物体验和提升业务效率。微软已经采取了一系列措施来�

AI购物
荐GPT-4调教指令揭秘，OpenAI又「Open」了一回！网友在线追问GPT-5

【新智元导读】GPT-4越来越懂事了，这背后有着非常巧妙的「调教」策略。OpenAI最新发布的「模型规范」，给LLM列出了条条框框，即正确的行为方式。为了推进「模型规范」，OpenAI将计划与全球政策制定者、信赖机构和行业专家等进行交流，以便更好了解:-他们对这种方法及其目标、规则和默认设置的看法-他们是否支持这些目标、规则和默认设置-我们是否需要考虑额外的目标�

GPT-4 OpenAI
荐外媒如何报道GPT-4o，有没有“炸裂”？

OpenAI宣布推出GPT-4o。该模型是GPT-4型号的更新版本，将向免费客户开放。每个人对炸裂有不同的理解，没有对错。

GPT-4o
流量戛然而止网友：郭有才的花期比菏泽牡丹还短

近日，不少网友发现，凭借一首《诺言》爆火的郭有才消失了”。流量迅速席卷来，又戛然止，有网友表示，网红和流量的花期比牡丹还短一些。但流量来得快去得也快，如果不能及时为流量匹配转化路径，网红们将不可避免地走向沉寂。
荐遥遥领先的GPT-4o，为什么要免费开放？

5月14日凌晨，OpenAI2024年春季发布会上线。这场发布会，表面看有点简陋，却是科技圈公认的魔法时刻。这也是大模型现在的两个方向。

GPT-4o
微软宣布 GPT-4o 模型在 Azure OpenAI 上使用

微软宣布OpenAI最新发布的多模态模型GPT-4o现已可以在AzureOpenAI云服务中使用。GPT-4o是一款支持跨文本、视频、音频多模态推理的先进模型，其强大多模态解读和输出能力使其在各个领域都展现出巨大的潜力。将GPT-4o与客户系统相结合，可以为用户提供拟人实时的服务，并通过强大的AI分析能力为决策制定各种计划提供数据支撑。

GPT-4o AzureOpenAI AI头条
GPT-4被证实有人类心智！网友：连AI都可以看出他在嘲讽你了

Nature杂志上发表的最新研究显示，GPT-4在心智理论方面的表现与人类相当，甚至在某些方面超过了人类。这项研究由JamesW.A.Strachan等人进行，他们通过一系列测试来评估GPT-4、GPT-3.5、Llama2以及人类参与者的表现，并进行了比较。研究者呼吁建立“机器心理学”，使用实验心理学的工具和范式来系统地研究大型语言模型的能力和局限性。

GPT-4 AI头条

Stackpointer:一站式商业搜索引擎，洞察企业技术栈。

Stackpointer是一个综合性商业搜索引擎，通过分析企业的技术栈来提供详细的商业洞察。用户可以通过关键词或特定技术来搜索企业，帮助创业者制定市场进入策略，识别市场饱和度，了解行业趋势，从而做出明智的商业决策。

商业洞察技术栈分析市场策略

Zest - Longevity:科学延长寿命，提升生活质量

Zest - Longevity是一个旨在帮助用户实现更长寿、更健康生活的应用程序。它基于过去十年来科学研究对衰老生物学根源的探索，提供了一种工具，让用户能够从核心层面上应对衰老，甚至预防和逆转生物衰老过程。该应用程序由医生、长寿科学家和研究人员团队共同开发，并持续更新评估推荐方案。Zest通过跟踪8个关键的长寿支柱：情绪、睡眠、运动、阳光暴露、冷浸、禁食、补充剂和血液测试，帮助用户形成每日推荐目标，综合这些目标形成用户的长寿得分。此外，Zest与Vital SDK和数字生物标记的被动跟踪兼容，支持几乎所有可穿戴设备，结合行为科学和长寿科学，运用心理学和神经科学帮助用户维持延长生命的习惯。