首页 > 业界 > 关键词  > AI产品最新资讯  > 正文

豆包悄悄上线的这个新功能,也能用眼睛推理全世界了。

2025-08-07 10:38 · 稿源: 数字生命卡兹克公众号

声明:本文来自于微信公众号 数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。

上周我写过一篇AI产品自用分享,当时我说,AI知识问答方面,我会选择openai o3和豆包。

PC场景下,o3比较多,而手机场景下,我用的比较多的还是豆包。

虽然ChatGPT也有app,但一旦手机开了魔法,微信啥的还有一些其他的应用,就很容易卡,非常的不方便。

所以我前两天在上海逛ChinaJoy的时候,看到一些忘了的图,或者是我不懂的梗,我都是随时随地问豆包。

比如这个暴雪展上巨大的泰瑞尔,当时跟朋友大眼瞪小眼,忘了是个啥,然后掏起了豆包就开始问。

然后我就发现,这个豆包,又双叒叕更新了。

更新了图片的视觉推理。

不愧是我群的高频讨论对象。。。

就是当你开着这个深度思考模式,再上传图片的时候,豆包就能对这个图片展开思维链推理了。

图片

我给你们直接放个实例看看。

比如我刷ChinaJoy视频,看到了一个特别抽象的黑人哥们儿,念哪吒的打油诗念的头头是道的。

我想知道他是谁,就在豆包的深度思考模式下上传了一张他的视频截图,然后问豆包。

图片

然后豆包就开始刷刷刷分步思考。

图片

先是找了参考图片,然后又根据返回的结果搜索关键词和参考资料。

图片

最后,给了我一个准确的结果。

如果ChatGPT玩的比较多的,应该就能非常熟悉了。

这不是o3最独特的那个视觉推理。

图片

豆包,也终于上线了这个视觉推理功能,牛逼。

而且,o3要钱的,而豆包,免费。

豆包还是牛逼。

也用这个功能,给大家测一些好玩的。

我想到的第一个case,就是德爷。

与贝爷齐名的荒野求生硬汉,最近来中国了,这阵子在深圳。

热情好客的中国朋友,本着来都来了大过年的都是孩子都不容易的原则,生生把德爷的荒野求生变成了满汉全席。

视频里他们吃的那家饭店,我还挺想吃的,但点进评论区,居然没人说是哪家。

这届网友不行。。。

所以我就去问豆包了。

(是为了测试,并不是因为我馋。)

我扔给豆包几张截图,然后问它,这是哪家店。

图片

它就开始思考了。

先确定这里是深圳。

盘子上有汉字,可能是店名。

视频发布者是德爷。

图片

然后按照自己的推测,开始放大盘子,查看汉字。

给我看懵了,这么小的字,它居然都给认全了。

给我的结果,就是旺吉利海鲜大排档。

图片

上大众点评一搜,真是这家店,往下一翻,卧槽,德爷跟店家的合照就明晃晃在店家动态里挂着。

图片

单说豆包,可能还感受不到差距。

但我放个失败的案例你们就明白了。

图片

把地址认成了北京,还说了一堆片儿汤话,最后也没给答案。

差距是拉开了的。

我们再来看一个德爷的案例。

最近他在深圳刷了一天盘子。

因为白吃了人家的牛杂,被抓去做劳力。

我就把德爷刷盘子这个图片发给豆包,问它这是哪家店。

它开始放大图片看细节。

图片

文字信息不全,它也会自己脑补,最终得出了准确的答案。

图片

还有更好玩的,我把一张表情包发给它,问它出处是什么,它也是张口就来。

比如这两个表情包,一只骚气的鸡和一只尴尬但不失礼貌的猪。

豆包给我的回答,是这样的。

图片

然后我才知道,这个鸡和这个猪,分别来自于太太乐鸡精和双汇火腿肠。

论当代网友的精神状态。。。

豆包甚至认识所有的奥特曼。

这是爱迪。

图片

这是盖亚。

图片

对于甄嬛传也是烂熟于心,给它看一张图,它就知道是哪个名场面,还能精确到集。

图片

这在某种程度上,其实已经有点超越人类了。。。

除了搞抽象,干正事儿也不耽误。

这是考公都要面对的行测题。

图片

豆包思维链那一栏刷刷刷跑了巨长,最后得出结论,这是一个关于对称的问题,然后选了B。

它答对了。

这道更复杂一点的题,也答对了。

还有这种考眼力的题目,我一看头都晕,但豆包飞快地把F给找了出来。

图片

我还考了它一个高难度问题,就是把宗庆后的全家福发出来,让它认。

一顿截图推理之后,结果是这样的:比较重要的人物,宗庆后,妻子施幼珍,女儿宗馥莉,爷爷宗启騄,奶奶王树珍,都对上号了。

不过,豆包的深度视觉推理当然也有软肋。

遇到这种六个手指的问题,它还是会信誓旦旦地说出五个手指。

图片

还有,把我的照片给它让它识别,它一次把我识别成了电竞选手,还有一次说我是电视剧三体的总导演。

到处碰瓷,把我给吓得。。。

图片

不过这俩其实都还好,毕竟六根手指是现在所有大模型都绕不过的幻觉。

而我的形象也并没有在网上大范围流传,它不知道也正常。

总的来说,我觉得豆包这个功能,还是挺实用的。

把o3的视觉推理直接免费平权,用着也很方便。

还有我一个,我觉得非常酷的事。

就是,我在忙到爆炸的间隙出去看了一部一直都很想看的电影,《浪浪山小妖怪》。

我真的非常非常非常喜欢这部电影。

讲的是一群被上司压榨多年无法晋升的小妖怪,决定搏一把大的,冒充唐僧师徒去西天取经。

一路上这支散装队伍吵吵闹闹的路过了很多风景。

那些风景,在熹微的晨光或是朦胧的夜晚,静默地注视着这群心怀热血的小妖怪,看他们到底能不能把这个充满规则和潜规则的世界,搅得天翻地覆。

答案当然是不能。

故事中的一段,他们来到了这个场景。

我一看,好眼熟啊,好像在黑神话里见过,但我忘了是哪了。

然后一出影院我就问豆包,这个场景是哪,它很快的给了我回答: 佛光寺。

我就说嘛,这是大圣去过的地方。

在电影里,几个小妖怪真在这个地方,见到了大圣。

小妖怪冒充唐僧师徒,但大圣没有杀小妖怪,而是给了他们,四根保命毫毛。

所以搜出来答案的那一刻,我感觉黑神话和浪浪山真的梦幻联动了,不只是场景。

还有内核,那种属于中国人骨子里的侠义情结,对命运的抗争,对苍生的悲悯。

然后我就觉得,这种快速把知识、线索串起来,然后电光火石间有所领悟的感觉太爽了。

这种知识丝滑进入脑海的方式。

可能就是我们未来与AI沟通的常态了。

当你有所想。

AI,便有所应。

举报

  • 相关推荐
  • 微星引爆2025 ChinaJoy!硬核装备集结,游戏盛宴邀你开战!

    2025 ChinaJoy上,微星科技联合多家品牌掀起硬件风暴:TCL展台汪东城cos登场,展示MAG 346CQ显示器;世纪华通展区带来海皇戟RS主机;抖音商城舞台呈现AI视觉盛宴。微星推出白色主题豪华装备礼包,包括MPG VELOX 300R机箱、MAG水冷等新品。重磅发布MAG 275QPF X30电竞显示器(2K/300Hz)和未来感十足的MEG VISION X AI主机。阿加斯特展区则通过匠心组装展示微星主板、电源等核心硬件协同作战的澎湃性能。微星以尖端硬件和沉浸体验为玩家打造硬核游戏乐园。

  • 倍孜网络×加彩传播展台燃爆ChinaJoy!《2025数字营销行业AI应用趋势研究报告》发布!

    2025 ChinaJoy首日盛况空前,倍慈网络联合展台吸引上万观众参与互动,现场人气爆棚。活动亮点包括144㎡超大展台展示品牌技术实力,以及"数字营销新浪潮|AI时代的营销升维"主题发布会。中国商务广告协会副会长陈徐彬和12306广告部部长许娜发表演讲,强调数字营销应注重人文温度。发布会重磅发布《2025中国数字营销行业人工智能应用趋势研究报告》,为行业提供智能�

  • ChinaJoy现“品牌分身术”:雷鸟借华星/腾讯/巨人展台上演场景革命

    2025ChinaJoy在上海新国际博览中心火热开幕,雷鸟展区以电竞主题格外亮眼:举办英雄联盟水友赛、抽奖送显示器等活动,邀请BLG战队选手与粉丝互动。雷鹤6 Ultra电视在腾讯展馆展示《王者荣耀》世界赛画面,低反光屏幕优化观赛体验;在巨人网络展区则还原游戏场景,多款热门游戏IP展区均配备雷鸟电视。雷鸟通过场景化营销,将Mini LED等技术转化为"五杀瞬间"等可感知体验,让产品自然融入电竞、二次元等青年文化场景,证明硬件品牌价值最终由其所承载的文化厚度定义。

  • 网易MuMu模拟器亮相 2025 ChinaJoy:技术革新赋能全平台手游生态

    2025年8月,网易MuMu模拟器5.0版本在ChinaJoy展会亮相,成为首个支持Windows、Windows ARM和macOS的全平台安卓模拟器。该版本通过ARM架构深度适配等核心技术,实现"不挑设备、秒开秒用"的流畅体验,可运行超220万款手游。MuMu 5.0同步推出海外版,支持多语言切换,助力网易游戏全球化布局。在高通展区,MuMu展示了基于ARM架构的移动应用解决方案,解决Windows ARM设备运行安卓模拟器的需求。现场玩家可通过搭载骁龙芯片的电脑体验《蛋仔派对》等热门手游的PC端极致表现。此次升级标志着MuMu从工具向跨端智能枢纽的转型,重新定义"无界交互"的游戏体验边界。

  • ChinaJoy 2025落幕!万里汇携数娱出海支付方案破解游戏全球化难题

    2025年ChinaJoy展会聚焦游戏出海热潮,蚂蚁国际旗下万里汇推出"数娱出海支付解决方案"。报告显示2024年中国自研游戏海外收入达185.6亿美元,占销售总收入33.62%。72%出海企业面临支付环节痛点,万里汇方案提供五大优势:多币种极速收款、210+国家本地化支付、超优费率、高效账户管理及合规保障。以9377游戏为例,采用该方案后跨境支付效率显著提升。未来支付能力将成为中小游戏企业出海核心竞争力,"本地化支付+运营"模式将成标配。

  • 联盟聚势,迅猛出击!AGON爱攻竞化之旅引爆2025 ChinaJoy

    2025 ChinaJoy展会盛大开幕,AGON爱攻以"迅猛出击,CJ竞化之旅"为主题,携尖端电竞产品矩阵亮相。现场AGON与完美世界电竞等成立"完美电竞合作联盟",推动产业标准化发展。重点展出了与CS联名定制的CS24A显示器,配备610Hz刷新率和0.3ms响应时间等硬核性能。展会期间举办了热血电竞赛事,并设置互动体验区让玩家沉浸感受专业电竞装备的魅力。AGON通过深化战略合作、创新产品展示和趣味互动,成功连接尖端科技与玩家热情,为数字娱乐盛会注入澎湃电竞能量。

  • 海信电视E8Q Pro以“影游旗舰”实力炸场,斩获2025ChinaJoy黑金奖

    海信电视E8Q Pro在2025年ChinaJoy黑金奖评选中脱颖而出,凭借三大核心技术突破获此殊荣:1.搭载全球首颗信芯AI画质芯片H7,通过AI光色同控技术实现26bits灰阶控制,智能优化画面色彩、清晰度等参数;2.独家黑曜屏Ultra技术将屏幕反射率降至1.28%,黑度达普通屏幕四倍;3.原生4K170Hz高刷配合动态330Hz刷新率,配备4路HDMI2.1接口,实现职业电竞级低延迟。该产品以"巅峰画质,影游旗舰"的硬核实力,为《黑神话:悟空》等游戏影视内容提供极致体验,引领电视行业技术革新。

  • Soul App 在 ChinaJoy,在三次元的世界打造“Gen AI社交游乐园”

    2025年8月1日,第二十二届ChinaJoy将在上海新国际博览中心开幕。作为亚洲规模最大、最具影响力的数字娱乐盛会,ChinaJoy不仅是青年流行文化的标杆性事件,更是全球数字创意产业发展的风向标。社交平台Soul App以"Soul树洞情绪疗愈酒吧"为主题亮相,推出原创IP"莫比乌斯·第三弹"限定款数字文创,展现平台孵化的原生潮流文化。现场观众还能体验Soul最新的AI社交技术,包括与虚拟人即时互动等。Soul通过数字文创产品深度融合平台标志性的"捏脸"文化,让用户通过个性化形象设计展现独特风格,实现情感表达。数据显示,Soul 18-30岁主力用户群体正通过数字文创实现自我探索与身份重构,反映了当代年轻人"情价比"取代传统"性价比"的消费心理。此外,Soul还展示了AI社交创新实践,致力于打造"超类真人"和"深度沉浸"的社交体验,重新定义AI社交范式。

  • 钛动科技亮相ChinaJoy2025,全球营销AI Agent赋能游戏出海新范式

    2025年ChinaJoy盛大开幕,铼动科技携全球首款营销AI+Agent产品Navos强势亮相。Navos通过AI技术覆盖营销全链路,提供出海营销解决方案。展会现场设置"星光奇遇展"和"出海加速站",展示智能营销云、创意生成引擎等创新产品。铼动还联合多家品牌推出互动打卡活动,吸引大量观众参与。线上直播同步进行,2.5小时获5.4万点赞。此次参展重点呈现AI赋能游戏出海的精细化、全球化服务能力,为行业带来"出海新曙光"。(140字)

  • 冲锋号吹响,沙巴克集结!ChinaJoy开展,996传奇盒子唤醒03年情怀

    996传奇盒子在ChinaJoy首日亮相,以经典游戏场景"沙巴克城堡"为主题打造沉浸式展区,还原网吧、商店等怀旧元素,并展出20年来的传奇点卡、攻略本等珍贵藏品。现场提供免费周边礼品,邀请知名coser扮演游戏角色,吸引众多玩家打卡互动。作为国内领先的传奇手游平台,996传奇盒子通过细分玩法满足不同玩家需求,持续推动这一经典IP焕发新活力。

热文

  • 3 天
  • 7天