生成很强，推理很弱：GPT-4o的视觉短板

2025-04-21 16:43 · 稿源：大数据文摘公众号

如果让AI画一只狗站在“左边”，但事先告诉它“左就是右”，你觉得它能反应过来吗?最近，UCLA的一项新研究用一系列精心设计的实验，揭开了GPT-4o在图像理解和推理上的短板——它画得漂亮，却未必真懂你的意思。论文主线很直接，GPT-4o的画图能力确实惊艳，但真正涉及理解图像、语

......

本文由站长之家合作伙伴自媒体作者“大数据文摘公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

今日AI领域动态：上海首例AI提示词著作权案宣判，法院认定提示词不具独创性；月之暗面发布Kimi K2思考模型，实现自主多轮工具调用；UniWorld-V2图像编辑模型支持中文框选即改，性能超越GPT-Image；谷歌推出AI文件检测工具Magika 1.0，支持超200种格式；Sora安卓版首日下载量达47万次；我国发布全球首个AI海洋大模型“瞰海”，可精准预测10天内海洋变化；宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控；谷歌Gemini API推出文件搜索工具，简化私有RAG系统集成。

AI 著作权提示词
进博会“全勤生”三星的AI全景图：AI Home中国首秀

三星在进博会上首次展出AI+Home智能家庭解决方案，通过Bespoke AI、Vision AI和Galaxy AI三大模块，实现全场景智慧生活。AI正从"会语言"向"会行动"演进，软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势，打破端侧AI的性能、算力与存储"不可能三角"，构建起覆盖手机、电视、家电的生态闭环。未来，AI将全面接管生活，让科技真正服务于人。

端侧AI AI Home
荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

近期AI炒币大赛Alpha Arena引发关注，六款主流大模型用1万美元本金在币圈实战。戏剧性的是，被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重，而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶，DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen，投资人Chamath也承认将业务转向中国模型。市场用真金白银投票：预测平台押注Qwen胜率高达36%，远超OpenAI的3%。这场竞赛�

AI炒币大赛 Alpha Arena
TTi OS行业首发“四图融合”车道级导航

2025年10月30日，TTi+OS车道级导航正式量产，成为行业首个“四图融合”产品。它基于自研多模态融合引擎，实现高精度导航信息直观呈现与便捷交互，提升出行安全与个性化体验。系统集成SR渲染、环境重构等四大功能，实时识别车道位置，通过直觉式交互引导路径，帮助复杂路况操作。依托高算力平台，可视化呈现动态风险与辅助驾驶信息，增强行车安全。产品融入解压游戏、地标建筑等娱乐化设计，兼具趣味性。目前该导航已搭载于深蓝L06车型，标志量产落地，未来将持续优化AI座舱体验，引领智能汽车科技进化。

车道级导航四图融合 TTi
九旬夫妻结婚78年从不吵架：相互理解是关键

近日，河南郑州一对结婚78年的九旬夫妻成为大众关注焦点，他们携手走过大半生却从未红过脸，其相处之道为众多人探寻婚姻秘诀提供了宝贵参考。这对夫妻中，95岁的奶奶与93岁的爷爷，用实际行动诠释了婚姻中的分工与体谅之美。在日常生活中，爷爷主动挑起家务重担，做饭、打扫、针线活样样精通。他常说:“她养孩子操持家负担更重，我责无旁贷。”这份担当与付�

婚姻秘诀九旬夫妻分工体谅
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech
Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发，专为多轮对话场景设计，支持中英川粤等多语言/方言与副语言风格，能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点，在播客、语音合成等场景表现突出，获开发者广泛关注。Hugging Face CEO也转发相关内容，团队未来将持续优化语音对话、拟人化表达等核心交互能力，深化开源生态建设。

SoulX-Podcast TTS 语音生成模型
被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

本文系统介绍生成式引擎优化(GEO)的核心方法，帮助内容从“给人看”升级为“AI友好型”。关键策略包括：1.采用结构化写作框架，在开头设置可直接回答问题的“黄金段落”；2.运用分步清单、数据标注、FAQ等模块提升内容引用率；3.通过多平台同步分发增加曝光；4.使用AIBase等工具量化监测内容被AI引用的频率与场景，并给出5天落地执行表。

AI搜索友好型内容创作 GEO Generative
TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

TabTab是一款全链路AI数据分析助手，核心功能包括多源数据连接（支持文档、数据库、电商平台等）、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互，降低分析门槛，让非技术人员也能快速完成客户洞察、销售业绩等分析，显著提升效率。产品定位中立，致力于构建多元化AI效率提升生态。

数据驱动效率提升智能体
华为Mate 70 Air配置价格公布：可选CPU 售价4199起

华为Mate70 Air于11月6日10:08开启预售，提供麒麟9020B和9020A两款CPU版本，价格从4199元至5199元。机身仅6.6mm厚、208g重，配备7英寸OLED临境大屏，支持120Hz刷新率。影像系统包括后置四摄组合与前置1070万超广角镜头，内置6500mAh电池与66W快充。支持双向北斗卫星消息、Wi-Fi7，预装HarmonyOS 5.1系统。凭借轻薄设计、可选CPU及全面配置，有望引发市场关注。

华为Mate70Air 麒麟9020B 麒麟9020A

今日大家都在搜的词：

热文

3 天
7天

生成很强，推理很弱：GPT-4o的视觉短板

荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

进博会“全勤生”三星的AI全景图：AI Home中国首秀

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

TTi OS行业首发“四图融合”车道级导航

九旬夫妻结婚78年从不吵架：相互理解是关键

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

华为Mate 70 Air配置价格公布：可选CPU 售价4199起

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

站长商机