扳回一局！Gemini-Pro多模态能力和GPT-4V不相上下

2023-12-22 14:46 · 稿源：站长之家

要点:
Gemini-Pro在多模态能力上与GPT-4V不相上下，尤其在多模态专有基准MME上表现出1933.4的高分，超过GPT-4V。
在37个视觉理解任务中，Gemini-Pro在文本翻译、颜色/地标/人物识别、OCR等任务中表现突出，而GPT-4V在名人识别任务上得分为0。
在高级认知、挑战性视觉任务和各种专家能力领域，Gemini-Pro展现了强大的视觉感知和理解能力，但在位置识别任务上表现都不佳。

站长之家（ChinaZ.com）12月22日消息:近期的Gemini-Pro评测报告显示其在多模态领域取得了显著的进展，与GPT-4V不相上下，甚至在某些方面表现更为出色。首先，在多模态专有基准MME上的综合表现中，Gemini-Pro以1933.4的高分超越了GPT-4V，展现出在感知和认知方面的全面优势。而在37个视觉理解任务中，Gemini-Pro在文本翻译、颜色/地标/人物识别以及OCR等任务中表现突出，显示了其在基础感知领域的卓越能力。

论文地址:https://arxiv.org/pdf/2312.12436.pdf

项目地址:https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models

然而，评测也揭示了两者的差异。在名人识别任务上，GPT-4V的得分为0，主要因其拒绝回答相关问题。而在位置识别任务中，两者都呈现出不佳的表现，显示它们对空间位置信息的不敏感。此外，开源模型SPHINX在感知任务上与GPT-4V和Gemini平齐甚至更优，但在认知方面存在较大差距。

评测报告分为基础感知、高级认知、挑战性视觉任务和各种专家能力四大领域，对Gemini-Pro的视觉理解能力进行了详细评估。基础感知测试涵盖了对象级感知、场景级感知和基于知识的感知能力，其中Gemini-Pro在颜色/地标/人物识别和OCR等任务中的表现突出。

高级认知测试则涉及富含文本的视觉推理、抽象视觉推理、解决科学问题、情感分析和智力游戏等任务，显示Gemini-Pro在公式生成和抽象视觉刺激方面取得良好成绩。

挑战性视觉任务包括指称表达式理解、目标跟踪和视觉故事生成等，Gemini-Pro在这些任务中展现了深厚的视觉感知和理解能力。最后，各种专家能力测试涉及缺陷检测和经济分析等任务，Gemini-Pro在股价走势图的分析上显示了出色的专业知识。然而，评测也指出Gemini-Pro在一些任务上存在幻觉问题，需要进一步改进。

Gemini-Pro在多模态领域取得了令人瞩目的成就，展现了其在视觉理解能力上的强大潜力。然而，评测也突显了在特定任务和领域仍需进一步提升的空间。Gemini-Pro的表现表明了多模态技术的潜在威力，为未来的研究和应用提供了有益的启示。

（举报）

相关推荐

关键词：

Gemini

央视深度揭秘：最值得买的RGB-Mini LED电视海信U7S Pro，硬实力来自中国芯

海信发布RGB-Mini LED电视U7S Pro，采用RGB三原色背光技术，无需荧光粉二次转换，实现更高色彩纯度和亮度，画面通透真实。搭载自研信芯AI画质芯片H7，支持行业最高3×10240分区控制，结合黑曜屏Ultra双层降反技术，反光率仅1.28%。具备4K 170Hz高刷，游戏体验流畅。新品预售价15999元起，预存1000元抵2000元，享能效补贴。

海信RGB-Mini LED电视 U7S
突破 Mini LED！三星 Micro RGB 引航显示进入 Micro 时代

三星在京东方MALL举办“AI的呵护”家电线下体验展，展出全球首款Micro RGB电视115MR95F。该电视采用Micro RGB技术，实现100% BT.2020色域覆盖，色彩精准度与对比度达到新高度。搭载AI芯片优化画质，支持144Hz刷新率与杜比全景声，定价199,999元。三星借此布局超高端市场，展示Micro RGB+QD-OLED+Micro LED三大技术矩阵，重塑显示行业格局。

AI家电 Micro RGB电视
超越RGB的全局高色域有多狠？2025最值得期待的电视技术还得看SQD-Mini LED

TCL最新发布的SQD-Mini LED技术突破行业十年色域瓶颈，实现100% BT.2020全局高色域，结合超级量子点与超强控光技术，解决了传统RGB-Mini LED色彩纯度不足、串色等问题。搭载该技术的X11L电视以万象分区精准控光提升对比度，色彩还原精准、过渡自然，树立了"光色双绝"新标杆，推动高端电视画质进入新纪元。

电视画质色彩技术 Mini
TCL华星助力产业规范，《Mini LED室内商用显示屏》团体标准重磅发布

2025年7月15日，《Mini LED室内商用显示屏》团体标准正式发布，标志着Mini LED技术从分散发展迈向统一规范的关键跨越。该标准由深圳照明与显示工程行业协会等机构牵头，汇聚近50家产业链企业智慧，构建了科学、系统的质量评估与性能规范体系。通过明确产品定义、分类维度、性能指标升级及检测方法，重点解决行业长期存在的技术指标不统一、质量参差不齐等痛点。标准实施将推动产业链协同，预计带动市场规模年增速超30%，助力企业提升高端产品竞争力，并为客户采购提供清晰依据，促进Mini LED在会议大屏、数字标牌等商用场景加速落地，引领产业向更高一致性、更低功耗演进。

Mini LED 室内商用显示
iPhone 17 Pro mini首曝：4.7英寸屏未能上市

9月24日有博主爆料，苹果曾计划推出4.7英寸iPhone 17 Pro mini，但在DVT阶段取消开发。该机型设计类似iPhone 17 Pro，采用横向矩阵相机和铝合金一体化机身，但工程师认为其外观“荒谬”。苹果曾尝试小屏路线，iPhone 12/13系列推出mini版本但销量未达预期，iPhone 14起以Plus替代mini，然而Plus销量同样不佳。从iPhone 17系列开始，苹果新增主打轻薄的Air机型，Plus系列正式退出市场。

iPhone 17 Pro
ChatExcel重磅发布：基于AMD锐龙AI MAX+ 395处理器的数据分析Mini AI 工作站

ChatExcel发布搭载AMD锐龙AI MAX+395处理器的Mini AI工作站，重构数据全链路，打造“找数-做数-分析数-看数-用数”的商业闭环平台。依托处理器96GB超大显存和统一内存架构，实现本地流畅运行GPT-oss-120B等大型模型，保障数据安全的同时显著提升分析效率。该方案以财务场景为例，支持多任务并行处理，将原本需1天完成的月度报表压缩至2小时，解决“数据不外发”与“高效处理”的核心矛盾。

文章搜索核心标签 AMD锐龙AI
名创优品MINISO叶国富：坚持自有IP与全球化布局，构建新消费市场

名创优品2025年第二季度及上半年财报显示，公司业绩全面增长。总营收达49.7亿元，同比增长23.1%；毛利率提升至44.3%。非国际财务报告准则下净利润为6.9亿元，增长10.6%。通过IP生态建设、渠道升级与全球化战略，中国及海外市场同店销售稳步增长，海外营收增幅达28.6%。门店扩张持续推进，全球零售网络新增124家。“开好店、开大店”策略成效显著，MINISO LAND等新业态单店效益突出。同时，公司宣布派发中期股息，并加大股份回购，强化股东回报。未来将持续深化全球布局，推动高质量增长。

财务报告营收增长毛利率
小米电视S Pro Mini LED 2026发布：售价5199元起

9月25日，小米电视S Pro Mini LED 2026正式发布，提供65、75、85、98英寸四种尺寸，满足多样化需求。新品搭载9655旗舰芯片，配备4GB+64GB存储组合，运行澎湃OS 3系统。屏幕采用Mini LED技术，峰值亮度达5200nits，支持4K 165Hz原生刷新率及330Hz竞技模式，具备VRR、FreeSync Premium Pro认证。音频方面配备2.1.2声道设计，支持杜比全景声。外观采用超窄边框，接口丰富，包括HDMI 2.1×3等。雷军特别推荐85英寸版本，称其适合大多数家庭。各尺寸首销价与零售价有差异，如65英寸首销5199元，零售6499元。

小米新品发布会小米电视S Pro
3299元起华为MatePad mini悦读版开售能打电话的小平板

华为MatePad Mini悦读版今日开售，提供常规屏和柔光屏两个版本，售价3299元起，仅限华为体验店等线下渠道销售。相比标准版，该版本不支持北斗卫星功能，芯片从麒麟9010降至9010B，核心数减少，USB接口从3.0降为2.0，但其他参数如屏幕尺寸、电池、摄像头等保持一致。亮点包括8.8英寸柔性OLED全面屏、1800nits峰值亮度，柔光屏版售价3799元，采用创新光学膜材降低闪烁干扰，并通过德国莱茵与SGS护眼认证。此外，该平板支持通话与蜂窝网络，可插卡使用，配备听筒及智能来电识别功能，前置3200万像素、后置5000万像素主摄，内置6400mAh电池并支持66W快充。

华为MatePad Mini悦读版柔光屏
2025年最值得买的高端MiniLED电视海信E7Q发布，7999元起售

9月26日，海信发布2025秋季新品E7Q系列电视，定位“旗舰性能，越级画质”。该系列基于ULED平台打造，采用Mini LED技术，配备自研信芯AI画质芯片H6超频版，实现控光精度提升16倍，原生4K刷新率达170Hz。搭载黑曜屏Pro，抗反光能力领先行业3倍，峰值亮度达7000nits。音质方面联合帝瓦雷调校，支持2.1.2声道环绕系统。提供65至100英寸四种规格，首发价7999元起，专为影音与游戏场景优化，以全面越级实力重塑高端Mini LED电视价值标准。

海信电视E7Q Mini LED电视

今日大家都在搜的词：

热文

3 天
7天

扳回一局！Gemini-Pro多模态能力和GPT-4V不相上下

央视深度揭秘：最值得买的RGB-Mini LED电视海信U7S Pro，硬实力来自中国芯

突破 Mini LED！三星 Micro RGB 引航显示进入 Micro 时代

超越RGB的全局高色域有多狠？2025最值得期待的电视技术还得看SQD-Mini LED

TCL华星助力产业规范，《Mini LED室内商用显示屏》团体标准重磅发布

iPhone 17 Pro mini首曝：4.7英寸屏未能上市

ChatExcel重磅发布：基于AMD锐龙AI MAX+ 395处理器的数据分析Mini AI 工作站

名创优品MINISO叶国富：坚持自有IP与全球化布局，构建新消费市场

小米电视S Pro Mini LED 2026发布：售价5199元起

3299元起华为MatePad mini悦读版开售能打电话的小平板

2025年最值得买的高端MiniLED电视海信E7Q发布，7999元起售

今日大家都在搜的词：

热文

苹果iOS18.7.1正式版更新发布重要安全修复

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

罗永浩替小米说公道话：海报小字是行业陋习

卢伟冰称小米17首销结果很不错并回应小米17为何最初无1TB

京东双11购物节官宣：10月9日晚8点开启

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

小米澎湃OS 3穿戴设备适配升级计划公布：10月开启推送

苹果iOS 26.0.1正式版发布：修复iPhone 17系列Wi-Fi、拍照等Bu

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果iOS18.7.1正式版更新发布重要安全修复

AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

理想i6正式上市：首销直减1万限时售价23.98万元

小米17系列开售5分钟破25年国产手机首销纪录

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

雷军大方推荐友商产品：不买YU7 可以考虑Model Y和理想i6

站长商机