首页 > 业界 > 关键词  > Grok-1.5Vision最新资讯  > 正文

马斯克XAI发布Grok-1.5 Vision 多模态模型 可处理文本和图片信息

2024-04-15 14:07 · 稿源:站长之家

站长之家(ChinaZ.com)4月15日 消息:在人工智能领域,多模态模型的发展一直是行业关注的焦点。近日,马斯克X AI公司发布了其最新的多模态模型——Grok-1.5Vision,这一模型不仅能够处理文本信息,还能够理解和分析各种视觉数据,如文档、图表、截图和照片,标志着公司在人工智能技术上迈出了重要一步。

Grok-1.5Vision模型在多项基准测试中展现了其卓越的性能,与业界领先的GPT4V模型相比,不仅不相上下,甚至在多个指标上实现了超越。特别值得一提的是,在新推出的RealWorldQA真实世界物理空间基准测试中,Grok-1.5Vision模型的表现超越了GPT4V以及其他所有参与测试的模型。

image.png

RealWorldQA基准测试是一项新的评估标准,旨在测试多模态模型对真实世界物理空间的理解能力。该测试包含了超过700个问题和答案,主要采用来自车辆前摄像头等实际环境中的图像。Grok-1.5Vision模型在这一测试中的优异表现,得益于其在多学科推理和理解文档、科学图表等方面的出色能力。

此外,Grok-1.5Vision模型在不使用思维链提示的情况下,在多个数据集上的对比测试中也展现了令人瞩目的表现。这表明该模型在处理和理解现实世界空间方面具有强大的能力,这对于推动人工智能技术的实际应用具有重要意义。

马斯克X AI还提供了应用代码示例,展示了Grok-1.5Vision模型如何将流程图转化为Python代码,并执行一个简单的猜数字游戏。这些示例不仅展示了模型的实际应用潜力,也为开发者提供了宝贵的参考。

Grok-1.5Vision模型的发布,不仅展示了马斯克X AI在人工智能领域的技术实力,也为未来多模态模型的发展和应用开辟了新的可能性。随着该模型的进一步优化和应用,我们有理由相信,它将在多个领域发挥重要作用,推动人工智能技术向前发展。

官网地址:https://top.aibase.com/tool/grok-1-5-vision-preview

举报

  • 相关推荐
  • 首款超跑概念车国内首秀!小米宣布Vision GT亮相2026北京国际车展

    今日,小米汽车宣布,Xiaomi Vision Gran Turismo即将亮相2026北京国际车展,这也是该车首次在国内车展公开展示。 作为小米首款超跑概念车,小米Vision GT主打极致空气动力学设计,采用浮动泪滴式乘员舱造型,底部配备大尺寸空气动力学风道,在兼顾性能与造型的同时降低风阻,风阻系数低至0.29。 设计理念上,小米首席设计师李田原表示:我们的理念是不依靠额外加装部件,就

  • 小区惊现“蛇吞蛇” 1.5米大蛇当众吞同类 居民吓得报警

    湖北十堰一个小区里发生了吓人的一幕,两个孩子玩耍时,亲眼看见一条1.5米左右的大蛇正在吞食另一条蛇,当场被吓得不轻。 孩子赶紧告诉家长,家长立刻拨打119报警求助。消防员赶到现场后,很快找到了这条正在吞吃同类的大蛇。 这条大蛇体长大概1.5米,被它吞食的小蛇长度在1米左右,场面看起来比较惊悚。消防员使用专业的捕蛇夹,小心地将两条蛇分离开。 随后,�

  • 阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

    阿里通义实验室近日正式推出语音识别大模型 Fun-ASR1.5。 该模型基于统一的大模型架构,单模型即可无缝覆盖30种语言、汉语七大方言体系及20余种地方口音,甚至连古诗词吟诵也能精准转写。 测试显示,在典型方言场景下,字错误率(CER)相对下降56.2%。目前已有5种方言的识别准确率突破90%,15种超过80%。

  • 安卓最强Pro来了!小米18 Pro外观渲染图冲上热搜:新增独立AI按键

    社交平台上曝光了一组号称是小米18 Pro的外观渲染图。相关话题迅速冲上了微博热搜榜,引发了科技爱好者们的广泛热议。 从曝光的图片来看,小米18 Pro的背部镜头模组布局十分抢眼。更令人关注的是,机身侧边新增了一颗独立的AI按键。这颗按键不仅支持一键启动AI功能,还能实现对小米智能家居以及小米汽车等设备的深度联动控制。 在屏幕方案上,小米18 Pro正面将配备一

  • ​骏驰新程,视联智造,Vision China 2026(上海)机器视觉展圆满落幕

    2026年3月25日至27日,Vision+China2026(上海)机器视觉展在上海新国际博览中心举办。展会聚焦机器视觉与人工智能的深度融合,特设“Vision+AI+机器人”创新展区,展示了视觉技术、AI与机器人在工业应用中的协同潜力。众多国内外知名企业参展,呈现了高精度工业相机、智能传感器、3D视觉设备及AI视觉算法等最新成果。同期举办的研讨会汇聚行业专家,探讨了视觉与AI融合如何推动工厂智能化转型,助力降本增效。展会为行业搭建了交流平台,彰显了机器视觉技术在智能制造领域的广阔前景。

  • Vision China 2026(上海)机器视觉展盛大开幕!

    2026年3月25日至27日,Vision+China2026(上海)机器视觉展成功举办。展会由CMVU主办,规模近3万平方米,吸引全球近300家企业参展。核心亮点是视觉技术与人工智能、机器人的深度融合,特别设立“VISION+AI+机器人”创新展区,展示三者协同应用潜力。同期研讨会聚焦“VISION+AI+机器人驱动工厂数智化”,举办17场专题演讲,探讨技术趋势与落地实践。展会还揭晓了“2025机器视觉创新产品TOP10”评选结果,集中展示年度技术突破,为行业发展注入创新动能。

  • 2294元 小米空调强劲风超1.5匹预售:1000m3/h超大风量 媲美柜机

    小米米家空调强劲风超1.5匹开启预售,国补后到手价2294元起,风量直接做到1000立方米每小时,挂机体验接近2匹柜机。 该新品有两款:标准版优惠价2699元,国补后2294.2元,Pro版优惠价3299元,国补后2804.2元。 这款空调定位大风量旗舰,最大亮点就是1000立方米每小时的超大风量,配合118mm大尺寸风轮和加宽出风口,制冷制热速度更快,全屋温度分布更均匀,普通挂机很难达到�

  • MicroComputer深度评测:助力Token吞吐飙升,忆联AM6D1 PCIe 5.0 SSD击穿AI存储墙

    本文介绍了忆联AM6D1 PCIe 5.0固态硬盘,它采用4通道DRAMLess主控设计,旨在解决AI大模型本地部署中的存储瓶颈。测试显示,其顺序读写速度分别超过11400MB/s和10900MB/s,随机4K读写性能达1600K+ IOPS和1150K+ IOPS。在加载32B和235B大模型时,耗时仅10.52秒和53.99秒,游戏载入测试也表现出色。同时,其功耗控制优秀,空闲功耗可低至3mW。该产品兼顾高性能与低成本,适合从工作站到移动设备的全场景AI部署需求。

  • 华为Pura 90 Pro 、 Pro Max 手机发布: 售价 5499 元起

    今日,华为举办 Pura 系列及全场景新品发布会,华为 Pura90Pro 和 Pura90Pro Max 手机正式登场,起售价5499元,为消费者带来诸多惊喜。 在售价方面,Pura90Pro 不同配置价格有所差异,12GB +256GB 版本售价5499元;12GB +512GB 版本售价5999元;16GB +512GB 版本售价6499元;16GB +1TB 版本售价7499元。Pura90Pro Max 同样有多个版本,12GB +256GB 售价6499元;12GB +512GB 售价6999元;16GB +512GB 售价7499元;16GB +1TB 售价8499�

  • 智谱发布GLM-5V-Turbo模型:编程告别纯文本 一张图片就能生成代码

    智谱AI于4月2日发布GLM-5V-Turbo多模态编程模型,专为视觉编程打造。该模型深度融合视觉与文本能力,能看懂设计稿、截图、网页界面并生成可运行代码,实现“看得懂画面、写得出代码”。其三大核心特性包括:原生多模态编程基座,支持图片、视频、设计稿等多模态输入;兼顾视觉与编程能力,在多模态编程、GUI+Agent等基准上表现领先;深度适配Claude Code与龙蜥场景,可实现环境规划与动作执行的完整闭环。实测显示,该模型在设计稿还原、视觉代码生成等任务中表现优异,在AndroidWorld、WebVoyager等GUI操控测试中同样突出,纯文本编程能力稳定。目前已落地图像即代码、龙蜥视觉赋能等典型场景。

今日大家都在搜的词: