马斯克的xAI正努力实现Grok多模态化将支持上传照片获得文本回复

2024-05-22 10:03 · 稿源：站长之家

划重点:
⭐ 埃隆・马斯克的 xAI 公司 x 正在为 Grok 聊天机器人添加多模态输入功能
⭐ 最新的开发者文档显示了 xAI 在推出新模型方面的进展
⭐ Grok1.5V 将允许用户上传照片并获得基于文本的答案

站长之家（ChinaZ.com）5月22日消息:埃隆・马斯克的人工智能公司 xAI 正在努力为其 Grok 聊天机器人增加多模态输入功能。

根据公开的开发者文件，埃隆·马斯克（Elon Musk）的人工智能公司xAI在向其Grok聊天机器人添加多模态输入方面取得了进展。这意味着，很快，用户就可以将照片上传到 Grok 并接收基于文本的答案。

xAI上个月在一篇博客文章中首次调侃了这一点，该博客称Grok-1.5V将提供“多个领域的多模态模型”。开发人员文档的最新更新似乎显示了新模型的发布进度。

在开发者文档中，一个 Python 脚本示范了开发人员如何使用 xAI 软件开发工具包库来生成基于文本和图像的回应。这个脚本读取图像文件，设置一个文本提示，并使用 xAI SDK 生成回应。

对于 xAI 而言，这是 Grok 的一项重大更新。Grok 最早于2023年11月发布，目前仅供购买 X 高级会员订阅的用户使用。最后一次更新是在今年3月的 Grok1.5版本，带来了改进的推理能力。

据 xAI 的一篇博文介，该模型是 “基于来自互联网公开来源直至2023年第三季度以及由人类审核员审查和整理的各种文本数据” 进行训练的。该博文补充说，Grok-1并未经过 xAI 的训练（包括 xAI 的公开帖子）。然而，Grok 确实拥有 “对世界的实时知识”，包括 xAI 上的帖子。

由埃隆・马斯克于2023年3月创立的 xAI 在人工智能领域相对较新，并落后于竞争对手，如 OpenAI 的 ChatGPT。然而，根据 xAI 的一篇博文，他们的 Grok1.5模型在各种基准测试中正在缩小与 GPT-4的差距，这些测试涵盖了从小学到高中各种竞赛题目的广泛范围。值得注意的是，大型语言模型的基准测试经常受到批评，因为如果这些基准测试包含在它们的训练数据中，这些模型就可以在基准测试上表现良好。

（举报）

相关推荐

关键词：

马斯克称xAI Grok“儿童模式”已上线完善布局全年龄段

马斯克10月26日在X平台宣布，其人工智能助手Grok的“儿童模式”已全面上线。该模式是7月预告的“Baby Grok”计划阶段性成果，承诺为儿童提供友好内容，但具体功能设置、过滤机制及适用年龄等细节尚未披露。媒体分析指出，Grok正构建覆盖全年龄段用户的AI生态体系，从标准对话到儿童专属版本，展现xAI在人工智能助手领域差异化竞争的雄心。

人工智能助手 Grok儿童模式 xAI
荐AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI百科全书Grokipedia

本期AI日报聚焦多领域突破：海螺AI 2.3实现视频生成技术跃升，支持双模式免费试用；豆包AI编程工具实现零基础可视化开发；马斯克推出AI百科Grokipedia；Mistral发布企业级AI开发平台；Anthropic推出金融版Claude，显著提升分析师效率；Pinterest升级AI购物助手功能；英伟达推出全能模型OmniVinci刷新性能纪录；DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

AI视频生成 Hailuo 2.3
三星Micro RGB色彩技术亮相进博，智绘AI家电新视界

三星在第八届进博会上紧扣AI浪潮，展示了显示技术、智能家电、半导体及物联网等领域的前沿成果。重点推出全球首款Micro RGB电视，融合微米级LED创新显示与AI功能，实现精准控光、更高亮度和真实色彩；同时展出144英寸Micro LED及纤薄折叠手机，体现从超大屏到移动显示的技术实力。全线产品集成Vision AI，通过影像增强、自适应音效等技术优化视听体验，并借助Galaxy AI提供个性化服务，强化在移动AI领域的领先地位。

AI智能家电显示技术半导体
荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

本期AI日报聚焦多领域突破：OpenAI视频应用Sora登陆安卓平台并引入付费角色功能；网易云音乐推出AI调音大师实现智能音效适配；字节跳动高薪布局人形机器人赛道；谷歌Gemini平台将升级图像生成技术；llama.cpp实现多模态革命；特斯拉秘密实验室通过行为数据训练机器人；上海首例AI著作权案宣判保护原创；微软推出自研图像生成器MAI-Image-1，在创意效率与质量间取得平衡。

OpenAI Sora Android
M6 iPad Pro将加入VC散热：向iPhone 17 Pro看齐

随着芯片性能的不断提升，苹果计划为iPad Pro配备VC散热系统，消费者最快会在M6 iPad Pro上看到。 Mark Gurman指出，如果iPhone与iPad Pro配备VC散热系统的尝试取得成功，苹果后续可能会将该技术应用到MacBook Air等其他被动散热设备上。目前苹果对iPad Pro的更新周期约为18个月，因此下一代iPad Pro预计将在2027年春季发布。

iPad Pro VC散热系统
何小鹏回应机器人IRON里是真人质疑：感谢认可

在第七届小鹏科技日上，小鹏汽车自主研发的人形机器人IRON首次亮相，其逼真步态引发网友惊叹“100%真人在里面”。面对质疑，董事长何小鹏以“感谢认可”巧妙回应，展现技术自信。IRON采用类人“骨骼-肌肉-皮肤”结构，搭载仿生肌肉驱动系统和22自由度拟态双手，能精准感知环境变化。团队历时7年研发，计划明年4月进入量产阶段。该机器人还融合物理世界模型体系，集成VLT/VLA/VLM三大核心能力，实现实时环境交互。此次展示既体现小鹏技术积累，也引发对科技真实性的思考。

小鹏科技日人形机器人 IRON亮相
荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

本期AI日报聚焦多项技术突破：火山引擎发布豆包视频生成模型1.0pro+fast，速度提升3倍且价格下降72%；百度与上海体育大学推出“上体体育大模型2.0”，拓展AI在运动员训练等场景应用；谷歌Gemini新增一键生成PPT功能；美团发布LongCat-Video模型，支持5分钟连贯视频生成；xAI推出虚拟女友Mika引发热议；MiniMax开源高性能M2编码模型；OpenAI上线企业知识管理功能；另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万，展现年轻创业者的技术影响力。

AI 视频生成火山引擎
有AI就有无限可能，灰豚AI发布新一代GEO系统

11月1日，灰豚AI发布新一代GEO系统，突破传统仅支持文本内容优化的局限，全面支持国内短视频平台作品优化，实现近乎零算力成本。该技术被视作行业重大创新，是当前国内GEO源头厂商的重要突破。系统通过AI训练提升企业在生成式搜索中的品牌影响力，助力企业获得竞争优势。未来电商将从平台化转向AI化，灰豚GEO系统支持多种合作模式，让企业以业务增长为导向，抢占AI市场先机。

灰豚AI GEO系统短视频优化
荐人类的心声，被AI听见了

过去一年里，一个看似无意义的Labubu，成为了颇具情绪号召力的符号。这只表情夸张、眼神狡黠的小兽，从逼仄的盲盒一路爬上潮流顶峰。它既不代表功能，也不传达身份，却让无数年轻人愿意为之排队、抽签。而这，离不开更大的消费变迁。事后诸葛来看，Labubu的走红并非偶然，而是精准踩中了一个趋势——在这个时代，人们似乎越来越愿意为“情绪价值”付费。与此�

文章搜索核心标签情绪价值
iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

据站长之家报道，iPhone 18 Pro系列正进行屏幕形态革新，测试HIAA挖孔方案，将显著缩小沿用多年的灵动岛设计，提升屏占比与视觉简洁度。同时硬件升级包括：测试可变光圈技术以优化拍照；Pro+Max版采用钢壳电池增强耐用性与安全性；新增透明版本提供个性化选择。超透镜技术的研发旨在缩小Face ID组件体积，确保识别精度，进一步压缩灵动岛区域，提升交互流畅性。

iPhone18Pro HIAA挖孔方案灵动岛设计

今日大家都在搜的词：

热文

3 天
7天

马斯克的xAI正努力实现Grok多模态化将支持上传照片获得文本回复

马斯克称xAI Grok“儿童模式”已上线完善布局全年龄段

荐AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI百科全书Grokipedia

三星Micro RGB色彩技术亮相进博，智绘AI家电新视界

荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

M6 iPad Pro将加入VC散热：向iPhone 17 Pro看齐

何小鹏回应机器人IRON里是真人质疑：感谢认可

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

有AI就有无限可能，灰豚AI发布新一代GEO系统

荐人类的心声，被AI听见了

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

站长商机

​马斯克的xAI正努力实现Grok多模态化 将支持上传照片获得文本回复

今日大家都在搜的词：

热文

站长商机

马斯克的xAI正努力实现Grok多模态化将支持上传照片获得文本回复