首页 > 业界 > 关键词  > xAI最新资讯  > 正文

​马斯克的xAI正努力实现Grok多模态化 将支持上传照片获得文本回复

2024-05-22 10:03 · 稿源:站长之家

划重点:

⭐ 埃隆・马斯克的 xAI 公司 x 正在为 Grok 聊天机器人添加多模态输入功能

最新的开发者文档显示了 xAI 在推出新模型方面的进展

⭐ Grok1.5V 将允许用户上传照片并获得基于文本的答案

站长之家(ChinaZ.com)5月22日 消息:埃隆・马斯克的人工智能公司 xAI 正在努力为其 Grok 聊天机器人增加多模态输入功能。

根据公开的开发者文件,埃隆·马斯克(Elon Musk)的人工智能公司xAI在向其Grok聊天机器人添加多模态输入方面取得了进展。这意味着,很快,用户就可以将照片上传到 Grok 并接收基于文本的答案。

xAI上个月在一篇博客文章中首次调侃了这一点,该博客称Grok-1.5V将提供“多个领域的多模态模型”。开发人员文档的最新更新似乎显示了新模型的发布进度。

在开发者文档中,一个 Python 脚本示范了开发人员如何使用 xAI 软件开发工具包库来生成基于文本和图像的回应。这个脚本读取图像文件,设置一个文本提示,并使用 xAI SDK 生成回应。

image.png

对于 xAI 而言,这是 Grok 的一项重大更新。Grok 最早于2023年11月发布,目前仅供购买 X 高级会员订阅的用户使用。最后一次更新是在今年3月的 Grok1.5版本,带来了改进的推理能力。

据 xAI 的一篇博文介,该模型是 “基于来自互联网公开来源直至2023年第三季度以及由人类审核员审查和整理的各种文本数据” 进行训练的。该博文补充说,Grok-1并未经过 xAI 的训练(包括 xAI 的公开帖子)。然而,Grok 确实拥有 “对世界的实时知识”,包括 xAI 上的帖子。

由埃隆・马斯克于2023年3月创立的 xAI 在人工智能领域相对较新,并落后于竞争对手,如 OpenAI 的 ChatGPT。然而,根据 xAI 的一篇博文,他们的 Grok1.5模型在各种基准测试中正在缩小与 GPT-4的差距,这些测试涵盖了从小学到高中各种竞赛题目的广泛范围。值得注意的是,大型语言模型的基准测试经常受到批评,因为如果这些基准测试包含在它们的训练数据中,这些模型就可以在基准测试上表现良好。

举报

  • 相关推荐
  • 马斯克称xAI Grok“儿童模式”已上线 完善布局全年龄段

    马斯克10月26日在X平台宣布,其人工智能助手Grok的“儿童模式”已全面上线。该模式是7月预告的“Baby Grok”计划阶段性成果,承诺为儿童提供友好内容,但具体功能设置、过滤机制及适用年龄等细节尚未披露。媒体分析指出,Grok正构建覆盖全年龄段用户的AI生态体系,从标准对话到儿童专属版本,展现xAI在人工智能助手领域差异化竞争的雄心。

  • AI日报:Hailuo 2.3发布;豆包AI编程史诗级升级;马斯克推出AI百科全书Grokipedia

    本期AI日报聚焦多领域突破:海螺AI 2.3实现视频生成技术跃升,支持双模式免费试用;豆包AI编程工具实现零基础可视化开发;马斯克推出AI百科Grokipedia;Mistral发布企业级AI开发平台;Anthropic推出金融版Claude,显著提升分析师效率;Pinterest升级AI购物助手功能;英伟达推出全能模型OmniVinci刷新性能纪录;DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

  • 三星Micro RGB色彩技术亮相进博,智绘AI家电新视界

    三星在第八届进博会上紧扣AI浪潮,展示了显示技术、智能家电、半导体及物联网等领域的前沿成果。重点推出全球首款Micro RGB电视,融合微米级LED创新显示与AI功能,实现精准控光、更高亮度和真实色彩;同时展出144英寸Micro LED及纤薄折叠手机,体现从超大屏到移动显示的技术实力。全线产品集成Vision AI,通过影像增强、自适应音效等技术优化视听体验,并借助Galaxy AI提供个性化服务,强化在移动AI领域的领先地位。

  • AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

    本期AI日报聚焦多领域突破:OpenAI视频应用Sora登陆安卓平台并引入付费角色功能;网易云音乐推出AI调音大师实现智能音效适配;字节跳动高薪布局人形机器人赛道;谷歌Gemini平台将升级图像生成技术;llama.cpp实现多模态革命;特斯拉秘密实验室通过行为数据训练机器人;上海首例AI著作权案宣判保护原创;微软推出自研图像生成器MAI-Image-1,在创意效率与质量间取得平衡。

  • M6 iPad Pro将加入VC散热:向iPhone 17 Pro看齐

    随着芯片性能的不断提升,苹果计划为iPad Pro配备VC散热系统,消费者最快会在M6 iPad Pro上看到。 Mark Gurman指出,如果iPhone与iPad Pro配备VC散热系统的尝试取得成功,苹果后续可能会将该技术应用到MacBook Air等其他被动散热设备上。 目前苹果对iPad Pro的更新周期约为18个月,因此下一代iPad Pro预计将在2027年春季发布。

  • 何小鹏回应机器人IRON里是真人质疑:感谢认可

    在第七届小鹏科技日上,小鹏汽车自主研发的人形机器人IRON首次亮相,其逼真步态引发网友惊叹“100%真人在里面”。面对质疑,董事长何小鹏以“感谢认可”巧妙回应,展现技术自信。IRON采用类人“骨骼-肌肉-皮肤”结构,搭载仿生肌肉驱动系统和22自由度拟态双手,能精准感知环境变化。团队历时7年研发,计划明年4月进入量产阶段。该机器人还融合物理世界模型体系,集成VLT/VLA/VLM三大核心能力,实现实时环境交互。此次展示既体现小鹏技术积累,也引发对科技真实性的思考。

  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

  • 有AI就有无限可能,灰豚AI发布新一代GEO系统

    11月1日,灰豚AI发布新一代GEO系统,突破传统仅支持文本内容优化的局限,全面支持国内短视频平台作品优化,实现近乎零算力成本。该技术被视作行业重大创新,是当前国内GEO源头厂商的重要突破。系统通过AI训练提升企业在生成式搜索中的品牌影响力,助力企业获得竞争优势。未来电商将从平台化转向AI化,灰豚GEO系统支持多种合作模式,让企业以业务增长为导向,抢占AI市场先机。

  • 人类的心声,被AI听见了

    过去一年里,一个看似无意义的Labubu,成为了颇具情绪号召力的符号。 这只表情夸张、眼神狡黠的小兽,从逼仄的盲盒一路爬上潮流顶峰。它既不代表功能,也不传达身份,却让无数年轻人愿意为之排队、抽签。 而这,离不开更大的消费变迁。事后诸葛来看,Labubu的走红并非偶然,而是精准踩中了一个趋势——在这个时代,人们似乎越来越愿意为“情绪价值”付费。 与此�

  • iPhone 18 Pro或缩小灵动岛 苹果正测试特殊挖孔方案

    据站长之家报道,iPhone 18 Pro系列正进行屏幕形态革新,测试HIAA挖孔方案,将显著缩小沿用多年的灵动岛设计,提升屏占比与视觉简洁度。同时硬件升级包括:测试可变光圈技术以优化拍照;Pro+Max版采用钢壳电池增强耐用性与安全性;新增透明版本提供个性化选择。超透镜技术的研发旨在缩小Face ID组件体积,确保识别精度,进一步压缩灵动岛区域,提升交互流畅性。

今日大家都在搜的词: