首页 > 业界 > 关键词  > Grok最新资讯  > 正文

马斯克本周将开源类ChatGPT产品Grok,性能超越GPT-3.5和LLaMA270B

2024-03-12 08:56 · 稿源:站长之家

**划重点:**

1. 🤖 Grok是由马斯克旗下公司xAI开发的生成式AI产品,于去年11月发布,测试性能超过GPT-3.5和LLaMA270B,但略弱于GPT-4。

2. 🌐 Grok-1模型通过多个测试平台表现出色,性能超越LLaMA2-70B和GPT-3.5,但与Claude2和GPT-4存在一定差距。

3. ⚖️ 马斯克选择开源Grok的背后可能与最近起诉OpenAI有关,强调兑现早期开放AI理念,反对转向闭源盈利的商业行为。

站长之家(ChinaZ.com)3月12日 消息:马斯克宣布将在本周开源由xAI旗下公司推出的生成式AI产品——Grok。

这款类ChatGPT产品于去年11月首次亮相,针对生成文本、代码、邮件和信息检索等多个领域提供功能。Grok经过测试,其性能在某些方面超越了GPT-3.5和LLaMA270B,但相对于GPT-4略显不足。

image.png

根据xAI官方公布的信息,Grok的开发团队采用了创新的训练方法。首先,他们训练了一个包含330亿参数的原始大模型Grok-0,其性能相当于拥有700亿参数的LLaMA2,但只使用了一半的训练资源。接着,基于Grok-0进行了蒸馏和微调,推出了Grok-1。

Grok-1在多个测试平台上的性能表现显著,超越了LLaMA2-70B和GPT-3.5。然而,在与Claude2和GPT-4的比较中,仍存在一定差距。开发团队还通过人工测试,使用了2023年匈牙利全国高中决赛的数学题,结果显示Grok-1在考试中以C级(59%)的成绩通过,相较之下,Claude-2获得55%,GPT-4则以68%的成绩获得B级,显示其推理能力较为优越。

尽管Grok-1在信息处理方面表现卓越,但需要注意的是其生成的内容仍需审核。Grok-1并非多模态产品,且缺乏独立搜索网络的能力。

马斯克选择在这一时刻开源Grok,可能与他最近对OpenAI的起诉有关。马斯克表示OpenAI背离了初衷,从最初的开源和造福人类的理念转向了闭源盈利。起诉书指控OpenAI违反了创始协议,要求其向公众免费提供技术成果。然而,OpenAI方面表示,当时为了更好地开发通用人工智能(AGI),获取更多资金是得到马斯克同意的。

xAI成立于2023年7月13日,属于马斯克旗下,核心团队成员曾在DeepMind、OpenAI、谷歌研究、微软研究、特斯拉等公司或多伦多大学等学术机构任职。以上内容参考xAI官网,如有侵权请联系删除。

举报

  • 相关推荐
  • 马斯克xAI发布Grok 4.1:响应速度和回答质量显著提升

    埃隆·马斯克旗下xAI公司于11月18日发布聊天机器人Grok 4.1版本。该版本在响应速度、回答质量及理解用户意图方面显著提升,支持“思考模式”深度推理与“非推理模式”即时回复。测试显示其情商、创意写作表现突出,幻觉率从12%降至4.2%。目前已在官网、X平台及苹果谷歌商店上线,并整合进特斯拉车辆。竞争对手包括ChatGPT、Gemini等主流AI助手,行业竞争日趋激烈。

  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • 马斯克称xAI Grok“儿童模式”已上线 完善布局全年龄段

    马斯克10月26日在X平台宣布,其人工智能助手Grok的“儿童模式”已全面上线。该模式是7月预告的“Baby Grok”计划阶段性成果,承诺为儿童提供友好内容,但具体功能设置、过滤机制及适用年龄等细节尚未披露。媒体分析指出,Grok正构建覆盖全年龄段用户的AI生态体系,从标准对话到儿童专属版本,展现xAI在人工智能助手领域差异化竞争的雄心。

  • 华为Mate 80/Pro/Pro Max/RS开启预约:全系直屏设计

    华为Mate80系列今日开启预约,四款机型亮相官网。全系延续星环设计语言,采用直边直屏方案,配备3D人脸识别技术。核心搭载新一代麒麟9030处理器,性能强劲。配色与存储选择丰富:Mate80提供四色及三种存储组合;Mate80 Pro增加16GB+1TB选项;Mate80 Pro+Max以四款独特配色亮相;顶配Mate80 RS大师版则带来三款高端配色及独家20GB定制内存方案,彰显技术实力。

  • 实测Gemini 3 Pro - 此即未来。

    经过238天等待,Gemini 3 Pro正式上线。在多项基准测试中表现惊人:Humanity's Last Exam测试达45.8%,Math Arena Apex获23.4分,ScreenSpot-Pro界面识别达72.7%。其前端代码能力尤为突出,仅用几十秒就能生成完整网页音乐播放器、像素画板,甚至成功复刻出可运行的Web OS系统。目前该模型在各大竞技场排行榜均位列第一,堪称2025年最具突破性的大模型。

  • 华为第一款Pro Max!华为Mate 80 Pro Max四色官图公布

    华为Mate 80系列已经官宣11月25日发布,同时还揭晓这次的四款机型,分别是分别是Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS非凡大师。 其中,Mate 80 Pro Max是全新版本,取代了以往的Pro 系列。 从官网信息来看,Mate 80和Mate 80 Pro应该差距较小,两款机型配备了完全一样的四款配色。

  • 华为Mate 80 Pro Max外观公布:采用双圆环设计

    华为宣布将于11月25日举行Mate80系列、Mate X7及全场景新品发布会,主题为“实力破圈,开启新篇”。官方预热视频首次展示Mate80 Pro+Max真机外观,后置摄像头延续圆形对称设计,新增“双环”ID,疑似磁吸充电模块,为系列首创。该系列将提供四款机型,首发麒麟9030处理器,预装鸿蒙OS6系统,性能与流畅度大幅提升,引发广泛关注。

  • AI日报:Hailuo 2.3发布;豆包AI编程史诗级升级;马斯克推出AI百科全书Grokipedia

    本期AI日报聚焦多领域突破:海螺AI 2.3实现视频生成技术跃升,支持双模式免费试用;豆包AI编程工具实现零基础可视化开发;马斯克推出AI百科Grokipedia;Mistral发布企业级AI开发平台;Anthropic推出金融版Claude,显著提升分析师效率;Pinterest升级AI购物助手功能;英伟达推出全能模型OmniVinci刷新性能纪录;DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

  • 打破乐器边界:AeroBand空气吉他助力机器人高交会开唱

    2025年11月14日,第二十七届中国国际高新技术成果交易会在深圳开幕。全球智能乐器品牌AeroBand空气乐队携智能乐器亮相,重点展示其明星产品AeroBand空气吉他。该产品是全球首款手自一体智能吉他,曾获2023年红点设计奖,具备手自一体、律动伴唱、APP互动学习及无痛硅胶弦等功能。展会现场,机器人化身演奏家与音乐人同台献艺,引发观众热烈反响。AeroBand通过科技重塑音乐全链路体验,致力于打造新一代智能乐器生态系统,让音乐学习更自由、创作更高效、表演更具突破性。

  • 腾讯智慧出行助力朗逸Pro升级智能座舱体验 推动微信等腾讯生态产品上车

    上汽大众11月17日发布朗逸Pro,起售价8.88万元。作为亮点,该车型率先搭载车载微信,支持语音播报消息、接听电话,确保驾驶安全;集成腾讯地图车机版,提供实时精准导航,并实现手机车机信息无缝流转。腾讯智慧出行基于云、AI及生态优势,推动微信等产品上车,助力打造差异化智能座舱体验。未来双方将持续合作,拓展更多服务场景,结合AI能力优化用户出行。

今日大家都在搜的词: