首页 > 业界 > 关键词  > 正文

理想汽车:理想Mind GPT中文大模型综合性评测榜名!

2023-12-11 06:58 · 稿源: 快科技

快科技12月10日消息,在刚刚举行的理想汽车智能软件发布会上,理想汽车官宣,在OTA 5.0中,理想同学最大的变化,就是引入了Mind GPT的能力

Mind GPT是理想全自研的多模态认知大模型,它可以与汽车进行一个完美的融合,让每位家庭成员都能在车里体验到最好的AI(爱)(注:目前Mind GPT还处于内测版本)。

理想汽车:理想Mind GPT中文大模型综合性评测榜第一名!

理想汽车称,其从0到1构建了Mind GPT原始基座模型,模型结构采用了自研的TaskFormer神经网络架构,基于用车、娱乐、出行等场景使用SFT、RLHF等技术进行了一系列的训练,让Mind GPT拥有了理解、生成、知识记忆及推理的三大能力。

那么Mind GPT在行业里到底是什么水平呢?

在目前国内极具权威性的,中文大语言模型评测榜单C-EVAL,覆盖了人文、社科、理工等多个方向共52个学科。

Mind GPT在58个参加测评的大模型中排行第一名,同时,还有涵盖从基础学科到高级专业包含67个主题领域的评测榜单CMMLU,Mind GPT也获得第一名,拿下了双冠军。

理想汽车:理想Mind GPT中文大模型综合性评测榜第一名!

理想汽车:理想Mind GPT中文大模型综合性评测榜第一名!

Mind GPT基于理想同学的重点场景,量身定制了覆盖111个领域、超过1000种以上的专属能力,而且还在不断进化和快速成长中。

举报

  • 相关推荐
  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • 当GPT-5遇上Gemini 2.5,谁更适合你的业务?这份对比报告说了算

    某跨境电商CTO复盘会上展示:GPT-5 Standard处理百万级商品描述时,费用比Gemini 2.5 Flash-Lite高35%,响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试,提供透明价格拆解和性能雷达图,帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%,而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价,生成定制化决策报告,用数据替代经验主义,提升技术选型效率。

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • 一到秋天就emo可能患上悲秋综合征:可通过这些方式调节情绪

    随着秋季的来临,不少人发现自己情绪出现了变化,莫名感到烦躁、嗜睡且情绪低落。近日,网络上众多网友分享自身感受,称一到秋天就陷入“emo”状态,疑似患上了所谓的“悲秋综合征”。 “悲秋综合征”并非严格的医学诊断术语,它描述的是在秋天因景色萧瑟,人们内心产生凄凉、苦闷之感,甚至出现焦虑、抑郁情绪的一种状况,本质上属于季节性情感障碍。其主要表

  • 零跑霸榜销冠5个月,“半价理想”能支棱多久?

    如果说新能源汽车圈最大的黑马,非零跑汽车莫属,它是唯一一个创始人拥有制造行业背景,却摆脱了"倒闭"魔咒的车企。今年,零跑已经连续5个月霸榜新能源汽车销量排行榜,最疯狂的7月,竟然交付了超过5万台车。截至8月21日这天,零跑累计交付90万台。 零跑汽车创始人、董事长朱江明曾多次表示,车企年销百万辆是生存基础,50万辆只能在挣扎线徘徊。虽然是除�

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • 甩第二名一大截!海尔洗衣机H1份额第一、量额双增

    中国家电行业面临国内竞争白热化与海外不确定性增强的双重挑战。洗衣机市场虽保持增长,但品牌竞争加剧,头部品牌增长压力凸显。海尔智家2025上半年财报显示,营收1564.94亿元,同比增长10.2%;净利润120.33亿元,增长15.6%,均创历史新高。其洗衣机市场份额达46.4%,稳居行业第一。海尔通过双高端品牌战略、全域营销体系及数字化降本增效实现高质量增长,核心部件自制率提升至60%,成本持续优化。

今日大家都在搜的词: