首页 > 业界 > 关键词  > 理想汽车最新资讯  > 正文

说话就能控制左右快慢!理想汽车MindVLA大模型实测视频发布

2025-03-21 18:30 · 稿源: 快科技

快科技3月21日消息,今天下午,理想汽车详细介绍了MindVLA大模型与现有端到端 VLM大模型的区别,并公布了相关实测视频。

按能力表现来看,MindVLA 模型加持下的汽车就像一个助手,能与用户沟通、理解用户意图,帮用户做更多事情。

比如,它可以在陌生车库漫游找车位直至自主完成泊车;

可以按照驾驶员的开快点、开慢点、左拐、右拐”等语音指令进行行动;

可以在你发给它地标照片后,按图索骥找到你等等。

理想汽车还表示,MindVLA是理想汽车下一代自动驾驶核心架构,使用了MindGPT作为语言基座,demo中的语音通过座舱的ASR后变成文字,输入给 MindVLA。

这一设计继承自 MindGPT 在语言理解与交互领域的优势能力(如语义解析、逻辑推理等),并针对自动驾驶场景进行了专项优化。

这体现了智舱与智驾在功能层的协同创新,而非系统层的完全融合。

未来,我们将持续探索多模态交互与驾驶决策的深度耦合,为用户提供更自然的人车共驾”体验。

说话就能控制左右快慢!理想汽车MindVLA大模型实测视频发布

举报

  • 相关推荐
  • 检出率超95%,支持透明液体识别!INDEMIND脏污识别:更快、更准、更智能

    扫地机器人技术正从“盲目清扫”向“智能识别”进化。INDEMIND推出立体视觉污染识别方案,能精准识别固态、液态、粉末及混合四类污渍,检出率超95%。该技术结合智能决策引擎,实现自主调整清洁参数,避免二次污染。同时提供单目、双目及三目模块矩阵,支持快速适配升级,推动行业迈向精准化智能清洁新阶段。

  • INDEMIND:高需求和低渗透之间,服务机器人为何规模化落地难?

    在全球经济面临劳动力短缺的背景下,加之疫情的进一步催化,服务机器人取得了蓬勃发展,预计 2022 年,全球服务机器人市场规模将达到 217 亿美元,然而尽管如此,在高速发展之下,机器人的行业渗透率却并未明显提高,究其原因在于红利之后,机器人的规模化商业落地过程走的并不顺利...作为国内领先的机器人关键AI技术供应商,INDEMIND在机器人的导航、避障、决策、AI交

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • 美萍智能物业收费系统_自动催缴+云报表_物业收费软件

    还在为手工做账、半夜对账、欠费难催而头疼?全国6000+物业公司都在用的“美萍智能物业收费管理系统”,3步让收费效率飙升80%!一键生成账单系统可按面积/阶梯/周期自动生成物业费、水电公摊、停车费等账单,规则透明零差错;业主信息、房产资料支持Excel批量导入,10分钟完成数万条数据初始化。业主缴费像网购一样简单关注物业公众号即可秒查账单、一键微信支付/支付宝/银联缴费;欠费前自动推送温馨提醒,缴费率平均提升15%。智能催收·财务清晰内置“智能催缴引擎”,按欠费天数自动发送短信/微信;电脑端+手机APP实时呈现收费率、账龄分析、现金流趋势,月底不再熬夜对账。多项目云端统管集团型物业可在同一后台统一管理N个小区,分楼栋授权、分项目核算,总部随时随地查看运营数据,决策有据。银行级数据安全阿里云双机房备份,HTTPS加密传输,业主资料与交易数据全程无忧。限时福利:现在搜索“美萍软件官网”注册即可免费试用30天,专业客服远程指导上线。让美萍帮您告别糊涂账,迈入智慧物业新时代!

  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

  • AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

    本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。

  • 聚焦制造业智能化转型 中国科学技术大学依托昇腾突破知识增强大模型关键技术

    中国科学技术大学宋骞团队基于昇腾平台开发了工业知识图谱构建框架和大模型增强推理技术。该研究通过融合领域小模型与大语言模型,构建了"初始识别-知识抽取-知识引导反思"三阶段框架,显著提升了知识抽取准确性。在智能运维系统应用中,团队采用ETL架构处理多模态数据,结合RDF语义网技术构建知识图谱,并研发故障智能预测诊断模块。同时创新性地提出知识增强与过滤框架,利用PLM嵌入空间降低计算负担,有效提升知识增强的灵活性。研究成果显著提升了工业设备智能运维水平,实现了核心技术的自主创新适配,为构建安全高效的现代工业体系提供关键技术支撑。

  • 华为云发布CloudVeo智能驾驶云服务 将在全国三大专区完成布局

    8月28日,第十一届中国国际大数据产业博览会期间,华为云发布智能驾驶云服务CloudVeo,并上线贵安汽车专区,与乌克兰察布专区形成南北双专区的全国一体化算力网络。华为云CloudMatrix384超节点助力智能驾驶模型训练,提升效率20%,并联合长安、广汽等车企推动智能驾驶技术创新,加速中国汽车产业智能化升级。

  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

  • 英伟达机器人底层技术突破,微美全息(WIMI.US)多维布局助推产业生态爆发

    英伟达发布机器人AI芯片,黄仁勋称AI下一波浪潮将是机器人。上海发布AI+制造方案,推动3000家企业智能化。人形机器人市场前景广阔,预计2030年产量达23万台。微美全息等企业积极布局,在工业与家庭场景加速落地。机器人技术从"炫技"走向实用,正重塑产业结构和生活方式。

今日大家都在搜的词: