首页 > 传媒 > 关键词  > 正文

融入文心一言大模型能力 极越01跑出全球最快智舱交互速度

2023-10-31 15:25 · 稿源: 站长之家用户

        10 月 27 日,极越首台AI汽车机器人——极越 01 上市,分别是极越01 Max,售价24. 99 万元,和极越01 Max Performance,售价33. 99 万元,而且现在购买还可最 高享价值 7 万元的权益优惠。

       可以看出,极越 01 这款车主打一个智能。要知道,极越 01 可是基于吉利SEA浩瀚架构和百度AI能力打造的智能汽车,高通 8295 芯片高算力、沉浸式3D视觉HMI效果、和融入文心一言大模型能力的SIMO等等,应有尽有,为用户创造除标杆级的智能科技出行体验。

       人车交互覆盖车内车外 智能AI伙伴SIMO融入语音大模型

       极越 01 被称为“汽车机器人”,那必然拥有一个强大的“大脑”,其国内首发搭载了高通第 4 代骁龙汽车数字座舱平台 8295 芯片,并首 次完全启用双NPU(60TOPS),是当下市面上主流芯片算力的 8 倍左右。大家可能对 8 倍的性能提升没有明显感知,那如果举几个例子,相信大家就能理解极越 01 的强大了。

       在“最 强大脑”的赋能下,极越 01 的智能AI伙伴SIMO语音反应速度业内领先,语音识别速度快至500ms,不仅覆盖车内车外、四路同说、连续对话等复杂场景,还融合语音、手势、视觉识别等多模态交互。同样,在 8295 的强算力支持下,极越 01 在SIMO上更是融入了文心一言的大模型能力,是全球首 个大模型“上车”的智能汽车,智商达到了新的高度,甚至可以解奥数题,而且用户和产品交互得越多,它就越能理解用户需求。

       值得一说的是,极越 01 还率先做到了语音AI算法全量本地化,全域全离线语音即便在山区、隧道等弱网甚至断网的环境下,依然能实现极速交互。由于车外设置了麦克风和扬声器,所以用户也可以再车外与SIMO交互。当用户携带UWB钥匙接近车辆约2m时,车辆会解锁,车外语音自动激活待命,灯光反馈,此时就可以进行语音交互了;而在任意乘员落座后,SIMO便会自动切换到车内语音。

       在车内,SIMO可见即可说,可说即可做,而且它还是国内首 个语音识别定位支持四路同时说的智舱,四个驾驶座都可以对SIMO发指令,即使在七嘴八舌、多人指令、声音交织、连续对话的情况下,它也能很好的理解和满足每个人的不同需求。

       智能导航远超同级 3D智能地图+超清3D大屏

       汽车机器人——极越 01 不仅有“最 强大脑”和“语言表达”等能力,还有眼观六路的“视觉”。全场景、全融合3D智能驾驶地图,图示化表达更清晰,车道级导航一目了然,实现了感知动静态的人、车、物与地图导航深度融合,消除视觉盲区,在车内即可清晰分辨周围车辆形态、道路信息与标识等,实现了从启到停、一镜到底的动效,更细腻、更贴合用车场景。

       当然这一切的最终成果,还得靠极越 01 的大屏呈现。业内独 家的35. 6 英寸6k超清一体3D大屏,是当前尺寸最 大、边框最窄、不割裂、不拼接的一体化大屏。用户可以在这块大屏上进行全屏/双屏/三屏任意分区体验,拖拽、缩放、三指操作等各类交互丝滑不卡顿,流畅度媲美旗舰手机。

       当然,用户还可以通过这块大屏进行全屏游戏,在专属自带的《狂野飙车》中,可以联动安全带、氛围灯、空调等配置,带来超4D的震撼体验,非常丝滑。此外还有KTV、观影厅和休息室等功能。总之就是,通过整车软硬件配置的协同,给用户打造其他车不可能具备的沉浸式体验。

       “后发先至”,作为智能汽车产品阵营的“生力军”,极越 01 拥有“最 强大脑”的强 力加持,也具备了“可听”、“可说”、“可思考”、“可娱乐”的智能科技,相信这样一个能打能扛的汽车机器人,必将会在未来的汽车市场中大放异彩。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • 从“全球首发”到“舱驾一体年内量产” ,卓驭携高通全系产品亮相苏州峰会

    6月26-27日,卓驭科技参加2025高通汽车技术与合作峰会,展示基于高通Snapdragon Ride芯片的智能驾驶解决方案,包括全球首发的7V/10V配置方案和即将量产的舱驾一体方案。公司控制器业务总经理齐贵宝发表主题演讲,介绍卓驭与高通合作打造的辅助驾驶系统:2024年底已实现城区领航功能量产,2025年将推出基于SA8775P芯片的舱驾一体方案。峰会期间,卓驭展示了与红旗合作的天工05/06车型,搭载其10V高算力方案,并带来场外试驾体验。卓驭的"成行平台"具备开放生态能力,已实现与红旗、高通的技术深度融合,打造出兼具高效感知、决策和安全性的智能驾驶方案。未来将持续技术创新,构建更完善的智能出行生态。

  • 2025最新全球AI大模型排名,国内外模型动态洗牌(实时更新平台推荐)

    2025年全球AI大模型竞争进入白热化阶段,OpenAI、Google等国际巨头与中国企业激烈交锋。技术迭代远超预期,仅半年内排名就经历多次洗牌。当前全球AI大模型综合排名Top10显示:1)GPT-4.5综合80.4分领跑;2)Claude3.7编程领域领先;3)Gemini2.0多模态标杆;4)国产DeepSeek R1推理速度提升3倍;5)阿里Qwen2.5数学编程单项第一。中国模型通过开源策略、垂直优化和成本革命实现弯道超车,如DeepSeek R1仅耗资600万美元达到GPT-4水平,字节豆包采用稀疏MoE架构成本大幅降低。中文场景深度优化表现突出,如文心一言4.0方言交互准确率92%。开源生态爆发,通义千问全尺寸开源(7B~110B参数)在Hugging Face排名第一。权威评估需结合标准化测试、人类盲测和场景适配性。

  • Soul App全双工语音大模型升级,让AI在交互中拥有“主动性”

    社交平台Soul App近日升级端到端全双工语音通话大模型,重新定义"全双工"交互模式。新模型突破传统语音交互依赖VAD机制与延迟控制逻辑的局限,赋予AI自主决策对话节奏的能力,实现主动打破沉默、适时打断用户、边听边说、时间语义感知等类人交互体验。同时具备多维度感知、口语化表达、音色复刻等功能,让AI更具"真人感"。该技术将应用于虚拟人实时通话、AI匹配1V1互动等场景,并探索多人互动场景应用。Soul CTO陶明表示,社交是情绪价值和信息价值的双向关系,平台将持续通过技术创新为用户提供更智能、沉浸的社交体验。数据显示,71.1%年轻人愿意和AI做朋友建立情感连接,AI社交正成为重要趋势。

  • 模型能力卷不过Google、快手,但这家视频生成创企却可能最先赚到钱?

    去年4月,我们曾经在《这个 AI 赛道,一个月内融资4笔,一大半的创始人是华人》选题中观察过 AI 视频赛道,彼时赛道 Top 级玩家还是 Pika、Pixverse、Haiper 等华人创企。

  • 长红30多年,全球第一的冰淇淋公司要IPO

    当各家冰淇淋品牌“争奇斗艳”的时候,国际冰淇淋巨头“梦龙冰淇淋”也在这个热浪滚滚的七月迎来关键进展。 7月1日,梦龙冰淇淋公司正式完成了从联合利华集团的剥离。一直以来,联合利华的冰淇淋业务拥有和路雪、梦龙、可爱多等多个知名品牌,占据全球20%的市场份额,是名副其实的冰淇淋巨头。 若用2024年份额绝对值来计算,联合利华冰淇淋业务的体量约等于2个雀

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • 深度理解,服务在地|Moka 用本地化实践深化全球布局

    Moka持续深耕海外市场,通过产品迭代和生态合作拓展全球化布局。2024年5月和6月,Moka先后亮相亚洲HR Tech展会和香港HR峰会,展示其AI驱动的智能招聘系统在多语言支持、跨时区面试安排等场景的解决方案。公司已在香港和新加坡设立办公室,并与当地服务商建立合作网络,强化区域落地能力。Moka Recruiting已服务东南亚、中东和欧洲客户,覆盖零售、金融科技等行业,通过持续打磨产品合规性和本地化功能,助力企业构建全球化人才连接能力。未来Moka将继续以技术驱动提升全球招聘效率,支持企业人力资源管理的全球化进程。

  • @开发者们:百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!

    6月30日,百度文心大模型4.5系列正式开源并在国内领先的开源平台GitCode首发上线。该系列包含10款模型,涵盖47B和3B参数的混合专家(MoE)模型及0.3B的稠密参数模型,采用创新的多模态异架构结构实现跨模态知识融合。模型基于飞桨框架开发,训练效率达47% MFU,在文本和多模态基准测试中达到SOTA水平。所有模型按Apache2.0协议开源,配套产业级开发套件支持多种芯片部署。GitCode平台已汇聚620万用户,为AI开发者提供代码托管、协同开发等全流程支持。此次开源将推动中国AI生态创新,加速大模型技术产业化应用。