首页 > 传媒 > 关键词  > 智能座舱最新资讯  > 正文

加速对话体验迭代,腾讯云智能车载语音助手推出场景化AI训练方案

2023-04-18 11:11 · 稿源: 站长之家用户

  当前,汽车行业正从“以车为中心”向“以人为中心”发展,用户选择从重视性能,向重视体验变化,智能座舱和服务也越来越重要。其中,车载语音助手作为连接人和车的主要交互方式,也被赋予“更好用、个性化、娱乐化”的新期待。

   4 月 17 日,在“TIME DAY·腾讯智慧出行技术开放日”,全新升级的腾讯云智能车载语音助手对外亮相。通过打通训练平台和云端能力,语音交互功能更新周期将缩短至小时级。在无代码开发环境下,即使无算法经验的人员也能轻松上手,轻松优化专属模型效果,实现需求快速上线。

  同时,3D数字人与语音助手联合,多方言、多语种识别等功能,也将助力车企打造更有温度、有效率、有感情的人车交互体验,以产品和服务创新赢得市场。腾讯云副总裁、腾讯云智能平台负责人李学朝表示,目前腾讯云智能车载语音助手已落地超过 15 家车企,交付超过 100 款国内外畅销车型,累计接入车辆 300 多万台。

  (腾讯云副总裁、腾讯云智能平台负责人 李学朝)

  AI训练平台和云端能力打通,软件迭代周期缩短至小时级

  当前,随着软件定义汽车趋势的发展,软件在整车价值中的占比越来越高,以数字技术提升研发效率、加速软件迭代,正成为车企竞争力的关键。当用户选择从重视性能,向重视体验变化,也向以智能座舱为代表的软件服务迭代周期提出新挑战。

  目前,行业普遍采用传统OTA方式进行软件研发、更新,迭代周期长达3- 6 个月,难以适应快节奏的更新需求。

  对此,腾讯车载语音助手结合腾讯云TI平台,提供场景化的训练能力,基于腾讯先进AI能力和技术经验,为车企提供模型训练、模型测评、模型管理等能力,用于快速提升ASR、NLP识别效果。从训练到部署上线,软件迭代周期从月级缩短至小时级。在ASR专有名词、场景句式,NLP新技能建设、语料泛化等核心场景,这将助力车企实现需求快速迭代、上线,及时根据车主、用户反馈做出响应。

  (腾讯车载语音助手结合腾讯云TI平台,推出场景化AI训练方案)

  在落地层面,腾讯将聚焦底层能力建设,针对汽车行业发展需求,推出可配置可训练的无代码开发平台。灵活的架构既支持个性化方案定制,也可以实现原子化AI能力的单点输出,从产品设计到代码层面联合共建,携手生态伙伴助力车企快速建立落地和迭代能力。

  (腾讯云智能车载语音助手推出可配置可训练的无代码开发平台)

  深度结合数字人能力,打造情感化用车体验

  近年来,数字人相关应用涌现,为大众带来更生动、直观的交互体验。如何将数字人更好地应用于车载场景,实现自然的语音交互,拟人的视听表达,也是腾讯云智能车载语音助手的探索方向。

  在本次升级中,腾讯云智能数智人,结合座舱场景定制出唱歌、跳舞等 100 多种动作,情感化TTS提供拟人化对话风格并支持多种情感识别。同时,数字人口型、动作和TTS发音均已实现音素级驱动,表达更逼真,交流更生动。

  根据车企需求,腾讯云智能车载语音助手还支持车企品牌定制专属数字人IP,提供成熟的人格化体系框架,并可根据个性化需求快速设计动作、表情、声音,合成真人或者卡通形象的数字人车载语音助手。

  与此同时,伴随汽车行业出海业务的蓬勃发展,车主用户覆盖至多个国家和地区。腾讯云智能车载语音助手,还可以提供七种方言、十四种外语识别,支撑多方言、多语种自由切换,达到流畅的跨语言对话体验。

  (腾讯云智能车载语音提供多方言、多语种识别)

  随着“智能座舱”的不断发展,车内终端应用越来越丰富,车主需要语音交互的场景日益增加。本次升级,腾讯云智能车载语音助手还展示了全场景可见即可说,用车知识问答,导航多途径点增加/减少等功能更新。此外,腾讯云智能车载语音助手还深度接入了音乐、播客、新闻、电台、有声书等多类型腾讯生态资源,让人车交互体验更智能、更轻松。

  (腾讯云智能车载语音助手支持车企品牌定制专属数字人IP)

  智能座舱直面用户,是感知比较强的服务之一。腾讯集团高 级执行副总裁、云与智慧产业事业群CEO汤道生表示,腾讯将基于AI不断优化交互体验,让汽车变得更智能、更有温度。与此同时,作为扎根产业互联网的科技公司,腾讯基于数字技术与产业实践融合的经验积累,以及 20 多年C端用户产品和服务经验,将积极联手产业链上下游合作伙伴,做好汽车产业数字化升级的助手,助力汽车产业发展新高峰。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Rhea:生成高质量的短视频

    Rhea是一款由人工智能驱动的短视频生成平台。它可以通过文本输入生成高质量、快速、引人入胜的短视频。Rhea还可以为您的视频生成字幕,使其更具可访问性。您还可以自定义字幕的样式,以与您的品牌相匹配。您可以根据需要定制视频的风格,例如使用定制的配色方案和字体。Rhea适用于各种用途的视频生成,从教育内容到营销视频不一而足。

  • LIDO:一键生成独特的AI音乐,为您的歌曲、TikToks、Reels等创作无版权的音乐。

    LIDO是一款AI音乐生成器,可以快速生成带有自定义歌词和风格的独特歌曲。无论您是新手音乐人还是想要探索音乐无限可能性的人,LIDO都是您释放创造力的一站式解决方案。它生成的音乐具有无版权,可以用于您的歌曲、TikToks、Reels等。定价信息请访问官网了解。

  • IceburgCRM:智能创建任意类型的CRM

    IceburgCRM是一个智能创建CRM的平台,使用AI技术,可以快速转换现有的MySQL数据库为全面的CRM系统。用户可以通过描述需求、选择预设模板或上传现有数据库来创建自己的CRM。IceburgCRM提供了各种预设模板,包括收藏品目录、葡萄酒管理、健身工作室、职业网络、手工艺品供应商、咖啡爱好者、养蜂等。IceburgCRM还提供AI辅助填写和数据导入导出功能,以及多种主题、工作流等特点。IceburgCRM有免费和付费版本可供选择。

  • Mynt:免费AI写作工具

    Mynt是一个免费的AI写作工具,提供单一界面生成各种内容。用户可以导入数据、讨论想法,生成各种文档和内容。Mynt使用先进的语言模型,帮助用户以更高效的方式生成高质量的内容。Mynt有不同的付费计划,包括免费试用和按需付费,满足不同团队的需求。

  • emojiu.cc:搜索和复制粘贴 iPhone 表情符号

    Emoji Copy Paste 是一个可以搜索和复制粘贴 iPhone 表情符号的工具。用户可以通过简单的点击,探索各种表情符号,包括心形、笑脸、骷髅、书呆子、悲伤、iPhone、眼睛、星星、点赞、亲吻和手心等表情符号。增强您的在线沟通,轻松表达自己。

  • ioPartners:连接3D可定制的AI伙伴。

    ioPartners是您的个人AI助手,与您的3D AI ioPartner进行无尽对话,定制外观、互动,并塑造其个性特点,以打造完美的伙伴,共同创造独特的故事和体验。记忆保留功能让您的AI伙伴记住对话的细节,打造个性化和不断发展的互动。通过选择和组合不同特点,为您的ioPartner塑造独特的个性。保护您的隐私,对话保密,不与第三方共享数据。无需下载或安装,直接在浏览器上运行。

  • Gen Master:All-in-One AI工具

    Genmaster.ai是一款集成了AI写作、图像生成和聊天机器人等功能的全能AI平台。通过我们的创新工具,您可以简化项目流程,释放创造力。

  • Campana:为您的业务提供竞争情报

    Campana是您获取竞争情报的最佳方式。当竞争对手更改网站、发布新功能、在社交媒体上发布内容等时,您将收到通知。启用竞争监测,保持竞争优势。

  • Instafill:智能表单填写工具

    InstaFill AI是一款智能表单填写工具,可以自动识别和填写各种表单,提高工作效率。它具有强大的表单识别和智能填写功能,可以自动填写各种常见表单字段,并支持自定义规则和模板。它可以广泛应用于各个行业的表单填写场景,例如在线购物、注册申请、表格填写等。InstaFill AI提供免费试用和付费版本,灵活满足用户的需求。

  • SermoAI:用于银行和金融科技公司提供全面客户支持的AI聊天机器人

    SermoAI是一款AI聊天机器人,帮助银行和金融科技公司以客户的母语提供全面的客户支持。它能够处理不断增长的支持需求,消除语言障碍,提供个性化答案,快速解决问题,自动化客户沟通,并降低支持成本。该产品的定价信息请联系官方网站获取。

  • Open Agent Studio:建立未来无法实现的业务自动化

    Open Agent Studio是一个无需编写易碎代码选择器或计算机视觉,就能够使用简单的英语来建立以前无法实现的业务自动化的新一代RPA工具。我们引入了强大的新RPA概念,例如“语义目标”,以简单的语言来创建比之前一代易碎代码选择器更稳健且易于使用的代理程序。用户可以使用Agent Recorder记录点击、鼠标移动和键盘输入,以便快速构建和编辑代理程序。Open Agent Studio是一个独特的无代码合作伙伴构建工具,为用户提供了一种在其他所有RPA工具中都无法实现的解决方案。

  • QnAPe:问答社区,学习交流平台

    QnAPe是一个问答平台,连接提供独特见解和高质量答案的人们。让我们一起学习领导。

  • LabEx:通过AI和动手实验学习编程

    LabEx是一个结合AI技术和动手实验室的教育平台,专注于提供Linux、Python、Docker、Kubernetes、机器学习等技术的实战学习体验。通过互动式的学习环境和结构化的技能树,用户可以逐步掌握技术技能,并在完成技能树后参与真实世界项目,巩固所学知识。LabEx还拥有AI助手Labby,为用户提供实时的编程帮助和答疑。此外,LabEx承诺每完成一个技能树,就会种植一棵真实的树,让学习之旅也能为地球做出贡献。

  • Ready AI Goal + Habit Tracker:为您打造和维持积极习惯的一款应用

    Ready是一款旨在帮助您建立和保持积极习惯,从而实现更快乐、更健康、更充实的生活的应用。它提供个性化的智能辅导,包括健康习惯、平衡生活、营养指导、个性化饮食计划、健身目标、个性化锻炼计划、早晨日常、赋能习惯、个性化指导、成功规划、目标设定、进展跟踪、个人成长等功能。Ready通过AI教练提供个性化指导,24/7全天候服务,为您提供通往更好生活的路径。

  • Mini-Gemini:多模态AI模型,图像理解与生成兼备

    Mini-Gemini是由香港中文大学终身教授贾佳亚团队开发的多模态模型,具备精准的图像理解能力和高质量的训练数据。该模型结合图像推理和生成,提供不同规模的版本,性能与GPT-4和DALLE3相媲美。Mini-Gemini采用Gemini的视觉双分支信息挖掘方法和SDXL技术,通过卷积网络编码图像并利用Attention机制挖掘信息,同时结合LLM生成文本链接两个模型。

  • ControlNet++:提升文本到图像生成的可控性

    ControlNet++是一种新型的文本到图像扩散模型,通过显式优化生成图像与条件控制之间的像素级循环一致性,显著提高了在各种条件控制下的可控性。它通过使用预训练的判别性奖励模型来提取生成图像的对应条件,并优化输入条件控制与提取条件之间的一致性损失。此外,ControlNet++引入了一种高效的奖励策略,通过向输入图像中添加噪声来扰动图像,然后使用单步去噪图像进行奖励微调,避免了与图像采样相关的大量时间和内存成本。

  • Suno 音乐生成器:基于 suno.ai 的文字快速创作音乐网站

    Suno 音乐生成器是一个基于 NextJS 开发的非官方 suno.ai 音乐生成网站,用户可以通过输入 prompt 快速生成自己想要的歌曲。通过 JavaScript 逆向工程解析 suno.ai 生成歌曲的 API,内置 token 更新和保活功能,无需担心 token 过期。

  • Cubeo AI:AI助手,业务自动化

    Cubeo是一款AI助手,可帮助您的业务实现销售提升、高质量潜在客户生成、品牌建设和业务自动化。它可以为您的业务提供全天候的支持,包括市场营销、销售、潜在客户生成、客户支持、人力资源、内部流程等方面的自动化。

  • STORM:自动化生成深度长篇内容

    STORM是由斯坦福大学开发的系统,能够自动化编写具有广度和深度的长篇文章,类似于维基百科。它通过互联网搜索自动搜集资料,模拟专家与作者对话生成结构化大纲,并最终生成完整文章。STORM还具备文章润色功能,优化语句和结构,确保内容流畅准确。

  • 多种草AI:小红书AI创作工具

    多种草是一个专为自媒体博主、市场运营设计的 AI 智能创作平台,服务自媒体工作者在抖音、小红书、微信等全平台文案及图文撰写。它提供多种功能,包括小红书文案创作、小红书敏感词检测、小红书账号定位分析、文案配图生成、小红书文案加表情、内容选题灵感等。用户可以根据不同的需求,使用该工具生成符合小红书风格的文案和图文,提升内容质量和创作效率。

今日大家都在搜的词: