首页 > 传媒 > 关键词  > 灵云科技最新资讯  > 正文

捷通灵云增远场语音识别能力服务智能产业

2015-10-28 17:21 · 稿源: 站长之家用户

灵云科技10日消息:捷通华声面向智能车载、智能家电、智能家居、机器人等领域专门开发的全方位解决方案——灵云种子近期将全面升级,灵云种子将采用灵云远场语音识别技术能力,从根本上改变目前市场上因各式问题导致的仅能近距离交互的方式,为智能语音技术应用于智能车载、智能家电、智能家居、机器人等灵云奠定坚实的基础。

灵云种子自2015年初发布以来,得到了智能硬件、车载、机器人等多个领域的一致好评,特别是在机器人领域,解决了之前存在的种种人机交互困难的问题,使设备脱离了机械控制,真正让机器人实现了“能说会听、能思考、会判断”。

很长一段时间以来,科大讯飞、NUANCE等语音技术公司都在努力开拓智能硬件市场,但智能硬件产品在很多场景下因语音交互体验不如人意而不能满足市场的需求,究其原因主要是受限于背景噪音、其他声音干扰、回声、混响等多重复杂因素,进而导致的识别距离近、识别率低等明显痛点,在这些问题没有解决之前,智能硬件语音交互方面将一直是一个短板。鉴于此,灵云推出远场语音识别技术,将极大推进语音识别技术在真实生活场景中的应用。

远场语音识别技术的核心有两点,一是语音前端处理:利用麦克风阵列、回声消除等技术将目标说话人的声音增强,并抑制/消除周围无用的声音(噪声+回声);二是语音识别引擎针对麦克风阵列处理后的数据进行专门优化,以使远场识别效果达到特出。

灵云种子此次推出的远场语音识别技术,集成了全新的麦克风阵列方案,并利用麦克风阵列的空域滤波特性——在目标说话人方向形成拾音波束,抑制波束之外的噪声和反射声,其降噪和去混响效果均为国内领先水平。

可以想象,基于灵云远场语音识别的远距离、高识别率支撑,现在用户在以家庭为单位的活动范围内,几乎可以通过语音轻松操控家里的一切智能硬件设备,推而广之,搭载远场识别的智能硬件产品将无限扩大适用范围和应用场景。目前的方案主要根据算法不同,可分为适用于电视机、空调、机器人等的加性麦克风阵列和适用于采访话筒、录音笔等的差分麦克风阵列。

灵云种子 智能终端交互一站式解决方案

2015年以来,国内各种智能硬件产品在争论中不断涌现,尤其是苹果公司apple watch的发布,几乎是给原本叫好不叫座的智能硬件市场打了一剂强心针,智能硬件厂商更是如雨后春笋般冒芽而出。尽管智能硬件以及机器人市场被炒得火热,但怎么定义智能,并真正体现智能依然为产业界,也是媒体争论的热点,传统人机交互方式带来的局促感也越来越显著,甚至成为其“叫好不叫座”的核心因素之一。过去,鲜有一套完整的方案能够全面满足各类智能硬件的智能交互需求。

在此背景之下,捷通华声依托灵云平台(hcicloud.com),强化灵云全方位人工智能技术的融合,向企业级开发商特别推出了一整套智能终端交互组件—灵云种子,包括灵云语音识别、语音合成、语义理解、声纹识别、人脸识别、指纹识别等多种人工智能交互能力,并提供简单易用的开发接口,供各类智能终端进行集成调用,实现人与终端设备多种方式的自由沟通和控制。包括智能语音交互、智能语音导航、智能语音控制、声纹解锁、手写输入、智能图像识别、安全身份认证等多种人机交互功能,满足了包括机器人、智能车载、智能家电、智能家居及可穿戴式设备等各个行业的对人工智能技术的应用的大量且多方位的需求。

目前,捷通华声“灵云种子”已经升级到3.0版,新版灵云种子新增云端和本地同时识别,并从结果中择优的功能,提高了语音识别的准确率和识别速度。优化了意图理解的32个领域。可广泛应用在以下场景中:

l语音检索:支持包括路况导航类、家居菜单智能导航类、周边服务类、生活服务类、娱乐类等多种语音检索服务;

l消息提醒:人性化定制推送类别:来电提醒、短信提醒、应用提醒,并可将设置在云端;

l通讯娱乐:支持短信发送,电话通讯,多媒体播放,手机操控;

l健康服务:支持传感器,提供传感器数据分析,为用户提供健康图表,并结合云端服务提供定制健康指导等现有及正在研发的能力;

l云平台:基于灵云平台,提供多设备数据同步,私人信息云存储,智能推荐;

l智能支付:结合智能终端特点,提供更便捷、更多样的智能支付方式。

l虚拟现实扩展:将AR技术与LBS技术整合,为用户提供包括周边景点商圈实景展示,路线提示,为O2O服务提供优秀体验;

这些方案类似于一个开发模版,灵云平台将这些特定领域和场景的智能交互方案经过设计和优化后,打造出一体化的全智能人机交互解决方案——“灵云种子”。直接应用“灵云种子”配置的技术服务和内容服务,即可满足各种智能硬件的智能化需求。

据捷通华声灵云产品研发部门人员介绍:灵云比较新远场语音识别技术由清华灵云人工智能研究中心承担了主要研发工作,而灵云种子更主要的作用是在产业中起到示范与引导作用,期望伴随灵云种子在各行各业智能硬件中的不断“生根发芽”,伴随智能硬件走进大众生活,无数大众将真实感受全智能时代的无限魅力!

捷通华声灵云平台已面向产业全面开放,在中国华南地区,尤其广州、深圳地区经济发达、创新力强,在机器人、智能车载、智能家电、智能家居、穿戴式设备拥有独特优势。为了向华南地区广大客户提供更加直接的支持与帮助,捷通华声在2015年初成立了深圳捷通华声分公司,旨在依托灵云平台,利用灵云平台智能语音、智能图像、语义理解等全方位人工智能技术能力和丰富完善的智能终端交互解决方案,与华南地区硬件厂商加强合作关系,发挥华南地区智能终端设备研发和生产的优势,以推动智能终端产业长足的进步,携手智能硬件厂商互惠共赢。

伴随人工智能产业在世界范围内的高速发展,捷通华声坚持“灵云科技 源自清华”的发展战略,依托清华大学科研力量相继创建清华灵云人工智能研究中心、清华海峡研究院人工智能研究中心。捷通华声将以清华大学人工智能科技力量为依托,不断提升人工智能各项能力,努力提升用户体验,更加专注人工智能技术研究与产业化应用,与合作伙伴精诚合作,共同创建良好的人工智能产业生态,共同推动中国人工智能产业的发展进步,为中国人工智能产业的发展做出应有的贡献!

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 上云好时机!华为云Flexus OBS化繁为简解锁存储管理新体验

    在AI热潮与企业数字化转型加速的背景下,华为云Flexus对象存储(OBS)凭借高效、稳定、安全、低成本的优势,成为企业构建海量非结构化数据存储体系的关键。它支持弹性扩展与按需付费,避免资源浪费,并通过多副本、纠删码等机制保障数据持久性。Flexus OBS还具备高并发处理能力,适配AI训练、音视频平台等场景,与华为云其他服务深度协同,实现“即存即用”。目前,华为云828 B2B企业节正推出优惠活动,助力企业降本增效。

  • 腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出面向Agent的AI基础设施解决方案。腾讯云副总裁李力强调“同源同构”为核心原则,通过统一技术架构支撑自研业务与外部客户,实现产品标准化与全球化服务一致性。升级方案包括Agent Runtime云沙箱、Cloud Mate智能运维体及全链路安全能力,旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力企业降低AI应用门槛。李力指出,未来两年AI+Agent部署将大幅增长,腾讯云已服务国内90%的大模型厂商,并为多行业提供高效智算支持。

  • GMIF2025:慧荣科技展示从云端到边缘的AI存储主控技术

    9月25日,第四届GMIF2025创新峰会在深圳湾万丽酒店召开,聚焦“AI应用,创新赋能”主题。慧荣科技总经理苟嘉章发表演讲,指出AI推动存储架构从“分层存储”向“存算融合”演进,存储成为AI计算关键环节。峰会展示了慧荣在数据中心、边缘与AI PC、车载嵌入式等领域的最新存储解决方案,并呼吁产业链协同创新,应对2026年可能出现的存储芯片紧缺局面。慧荣凭借主控芯片技术优势荣获“杰出主控技术创新奖”。

  • BOE IPC 2025数字文旅分论坛:艺云科技发布一系列“小而美”创新合作,2030实现“百万计划”!

    9月12日,艺云科技在京东方全球创新伙伴大会期间举办BOE+IPC2025数字文旅峰会。论坛聚焦“数智文旅·AI焕新”主题,探讨AI技术与文旅融合新路径,提出“四化”举措破解行业发展难题,并启动“百万数字文旅体验场景计划”。现场展示多项创新成果,与多家机构签约合作,推动科技与文旅深度融合,助力产业高质量发展。

  • 钛动科技与华为云战略签约,驱动出海营销全链路智能化

    9月18日,广州钜动科技与华为云在华为全联接大会期间签署战略合作协议,双方将在云基础设施、AI大模型、智能营销解决方案等领域深度合作,共同推动中国企业全球化增长的AI数字化转型。此次合作将填补出海营销AI大模型空白,打造用户级广告决策引擎,助力品牌实现从传统人力策划向智能化营销的跃迁。

  • 2025 云栖大会|云通信+AI:释放通信新动能

    2025年9月25日,阿里云成功举办“云栖大会云通信分论坛”,聚焦大模型在云通信中的创新应用与全球化实践。论坛汇聚Meta、雨果跨境等生态伙伴,探讨行业趋势,剖析技术机遇与挑战。阿里云发布Chat App AI助理和智能联络中心2.0,展示智能化探索成果,强调合规化与智能化并重,推动通信服务从基础功能向个性化、自动化升级。通过AI与消息引擎结合,助力企业打通公域到私域的全链路增长,实现高效全球化运营与本地化深耕。

  • 腾讯云李力:坚持同源同构,为企业打造更贴近Agent的AI原生云

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出“更贴近Agent的AI+Infra”解决方案,包括Agent+Runtime、云专家服务智能体Cloud Mate及全链路安全能力。腾讯云副总裁李力强调,“同源同构”是核心原则,确保产品服务一致性与全球化布局。方案旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力AI从实验室走向生产级应用。腾讯云通过硬件多元支持、软件加速优化及智能运维服务,降低企业技术门槛,已服务国内90%大模型厂商及千行百业。

  • 腾讯云:扎根产业,出海破圈

    与产业共生共长,一直是腾讯云的愿景。 2025年9月16日,腾讯全球数字生态大会在深圳如期举行,其间腾讯云展现了多项新产品的进展和能力升级,并全面开放AI能力。 这意味着,腾讯云的产数融合又进了一步。 当下,腾讯云正在与千行百业深度融合,助力企业拥抱“智能化”与“全球化”,进而推动产业可持续高质量增长。 毋庸置疑,腾讯云“智向远大”。

  • 云栖大会智舱黑科技:全球首个全模态端侧大模型解决方案,斑马智行首发

    9月24日,2025云栖大会在杭州开幕,主题为“云智一体·碳硅共生”,汇聚全球50多国2000余位嘉宾探讨AI、云计算与产业应用趋势。阿里云发布7款通义大模型,其中Qwen3-Omni作为行业首个端到端全模态AI大模型,在36项基准测试中实现22项SOTA,性能全面突破。大会聚焦多模态技术,斑马智行宣布率先接入Qwen3-Omni,并与阿里云、高通联合推出端到端全模态端侧大模型方案Auto+Omni,具备主动智能、断网可用、隐私无忧三大特点,推动汽车智能座舱从指令交互向Always-on主动服务升级。首批搭载方案车型将于2026年量产,标志着汽车智能化迈入“自主行动”新阶段。大会将持续至26日,预计更多创新技术将亮相。

  • Testin 云测入选 “2025 新科技 100 强金 i 奖”,AI测试技术成核心壁垒

    9月19日,Testin云测凭借AI测试技术入选“2025新科技100强金i奖”,获评“AI测试领航服务商”。其推出的Testin XAgent系统通过自然语言处理、视觉识别与自主探索能力,实现测试用例自动生成与全流程覆盖,推动软件测试从自动化向智能化升级。同时,Testin积极参与行业标准制定,联合信通院启动智能测试能力评估体系,助力构建规范化行业生态。目前,Testin已服务超300万款应用,未来将持续以AI为核心引擎,重塑软件研发质量效能,彰显中国技术在AI测试领域的领先实力。

今日大家都在搜的词: