首页 > 传媒 > 关键词 > 思必驰最新资讯 > 正文

​端到端识别、增量学习…思必驰DUI标注训练一体化平台的封神级操作

2021-05-19 17:23 · 稿源:站长之家用户

坊间总会流传些他们的段子

格子衫、双肩包、沉默且不苟言笑

当然,还有岌岌可危的发量(没有,不是我说的)

那只能说,这些都是表象

堪称新时代的中流砥柱

每天家住回龙观,征战新中关

浑身散发出高级又内敛的气质

究竟是什么塑造的?

(一切为了工作 挣钱)

小驰捕捉到一位思必驰程序员小哥哥

今天去看看

他日常的那些“封神级”操作!

Q:一句话形容你正在做的事情?

A:人类之光…在宇宙中心呼唤AI…反正很Cool就对了

Q:最近有什么新成果吗?

A:你光顾着关注我们发际线,不关注我们的精神成果,扣鸡腿…

最近发布了DUI标注训练一体化平台,具体干啥的,来补课!↓↓↓

DUI标注训练一体化平台全场景应用,识别体验持续提升!

https://mp.weixin.qq.com/s/GaVP0XvAgwxrrdFT3fuqRQ

思必驰DUI标注训练一体化平台,让服务赋能走向能力赋能:

https://mp.weixin.qq.com/s/voKIm5uPzSceYmiHdiJWeA

Q:如果我中英文掺着说,语音识别TA能听懂吗?

A:不同场景、环境下的语音识别效果多少会受噪声、专业术语、多语言混合影响。契合场景来提升语音识别率,自然就能准确许多。

Q:让场景识别率能持续提升,你们有什么“神技”傍身?

A:我们融进了最新的「端到端识别技术」来提升识别准确率,通过大规模预训练模型技术提升语音识别后处理效果。结合「增量学习」、「主动学习」、「联邦学习」和「小样本迁移」等技术手段,提升用户体验。同时开放「端点检测模型自训练」、「标点断句自训练」等功能,让用户自己拥有自主权,来解决实际问题。

Q:呃…

A:好,说点你能听懂的

高能,划重点!

第一,关于端到端识别技术。

过往严格意义上的端到端识别技术,如基于LAS的端到端系统,虽然可以较明显地提升通用语音识别的准确率,但受限于计算复杂、自定制语言模型技术不成熟等原因,不能大规模的商用。思必驰去年推出新一代端到端语音识别建模技术,在实现通用识别准确率相对提升10%-15% 的同时,也提升了模型计算速度,更可以满足快速有效的语言模型自定制。

第二,关于大规模预训练模型技术。

要知道,语音识别系统中除了核心的语音识别(ASR)模型部分,语音识别的后处理模型也是十分重要的,它直接影响到识别结果的可读性。思必驰语音识别系统支持「智能纠错」、「智能标点断句」、「智能口语顺滑」、「智能语义分段」、「智能语义纠错」等语音识别后处理技术,能进一步提升语音识别的效果与可懂度。模型采用大规模预训练模型,结合多任务学习(Multi-Task Learning)和知识蒸馏(Knowledge Distillation)方法。在降低70%以上模型规模的条件下,提升了模型效果,运算效率大幅提升同时降低了内存开销。

例如在智能会议场景中,通常转写结果是篇章段落,且多含有口语化的表达,通过我们的识别后处理功能,可以将会议转写结果整理成格式化,易读易懂的会议记录。

第三,增量学习。

受限于深度神经网络技术中的灾难性遗忘问题,采用深度学习方法的ASR建模在权衡“既要保障模型原有识别效果,又要提升新的目标场景识别效果”时,通常采用基于新旧数据混合训练的方法。弊端是,该方法增长了模型优化的周期,又会带来数据安全隐患。基于思必驰自研的KDF-IL增量学习方法,在语音识别优化时,可以仅用新增数据进行模型训练,缩短开发周期同时,也有效保障数据安全。 第四,小样本学习。

自研的小样本迁移学习技术,使用少量数据就可快速实现场景体验优化。例如使用少量带标注的文本数据,即可对标点断句模型进行优化,相对传统模式调优,节省了83%的数据量。例如,在真实的航空质检场景中,通用的标点断句模型面对特殊的专业术语和断句方式,一定会水土不服。得益于小样本迁移学习技术,在使用少量的标注文本情况下,即可实现F值40%左右的绝对值提升,完成体验效果从不可用到可用的转变。 最后,咳咳….(这个氛围是不是该升华了)在功能层面,我们深知不同用户的使用场景复杂多样,单靠赋能用户自主训练ASR模型不能满足需求。

我们!(升华来了)秉承以解决用户实际问题为核心的产品理念,开放端点检测模型自训练、标点断句自训练等功能,使得用户可以通过我们的产品,完成识别系统中几乎所有模块功能的自训练,最大程度优化用户体验。

Q:啊,真不愧是“人类之光”。求问,没经验可以用吗?

A:平台建立的出发点就是降低 AI 使用门槛,只要企业有数智化转型的需求,我们就能匹配提供高可用定制的模型。平台的私有化部署能力,也能将自主权交给企业自己,非AI专家都能使用,”零“学习成本。

Q:怎么合作呢?

A:平台同时满足「模块化输出」+「支持 UI可视化界面 /API输出」这两点,可以根据业务需求灵活配置,选择使用一体化平台的全部功能,或者只使用其中几个模块的功能。

Q:可以拓展使用吗?

A:当然可以,「全场景覆盖」是平台的一大优点。适用于各类行业场景,如会议办公、航空通讯、智慧医疗、城市交通、数字化门店、智慧园区、线下质检、政务、庭审等等,可以快速从当前项目复用到新项目中,形成规模化生产定制,满足多样化的业务需求。

Q:怎么联系你们呢?

如有合作意向,请发邮件

Q: 好,不愧是气质不凡的你们!今天收获颇丰!

A:总结下,就是我们在一个科技开放和包容的时代,和一群特别Cool的人,做了些特别Cool的产品和事情。如果你想更了解我们,欢迎随时交流。

  • 相关推荐
  • 大家在看
  • 思必驰智能硬件新品发布 宾狗智造精彩生活

    2021 年 5 月 18 日,「会声慧色」 —— 2021 思必驰智能硬件新品发布会在京顺利召开,吸引了包括腾讯、新浪、搜狐、今日头条、新华网、极果网等数十家主流媒体聚焦现场。一直以来,作为国内领先的对话式人工智能平台公司,思必驰备受行业关注。在IoT、智慧出行、智慧办公、呼叫中心等领域,思必驰不断推进着传统行业的智能化升级,专业的智能对话方案,让思必驰跻身成为智能语音行业的头部企业。思必驰副总裁兼消费者事业部总经理

  • 思必驰再燃芯声,深聪智能推出二代AI芯片

    伴随着社会智能化程度的不断提升,人工智能芯片作为智能设备的核心需求量持续攀升,政策的利好推进着整个行业的蓬勃发展,百花齐放,芯片国产化之路快速前进。思必驰作为国内专业的对话式人工智能平台公司,不断推进着AI技术的研发与应用,思必驰旗下芯片公司深聪智能于 2019 年推出了AI芯片太行TH1520,搭载思必驰全链路人工智能语音技术,低功耗算法的优势使其广泛地应用于智能家居白电、黑电以及智能车载领域,推进传统行业的规

  • 宏光MINIEV马卡龙 思必驰语音交互加持产品力

    2021 上海车展,上汽通用五菱展示了最新推出的宏光MINIEV马卡龙。此次宏光MINIEV马卡龙版本,内置思必驰全新自研软硬一体智能化车载前装解决方案——智能收放机,让智能语音交互快速加持产品力。思必驰作为上汽通用五菱重要合作伙伴,已助力旗下新宝骏RC-6、新宝骏RS- 3 先后完成智能化升级。宏光MINIEV马卡龙,时尚代步新选择宏光MINIEV马卡龙作为一款成熟的“人民代步车”,全新配备智能语音交互,提供更懂人民的服务。其内置思?

  • 思必驰会话精灵服务数字化解决方案 升级重塑线下门店运营

    互联网流量红利的结束以及疫情的冲击,标志着全社会进入存量时代,这个时代最显著的特征是门店服务要进行精细化运营,提升每个客户、员工对企业的数字化价值,构建数字化的商业模式形态。从传统迈向数字化后疫情时代,线下门店竞争愈发激烈,服务能力已成为公认的强化客户粘性的法宝。不过,作为一个动态过程,“服务”,尤其是“线下服务”却很难窥其全貌,大量的线下服务数据仍然无法被有效收集、整合、使用。针对于此,思必驰基

  • 2021上海车展 | 重塑“人车”关系,思必驰智能语音技术指路出行

    2021年上海车展的开幕,激起了沉寂已久的汽车消费市场。其中市场表现不乏亮点:高端市场及新能源汽车销量稳步增长。 智能科技的加持,成为消费者购车时的重要考量。辅助驾驶、智能网联、自动驾驶的触点深入消费者决策。 来源:《2021麦肯锡汽车消费者洞察》 现场,传统车企与造车新势力竞展实力,中外一线汽车供应链企业悉数亮相。思必驰作为专业的对话式人工智能平台公司,推出车联网解决方案为众多车企终端产品提供语音交互能力。 软硬

  • 思必驰入选中央网信办人工智能企业典型应用案例

    4 月 26 日,在数字中国建设成果峰会人工智能分论坛上,中央网信办组织评选的人工智能企业典型应用案例正式发布,思必驰“AI社区数字网格员应用案例”成功入选。据了解,此次评选始于去年 10 月,由中央网信办信息化发展局开展人工智能创新应用案例征集工作,经人工智能社会实验专家组评审,其目的是发现和挖掘人工智能行业的最新场景和杰出企业,进一步推动我国人工智能健康稳定发展,最终共遴选出 35 家人工智能企业典型应用案例

  • 思必驰智能降噪技术,给你的世界按下“净”音键

    随着城市的快速发展,噪音作为“看不见的污染”,正持续地“入侵”着现代城市生活。不过,这一难题,现已在众多场景中,被思必驰新一代的智能降噪技术所攻破。自研算法,兼顾噪音抑制和保真性语音识别近年来有了极大的发展,但在当前,它还没有达到“一套技术打遍天下”的状态。作为一个强场景化的技术,语音识别在诸多真实应用场景中,仍然存在着“最后一公里”的问题。这其中,特定场景的噪声,就是一个非常大的干扰因素,会使得

  • 关于思必驰完成股份制改造及公司名称变更的公告

    3月31日,苏州思必驰信息科技有限公司成功完成股份制改造,经市场监督管理局核准,正式更名为“思必驰科技股份有限公司”。思必驰成立于2007年,是国内专业的对话式人工智能平台公司,公司愿景为沟通万物,打理万事。思必驰拥有全链路的智能语音语言技术,自主研发了新一代的人机交互平台(DUI),和人工智能芯片(TH1520),为车联网、IoT、以及金融、办公、政务、医疗、地产等众多行业场景伙伴提供自然语言交互解决方案。思必驰致力于降低人工

  • 思必驰会议魔方M1 用AI激活企业生产力

    会议,是人类交流信息、解决问题的重要形式,在现实工作中,却总因低效而饱受诟病。利用科技提高会议效率,将成为未来每一个企业提升竞争力的必修课。思必驰会议魔方M1就是一款能够迅速实现“会议室”智能化的AI神器,颠覆传统的会议体验,让未来企业告别低效会议。会议魔方,低效会议的“终结者”会议魔方M1是一款针对会议办公场景的轻便级智能麦克风,由思必驰自主研发,力致让企业白领随时随地享受清晰、稳定、流畅的远程会议体验。受疫?

  • 场景实战:思必驰DUI标注训练一体化平台,持续提升识别率

    “07---读洞拐”“什么是疱疹---什么是PORT”“导航去fu南电视台---导航去湖南电视台”“介个东西是我的---这个东西是我的”人机自由交流的前景是漫长而渐进的,语音识别技术在细分场景持续落地,需要“因地制宜”提升识别效果。01 语音识别的“三大考验”噪声环境。目前对语音识别效果影响最大的就是环境杂音或噪音,在公共场所中,来自四面八方的声音会让识别系统不知所措,实验室环境下的优异表现可能在实际应用场景中被“吊打?

  • 雅迪与思必驰达成战略合作,共推两轮电动车智能升级

    4 月 15 日,雅迪与思必驰在无锡雅迪科技集团总部正式签署战略合作协议,雅迪科技集团董事长董经贵、高级副总裁周超、副总裁兼研究院院长周朝阳、资深总监沈长海、采购副总经理曹巍,以及思必驰董事长兼CEO高始兴、思必驰副总裁雷雄国、思必驰旗下深聪智能创始人&CEO吴耿源、思必驰智能汽车事业部商务总经理李枝桂等双方代表出席签约仪式。雅迪科技集团历经 20 余年的发展,现已成为集电动自行车、电动轻便摩托车、电动摩托车及其?

  • 思必驰中文命名实体识别任务助力AI落地应用

    随着人工智能从感知智能向认知智能发展,语言理解和知识挖掘研究不断深入,事实和常识知识愈发重要。智能问答、对话、推理、推荐等应用均需要丰富的知识作为基础支撑,而命名实体识别作为文本中重要的知识获取手段,已成为一项重要研究课题。命名实体识别(Named Entity Recognition,NER)任务的目标是识别出文本中预定义类别的实体。作为NLP领域的重要基础工具,其有效推动了NLP技术从实验阶段走向实用化。近期,思必驰语言与知?

  • 思必驰AI语音,助力TWS耳机体验升级

    生活中随处可见,热衷于智能耳机的用户们,有着非常明显的群体特征,他们往往日常上班通勤,热爱运动健身和出差旅游,为音乐发烧,生活中常常接触外卖、出行、快递等服务,他们更为年轻,更关注生活品质,也具备一定的消费能力基础。这样的他们,对产品也抱有更高的期望。AI语音助力TWS耳机体验提升8月20日,我爱音频网主办的 “2020(秋季)亚洲蓝牙耳机展”在深圳举办,峰会聚集全球知名蓝牙耳机产业链企业,揭晓多款重磅产品。同时,智能语音是?

  • 思必驰AI电视 “芯”方案 强大却不仅于此

    在彩电市场持续萎靡的背景之下,智能电视依靠更具潮流的产品理念及更友好的使用体验完成产品升级,成为家电行业的一匹黑马。据调查,2020年2月中国智能电视的日均使用时长环比大幅增长11.5%,这无疑为整体规模增长乏力的彩电行业注入了一剂强心针;另有报告称,2020年智能电视市场渗透率将达到90%以上*。电视遇见AI,不仅是基础功能的迭代焕新,而是生活品质与方式的跃进。AI与语音的结合,势必为智能电视发展新赛道中一条必由之路。TH1520-

  • 思必驰川渝方言AI客服上线,降本增效看我的

    当今世界,现存约7000种语言,即使是同一种语言,仍存在着“三里不同调,十里不同音”的现象,这也对正处在快速发展阶段的对话式人工智能技术提出了更高的要求。尽管,智能机器人因为听不懂方言而被用户嫌弃的新闻屡见不鲜,但并不能阻挡AI为人类“降本增效”的前行力量。这不,在方言难懂指数五颗星的川渝地区,基于思必驰全链路智能语音语言技术打造的智能客服,在多个特定领域的识别率就已达到了97%,并被用于政务、金融、电力、运营商、物

  • 思必驰,造声工场

    导航中的明星语音包难道是请明星在录音棚一句一句录制的吗?当然不是!试想导航中数不尽的地名,以及到达时间与路程距离等变量数据,要求真人录制是不现实的。当下被人们所熟知的“语音包”其实是应用的语音合成技术,又称TTS(Text to Speech)。语音合成技术也是当今国际人机交互领域竞相研究的热门技术之一,合成音的应用极大减少了人力录音的成本,成为了智能机器的标配能力,帮助厂商打造voice-IP。思必驰提供数十种语音合成预?

  • 开会不头疼!看思必驰如何邂逅“智能会议”

    对于在职场摸爬滚打的职场狗来说,开会,是日常工作中必不可少的组成部分。据调查统计,有七成白领平均每天开会时长在 1 小时内,18.1%在1~ 3 小时,4.9%的白领表示自己每天开会3~ 5 小时,5.2%的白领表示自己几乎一天的工作时间都在开会。开会,令人十分头疼。从纸笔时代到科技时代相对于纸笔时代,科技进步为现代会议带来了一些改观,例如,远程电话/视频会议连线、屏幕共享成为现实。但是,通话效果和视频画质却成了被吐槽的焦?

  • 机器人求职启示录:思必驰信源生态

    一台失能的人型机器,被扔在布满蛛网的旧库房。一台会说话的音箱,却令主人如交密友。所谓好看的“皮囊”任人设计,有用的灵魂才是万里挑一。机器人讨喜关键为何?是值得每一个机器人思考的求职命题。机器人的价值在于完成人类的命令,提供相应服务。赋能终端,让智能设备开口说话,通过语音交互完成用户提出的需求,是思必驰的使命。消费者为机器人买单,那么要先看看这台机器人会什么。于是,思必驰推出DUI开放平台,将语音交互与

  • 思必驰AI会议方案,运筹帷幄的智慧大脑

    一场会议,往往会花费大量的时间在与议题无关的筹备工作上。一场会议,常常需占用若干人力成本提供会议支持与服务。贯穿始终的会议精灵K510 月 16 日,科达视讯重磅推出全场景智能会议新品,作为科达全场景智能会议产品系列中的核心成员,会议精灵K5 担负着重要的语音交互功能。K5 的唤醒词小科,成为企业会议过程中最熟悉最可靠的“同事姓名”。通过语音交互,K5 可完成会前召集、会中执行、会后跟进大多数指令任务,轻松懂你的会

  • 思必驰联手华凌造风,萌音空调温暖寒冬

    十月十日,华凌空调发布新品语音空调,为其年轻家电新物种再添成员。此次华凌空调用心的选择“萌节”召开“新物种·萌音新声代”新品发布会,凭借“声色俱厉”的亮点,精准面向年轻宅男潮女的消费市场。声·互动释放天性思必驰智能白电方案,包括针对家居场景的单/双、线性4/6、环形4/ 6 等麦克风阵列,支持高可用定制的全链路对话技术以及基于DUI平台的海量技能与内容,几乎实现了家居场景的智能语音设备方案需求的全覆盖。作为此

  • 热门标签