首页 > 传媒 > 关键词  > 正文

新能力|标贝科技语音合成支持数理化公式等复杂数字符号的自然朗读

2023-10-20 16:23 · 稿源: 站长之家用户

“哪里不会点哪里,妈妈再也不担心我的学习了,so easy!”

当年这段广告词可谓洗脑神句传遍大江南北,点读机作为教育场景的典型电子产品,也一度风靡市场。

随着AI技术在教育场景的广泛应用,特别是语音交互技术丰富了学生上课体验形式。以点读机、学习机、甚至AI虚拟老师等为代表的教学方式也越来越普及。让在线教育更加智能化、个性化,有效解决了学生们差异化的学习需求。

目前,语音合成已经进入较为成熟的发展阶段,在教学内容生产方面,可以增加配课、点读等有声教学素材,甚至可以取代部分真人对话的教育内容,大大降低教学配音的成本和周期。

例如,在语文、英语等语言学习科目中,AI虚拟老师可以通过教学视频和语音合成,生成虚拟教学内容,缓解线下教师的工作压力;学生则借助智能学习设备,扫描自己想要学习的文字或短语,听取正确的发音和语调,跟着模仿发音。

但是在数理化等科目里涉及到公式的读法时,大部分语音合成软件存在一定的难度。对于较为简单的,如数学中的加减乘除、开方、指数、三角函数等,一般语音合成软件通常可以给出正确的读法。而对于复杂的如物理、化学等领域的公式,由于这些公式中可能包含大量的特殊符号、单位和上下文信息等,需要逐字进行转换,耗费时间且准确率较低。

为了完善AI教育应用场景,标贝科技通过语音合成前端语言模型优化,实现了语音合成技术对Latex数理化公式朗读的支持,提供更好的教学体验。

什么是Latex?

LaTeX是一种基于TeX的排版系统,由美国计算机科学家莱斯利·兰伯特在 20 世纪 80 年代初期开发。 MathJax是一个跨浏览器的JavaScript库,它使用MathML、LaTeX和ASCIIMathML标记在Web浏览器中显示数学符号。

举例↓:

latex公式:

实际页面展示的公式:

标贝科技基于LaTeX公式的基本组成单元和语法规则,依托比较准确的词法分析和深入的句法分析技术,将复杂的LaTeX公式拆解为最细粒度的词法单元,然后将这些单元映射为能准确反映LaTeX公式层次结构的抽象语法树(AST)。

接着再建立一套规则,用于将LaTeX公式中的符号、元素和命令翻译成自然语言。通过在AST上进行遍历并应用这些翻译规则,最终成功实现从LaTeX公式到自然语言的转换。

目前,标贝科技语音合成技术能够以通俗易懂的方式朗读 LaTeX 公式,覆盖从小学到初中 12 年教科书中涉及到的数学、物理、化学公式。同时标贝科技还可以根据客户具体需求,定制高中及其他复杂数据符号的科目。

标贝科技前端语言模型优化定制方案

在语音合成技术中,前端语言模型主要负责对输入到语音合成系统的文本进行分析,并提取发声和韵律特征,以便声学模型根据这些特征生成对应的语音信号,是处理和生成语音信号的重要环节之一。

前端语言模型通常有一些通用方案,但是在不同的业务任务和数据特点下,通用方案无法直接将文本转化为可合成的语音信号时,就需要对前端语言模型进行改进和优化。

标贝科技可以提供前端语言模型优化定制方案,将文本中复杂的数字、符号、缩写等转换成语言文字,客户无需做二次转换,即可获得准确的发音,提高模型的性能和效果。

例如,除了支持以上LaTeX 公式类的朗读外,标贝科技还可以通过前端语言模型优化定制方案,输出对手机型号或者各类机器设备型号的正确读法。欢迎新老用户咨询体验!

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看

今日大家都在搜的词:

热文

  • 3 天
  • 7天