首页 > 业界 > 关键词  > 模型库PaddleSpeech最新资讯  > 正文

实时性升至秒级!百度飞桨赋能金融双录业务走向智能化

2023-01-16 19:58 · 稿源: TechWeb.com.cn

你是否经历过这样的场景?

当你去银行购买理财产品时,理财经理告诉你需要进行录音录像采集,经过你的同意后,理财经理会打开放置在柜台上的摄像头,然后向你确认身份信息,提示产品风险,还会给你一些材料阅读签字。

这一过程涉及到了标准的金融双录。

所谓“双录”是银行在销售每笔理财产品时使用双录电子设备对过程进行录音和录像。采用双录初衷是为了规范销售话术,确保消费者的知情权,避免工作人员违规操作等潜在风险。自2017年起,银监会陆续出台了一系列监管政策规范金融产品销售行为,明确规定银行业金融机构销售专区必须实行双录。由此,双录成为各大银行销售理财产品的“规定动作”。

01

传统金融双录质检滞后,AI破解实时性难题

双录完成后,通常银行的做法是派工作人员对双录内容进行质检,检查双录过程中是否存在违规操作、是否符合银监会的要求以及银行内部的操作流程等。

但这种方式是通过人工抽查做事后质检,存在时效性滞后、风险覆盖率低、人力成本高等问题。首先,如果质检发现双录过程存在问题,实际上很多业务已经完成了,无法做到实时监管和介入,往往会给银行造成重大损失;其次,庞大的人工质检团队依然难以对双录过程展开全面质检,包括客户不在场、人员更换、代客操作和收受回扣等非正常行为。

据统计,在传统双录场景中,一笔双录业务平均大约花费1小时左右,一次性通过率小于50%,这种低通过率大部分源于操作不规范、话语遗漏等,影响了客户购买理财产品的业务体验,从而降低其购买意愿。

近几年来,银行因双录工作不规范被罚款的事件屡有发生,在一定程度上也暴露了传统双录质检系统的弊端。

银行因双录不规范被罚款新闻截图

不但如此,从银行自身而言,建设一套人工双录质检系统也是一件耗时耗力的工程。一方面,人工质检需要银行持续投入预算,每位客户的录音录像都要保存下来,银行要配备上百人的团队做质检,而质检不合格的视频又需要客户到现场进行重录,鉴于重录操作难度大,造成客户购买理财产品的体验感差;另一方面,为了完成双录质检,银行将不同网点对应的不同销售区域的数据收集上来,汇聚到银行的数据中心,这中间处理非常大的数据量,花费时间周期较长。

基于对上述金融双录业务场景和行业痛点的深刻洞察,杭州谐云科技有限公司(简称谐云)的边缘智能团队发现,人工质检的滞后性给金融双录业务造成了巨大的麻烦和漏洞,如果能引入音视频分析、 AI语音识别边缘计算等技术,实现双录过程的智能化质检,将对提升金融双录质检的效率,改善客户购买理财产品的体验,降低银行运营成本等具有重要意义。

02

飞桨 PaddleSpeech 让双录质检实时性升至秒级

谐云边缘智能团队自2021年开始从事算法研究,终于历经一年半的时间,推出完整的双录智能质检解决方案。该方案深度融合了百度飞桨的语音模型库PaddleSpeech与自研的视频AI分析算法模型,设计出双录语音视频质检方案,可为银行降低90%的人力成本,使银行从过去上百人的质检团队缩减到几人;同时引入边缘计算,实现双录实时质检,相比于传统的事后质检,实时性从原来的小时级别提高到了秒级。

谐云双录智能质检系统架构图

这样一来,方案既通过监测音视频质量,对于录制过程中出现的如无声、花屏、黑屏等情况做出及时提醒,减少了人工双录过程中的录制失败、操作不规范等情况,使双录成功率整体提高30%,大幅改善了客户购买理财产品的体验;也能将部分稽查质检工作提前到事中,尽早识别出危险情况,通过告警提前介入,最大程度减少风险产生的经济损失,有助于银行理财产品及代销的销售环节监管无真空,有效保护消费者的知情权,最终实现“买者自负,卖者尽责”。

据谐云智能边缘团队的AI技术专家陈雪儿介绍,该方案在语音识别研发部分用到飞桨语音模型库PaddleSpeech。她提到,语音识别最终目的是还原双录中双方的对话,呈现出像微信对话框一样有身份、有顺序、有内容、有标点的对话效果。分解到具体步骤,开始要对原始的音频文件进行语音分割,若非双声道音频,则要对说话人进行分类(指用声音特征区分说话人身份,即声纹识别),分类之后再做语音识别,形成文本,做标点恢复,得到最终的完整的对话结果。

其中,最后一个步骤语音识别部分,谐云研发团队运用了飞桨语音模型库PaddleSpeech里的模型U2Model执行语音识别任务。

之所以选择飞桨PaddleSpeech模型库,是因为陈雪儿团队在研发双录质检项目过程中,察觉到金融行业对于语音质检有着强烈的需求,在对比市面上其他语音识别的开源产品框架后,他们认为飞桨框架具有明显优势,主要体现在资料全,为开发者提供了较多的预训练模型和对应的语音数据集,同时模型精度较高。

2022年7月,谐云科技的技术专家在网络平台上发布了一篇题为《谐云课堂 | 浅谈智能语音技术在双录质检中的应用》的文章,百度飞桨的产品经理看到这篇文章找到了谐云,双方建立联系并迅速开启了深度合作。9月,谐云科技和百度飞桨联合组织金融直播课介绍双录质检解决方案。11月,谐云与百度飞桨达成合作,正式加入飞桨技术伙伴计划,双方继续在智慧双录、音频质检等领域积极探索。

03

借助飞桨将语音识别准确率提高到95%

听说IT圈十个人里有九个是男性开发者,女生并不多,陈雪儿可以算是这个群体中独特的存在。

刚开始聊到与AI相关的话题时,陈雪儿显得有点儿腼腆。她坦言,自己是比较典型的理科生性格,本科学的是计算机专业,研究生考到浙江大学,主攻方向是人工智能。读研期间,陈雪儿接触到了浙江大学SEL实验室(Soft Engineering Lab,SEL),由此与谐云结下了不解之缘。

2011年,浙江大学SEL实验室在浙大计算机学院和超大规模信息实验室支持下成立,后来实验室不断扩大,到2016 年孵化创立了谐云,目前已经发展到500多人。陈雪儿毕业后跟随团队老师来到了谐云工作,2020年,陈雪儿加入谐云边缘计算团队,并成为团队技术骨干,她的团队当时就意识到边缘计算与 AI 的结合是未来的趋势,于是谐云加速布局 “AI +边缘计算”领域。

引入自研的边缘计算是双录质检系统的一大亮点。陈雪儿进一步解释到,目前市场上大多数的IoT解决方案是把算法或应用以SDK等方式固化到设备中, 如果需要更新算法、应用,就要替换整个设备,在边缘设备部署智能应用的情况下,当面临应用更新迭代以及场景扩充时,这种传统的方式明显不够灵活。

谐云采用云边协同的方式,在银行的数据中心部署云端智能管理平台,能实现快捷方便地在云端直接一键部署应用,并进行更新迭代。同时,这种边缘计算模式由于将算力下沉到了边缘侧,使得双录过程中的音频视频数据能就近获得处理,大大提升了处理的时效性,为双录场景下实时处理音频视频数据处理提供了重要的框架支撑。

双录质检系统的研发过程充满了挑战。陈雪儿回忆到,他们最开始以为这只是一个普通的语音识别的任务,后面才发现双录过程对说话人的身份和顺序有严格的要求,因此说话人分类以及语音分割十分重要。此外,双录过程中会出现许多比较难以识别的短句,一些方言口音识别不好也可能造成质检误报等情况,他们针对这些问题都专门做了模型调整和优化。

在模型调整方面,谐云的团队通过“算法和数据扩充”的方式,使用飞桨框架,基于飞桨语音模型库PaddleSpeech对算法模型进行了重新训练,由于PaddleSpeech中U2Model模型采用端到端的语音识别模式,在执行语音识别任务方面相对于传统方法识别效果更佳、精度较高,经过训练后的模型语音识别准确率提高到了95% 。

PaddleSpeech模型库全景图

据了解,谐云的双录智能质检系统已在某城商行、某商业银行等落地。未来,谐云将继续推进更多银行试点,优化双录质检解决方案及应用场景。陈雪儿谈到,她希望双录的能力将来可以加入到无人银行的自助设备机以及远程银行的流程中,为金融行业数字化升级和智慧银行添智赋能。

除了金融双录业务外,双录质检系统还能应用到诸多音频视频需求的场景中,例如,视频客服过程中实时监测内容和质量,金融贷款业务中监控违规行为等。

随着金融数字化转型步伐加快,以人工智能为代表的新技术正成为助力金融科技变革的一股新力量,除了上述提到的语音模型库之外,飞桨深度学习开源开放平台还包含PaddleNLP、PaddleVideo、PaddleDetection等众多覆盖不同场景和任务的模型库和套件,正落地应用到金融业务各场景中帮助金融机构降险增效和智能化升级。

举报

  • 相关推荐
  • 2026中国边缘计算企业20强揭晓,AI与边缘融合趋势凸显

    近日,“2026中国边缘计算企业20强”榜单发布,AI正加速从云端走向产业现场,从模型能力走向产业能力。边缘计算正从过去的配套能力,逐步成为支撑AI落地的重要基础设施。榜单由边缘计算社区推出,已连续发布七届,持续关注中国边缘计算产业演进。上榜企业在AI相关领域普遍具备较强实力,共同构成了中国AI走向产业深处的重要支撑力量。

  • 长江计算跻身2026中国边缘计算企业20强,以硬核算力底座赋能产业数智升级

    4月8日,长江计算凭借突出的算力技术与成熟的产业落地能力,成功入选“2026中国边缘计算企业20强”榜单。作为算力基础设施国家队,公司依托鲲鹏+昇腾双引擎,构建了覆盖全场景的算力产品矩阵,并在异架构算力融合、算力资源集约化管理等关键技术领域持续突破,全面适配各行业数字化转型对高性能、高可靠、高安全算力的需求。长江计算积极推动算力与通信、金融、电力、制造等重点行业深度融合,实现规模化落地,为千行万业数字化升级提供坚实支撑。未来,公司将持续深耕计算领域,深化算力技术与人工智能、物联网、5G等前沿技术的融合创新,拓展更广泛的行业应用场景,为数字中国建设贡献硬核算力力量。

  • 爆款预定!iPhone Fold将成为苹果年度理财产品:黄牛要疯抢

    今年9月,苹果除了按惯例推出iPhone 18 Pro系列之外,还将带来备受瞩目的旗下首款折叠屏手机iPhone Fold。这款新机的亮相,标志着苹果正式进军折叠屏领域,引发了全行业的关注。 博主定焦数码指出,iPhone Fold将成为一款具备极高保值率的理财产品。尽管其起售价预计高达14999元,成为苹果史上最贵的机型,但业界对其首销表现普遍持极度乐观的态度。 市场普遍认为,iPhone Fold

  • 18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场

    全球首个大规模具身智能真机评测平台RoboChallenge,凭借数万次标准化真机测试与客观权威的评测结果,获得全行业高度认可,成为衡量具身模型物理实操能力的核心标杆。近日,平台完成第二批生态扩容,星动纪元、极佳视界、地平线、光轮智能、生数科技、中移杭研、长虹、算力自由等8家顶尖企业重磅入驻,覆盖算力、仿真、硬件、算法全链条,加速构建开放协同的标准化具身智能产业生态。今年3月,同步升级的Table30V2聚焦真实应用场景,任务难度全面提升,以更高标准推动具身智能技术落地迭代。RoboChallenge打造真实物理考场,推动具身智能突破,其进步不仅来自单点模型能力的提升,更源于评测标准、数据基准与真实本体的共同成熟。平台累计执行的真机测试总量已突破4万次,形成评测闭环,并为深度技术分析筑牢数据根基。除国内开发者外,来自美国、新加坡、日本、阿联酋等多国科研团队和开发者也纷纷入驻参与,国际化生态正蓬勃壮大。

  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • 字节跳动发布全双工语音大模型Seeduplex!豆包率先接入:打电话可边听边讲

    字节跳动正式推出原生全双工语音大模型Seeduplex,基于边听边说”的全新架构,彻底打破传统AI语音交互一问一答”的局限,实现自然实时对话。 目前Seeduplex已在豆包App全量落地,成为行业内首个规模化应用的全双工语音大模型。 Seeduplex的核心突破的是改变了传统半双工听完再说”的交互模式,真正实现了听与说的同步处理,其中两大核心能力得到重点突破: 精准抗干扰:

  • 上线华为云!智谱最新模型GLM-5.1:支持8小时自主长程任务 多产品体验

    智谱AI近日发布新一代旗舰模型GLM-5.1,其Day0”版本在发布当天即正式上线华为云平台。 模型在长程任务处理上实现重大突破,单次自主持续工作长达8小时,并交付完整工程级成果。 智谱GLM-5.1在华为昇腾算力上通过Layer级MOE绝对均衡、框架优化专家Token产出均衡,并结合昇腾Attention算子与推理框架硬件协同优化,大幅提升算力均衡和HBM访存能力,经华为云系统级加速后整体推

  • 女子回应获3亿遗产引丈夫子女不满:从未主动提过财产

    最近三亚有一件豪门财产纷争的事儿可太引人关注了!一位六旬的侯老七,不幸患上了肺癌晚期。在生命进入倒计时的阶段,他做出了一个重大决定——把价值3亿的家产全部赠送给比自己小28岁的现任妻子莉女士,以此感谢她这10年来的相伴。 这莉女士是93年出生的,和侯老七携手走过了十年婚姻,还育有一个儿子。在侯老七重病期间,莉女士那真是尽心尽力,一直贴身照料,�

  • 有哪些品牌的按摩椅值得购买?避开“一刀切”,选对才实用!

    家用按摩椅的核心价值在于精准匹配需求:上班族需缓解肩颈腰背劳损,中老年人需温和理疗与关节呵护,全家共用则需兼顾各年龄段习惯。盲目跟风选购,要么力度过强不适合老人,要么功能冗余浪费预算。本文针对不同人群需求,拆解选购重点,帮你找到“量身定制”的按摩椅,让每位家人都能享受专属放松体验。选购时需避开虚标参数、塑料机芯、短导轨等陷阱,优先选择松胜、奥佳华、荣泰等有自研专利、售后完善的品牌。按摩椅的核心是“适配”,选对适合自己和家人的机型,才能真正发挥其放松理疗的价值。

  • Ozon防跟卖的方法有哪些?Ozon如何防止产品被跟卖?妙手ERP一文破解!

    随着Ozon平台竞争加剧,跟卖现象已成为制约卖家发展的核心痛点。卖家面临流量被瓜分、利润受挤压等风险,被迫卷入价格战。文章通过多个案例揭示跟卖对品牌卖家的直接损害,并提出妙手ERP的“跟卖调价”功能作为解决方案,帮助卖家实现自动监控、批量调价和自定义店铺排除,有效构建防跟卖机制,重塑产品竞争优势。

今日大家都在搜的词: