首页 > 传媒 > 关键词  > 智能客服机器人最新资讯  > 正文

Sobot 智齿科技:AIGC给「构建企业知识库」带来的改变

2023-06-13 14:35 · 稿源: 站长之家用户

智能客服机器人的核心是企业知识,而企业知识获取的核心步骤,是企业知识库的构建。

构建逻辑是:结构化企业数据,存入企业问答知识库。之后,根据知识库进行线上的FAQ问答(基于常见问答对的)、MRC问答(基于机器阅读的)等,对应构建形成 {问题:答案}、{文档}等知识库。

过往,这种企业知识库的构建,都是离线的、耗时的、需要人工反复校验的。尤其是上线后,为了提高机器人的问答准确率,就需要运营人员基于具体业务去持续做优化,如用户关键词抽取、实体抽取、同义词理解等等,耗时很多。

在AIGC时代,这一切都将改变。

构建知识库的速度和问答准确率,都将极大提升。主要是因为数据来源更容易无限扩展,不再局限于结构化、半结构化的企业文档,说明书,文字、语音、图片、视频等都可以被快速提取出有效信息,输入给大型预训练语言模型理解后问答,或者直接存储到知识库中,搜索后推出,也可二者结合。

1. FAQ文本知识库

FAQ(Frequently Asked Questions),即常见问题解答,是指整理和归纳常见问题及其对应答案的文档或资源集合。这些问题通常是某个业务场景下,客户会经常遇到的问题,可以帮助客服机器人快速、准确地解决常见问题,提升客户满意度。

FAQ文本知识库的创建、扩写对运营岗位的消耗较大。举个简单的例子:

query: “工作过多个城市,现在如何查询自己的公积金是属于哪个公积金中心?”。

我们需要对这个query扩展相似问,自动生成多个相似问。通过这种方式快速丰富知识库问题,同时提高实际线上问答的语义搜索结果可靠性。

就在这个过程中,扩展生成的相似问,需要经过多步自动化校验,包括答案一致性校验、口语化校验、相似性校验、属性分类校验等等。

答案一致性校验是指“从扩展的相似问题中,那些与原始query的标准答案相关,且该标准答案能对其进行解答的问题”。这样,它们有可能组成标准问题-相似问题对,答案也相同。

下面是通过答案一致性校验的相似问:

通过答案一致性校验后,还是会有很多问题。例如:

很多问题是有效问题,却不是该业务下的常见表述,简单来说就是不够口语化。这些问题,不仅会增加知识库的冗余,还会影响其他业务的搜索结果。针对这类问题还需要进行口语化校验,校验后保留如下:

经过上述校验的问答对,往往还会存在一个问题,就是相似性过高。这些问题,往往只是简单换了个词汇,存储知识库的必要性低。因此,我们还需要做一轮相似性校验,具体来说,就是根据业务特性设定去除和保留比例,通过聚类、相似度计算去除冗余部分。校验后保留如下:

可以看到,经过系列校验后,保留下来的相似问已经有很高的质量了。

在知识库的的构建方面,除了标准问、相似问的生成,还必须关注业务覆盖率这个指标,一般来说,业务覆盖率越高,知识库的质量也越高。

例如,“公积金”查询会涉及地点、时间、金额、查询方式、缴费方式等问题维度,维度越多,覆盖率就越高。

举个例子:可对“公积金归属地查询”这个原始问题拓展出的所有相似问题,进行分类,进一步发现更多有价值的句子。从下面分类结果看到,其中的类别 1 和原始问题答案相同,其他类别下的问题,是“公积金”相关的其他维度的业务问题,只是答案和原始问题的可能不同。那么,这些句子如果能加入知识库,就拓展了“公积金”相关的业务覆盖率。

对上面初始拓展的 39 个问题,分类如下:

类别1:公积金归属地的基本查询。

询问如何查询公积金的归属地,包括城市、地区、省份、县、区等,关注点寻找基本的位置信息。

分类结果包含:1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 13, 16, 18, 19, 21, 22, 24, 25, 27, 28, 30, 31, 33, 34, 37。

类别2:公积金归属地查询的具体步骤和流程

关注查询公积金归属地的步骤、流程,关注点是更详细的查询指导。

分类结果包含:11, 23。

类别3:公积金归属地查询的工具和平台

询问关于查询公积金归属地的工具、软件、系统、平台、网址等,关注点是查询工具和平台的选择。

分类结果包含:14, 17, 20, 26, 29, 32, 35, 38。

类别4:公积金归属地的详细信息查询

询问如何查询公积金归属地的具体地址、邮编、电话号码、邮寄地址等详细信息,关注点获取更具体的信息。

分类结果包含:15, 24, 27, 30, 33, 36, 39。

上面分类后的类别2、类别3、类别4,是经过答案一致性校验后,被排除的。查询知识库如果有相似query或答案,可进入到下一轮的自动化校验,对符合条件的可人工校验入库。另外,新增的这些问题,还可做预测性的FAQ  (PFAQ),预测用户可能会遇到的问题,并提前提供问答。

2. MRC文本知识库

MRC问答,也就是机器阅读理解(Machine Reading Comprehension)的问答,系统通过阅读和理解自然语言文本,并根据这些文本回答给定的问题。在我们的机器人中,是将query和与它最相关的文本块给与LLM,输出answer。

通过文档上传,文档切片分块,向量化存储后,即可语义搜索。问答时,根据文档搜索结果和query一起加入Prompt,输入LLM理解后回答。

受限于语言模型的理解能力,过往的MRC的问答效果一般。现在,结合LLM模型, 文档理解和问答的准确性,已经能解决常见问题。

在智能问答客服机器人中,为进一步提高问答效果,对于分块文档,还可增加问答对的抽取。一方面结合原始的分块文档,可以提高query理解的准确性,另一方面,对于文档切片后引起的块内知识不完全,是个很好的补充。

常用的tricks,比如在原有的文档切片的基础上,提取摘要、关键词、关键句等信息,作为补充,也可提取问答对作为补充。

问答对的提取如下,例如分块后的文档如下:

进行问答对抽取,得到如下:

通过对切片后的文档进行问答对抽取,可以快速完成多源数据的知识库构建。

更重要的是,这种文档的直接切片分块,知识构建,在文档上传后,即可进行智能问答。好处是,快速更新的企业知识,也能够快速应用在业务中。

以上方法构建的企业知识库,生成校验极快。并且在机器人的问答准确性上,结合模型强大的理解能力,语义搜索后的多个潜在答案通过LLM进一步加工,答案准确性非常高。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 魔乐社区AIGC创作专区正式上线

    魔乐社区推出免费开放的AIGC创作专区,提供快速生图和专业生图两大核心功能。专区首页汇聚热门AI模型和优质作品展示,支持中英文输入和多种艺术风格模板。快速生图功能操作简单,用户输入文字描述即可一键生成高质量图像;专业生图模块提供LoRA模型组合、采样方法等高级参数调节,满足商业设计等专业需求。同时推出"AI夏日造梦"创作活动,7月12日至8月12日期间分享作品可参与人气打榜赢取奖品。该平台整合免费NPU算力资源,为从入门到专业的创作者提供高效低门槛的AI内容创作环境。

  • 直击企业痛点 全球制造链+科技巨头聚焦GPTBots.ai

    在2025深圳国际人工智能展上,极光旗下企业级AI Agent平台GPTBots成为焦点。该平台展示了在制造业智能化升级中的解决方案,包括构建企业知识搜索引擎、自动化办公流程及跨境商务沟通等应用场景。展会期间,平台吸引了苹果等科技巨头及多国企业代表关注,探讨了AI在供应链管理、项目监控等领域的落地实践。GPTBots凭借模块化架构和安全部署能力,已服务金融、制造等十余个行业客户,助力企业实现降本增效和智能化转型。

  • 极光GPTBots实力入选《2025政务行业信创生态图谱》,赋能智慧政务新未来

    在北京召开的"2025中国信息技术应用创新峰会"上,极光GPTBots凭借在政务智能问答、办公提效、数据分析等场景的卓越表现,入选《2025政务行业信创生态图谱》。该图谱系统梳理了政务信创生态现状与趋势,为构建自主可控、安全可靠的政务创新生态提供指引。极光GPTBots深度融合国产大模型技术,在政策智能解答、办公自动化、文档处理等政务场景实现深度赋能。此次入选标志着其在推动政务数字化转型方面的贡献获得权威认可,未来将持续投入核心技术研发,深化政务场景应用探索,助力数字政府建设。

  • 大模型时代企业查询第一站——水滴信用企业数据查询MCP

    水滴信用推出企业数据查询MCP平台,通过大模型技术实现企业数据查询的智能化升级。该平台整合3.7亿市场主体数据,覆盖工商、司法、知识产权等六大类1000+维度信息,支持自然语言交互和跨域关联分析。目前已应用于银行风控、证券投研、供应链管理等核心场景,显著提升商业决策效率。作为央行备案征信机构,水滴信用凭借权威数据源和专业团队,正推动企业征信服务进入AI普惠时代,降低高价值商业情报获取门槛,促进透明可信的商业环境形成。

  • PhotonPay光⼦易推出实体万事达卡商务信用卡,拓展全球企业多元⽀付场景

    光子易(PhotonPay)与万事达卡合作推出实体商务信用卡,覆盖全球210个国家和地区的1.5亿商户网络,支持线上线下全场景支付。该卡直连光子易多币种账户,具备ATM提现功能,可自定义币种、限额等参数,实时同步智能对账系统,提升企业跨境支付效率和财务管理透明度。作为持牌跨境支付服务商,光子易通过数字化基础设施与万事达全球支付网络的深度整合,解决了传统跨境支付流程繁琐、汇率波动等痛点,助力企业实现"一卡在手,全球支付可视可控"的数字化管理。公司已服务超20万家出海企业,并获得多项国际发卡资质认证。

  • 商查平台企业信息查询新范式:水滴信用企业查询MCP

    水滴信用推出的企业信息查询MCP平台,通过大模型技术重构传统商业查询模式,实现三大创新:1)自然语言交互,用户可用日常语言提问并持续追问,系统自动整合工商、司法、知识产权等跨维度数据;2)全景数据架构,打破信息孤岛,智能关联股权穿透、供应链等复杂关系网络;3)动态智能报告,自动生成定制化分析报告,针对风控、投资等不同场景突出关键洞察。该平台将专业用户从繁琐信息收集中解放,使业务人员零门槛获取商业洞察,标志着企业查询从"信息仓库"迈向"智能中枢"时代。

  • 专为企业打造的智能体中台来了!迈富时AI-Agentforce 2.0让Agent正式走向工作岗位

    Gartner预测到2028年,15%的日常工作决策将由自主智能代理完成。迈富时最新发布的AI-Agentforce2.0作为企业级智能体中台,采用"技术赋能+场景落地"双轴驱动模式,重新定义企业智能化转型路径。该平台通过"模型-应用-开发平台"三位一体架构,提供从底层能力到上层应用的完整闭环,包含五大技术模块:模型管理、知识引擎、工具生态、流程编排和企业级基座。相比传统开发方式,该平台将Agent开发周期从3-6个月缩短至2分钟-2周,并已在金融、零售、供应链等行业实现规模化落地,典型应用包括智能导购、财务审批等场景。

  • 销量破万,多地售罄!出门问问TicNote全球热销触发紧急补货

    出门问问(02438.HK)推出AI硬件产品TicNote,全球销量已破万台。该产品搭载"Shadow AI"系统,具备记录、分析、创作等智能功能,实现软硬件结合。TicNote在国内天猫、京东相关品类排名前二,部分区域已断货。作为公司十年AI技术积累的成果,TicNote致力于成为用户的随身AI思考伙伴。出门问问持续深耕AI核心技术,未来将以"Shadow AI"为基础,拓展更多应用场景。目前产品正在紧急补货中,用户可通过京东、天猫旗舰店购买。

  • OPPO K13 Turbo系列外观公布:自带RGB风扇 EVA初号机配色

    OPPO今天正式公布了OPPO K13 Turbo系列新机外观,展示了新机的风扇等外观细节,以及全新配色。 该机后摄模组造型比较简洁,只有主摄和下放的风扇凸起,风扇外圈自带RGB灯效。

  • 王腾:REDMI Turbo 4 Pro非常成功 很多友商都在关注

    REDMI总经理王腾发文表示,REDMI上半年发布的Turbo 4 Pro非常成功,受到了广大用户的喜爱,也收到了很多友商的关注。 据悉,REDMI Turbo 4 Pro于4月份发布,首发起售价是1999元,该机上市不到一个月累计销量突破100万台,成为行业内最火的Turbo手机。 随着REDMI Turbo系列的热销,各大品牌纷纷推出Turbo系列手机,主打高性能,对此王腾表示,领先的一种体现就是被模仿,说明REDMI这几�