让智能客服讲好每一句话到底有多难?

2022-12-05 14:25 大众报业·半岛网阅读 (21486) 扫描到手机

“hello,world!”

是很多人关于电脑的初始记忆

简短的两个单词

叩响了科技通往现实的大门

也打开了便捷交互的新世界


如今, 随时召唤的语音助手、

网购时的智能回复、

车载导航里的语音提醒…

关于“用科技讲好每句话”

我们可能早已习以为常

而这,其实并不简单


为此,平安专门研发了一个平台

——平安百灵TTS

它都有哪些特点?一起来看


暖心:真·有“人味儿”

“您好,这里是…”

当手机另一端传来机械式的声音

可能还未等语音播送完毕

早已被当成骚扰电话直接被挂断


简简单单的一句话

既要让人听清楚、听得懂

还要透出人情味、让人愿意听

这是摆在现实的一大难点


在语音技术运用最多的平安客服中心

平均每天需处理数百万通电话

单纯靠人力完成,难度不小


而我们通过平安百灵TTS

从坐席助手到语音质检再到语音交互

在八十多个场景中人工的重复性工作

均可由机器人代替完成

准确率达95.6%,超过业界的标杆水平的6%

(小小地骄傲一下)


不仅如此,伴随着百灵语音克隆产品的推出

上海话、广东话、四川话、河南话等方言

也能够被百灵TTS准确建模和复刻

在音色上更加宜人

满足了平安集团内绝大部分的客服或坐席代表场景


此外,在跟客户交流过程中

口语化TTS会自动合理使用口语词,并增加停顿

让客户感觉对话更有“人味”

声音有了温度,服务也变得更省事


快速:真·秒回复

随着生活节奏越来越快

在即时通话、实时视频交互等场景下

对于语音交互的反应速度的要求也越来越高


比如,当你驾车使用手机地图进行导航

途经某个分岔路口时

语音播报的提示延迟了几秒钟

而你可能就已开到了错误的那个方向

整个驾车路线又需要重新规划

这样的情况,无形中让服务的使用感大打折扣

我们的语音算法团队通过大量的研发

实现了语音的流式合成与传输


简单而言,百灵TTS可以一边合成一边播

最长仅需0.2秒的等待

(不超过眨一次眼睛的时间)

就好像和人边想边说一样

不仅时效性高,响应速度也很快

搭配畅听的语音克隆

让忙碌世界中的沟通更有了真实的“对话感”


专业:真·够懂你

早期的语音技术

单人需要几千到上万句录音

相当于对着麦克风

辛苦又尴尬地讲上几十至上百个小时

(妥妥的无实物表演)

时间虽已给到位,但效果却还是差点味


以数字为例,同样的“123”

可以读作“一、二、三”

也可以是“一百二十三”

再比如“22-9-7”

可能是年月日,也可能是一串编码

尤其在金融场景中,数字更常见


如何更好地让语音技术理解沟通时的本意

尽可能减少不必要的误解?

我们采取“两手抓”


一方面,从源头模型进行优化

确保语音模拟技术与场景变化的良好匹配

另一方面,在实际应用中

当客户拨入电话后

智能语音机器人在识别理解客户的意图、

自动查询相关支持信息的同时

以语音模拟保持和客户的顺畅交流

而接线人员也同步进行选择答案与操作


通过智能语音机器人和人工的巧妙配合

既让客户倍感重视,又实现了不间断交流的体验感

这专业,靠得住!


目前,百灵TTS实现了每月500万以上的外呼数量

并同步形成记录,回传至人工坐席衔接

将科技和专业创造的价值

融入到我们的日常生活中


而当下的语音技术

也不断创造出了更多新的可能——

2.3亿居家养老的老人离不开智能语音的呵护、

3亿人的中医问诊服务离不开语音问答、

针对阿尔茨海默症的语音问诊将作为诊断依据……


从“讲好第一句话”的渺小初衷

到“讲好每一句话”的不懈追求

语音技术如同一根杠杆

轻盈而准确地撬动了科技时代里更多的可能性


我们希望,这只“百灵鸟”的声音

将在更多需要的地方响起

被更多人“听”见