1.客户-语音→语音识别:机器人本身是无法完成识别语音的,因此第一步是将用户的语音转换为文本,该步骤需要依靠语音识别这一技术。单谈语音识别的话,是一项复杂、需要持续投资的技术,在当今社会,这一块做的好的也就那么几家,科大讯飞、谷歌、微软、阿里、百度、腾讯等。因此很多做电话机器人使用的都是这些大厂的语音识别技术(国内主要使用科大和阿里的)。
2.语音识别-文本→自然语言理解:这时候用户说的话已经被语音识别转化为文字了,机器人拿到文字后,利用自然语言理解,分析用户的意图,通俗来说,就是要知道客户在说什么
3.语言识别-意图→对话管理:此时,机器已经识别出客户的意图,下一步机器需要知道应该如何正确回答客户的问题。
4.对话管理-触发→预设话术:此时机器人已经理解客户在说什么,需要做的就是组织好语音回答客户的问题,一般情况,这些回答都是提前预设,机器人会自动调用然后回答客户的问题,从而完成一次有效对话。
5.预设话术-呼叫→人工录音:当机器知道需要回答哪个话术时,就需要调用与该话术相对应的录音。此时,为了提高营销效果,大多数客户都选择播放真人录音,但效果更逼真。因此,人工录音的效果在很大程度上决定了前端用户接电话时的体验。