客服 机器人 如何划分?
我们今天的话题是新一代客服机器人,既然是新一代,那么前几代是怎样的?
第一代
第一代客服机器人叫问答机器人,基于单个关键词的精确匹配。它很简单,简单到几乎没有什么技术可言,客户问的问题也不像是我们常见的问题。例如,在微信公众号平台回复一些关键字词,获取某篇文章或活动入口。这样的问答机器人的原型是出现在电话客服上的,我们叫IVR(交互语音应答系统)。大家应该都有接触过,例如打电话给银行客服,语音提示你选择所需服务的序号,菜单会一层层深入了解客户究竟想问什么问题,最后给出一个自动化的语音回答。
由于第一代问答机器人使用的是单个词的完全匹配,在使用场景中受限很多,所以很快出现了第二代机器人。
第二代
第二代客服机器人已经可以支持多个词匹配,并且具有模糊查询能力。但我们可以发现它仍停留在“词”的层面,例如图书馆的查询书籍系统。第二代机器人还有个名称叫做“精灵系统”,早期在网易游戏中的客服系统,就是这样一个精灵系统。这里顺便再提一下,网易游戏精灵虽然还叫做“精灵”,但是从技术上讲它早已不再停留在第二代技术,这也是顺应更复杂业务场景的要求。
第二代客服机器人虽然比上一代机器人有了进步,但局限也很大,就是它的匹配规则是比较死板的,只能应用于一些简单场景中。例如图书馆查询系统中的书名、作者名都是比较明确的;游戏中查询的角色、装备、副本信息也是相对明确的。这些内容有一个很大的特点——用户问法简单、明确,没有太大变化,在后方支撑这个系统的是一个关键词列表。但当这个系统应用于一个业务相对复杂的场景中,就会出现这样的问题——需要维护一个非常庞大的关键词列表,而且表达同一意义的会有若干不同的关键词,这也就会影响到最终匹配的精度和结果。它需要依靠人的经验、技巧去调整配置关键词列表,可靠性不高,而且还增加了大量的人力成本。这也就是为什么我一开始就强调使用客服机器人的目的是为了节省人力支出。当关键词列表越来越庞大时,其实是在增加人力成本,这就与我们的初衷背道而驰。
第三代
当业务复杂后,我们又不得不寻求一些新技术,这就是第三代智能客服机器人。在关键词匹配的基础上引入了自然语言处理(NLP)技术。比较大的飞跃是,机器人处理的不仅仅是词,可以进一步处理句子。一些简单的处理流程是这样:首先输入信息,然后对数据进行清洗和预处理的工作,把一些杂乱和无效的信息排除。接着进入自然语言处理的流程:这里面包含一些技术如分词、词性标注、文法、句法、识别关键词(即:把一个句子切开,把里面每一个词搞清楚,给每个词加一个权重,根据权重的综合算法来匹配知识库中哪个答案可以最准确回答用户问题)。
如果大家用过后就会发现,它的智能体现在,当我们问一个问题时,机器人支持一定问法上的变化。比如,知识库设定的一个条目是“我要退货”,当客户说“我想退货”时,第三代机器人是可以理解用户意思的,但语义判断能力还是有限,匹配精度还没有特别高,第三代机器人就需要运营知识库弥补这些局限。运营知识库就是运营问法,不再是关键词,数量上会大量减少,维护方式也变得简单。这就是自然语言处理技术所起的作用,机器人与用户的沟通,更接近于人与人的交流,用户可以用一个完整的句子提问,不再是一个个单个的关键词。