Gartner：《智能客服机器人之客户服务行业最佳实践》（环信联合发布）

2017-08-18

牛透社

2016，开启了人工智能（AI）元年，在世界范围内掀起了一轮新的技术和应用革命。由于云计算、大数据、机器学习、深度学习等技术的不断发展进步，伴随着人工红利消失、消费升级、个性化用户体验的刚性需求催化了各种AI应用的快速落地，包括无人驾驶、计算机视觉、智能聊天机器人等人工智能技术慢慢从实验室走进了我们的日常生活。

随着2016年Alpha GO打败李世石震惊了世界，人工智能也迎来了一波投资热潮。2016年前三季度全球人工智能行业融资额36.84亿美元，融资交易高达457次。据统计，2015年全球AI市场规模约为484亿元人民币，到2020年，全球AI市场将达到1190亿元人民币规模。

有科学家大胆预测，在未来几十年人类将创造出具有灵长类动物智能的人工智能系统。但现阶段AI发挥最大生产力更可能是在垂直行业，如无人驾驶、安防、医疗、工业机器人、企业服务等。

环信CEO刘俊彦认为：“在中国目前的环境，锦上添花的AI功能叫好不叫座，客户缺乏付费意愿。AI只有做到真正替代人工或者完全自动化一个企业的流程，甚至创造出一个全新的更具效率的业务流程，才会有客户大规模买单。”

在客户服务行业，当用户请求接入后，先由智能客服机器人解答80%的常见问题，剩下20%复杂问题再由真人专家客服来回答解决。智能客服机器人创造的整套流程已经完全改变了整个客服行业的劳动力结构和工作方式，正如自动驾驶未来终将彻底改变整个交通出行和汽车制造行业。

不要错误理解“智能机器人”

市场上关于机器人的分类很多，误区也有很多。往往人们会将客服机器人等同于聊天机器人，但客服机器人其实只是聊天机器人的一种。聊天机器人主要分为两个大类：闲聊机器人与Task Oriented 机器人。

闲聊机器人的主要目的是和用户交流情感，不一定需要解决实际问题，即我们通常所说的搭讪。这类机器人的代表是微软小冰，比如当用户问“明天天气怎么样？”，闲聊机器人不一定会给出正面回答，而是回复“你自己不会去查吗？”

Task Oriented 机器人是以任务目的为导向的机器人，又包括个人助理机器人与客服机器人。个人助理机器人主要目的是为用户提供一些服务，如设置提醒、查天气、订票、对其它设备的控制等，这类机器人的代表有Siri、微软Cortana、亚马逊Alexa。

客服机器人则是指帮助客服回答问题提高人工客服效率的机器人，目前商业领域有众多服务于企业智能客服的机器人厂商。与闲聊机器人不同，这两类机器人都会帮用户真正解决问题，如同样对于“明天天气怎么样？”的问题，用户会收到更加具体如“明天天气：晴，4°C/15°C”的回复。

下表对闲聊机器人、个人助理机器人、客服机器人从解决问题领域、平台系统开放性、技术方案的角度进行了详细比较，主要区别如下：

1、从解决问题领域来说，闲聊机器人的问答不限定领域，而个人助理和具体到个体的客服机器人都会限定领域。

2、从系统开放性角度，闲聊机器人和个人助理通常是一家公司开发，直接面向消费者，不会开放技术细节，最多是调用第三方的服务，第三方不能定制机器人的对话。而客服机器人通常是一个平台，可能开放技术细节也可能不开放，有可能支持普通用户通过配置来修改机器人的行为。

3、三种机器人采取的技术方案，一般由问题决定。闲聊机器人为检索式+生成式，通过构建一个闲聊库检索类似问题，给出答案，并从闲聊库中学习生成模型。个人助理机器人则采用意图识别+多轮对话+对接公开API+知识图谱，需要对服务领域的意图和对话有预先的定义。客服机器人则采用检索式与复杂的意图识别+多轮对话+对接企业内部信息系统+企业知识图谱结合。

智能客服机器人概述与分类

如何才能科学的评测和选型智能客服机器人？在这一部分中我们将对智能客服机器人的会话场景及评测指标进行描述。

一般来说，智能客服机器人问题按照业务场景分为售前销售和售后服务两大类。

售后的特点是问题通常为一些重复性的服务性请求，比如退货，查订单，故障报告。在这种情况下，会使用到机器人单轮对话、多轮对话以及API集成，其中对单轮会话有更多的应用。

售前的特点通常会以销售为导向。销售是一门艺术，需要非常多技巧，但现在的AI技术，还不足以支持用机器人完成这样的工作。所以售前场景下，除了机器人单轮对话、多轮对话、API集成，还会用到人机协作，其中尤其对多轮会话和人机协作有更多的应用。

单轮会话和多轮会话的评测指标

1、单轮会话

单轮会话是指简单的一问一答，问题可以用一句话来描述，不依赖于上下文。比如问，你们发哪家快递。答，我们发中通。在客服场景下，大量的问题都是这样的单轮问答。

一般这样的问答依赖于一个知识库/问答对
机器人从知识库里检索相似的问题，给出答案

评判单轮会话的主要指标为召回率、准确率和问题解决率。

召回率=机器人能回答的问题数/问题总数

召回率是指机器人能回答的问题数与问题总数的比值。机器人能答上来的问题越多，则召回率越高。会话没有召回可能存在两种情况，第一种，知识库规则不够全面，问题是知识库里没有的问题，在这种情况下需要完善知识库，涉及到知识库的初始设置和后续的自学习能力；第二种，相似问题在知识库里有，但是由于语义理解问题没有找到，这种情况下则需要优化算法。

准确率=机器人正确回答问题数/问题总数

准确率是指机器人正确回答问题数与问题总数的比值。对闲聊机器人来说，因为闲聊场景下通常没有明确的正确答案，所以通常来说准确率不是闲聊机器的主要评测指标，闲聊机器人更关注召回率，更关注回答的相关性，是否有趣有情感等指标。对客服机器人来说，通常要求优先保证准确率，即宁愿不回答，也不能答错。

准确率这一评测指标在实际使用中需要人工来标注机器人的回答是否准确，所以使用场景相对受限。企业的客服部门通常会使用问题解决率来作为日常工作中对机器人的主要评测指标。

问题解决率=机器人成功解决问题数/问题总数

问题解决率是指机器人成功解决的问题数与问题总数的比值。机器人成功解决的问题数=（问题总数-转人工客服的问题数量-顾客反馈不满意的问题数量）。企业需要设置合理的机器人转人工客服策略，确保顾客在机器人不能很好地解决的问题情况下，可以转由人工客服接待。同时，企业在客服系统中应该提供对机器人客服的反馈和打分机制。

2、单轮会话技术实现方案

单轮会话常用的两种实现方式是相似度检索及意图分类。相似度检索方法更为通用，多数厂商在解决单轮会话时采用的是这种方法，但准确率不如意图分类方法。相似度计算的算法基础工具一般为分词、词性标注、句法分析、核心词识别等，相似度计算还会用到tf-idf及Deeplearning（lstm, dssm)等。

意图分类方法则需要先定义出“意图”，再使用分类器把句子分类到某个意图。相比于相似度检索方法意图分类更准确，因为它不是基于语义相似度的匹配，而是直接对问题意图进行分类。

比如还是上文所述例子，机器人要先学习大量问发哪家快递的问法数据，结合人工给出定义，定义出哪些属于问发快递的意图，哪些不是。当识别某句子属于某种意图，返回对应答案。

机器人系统通常会结合两种方法，对于重点关注的“行业”，会使用意图识别解决常见问题，以期达到更高的准确率，对于其他问题，则可以使用检索的方法。

3、多轮会话

在客服场景下，很多问题不能通过单轮会话的简单一问一答来解决。如图所示，顾客提问“订单什么时候能到？”，机器人回答“请提供订单号”，顾客很可能记不住订单号，机器人就需要引导顾客提供其他信息，来查询对应订单。

这样来回几轮交互的会话被称为多轮会话。多轮会话不是单纯的一问一答，机器人回答内容要参考上下文信息，引导用户提供需要的信息或数据进入下一轮会话，直到准确回复用户想要的答案。

评测多轮会话的主要指标为任务完成率和多轮会话开发定制的快速简单程度。

任务完成率= 成功结束的多轮会话数/多轮会话总数

成功结束的会话数量越多，则认为任务完成率相对较高，从而多轮会话的可用性也可能更好。但需要注意的是，会话成功结束，并不一定意味着问题得到解决，也有可能客户没有从机器人处得到需要答案。通常，多轮会话机器人会设置转人工策略，当机器人会话不能继续时，转交给人工客服处理。

多轮会话开发定制的快速简单程度主要指三点：

第一，是否提供完整的API接口和开发文档，技术开发人员能够快速开发和集成；

第二，是否支持非AI专业人员开发多轮对话模型；

第三，界面交互体验是否优秀，是否支持直观可视化编辑。

不可忽视的人机协作

人机协作是指与客户沟通交流的是人工客服，但机器人同时给予人工客服实时的协助。

单轮会话和多轮会话经常用于企业的售后场景。而在售前场景下，企业的客服不仅仅要担负问题解决的任务，还要担负销售转化和销售成单的任务。当企业获客成本较高时，潜在客户线索非常珍贵，直接交给机器人接待很容易造成流失，因此需要人工进行转化，同时机器人进行辅助，当客户提出问题时，机器人会根据自身的知识体系及历史会话数据计算，向人工客服推荐答案。

在这个过程中，人机协作主要起到两个作用：

智能推荐给客服应答备选，点选即回，提升服务效率；
积累专业行业话术体系，作为最佳实践传递给其他一线客服；

评测人机协作的指标主要为采纳率。

采纳率=人工客服选择机器人推荐答案数/机器人推荐答案数

采纳率是指人机协助模式下，人工客服选择机器人推荐答案的数量与机器人推荐答案总数量的比值。当采纳率越高时，说明机器人推荐的答案正确解决问题的比例越高，人机协作的可用性就越强。

人机协作模式下应对的客户问题一般比较复杂，人工客服和机器人之间的交互体验设计是主要的难点：

1、统一的知识库。

统一知识库是指机器人知识库和传统人工客服知识库的融合。

一般情况下，机器人知识库与人工客服使用的知识库结构不同，维护方式也不同。而在人机协作模式下，需要两类知识进行打通，除了人工本身能用的日常知识库，机器人的知识库也可以在这样的情况下发挥作用。此外，人机模式的统一知识库不应仅限于结构化的知识库体系，还应包括海量日常历史会话，这是统一知识库数据的重要来源。

2、人机无缝切换。

从客户体验的角度出发，在人机协作模式下不应让客户感受到人与机器分别都在服务，而应是一个整体，因此对人工与机器人切换的流畅性就需要做一定要求。这既包括了机器人推荐答案需要高可用，也包括了操作设计需要简单便捷，才能实现完全无缝的流畅问答。

3、人对机器的反馈。

当人机模式下机器人推荐答案采纳率不高时，除了算法的优化，人工反馈也相当重要。机器人需要一种有效方式，使人工客服能够将答案为什么没有被采纳、应该采纳什么答案等优化建议反馈回来，以利于机器人对推荐答案的更新迭代。

本文作者：牛透社

本文来源：牛透社

分享到：

声明：本文由入驻牛透社的作者撰写，观点仅代表作者本人，绝不代表牛透社赞同其观点或证实其描述。