NLP的成功落地需要场景化

  NLP的需求,无处不在,只要有语言出现的地方,就有NLP的用武之地。但通常无法简单概括NLP的需求,必须结合场景才能明确。像语音识别、人脸识别等应用,需求相对单一明确,与场景关联度低。例如语音识别是把语音转换成文字,无论转录、同声传译、对话场景,或是金融、教育等应用领域,需求是明确不变的。NLP需求的场景化,使NLP应用必须深入业务,只能针对具体场景具体定制,无法实现快速复制。这也是在NLP领域尚没有出现类似科大讯飞、商汤科技这样的独角兽公司的原因。

  在石正柏看来,NLP技术的实际应用需要常识知识,而常识知识来源于具体的场景。常识知识包括两种,一种是通用知识,这些是普通人都掌握的知识。另一种是具体场景下的业务知识,例如催收场景下具体的催收流程、催收术语和催收话术等,这些是专业人员所拥有的专业知识,必须来源于场景。

  具体场景下的业务知识,一般是由两类人掌握。一是具体业务人员,如一线催收人员,但他们只懂业务,而对技术了解甚少;一是提供行业解决方案的应用开发人员,如中腾信智能语音机器人的开发工程师,既懂业务,又懂技术,做到了二者的结合。而对一般NLP开发人员来说,场景业务知识是短板。这是很多NLP技术人员,甚至是高校和大厂的顶级专家,落地到具体场景应用下倍感挫折的原因。NLP应用的落地,一定要将NLP技术与场景的常识知识结合起来。