摘要:在云栖大会上,天猫精灵幕后团队——人工智能实验室的聂再清为大家介绍了语音交互平台的运作机理和完善方法。在智能化普及程度逐渐加深的当代,人机交互也就成为了丞待解决的问题。为了解决这一难题,阿里巴巴的人工智能实验室对智能语音交互平台进行了深入研究和全面优化。
以下为精彩视频内容整理:
优化人机交互下阶段的目标人机交互平台的发展经历了字符阶段、图像阶段、触屏阶段,而触屏阶段的普及在带来便利的同时营业产生了诸多不便,"低头族" 的产生便是最好的证明。人类的需求是永不止步的,需要将人的眼睛拘束于操作界面的便利已不再是便利。语音操作系统可以让人们通过简单的发出指令来获取贴心的服务,使人们不再需要投入眼力和手力,所以智能语音交互平台的普及是必然的。
想要使智能语音交互平台更加地贴心,首先要解决的便是要让其拥有正确的理解能力,人工智能团队意识到了这个问题,并制定出了详细的计划。他们认为,革新人机交互方式是解决问题的有效途径。智能语音交互平台不仅仅需要计算能力,同时也需要知识、推理能力、行动能力、感知能力、甚至认知能力。使天猫精灵的智能语音交互平台拥有这些能力,便是人工智能实验室日后努力达成的目标。
需要解决的具体问题天猫精灵的语音交互平台,作为行业的代表,已拥有许多贴心的功能来满足大众日常需求,而在满足大众需求的过程中,也发现了一些具体问题:
交互平台需要有识别多种语句的能力,提取出客户要表达的正确意思,并且准确地执行,给客户正确的回复。这其中可能需要调用第三方的 API,并且定下对话策略。指令的理解难点在于人说话的多意性和歧义性,而这两个特性起因在于人日常说话是很随性的。还是以查询天气为例,可以说 "明天的天气怎么样","我想知道明天的天气","明天的风大不大" 等等,而这些指令的意思却是同一种,那就是查询天气。语音交互平台需要有识别一种指令多种表达的能力,也要有能区分意思相近指令区别的能力。解决这些问题的途径,就是需要添加语料,这并不简单。
客户是不可控的,我们永远没法预测客户会以什么样的语言形式表达出一个指令。请专家或专业人员来解决这件事,代价是昂贵的,而问题又是必须解决的,所以提出了开发人员提供数据的解决方案,也就是自定义技能添加语料倒句和模板。具体方案为对语料等了解不深的开发人员,可以提供类似笑话集等数据;对语料略有了解的开发人员由部门提供语句,开发人员负责标注语料并添加;而关于涉及到客户隐私之类的语料不便于开发人员存储,以免泄密,所以由人工智能的记忆功能来解决。当客户的语料不明显或不存在时,平台将通过交互式构建可替换词词典和语料模板的方式,定于或发掘语料。具体来说,就是通过互联网查询指令中与网络库模板相近的语料,过滤无意义或者无用语料,提取语音不明语料并用明确的语料替代。这个操作需要建立可替代词词典并在日后的使用中逐渐完善这一词典。比如在客户使用时,提取客户语料后,将之与词典里的语料相匹配,当意义确实相同时,不但可以完成替代,还可以把客户的语料也加入词典。这种滚雪球的方式将会使词典越来越丰富,语音交互平台理解客户意思越来越准确和快速。
如何避免智能语音交互笨拙在最后,聂再清又总结了自己对于如何避免智能语音交互笨拙的一些看法。第一是要做垂直应用,开发团队不要抱着能把所有问题都解决的想法,因为技术的先进程度还不足以实现,所以要专注于垂直应用;第二是用户的期待要符合实际,这就需要专业人员的讲解,告诉用户什么是可能的,避免客户期望值过高,失望过大;第三是知识图谱和用户画像,知识是正确使用语音交互平台的前提,而用户画像指的是对用户的了解,这对平台的正确应用也是必不可少的。如果语音交互的生态系统能招募广大开发者一同建造,那么显而易见的,系统的建成将会事半功倍。
人工智能是为了帮助人而设计的,而不是代替人,秉承这一理念,阿里将会继续努力普及人工智能,为人们带去便利。
来源: https://yq.aliyun.com/articles/327091