图片来源 @视觉中国
文 | 脑极体
在初为父母的前几年时间里, 你们会有一件其乐无穷的事情就是观察孩子们的情感状态. 小孩子的情感的丰富度是随着大脑的日渐发育, 还有生活经验, 尤其是父母的情感和情绪表现而逐渐发展的.
细心观察就会发现, 孩子们会由最开始的本能的哭泣, 开心, 慢慢流露出生气, 着急, 疑惑和好奇, 个性开始展现. 再然后她便开始学着模仿大人的表情, 表现出委屈, 愤怒, 不情不愿, 悲伤, 害怕, 也表现出兴奋, 淘气, 使坏得逞后的得意, 装模作样被发现后的狡黠......
在个性, 言语和情绪掌握上, 父母很大程度就像是孩子的镜像, 孩子就是父母的印刻. 几乎每个家庭都在用自己的方式培养这样一个 "纯人工智能".
世界级神经科学家安东尼奥. 达马西奥在其著作《笛卡尔的错误》中指出, 情绪和情感也是人类理性的基础, 情绪部分的缺失使得理性决策难以实现. 简单来说, 人类的理性不仅仅由智商 (IQ) 决定, 也受情商 (EQ) 决定.
这一研究解释了人类的智能不是简单的逻辑计算和推理, 还有情绪感受推动着的决策和行动. 那么, 对于人工智能而言, 仅仅具有分析和识别能力是远远不够的, 能否具有情绪情感的识别和表达能力才是向人类智能的大步飞跃.
正如马文. 明斯基所言:"如果机器不能够很好地模拟情感, 那么人们可能永远也不会觉得机器具有智能."
如何让机器具有识别, 理解和表达人的情感的能力, 其实也早已进入人工智能研究的视野之内. 在 1997 年, MIT 媒体实验室的 AI 专家罗莎琳德. 皮卡德教授已经正式提出 "情感计算(Affective Computing)" 的概念, 也同时开创了计算机科学, 神经科学和人工智能学科结合的这一分支学科 -- 情感计算, 从而推动了情感识别分析与 AI 技术相结合的情感智能的持续发展.
我们知道最近十年里 AI 技术的爆发, 主要是在计算机视觉, 自然语言处理, 语音识别等机器学习和深度学习算法领域发生的. 图像识别, 语音识别等 AI 应用在产业的成熟落地, 其风头正劲的光芒遮盖了仍处在探索当中情感智能的发展. 同时, 这也说明情感智能是下一阶段更高阶的 AI 技术, 其成熟度和应用场景还需要更多时间来培养.
根据德勤最新一份研究报告, 作为 2020 年后新技术趋势的情感智能, 将成为很多人重新体验 AI 技术的新方式之一.
也就是说, 情感, 情绪, 这一原本专属于人类个体的独特而又复杂的内在属性, 正在成为被技术模拟和商业重构的生产力形式, 现在以人机交互的方式来到我们身边.
那么, 情感到底是如何被机器计算? 情感智能的商业化是否靠谱? 我们希望带着这些令人好奇问题深入到情感智能的最前沿.
情感情绪识别, 实现情感智能第一步
在搞清楚情感计算和情感智能之前, 搞清楚情感概念本身就是一个非常复杂的问题. 据统计, 关于情感的研究和定义, 相关的理论就有 150 种之多.
我们可能很轻松地认出他人神态, 语气, 姿势当中包含的当下情绪和持续的情感状态, 但是让我们说清楚到底什么是情感, 不同状态, 不同程度的情感的细微差别, 可能就非常难了.
那么, 在识别情感情绪这件事情上, 机器可以做的比人类更好吗?
我们可以肯定的是情感是可以计算的. 从性质上, 情感其实可以区分为生理上的和心理上的两个部分. 前者体现为表情, 音调, 身体姿态以及依靠传感器才能觉察的肌肉, 心电反应; 后者体现为个体的内在的心理状态, 前者是后者的生理性表现, 后者又是前者的心理基础.
显然, 机器更擅长从前者的角度来识别和认知情感情绪. 在情感计算的研究中, 情感情绪识别是最基础, 也是最重要的研究领域.
情感情绪识别主要就是通过对人的面部表情, 语音语调, 文本内容以及身体生理信号等各种模态数据的学习, 从而识别出人类的各种情绪和情感状态. 在此基础上, 现在情感计算领域已经具有很好的人脸表情识别, 语音情感识别, 文本情感识别, 多模态情感情绪识别等.
以人脸表情识别为例. 表情识别技术就可以利用人脸的面部信息, 比如眼角细纹, 眉头, 嘴角位置的变化, 来进行表情的判断. 由于深度学习的应用, 表情识别的算法也取得了很大的提升. 现在研究者更是将注意力集中在人类难以察觉的微表情识别当中. 这些在美剧当中出现的技术将实际应用到司法, 金融以及教育领域.
人脸表情识别技术不仅能知道人们是否是发自内心的微笑还是社交微笑, 还能够抓取到连本人都意识不到的, 转瞬即逝的表情, 尽管这些表情是本人刻意隐藏的或者无意识流露出来的.
除人脸表情识别外, 语音情感识别是一种同样重要的情感识别方式. 语音情感的识别算法是通过对声音信号的特征提取, 处理, 实现分类器所需的训练模型, 利用分类器来对要识别的情感类型进行预测.
在人机的语音情感交互中, 除了机器准确地获取和识别人类的语音情感信息, 再就是机器如何使用带有情感的语音信息进行反馈. 目前来看, 我们在智能音箱, 智能导航上听到的那些四平八稳的机器合成仿人类语音, 距离有着韵律和节奏感的真人音色和情感表达上还是有一定差距的. 但是在迁移学习, 强化学习等方法的帮助下, 模仿真人带有真实情感的语音语调的合成语音, 其以假乱真的程度已经超出了我们的想象. 很多在线客服, 仅从声音上已经很难判断是人工还是人工智能了.
基于文本的情感识别, 尽管没有了图像, 语音等维度的个性化数据信息, 但通过自然语言处理, 机器增加了对话, 语句, 语词属性等多个层次的语义分析. 从对话中可以获得对方的情感倾向, 从语句中获得其情绪的转变, 从语词属性中提取观点. 这样在机器进行文本应答的过程中, 就可以给出更个性化的回复, 而不是像现在电商客服里清一水的感谢或者道歉的标准文案.
多模态情感情绪识别, 相比较于单模态的数据识别, 可以综合不同模态的情感信息来提高情绪情感识别的准确度. 首先是智能终端设备, 包括像智能手表, VR 眼镜等可穿戴设备的成熟, 使得多模态数据收集成为可能. 其次, 研究者已经可以采用深度信念网络对生理信号, 表情与姿势信息以及语音信号等多模态信息进行特征融合, 再通过支持向量机来进行特征分类, 从而给出情绪情感识别的结果.
情感情绪识别只是迈出了情感计算最基础的一步, 当 AI 开始尝试给出带有情感表达和情感决策的反馈, 人机的情感互动才可以建立起完整的闭环. 当然, 由于商业活动当中, 有大量的场景需要应用到对于人类的情感情绪识别技术.
伴随着这些情感计算的情感情绪识别技术开始的出现, 其商业化进程就已经开始, 特别是近几年伴随着 AI 应用的大规模普及, 情感智能正成为了 AI 领域的新热点.
新交互体验, 情感智能的商业新机
随着情感计算技术的成熟, 人脸表情识别, 语音文本识别, 人机情感交互已经在零售, 金融, 教育, 临床医学, 心理分析, 车辆监控等商业领域得到了广泛的应用, 涌现出一大批以情感计算技术为核心的创业公司.
在众多的商业场景中, 客户或者用户的情感情绪对于企业来说是非常重要的参考数据, 也是企业进行决策的数据.
比如, 广告主希望知道消费者对于他们的广告宣传的关注点和感兴趣的程度; 零售商希望知道进店顾客对于陈列商品的喜好程度; 教育工作者希望了解授课过程中学生们的学习状态和对知识的兴趣态度; 在线客服则希望最及时地处理顾客的负面投诉, 想尽快地识别和安抚那些已经气急败坏的客户以降低投诉风险; 金融业则希望了解重要客户的诚信情况, 除了其历史记录, 还想知道其当前的真实意图......
传统的调查, 访谈或者增加人力的方法, 尽管有一定作用, 但仍然存在着大量的主观的, 不确定的影响因素来影响企业对客户情绪的有效判断. 而基于情感智能的识别分析, 则能够得到客户和用户最真实的情感表现, 同时由于机器学习的大规模应用, 还能有效降低在情感计算上面的时间, 人力的投入.
在广告效果测试中, 如果是基于问卷调查, 被测试者往往会经过理性思考, 出于维护个人形象或者出于社交礼貌等因素, 给予被测试广告过高的评价. 而基于人脸情绪识别, 则可以发现被测者在观看广告时的无意识的情绪状态, 这样更有助于得到对该广告的真实反馈.
再比如零售门店的场景当中, 遍布门口以及店内的摄像头, 可以代替店员最先捕捉到顾客的浏览状态, 在商品前的停留时间, 神情状态等信息, 从而可以有效指导店员进行服务介入. 另外, 与会员制的结合, 可以对该顾客的购买记录, 到店的情感状态记录一起形成顾客的个性化资料库, 从而进行更有针对性的购物指导, 提高到店复购率.
在金融领域, 情感智能可以有效应用在金融信贷反欺诈领域. 在应用这些技术之前, 金融机构只能根据信贷客户的历史表现和资产信息进行判断, 这样一方面限制了信贷的客户群体, 一方面有可能遭遇客户的类似 "庞氏骗局" 形式的故意欺诈, 即通过之前良好的信贷记录, 最后一次性大额信贷后卷款跑路.
基于情感智能技术的实时性和分析数据的 "不可伪造" 特性, 金融机构就可以通过对信贷客户在面对面访谈过程中的人体数据进行音视频的记录和分析. 基于对这些数据的分析, 可以形成一个欺诈可能性的概率, 为金融机构的最终判断提供参考依据.
如果将这些应用场景列举下去, 我们会得到一串长长的情感智能的商业化清单. 我们其实也能看到, 从商业机构, 企业主的角度出发, 他们想要将情感智能技术应用到各类商业场景当中, 从而获得更多的消费者数据和商业机会.
作为消费者和一些平台用户的我们是否该问一句: 在这些应用场景当中, 是否要订立一些使用的边界, 来保护我们个人最后的那一点隐私呢?
知情和许可, 打开情感智能商业化的正确姿势
情感计算和情感智能的技术可行性以及应用的可行性, 其实已经毋庸置疑了. 但是情感智能的应用边界和规则, 却理应得到认真的思考和界定.
思考这样几个场景. 比如, 当你在驾车行驶的途中, 车内摄像头可以捕捉到你的面部表情, 就会判断你是否处于疲劳, 分心或者路怒状态, 并进行及时的提醒和休息建议. 这项技术现在早已开始普及. 但是如果这些被记录的情绪状态, 如果被用来作为你下一次车险的判断依据, 就需要值得商榷了.
再比如, 去年一段小学生戴着监控头环上课的事件闹得沸沸扬扬. 这一设备可以记录孩子们的走神, 分心的情况, 并进行注意力打分, 汇报给老师和家长. 这种情绪数据的监控, 以及类似地对学生上课状态的识别, 是否对学生的隐私造成侵犯和伤害, 也是一件值得探讨的事情.
更极端的情况, 比如一些公司如果想用这套情感智能系统来监控员工的工作表现, 社交网站和分析机构使用用户的社交记录来进行政治倾向的筛选和政治选举的刻意引导, 正如 Facebook 和剑桥分析所做的那样, 造成了极为恶劣的社会影响.
显然, 商业机构或者各类组织在应用情感智能的技术时候, 应该让消费者和使用者拥有充分的知情权, 并且在某些情况下, 要征得用户的许可授权, 这样才能更好地为情感智能的应用提供友好的使用环境.
首先, 提供知情权是所有应用情感智能的基础. 比如, 零售场景的视频监控和数据监控应做好明显的提示; 在线客服的机器客服应答, 也应明确告知其真实身份.
其次, 某些场景下获得消费者和用户的许可授权, 是进行情感智能的必要步骤. 比如, 广告商想要获取用户的真实反馈, 比如在智能电视, 影院等场景, 必须获得观众用户的许可, 才可以进行数据采集和分析. 另外, 从公共安全和公民个人隐私保护的权衡利弊上, 国家也应该开始制定相应的法律法规, 限制情感智能在可能会涉及的危害公共安全和个人隐私领域的应用.
我们知道商业机构以及各类组织在新技术, 新商业模式上的探索热情是难以遏制的. 情感智能所产生的商业新场景, 将激发全新的人机交互场景. 但这同时意味着个人用户必须让渡自己的更为私密的隐私数据.
按照科斯定理, 一项资源归谁所有, 不在于它是属于谁的, 而是在于谁用得好就归谁所有. 这一理解确实很好地解释了资源在市场中如何最高效利用的背后原因. 比如, 薛兆丰所列举的淘宝的购物大数据以及亚马逊的注释的数据, 由于是淘宝网站的广告平台以及亚马逊的数据平台可以用得最好, 这些数据就应该归淘宝和亚马逊所有.
当然这有一定道理, 毕竟用户们免费使用了平台提供的一系列服务, 并且肯定同意了平台的那些 "冗长的" 用户服务协议, 让渡数据才能更好地帮助平台成长.
但是现在情感智能技术的进展要开始获取个人几乎最私密, 最主观化的身体和心理数据, 这必须让我们重新审视一下科斯定理的适用范围了.
用户是否在意自己的这一隐私数据是一回事情, 商业机构是否提供情感智能应用的知情权和许可权就是另一回事. 至少像手机 App 应用在安装的时候, 也要问一句, 是否同意获取您的个人情绪情感信息.
情感智能的商业野心之下, 还请让选择权留在用户的手中.
来源: http://www.tuicool.com/articles/VjMzie6