训练机器人在脸上读 "心" 真的可靠吗?

2020-09-02 16:27   来源: 互联网    阅读量:66

屏幕上一个一个地闪着数百张脸,有的盯着眼睛,有的张着扁平的嘴,有的闭着眼睛,嘴角向上,嘴巴张得大大的。当你看到这些脸时,你必须回答一个简单的问题:这个人是经历了最好的部分还是痛苦?


2018 年,心理学家瑞秋杰克(RachaelJack) 和她的同事招募了 80 人参加这个测试。格拉斯哥大学(University OF Glasgow) 的团队招募了来自西亚和东亚的参与者,研究一个长期存在的热门问题:面部表情真的能传达情感吗?


几十年来,研究人员一直在阅读面部情绪,包括不同国家的成年人和儿童,甚至偏远地区的土著人。上世纪 60 年代和 70 年代,美国心理学家保尔·埃克曼(PaulEkman) 进行的一项著名观察研究发现,世界各地的人们都能从面部表情中准确推断出他们背后的情绪,这表明情绪的表达是相互关联的。


这一观点在一代人的时间里基本上没有受到质疑。然而,新一代心理学家和认知科学家在回顾了这些数据后,对这些数据提出了质疑。许多研究人员现在认为,实际情况要复杂得多,在不同的情况和文化中,面部表情有着非常不同的含义。例如,杰克的研究发现,虽然西方人和东亚人对痛苦的面部表情有着相似的看法,但他们并不同意哪种表情表达出愉悦。


研究人员对埃克曼的结论 -- 面孔是情感表达窗口 -- 的分歧越来越大。但这并不能阻止商业公司和政府 "支付" 他所说的话,并以一种改变人们命运的方式运用它。例如,在西方的许多司法体系中,解读被告的情绪是公平审判的一部分。美国最高法院大法官安托尼·肯尼迪(AnthonyKennedy) 在 1992 年写道,这对 "理解罪犯的心灵" 是必要的。


埃克曼为运输安全管理局(TSA) 设计了一项有争议的培训项目,该项目于 2007 年启动,重点是情感解读。该项目名为 "乘客甄别观察法"(ScreeningPassengersbyWatch,Spot),目的是培训 TSA 人员监测数十个可能反映乘客焦虑、欺骗和恐惧的可疑信号。该项目受到科学家、国会议员和美国公民自由联盟(American Civil Liberties Union) 等民间社会组织的广泛质疑,该组织指责该计划不准确,并导致种族偏见。


一家又一家的顶级科技公司认为情绪很容易被检测出来,而其中一些公司已经开发了情绪识别软件。目前,该软件正在测试或推广,从评估求职者与工作的匹配程度、测谎、让广告更具吸引力,以及检测痴呆症和抑郁症等一系列疾病。


这一行业的估值高达数百亿美元。微软(Microsoft)、IBM 和亚马逊(Amazon) 等科技巨头,以及波士顿的阿弗莱蒂瓦(Affectiva) 和迈阿密的 NeuroDataLab 等更为专业的公司,都推出了通过面部检测情绪的算法。

image

研究人员仍在争论人类面孔是否能忠实地表达和感知情绪,许多专家认为,现在用电脑实现表情自动化还为时过早,特别是因为这种技术可能具有破坏性。纽约大学(New York University) 的研究中心艾诺研究所(AINowInstitute) 呼吁禁止在招聘和强制执行等敏感情况下使用情感识别技术。



研究该问题的俄亥俄州立大学(俄亥俄州立大学)研究员亚历克斯·马丁内斯(AleixMartinez) 说,面部表情很难理解,即使对人类自己也是如此。他说,考虑到这一点,再加上目前一切都可以自动化的趋势,"我们应该担心"。


浅见


人类面部有 43 块肌肉,可以伸展、上升、扭曲和表达数十种不同的表情。虽然面部肌肉可以做很多动作,但科学家们一直认为特定的表情与特定的情绪相对应。


持这种观点的人包括达尔文。1859 年,他发表了一篇伟大的田野研究,"物种的起源",可以称之为观察教科书。他的另一部影响力较小的著作 "人与动物的情感表达"(1872 年)相当教条。


达尔文指出,灵长类动物的面部动作在某种程度上类似于人类的情绪表达,比如厌恶和恐惧。因此,他认为,这些表情必须具有一定的适应功能。例如,最初可能会用嘴、皱鼻子和按住眼睛来抵御有害的病原体。只有随着社交行为的出现,这些面部表情才开始发挥沟通作用。


达尔文的情感话语中包含了大量的拍击表达,比如那些试图模仿痛苦的人。


艾克曼在 20 世纪 60 年代进行的第一次跨文化实地调查支持了达尔文的假说。他研究了人类对世界各地六种主要情绪(幸福、悲伤、愤怒、恐惧、惊讶和厌恶)的表达和感知,甚至包括新几内亚的一个偏远部落。


埃克曼告诉 "自然" 杂志,他选择这六种情绪是出于实际原因。有些情绪,比如羞愧和内疚,没有明确的表达方式,"他说。" 我关心的六种情绪是感性的,也就是说,它们可以成为研究的对象。" 埃克曼认为,早期的研究支持了达尔文进化论中的普遍表达理论。后来的研究表明,一些面部表情具有适应性优势。


波士顿东北大学的心理学家 LisaFeldmanBarrett 说:"面部表情一直被认为是一种强制性的行为。" 也就是说,我们的脸无法隐藏我们的情绪。然而,这一假设中一个明显的漏洞是,人们确实可以伪造情绪,或者阻止它们写在脸上。埃克曼派的学者也承认,没有这样的标准 --"每一种情绪表达都有黄金标准"。


越来越多的研究人员认为,与情绪相对应的表达方式如此宽泛,以至于金本位的概念几乎正在瓦解。他们对这一观点进行了大量的概述。几年前,"心理科学"(ThePublicInterest) 杂志的编辑邀请了相互排斥的作者组成一个专家小组,完成这一评论。


我们尽我们所能摆脱先见之明,"负责合作的巴雷特说。他们没有事先设定假设,而是直接从数据开始。" 当我们不同意的时候,我们会寻找新的证据," 她说。最后,他们阅读了大约 1000 篇论文,经过两年半的研究,得出了一个明确的结论,即没有证据,也没有什么证据表明,人们可以通过各种面部动作来推测某人的情绪状态。



研究人员甚至引用的研究表明,面部运动与内心情感无关。英国德蒙福德大学(University OF Demonford) 的心理学家卡洛斯 - 克里维利(CarlosCrivelli) 研究过巴布亚新几内亚特罗布里亚群岛(Trobrian Islands) 的居民,他没有发现任何证据支持埃克曼的观点。克里维利总结称,从外在表现推断内心状态就像与统治者称重一样。


缺乏证据来证明表情的普遍性的另一个原因是,面部只提供了部分信息。其他信息,如身体动作、个性、语调和面部变化,也对我们的情绪识别和表达起着重要作用。就像情绪变化会影响血液流动一样,血液流动也会影响脸部。马丁内斯和同事发现,人们可以找到面部变化与情绪之间的关系。背景等视觉信号也可以提供线索来识别情绪状态。


从左上角顺时针方向:篮球运动员 ZionWilliamson 庆祝扣篮的成功;墨西哥球迷庆祝世界杯小组会;歌手 Adele 赢得 2012 年格莱美奖;JustinBieber 球迷在墨西哥城的一场音乐会上哭泣。


复杂情感


其他研究人员指出,人们对埃克曼的结论反应过度。埃克曼自己认为这是理所当然的。2014 年,在回应巴雷特的批评时,他指出,有许多研究支持他先前的结论,包括一些研究表明,面部表情是自发的。其他研究发现表情与大脑和身体的状态之间存在联系。他说,作为回应,这些研究表明,面部表情不仅反映了人类的情绪,还反映了神经生理活动的模式。他说,他的观点没有改变。


根据加拿大不列颠哥伦比亚省大学(University OF British Columbia) 心理学家耶西卡·特蕾西(JesicaTracy) 的说法,那些认为埃克曼的表达理论是错误的人所提供的证据,只不过是一小群反例,而且他们夸大了。


她认为,即使在不同的群体或文化中,对愤怒表情的理解稍有偏差,也无法推翻整个理论。大多数人乍一看就知道这是一张愤怒的脸,她引用了对 100 项研究的分析。有很多其他证据表明,世界上大多数文化中的大多数人都认为这种表达是普遍的," 她说。


特雷西和其他三位心理学家在一篇文献综述中说,他们把六种情绪和面部动作严格地匹配起来,这一解释有点夸张。阿姆斯特丹大学(University OF 阿姆斯特丹)的作者之一 DisaSauter 说:" 我认为在情感科学领域,没有其他研究人员同意她的观点。


Sauter 和 Tracy 认为,解释面部表情需要对情绪进行更复杂的分类。研究人员不应将幸福视为一种单一的情感,而应继续细分它;幸福还包括快乐、快乐、同情、骄傲等。这些情绪的表达可能不同或重叠。



一些研究使用电脑来产生随机表达。在瑞秋杰克2018年进行的一项研究中,参与者被要求指出每一张脸在多大程度上与痛苦的定义一致,也就是他们脑海中最令人兴奋的部分。


争论的核心在于显着性的定义。在一项研究中,参与者被要求选择六种情绪标记中的一种来描述他们看到的脸。一些研究人员可能会认为,如果一个表情被选中的概率超过20%,那就意味着这个表达方式更通用。


其他人认为20%的标准太过宽松。杰克认为Ekman的门槛太低。她在阅读博客时读了Ekman的早期论文。"我总是去找我的导师,给他看这些六、七十年代的图表,每个图表都有很大的文化差异,"她说。到目前为止,还没有数据证明情感识别是普遍的。


即使没有考虑到重要性,研究人员也必须面对一个主观问题:为了在实验结束时进行比较,许多研究都需要事先给情绪贴上标签。因此,巴雷特、杰克和其他学者希望用更客观的方法来研究情感。巴雷特正在为研究生管理指标,她想用这些指标来描述愤怒、恐惧和快乐。


杰克使用计算机生成的表情,而不是摆动面部照片,以避免局限于六种最常见的情绪。其他研究人员要求参与者自己对面部进行分类,或者要求来自不同文化的参与者用母语标记照片。


硅基情感


软件公司避免算法的自由结合。一般来说,用于情感识别的人工智能算法需要学习数百万张人脸图像和数百个小时的视频--每一种情感都是从这些材料中标注和学习的。阿弗莱蒂法说,该公司已经培训了来自87个国家的700多万张脸,其情感识别准确率已达到90%。


该公司拒绝透露该算法背后的科学依据。NeurodataLab意识到面部表情的差异,但指出:"如果某人正在经历一种情绪,一些面部表情更有可能出现,而不是随机出现。这正是公司的算法所利用的。不同意的研究人员,不管他们的立场是什么,他们对软件持怀疑态度,他们是否担心训练算法中使用的数据,或者该领域仍然没有定论。


埃克曼说,他对这些公司提出了直截了当的挑战。他写信给几家公司,但拒绝透露他们的名字,只说"他们都是世界上最大的软件公司",并要求他们提供证据,证明他们的自动化技术是有效的,但没有人回答。"在我看来,没有证据支持他们的理论,"他说。


马丁内斯(Martinez)妥协说,自动情感识别可能代表一个群体的平均情绪反应。阿弗莱蒂法向营销机构和某些品牌出售软件,帮助它们预测特定消费者对产品或营销工具的反应。


即使软件出了问题,它也不会产生多大影响,充其量,广告的效果也不会像预期的那样好。然而,一些算法的应用可能会改变人们的生活,比如面谈和边境检查。去年,匈牙利、拉脱维亚和希腊尝试了一种乘客预筛查系统,通过分析面部微表情来检测测谎。


为了平息这种感性的面部争论,我们需要不同的研究方法。巴雷特经常受邀向科技公司展示她的研究成果,最近她去了微软。她认为,研究人员应该实践达尔文的物种起源方法:"观察、观察和重新观察。"观察人们在现实生活中如何通过面部和身体传递信息,而不仅仅是在实验室。然后,机器被用来记录和分析真实生活中的图像。


巴雷特认为,更多的数据和分析技术,而不是回顾过时的数据和实验,可以帮助研究人员获得新的知识。对于这门科学,她和其他研究人员似乎站不住脚,许多科技公司急于尝试,她向这些公司提出了挑战:"我们正处在悬崖边缘。"人工智能公司是会继续使用漏洞百出的研究假设,还是会做该做的事?




责任编辑:萤莹香草钟
分享到:
0
【慎重声明】凡本站未注明来源为"中国科技观察网"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行!