我们每天从睁开眼睛开始,每时每刻都在做的一件事就是找东西,更书面化一点,视觉搜索。比如在杂乱无章的书桌上找钥匙,在拥挤的食堂找同伴的面孔,在街道上找一个特定的店铺,这时候你会意识到你在做这件事,因为费劲。但大多时候,视觉搜索这件事发生地悄无声息,你根本不会觉察到,比如你想打开一个桌面上的文件,你得先找到这个文件的位置。虽然这时候的搜索发生地非常自动化,但我们的大脑其实在这个过程中做了不少工作,就像我在一篇文章里读到的很喜欢的一句话,"The results presented here are in many ways a case study of one of the central lessons of cognitive science: that how effortless and natural a process feels is a poor guide to how much work is supporting that process beneath the surface."(大意:这个结果从多方面例证了认知科学的启示:一个感觉起来自然不费劲的加工过程背后其实有大量的支持工作)。
在视觉搜索这个任务以及背后的认知过程,心理学家 / 脑科学家的研究非常之多,也开始地很早。大多数的视觉搜索研究都采用比较简单的范式(图 1),比如在多个色块中搜索一个不同颜色的色块,在多个有一定朝向的线段中搜索一个不同朝向的线段,或者采用更复杂一点的刺激,搜索字母或者图形等。这些采用简单刺激的研究的好处在于剥离掉很多无关因素的影响,但相应地,和我们实际生活中的搜索任务相差较多。所以现在很多的研究开始关注真实场景下的视觉搜索(visual search in a real-world scene),这些研究结果也可以为机器视觉提供支持:如何在机器上重建人类的视觉搜索能力。
那么,真实场景下的视觉搜索研究和简单的视觉搜索关注的问题有什么不一样呢?
第一:情境线索 (contextual cues)
在简单的视觉搜索任务中,目标(你要找的东西)出现的位置通常是随机的,可能出现在场景中的任意位置。但是在真实场景下的视觉搜索任务,目标的可能位置是受到限制的。比如你要下面这张图(图 2)上找直升机,那么你肯定会在天上(图片的上方)去找,而不会从沙漠(图片的下方)去找,这时候 "天空" 就是情境线索,限制了目标可能出现的位置。相反地,如果要去搜索吉普车,"沙漠" 就成了情境线索。
第二:物物共存关系 (object-object occurrence)
物物共存关系指的是有些物体在真实生活中总是成对出现的
来源: http://www.tuicool.com/articles/BzM7FfA