Энн Трейсман. Объекты и их признаки в зрительном восприятии человека

Энн Трейсман. Объекты и их признаки в зрительном восприятии человека
Добавлено
22.08.2011 (Правка 22.08.2011)

Не так давно начали появляться обобщенные и упрощенные описания процесса переработки зрительной информации у человека. Одно из таких описаний различает два уровня переработки. Частично переработка зрительной информации осуществляется как бы спонтанно, одновременно для всего поля зрения и автоматически (без концентрации внимания на какой-либо части зрительного поля), а частично, похоже, зависит от концентрации внимания: информация обрабатывается постадийно, как если бы пятно света перемещалось из одного места в другое.

В 1967 г. У. Найссер предположил, что на некотором предшествующем вниманию уровне переработки поле зрения разделяется на фигуры и фон, а на следующем уровне «включается» внимание и идентифицируются конкретные объекты. Несколько позднее Д. Марр, занимавшийся компьютерным моделированием зрения, счел необходимым постулировать существование «первичного наброска» — первой ступени переработки информации, на которой падающий на рецепторы сетчаток поток света преобразуется в кодированное описание линий, пятен или контуров и их размещения, ориентации и цвета. Репрезентация поверхностей и объемов и, наконец, идентификация объекта происходят уже после такого первичного кодирования.

Модели с двумя и более ступенями переработки зрительной информации завоевывают все большую популярность у психологов, физиологов и специалистов по искусственному интеллекту. Первую ступень можно описать как извлечение признаков из пучка падающего света. На последующих ступенях происходит идентификация объекта и его окружения. Таким образом, слова «признаки» и «объекты», вынесенные в заголовок этой статьи, характеризуют зарождающуюся гипотезу о начальных стадиях зрительного восприятия. [...]

Каким же образом можно исследовать в лаборатории ту стадию переработки зрительной информации, которая предшествует вниманию? Одну из стратегий исследования подсказывает тот очевидный факт, что в реальном мире части одного и того же объекта имеют общие признаки: у них один цвет и текстура, их границы являются непрерывными прямыми или кривыми, они движутся вместе и находятся примерно на одинаковом расстоянии от наблюдателя. Поэтому исследователь может попросить испытуемых определить границы между участками изображений и получить таким образом информацию о тех признаках объекта, которые делают границу «бросающейся в глаза», «выпячивающейся» из наблюдаемой сцены. Это, вероятно, и будут те самые признаки объекта, которые зрительная система обычно использует для выделения фигуры из фона. [...]

Похоже, что первоначальный «разбор» зрительного поля опирается на отдельные признаки, а не на сочетания признаков. Другими словами, анализ признаков и частей предшествует их синтезу. А если части или признаки идентифицируются до объединения в объекты, они должны иметь некоторый независимый психологический статус.

Отсюда следует очень важное утверждение: иногда синтез должен происходить с ошибками. Другими словами, время от времени испытуемый должен видеть иллюзорное сочетание частей или признаков, «изъятых» из разных зон наблюдаемой сцены. В определенных условиях такие иллюзии возникают довольно часто. В одном из экспериментов автора и ее коллег испытуемому на короткое время (200 мс, или 1/5 сек.) предъявляли три цветных знака: например, синий X, зеленый Т и красный О. Внимание испытуемых отвлекали, спрашивая сначала о том, какая цифра появляется с той или другой стороны экрана. Затем следовал вопрос о цвете знаков. Примерно треть всех ответов была ошибочной — например, называли такую комбинацию: красный X, зеленый О и синий Т.

Испытуемые совершали ошибки соединения гораздо чаще, чем называли цвет или знак, не предъявлявшиеся на экране. Следовательно, их ошибки действительно свидетельствуют о перестановке признаков, а не о простой ошибке восприятия от-дельного объекта. Кроме того, большинство ошибок явно носит характер подлинных иллюзий, поскольку испытуемые часто не верили, что ошиблись, и просили показать комбинацию еще раз.

Мы попытались найти ограничения на появление таких иллюзорных соединений признаков. Например, мы смотрели, насколько похожими должны быть объекты, чтобы испытуемый мог менять местами их признаки. Оказалось, что такого ограничения практически нет: испытуемые с такой же легкостью приписывали цвет маленького красного контурного квадрата большому, сплошь залитому синим кругу, как и меняли цвета у двух маленьких контурных треугольников. Получалось, что красный цвет треугольника представлен абстрактным кодом красного, а не включен в аналоговый код треугольника, несущий информацию о размере и форме объекта. [... ]

Другой способ лабораторных исследований переработки зрительной информации на уровне предвнимания — это решение задач на зрительный поиск. Например, испытуемого просят найти объект среди других, «отвлекающих» предметов (дистракторов). При этом исходят из следующего допущения: если на уровне предвнимания переработка информации реализуется автоматически и по всему зрительному полю, объект, выделяющийся среди своих соседей на этом уровне его репрезентации в мозгу, будет «выскакивать» из наблюдаемой сцены. Иголку в стоге сена из известной поговорки найти трудно именно потому, что некоторые ее признаки— длина, толщина, ориентация — совпадают с признаками сена, в котором она спрятана. Найти цветок мака в том же стоге гораздо легче: его красный цвет и форма обнаруживаются автоматически.

Мы нашли, что, если объект отличается от окружающих предметов каким-нибудь простым признаком (например, ориентацией, цветом или кривизной), он обнаруживается почти одинаково быстро и в наборе из трех, и в наборе из тридцати предметов. Такие объекты действительно субъективно «выскакивают» из сцены, и время, необходимое на их поиск, не зависит от количества дистракторов. Эта «независимость» сохраняется даже в том случае, когда испытуемым не говорят, каким отличительным признаком обладает искомый объект. В этом случае обнаружение его длится несколько дольше, но количество дистракторов и здесь не играет практически никакой роли.

Если же объект характеризуется только сочетанием признаков (например, красный знак О среди красных и зеленых О) или определяется только конкретной комбинацией компонентов (например, К среди набора Р и О, которые в совокупности включают все компоненты К), время, нужное на обнаружение объекта или принятие решения о его отсутствии на изображении, возрастает пропорционально количеству дистракторов. Получается, что испытуемые в этих условиях вынуждены концентрировать внимание поочередно на каждом предмете, чтобы определить, как соединяются его признаки или части. В опыте с положительным исходом (когда заданный объект на изображении присутствует) поиск длится до обнаружения объекта, поэтому он заканчивается после рассматривания в среднем половины всех дистракторов. В опыте с отрицательным исходом (когда искомого объекта на изображении нет) испытуемому приходится проверять все дистракторы. Поэтому при увеличении количества дистракторов время поиска в опытах с отрицательным исходом возрастает вдвое быстрее, чем в опытах с положительным исходом.

Различия во времени поиска простых признаков и сочетаний признаков могут иметь прикладное значение. Например, контролеры выпускаемой продукции на предприятии могут затрачивать больше времени на обнаружение технического брака, если он представляет собой сочетание признаков, чем если он выражается изменением одного признака. Точно так же каждый символ, кодирующий пункт назначения багажа на авиалиниях, должен быть представлен уникальным сочетанием признаков.

В последующей серии экспериментов использовалась своего рода обратная задача на зрительный поиск. В качестве искомого испытуемому предлагался объект, отличающийся от дистракторов отсутствием какого-либо признака. Например, мы предъявляли изображения, составленные из знаков О и Q, так что различие между искомым объектом и дистракторами заключалось в том, что один представлял собой просто кружок, а другой — кружок, пересеченный черточкой (см. рис. 1). Мы обнаружили весьма примечательное отличие ситуации, когда искомым был знак Q (с черточкой), и ситуацией, в которой искомым был знак О, не имевший черточки. Когда искомый объект имел черточку, время поиска не зависело от количества дистракторов. Очевидно, что он «выскакивал» из сцены. Когда же искомый объект не имел черточки, время поиска увеличивалось пропорционально количеству дистракторов. Ясно, что все объекты в этой ситуации поочередно просматривались испытуемыми.

Этот результат противоречит интуитивному ожиданию: в самом деле, в обоих случаях необходимо было провести различие между одними и теми же стимулами: О и Q. В то же время результат хорошо согласуется с представлениями о том, что на ранней стадии переработки зрительной информации нейронный сигнал несет информацию именно о наличии отличительного признака, а не о его отсутствии. Другими словами, на начальной стадии переработки зрительная система извлекает лишь простые признаки, и каждый из них «приводит» в активное состояние группу специализированных детекторов. Объект с уникальным признаком обнаруживается простой проверкой активности соответствующих детекторов. И напротив, объект, у которого отсутствует признак, присущий всем другим объектам (дистракторам), вызывает только немногим меньшую активность, чем рассматривание изображения, состоящего исключительно из дистракторов. Исходя из этого, мы предположили, что на ранней стадии переработки зрительной информации возникает нечто вроде «карт признаков».

Похоже, что на начальной стадии переработки зрительной информации извлекается только очень небольшое число признаков. Сюда входят цвет, размер, контрастность, наклон, кривизна и наличие концов линий. Данные других исследователей позволяют добавить в этот список движение и различия по глубине при стереоскопическом видении. Строительными блоками зрения являются простые признаки, характеризующие отдельные элементы — такие, как точки и линии, — а не отношения между ними. Замкнутость является, пожалуй, самым сложным признаком, обнаруживаемым на этом уровне. Наконец, согласно полученным нами результатам некоторые признаки на этой стадии переработки кодируются как отклонения от нулевой (эталонной) величины.

О том, что для объединения признаков необходима концентрация внимания, свидетельствуют несколько групп факторов.


Рис. 1. Наличие или отсутствие признака могут оказывать существенно различное влияние на время поиска объекта среди дистракторов. В одном из экспериментов объектом был либо кружок, пересеченный вертикальной черточкой, либо кружок без этого признака. Время поиска перечеркнутого кружка (черная кривая) почти не зависело от общего количества объектов на изображении, то есть данный признак «бросался в глаза». Время поиска неперечеркнутого кружка (цветная кривая) резко возрастало при увеличении количества дистракторов. Следовательно, испытуемые поочередно просматривали все изображенные объекты


Первая из них получена в экспериментах, где испытуемому нужно было идентифицировать объект и сказать, в каком месте он его видит. В одном типе изображений объект отличался от дистракторов одним простым признаком. Например, объектом служил красный знак Н среди красных О и синих X или оранжевый X среди красных О и синих X. В другом типе изображений объект отличался способом сочетания признаков: например, синий О или красный X среди красных О и синих X. Нас особенно интересовали случаи, когда испытуемый правильно идентифицировал объект, но неправильно определял его местонахождение. Как мы и ожидали, при успешной идентификации простого объекта (например, отличающегося только цветом) испытуемые время от времени ошибались в определении его местонахождения. Отсюда следует, что для правильного соединения признаков внимание должно быть направлено на место их сосредоточения.

В реальных условиях, конечно, многие из возможных сочетаний отбрасываются на основе предварительного знания. В жизни редко можно встретить синий банан или мохнатую яичницу. Переработка зрительной информации на уровне предвнимания в известном смысле происходит «снизу вверх», поскольку носит автоматический характер и упомянутые знания в ней не учитываются. Другими словами, она осуществляется без ограничений «сверху». Можно предположить, что иллюзорных соединений признаков в повседневной жизни не происходит именно потому, что это противоречит ожиданиям «сверху». [...]

Как же происходит восприятие объектов, когда внимание уже сфокусировано на них и из всех присутствующих в видимой сцене признаков взят «правильный» их набор? В частности, как порождается и сохраняется перцептивное единство объекта, если учесть к тому же, что объекты движутся и изменяются? Представьте себе птицу на ветке. Вы видите ее под определенным углом зрения, при определенном освещении. Теперь представьте, что она начинает чистить перышки, затем взмахивает крыльями и улетает; при этом ее форма, размеры и цвет изменяются. Однако, несмотря на изменение практически всех признаков, птица сохраняет перцептивную целостность: она остается одним и тем же целостным объектом.

Д. Канеман и автор предположили, что восприятие объекта опосредуется не только его узнаванием или сравнением с хранимым в памяти эталоном или описанием, но и построением некоторой временной репрезентации, которая соответствует виду объекта в данный момент и постоянно подновляется по мере его изменения. Это похоже на досье, в которое вводится перцептивная информация о некотором объекте — аналогично полицейскому досье, в котором собирается информация о преступлении. Тогда перцептивная непрерывность объекта должна зависеть от того, помещается ли текущая информация в то же досье, что и предыдущая. А это возможно, если объект остается неподвижным или изменяет свое положение в пределах, позволяющих перцептивной системе следить, в какое досье необходимо занести соответствующие ему данные.


Рис. 2. Объединение сенсорной информации в своего рода досье на данный зрительный объект изучалось с помощью перемещения рамок. В каждой серии опытов появлялись две рамки, в которых на короткое время предъявлялись буквы (о). Затем рамки перемещались на новое место, и в одной из них вновь появлялась буква (б). Испытуемый должен был по возможности быстрее назвать эту букву. Если она совпадала с первой буквой и была в той же рамке, то называние происходило быстрее, чем если она появлялась в другой рам¬ке или отличалась от первой. Из этого следует, что на обновление старого или создание нового досье объекта требуется больше времени, чем на простое повторное восприятие того же объекта


Для проверки этой идеи мы совместно с Б. Гиббсом предложили задачу на называние букв (см. рис. 2). На короткое время в двух рамках появлялись две буквы. Затем рамки без букв смещались на новое место, и в одной из них снова появлялась буква. Все это проделывалось таким образом, чтобы пространственные и временные интервалы между исходными буквами и последующей были одинаковыми, а единственным различием было бы перемещение рамок. Испытуемый должен был как можно скорее назвать последнюю появившуюся букву.

Мы знали, что предварительное предъявление буквы обычно сокращает время идентификации той же буквы, — это известный эффект «прайминга». Нас же интересовало следующее: не будет ли этот эффект проявляться лишь в отдельных ситуациях? Мы предполагали, что если последняя буква будет той же, что и предъявлявшаяся ранее, и появится в той же рамке, то обе будут расценены испытуемым как один и тот же объект. Другими словами, вся перцептивная задача должна сводиться в этом случае к обнаружению того же объекта в другом месте. Если же в рамке появится другая буква, то необходимо будет «обновить досье», что, скорее всего, увеличит время на опознание и называние объекта.
Как оказалось, наше предположение было верным. Испытуемые реагировали в среднем за 30 мс раньше, если появлялась та же буква и в той же рамке, в которой ее видели раньше. Если та же буква появлялась в другой рамке, то эффект не наблюдался. Этот результат подтверждает гипотезу, согласно которой на более поздних стадиях зрительного восприятия информация предыдущих стадий, имеющих дело с признаками, объединяется во временные конкретно-предметные репрезентации.

Предлагаемая мною общая схема переработки зрительной информации может быть представлена в виде модели (см. рис. 3). Зрительная система начинает с того, что кодирует некоторые простые и полезные признаки, складывая их в своего рода пачку карт. В мозгу такие карты обычно сохраняют порядок пространственных отношений видимого мира. Тем не менее эта пространственная информация может быть непосредственно недоступной на последующих стадиях переработки зрительной информации, то есть сигнал о наличии признака может не нести информации о его местонахождении. На последующих ступенях «включается» внимание. Здесь можно предложить аналогию с работой со штурманской картой, на которой видны разрывы интенсивности или цвета, но не уточняется, что они из себя представляют. Внимание использует такую карту, одновременно отбирая все признаки, присутствующие в данном месте, на основе связей между отдельными картами признаков. Потом все это складывается во временную репрезентацию объекта, или его «досье».



Наконец, согласно этой модели, объединенная информация о признаках и структурных отношениях в каждом досье сравнивается с описаниями, хранящимися в «распознающей сети». В этой сети специфицированы ключевые признаки кошек, деревьев, яичницы с ветчиной, наших бабушек и прочих перцептивно знакомых объектов, что открывает доступ к их наименованиям, типичному поведению и текущей значимости. Я полагаю, что осознание чего-либо зависит от досье на данный объект и информации, которая в этом досье содержится. Другими словами, оно зависит от репрезентаций, в которые собрана информация об объекте — как из анализа сенсорных данных, так и из «распознающей сети» — и в которых она постоянно обновляется. Если при этом случаются значительные разрывы в пространстве или во времени, то досье на объект аннулируется: оно перестает быть источником перцептивного опыта. Сам же объект в этом случае исчезает и заменяется новым, со своим собственным временным досье, готовым начать новую перцептивную историю.





Описание Обсуждается проблема поиска объектов в зрительном поле на основе теории интеграции признаков Э. Трейсман. [Когнитивная психология: история и современность. Хрестоматия. / Под ред. М. Фаликман и В. Спиридонова. М., 2011. С. 266-275]
Вложенные файлы
  • treisman_002.jpg
  • treisman_001.jpg
  • treisman_003.jpg
Рейтинг
0/5 на основе 0 голосов. Медианный рейтинг 0.
Теги , , , ,
Просмотры 5942 просмотров. В среднем 2 просмотров в день.
Похожие статьи