Р. Шенк, Л. Бирнбаум, Дж. Мей. К интеграции семантики и прагматики: Psychology OnLine.Net

Р. Шенк, Л. Бирнбаум, Дж. Мей. К интеграции семантики и прагматики

Р. Шенк, Л. Бирнбаум, Дж. Мей. К интеграции семантики и прагматики
Добавлено
06.11.2013 (Правка 07.11.2013)

ВВЕДЕНИЕ


Является ли некоторый данный уровень описания языка авто­номным относительно соседнего, более „высокого" уровня — этот вопрос представляет большой интерес для лингвистики независимо от того, о каких конкретно уровнях идет речь. Наиболее очевид­ным примером здесь могут служить разногласия, существующие в генеративной лингвистике по вопросу о соотношении синтаксиса и семантики. Мы уже писали (Schank, Birnbaum, 1984), что, с точки зрения искусственного интеллекта, при построении процес­суальной модели языка эти два уровня должны быть объединены (integrated). Поскольку обработка языковых данных требует объеди­нения знаний, содержание которых чрезвычайно разнообразно, мы должны поверить в возможность того, что между уровнями языка не существует функциональных различий (хотя разграничение их и может быть удобно в целях описания). Соответственно, в настоящей работе мы утверждаем, что семантику и прагматику также следует свести в единое целое.

Искусственный интеллект (в дальнейшем — ИИ) занимается раз­работкой когнитивных процессуальных [2] теорий (theories of cogni­tive processing), а также экспериментами по компьютерному вопло­щению этих теорий. Делая упор на процессуальное описание, ИИ применяет особый подход к языку, четко отличающийся от других парадигм лингвистического исследования. С этой точки зрения, уяснение соотношения семантики и прагматики (или любых других аспектов языка) подразумевает уяснение того, как и когда каждый из аспектов используется в процессах понимания и вербализации (language comprehension and production). Важное методологическое положение состоит в том, что специалисты в области ИИ должны целенаправленно решать эту проблему, если они стремятся к построе­нию процессуальной модели, способной выполнять существенные языковые задачи: понимание текста, ответы на вопросы, перевод и др. В ИИ нельзя произвольно рисовать квадраты, обозначающие модули (modules), которые содержат знания разного типа, и соеди­нять их стрелками. Независимые элементы должны действительно работать независимо. Если же это не так, то разграничения между ними нужно переосмыслить. Другим теоретико-лингвистическим па­радигмам, как правило, не приходится сталкиваться с таким давле­нием избранной методологии.

ЧТО СЛЕДУЕТ ИЗ ИНТЕГРАЛЬНОЙ КОНЦЕПЦИИ



Наше утверждение о единстве семантики и прагматики можно сформулировать точнее, как утверждение об их функциональном единстве. Иными словами, процессуальные модели языка не пользу­ются каким-либо отдельным, независимым уровнем семантической обработки или семантических знаний. Семантические знания приме­няются в процессе обработки языковых данных точно так же, как прагматические, при этом задействованы те же способности делать умозаключения и пользоваться памятью, что и в процессах обыден­ного мышления. Семантика — неотъемлемая часть прагматики, то есть нашего общего знания о мире и об использовании языка. Ка­ковы эмпирические последствия такого утверждения? С психологи­ческой точки зрения, наиболее кардинальным является то, что процессуальный подход к языку не включает вычисления некоего уровня семантического представления, независимого от прагмати­ческих знаний и служащего входом (или, в случае вербализации, выходом) для отдельного компонента прагматического рассуждения (reasoning). Понимание достигается объединенным применением се­мантических и прагматических знаний. Значение слова или вы­сказывания представлено как составная часть памяти, точно так же, как и другие знания. Важнейшим понятием здесь является память. Иные лингвистические теории могут существовать без адекватной концепции памяти, но процессуальные модели естественного языка — нет.

Для лингвистической семантики из высказанного взгляда следует два главных вывода. Первый состоит в том, что не существует „словаря", а есть только „энциклопедия". Иначе говоря, лексикон тесно связан с прочими нашими знаниями и неотделим от них. Второй вывод касается проблематичности понятия „буквальное зна­чение". Если представление лексем и высказываний включает структуры, неотъемлемо связанные с прочими знаниями, может оказаться, что, вообще говоря, невозможно обособить части этих струк­тур, отождествимые с буквальным содержанием этих слов и выска­зываний. Таким образом, этот взгляд ставит под сомнение основания простых „восходящих" (bottom-up), чисто комбинаторных теорий значения, таких, например, как теория Катца — Фодора или семанти­ка условий истинности.

Почему же тогда самостоятельная семантика существует, и по­чему лингвисты пытались строить теории, основанные на такой точке зрения? По-видимому, эта идея явилась побочным продуктом других доктрин. Например, Луи Ельмслев (Hjelmslev, 1953) сумел подчинить семантику автономной системе морфологии и син­таксиса, постулировав полный параллелизм между структурами „плана выражения" и „плана содержания". Казалось, что в его теорию довольно искусно включалась семантика, тогда как в дей­ствительности она была изгнана — типичный пример того, «как зани­маться семантикой, на самом деле не занимаясь ею». Доктри­на автономного синтаксиса в порождающей лингвистике привела к похожему результату. Если считать, что синтаксис не зависит от семантики, то будет естественно предположить, что семантика, в свою очередь, независима от прагматики. Методологический смысл нашего взгляда состоит в том, что, поскольку семантика связана с прагматикой, она не должна изучаться независимо. Семантические теории должны использовать такие крупные структуры для представ­ления обыденных (common-sense) знаний, которые изучались когни­тивными науками, то есть фреймы (Мinskу, 1976; Сharniak, 1978) и сценарии (scripts) (Schank, Abelson, 1977). В работе Филлмора (Fillmore, 1976) дается особенно четкий пример такого подхода:

«В английском языке есть семантическая область, связанная с тем, что можно назвать "торговой сделкой". Фрейм ее имеет форму сценария (scenario), содержащего роли, которые можно обозначить как 'покупатель', 'продавец', 'товар' и 'деньги'; он содержит такие "кадры", в которых показано, как покупатель отдает деньги и берет товар, а продавец отдает товар и берет деньги. Весь сценарий (scenario) торговой сделки активизируется в сознании всякий раз, когда человек встречает и пони­мает любое из следующих слов: buy 'покупать', sell 'продавать', pay 'платить', cost 'стоить', spend 'тратить', charge 'назначить цену' и т. д., хотя каждое из них выделяет, или выводит на первый план, только небольшой участок фрейма. Каждое из этих слов несет в себе одновременно и фон, и изображение, и всю обстановку, и ту часть этой обстановки, на которую указывает данное слово».


Сложилось так, что стандартное возражение против такой кон­цепции семантики апеллирует к практической невозможности дей­ствительно указать все те знания о мире, которыми обладает чело­век. Например, Катц и Фодор (Katz, Fodor, 1963), приводя аргументы против уместности прагматики в семантической теории, утверждают, что «необходимым условием, которому должна удовле­творять любая разновидность такого рода теории, является способ­ность представить всю неязыковую информацию, нужную говоря­щему для понимания предложений...». Далее они пишут, что «пол­ная теория такого рода принципиально невозможна, ибо, чтобы удовлетворять вышеуказанному необходимому условию, эта теория должна была бы представлять все знания о мире, имеющиеся у гово­рящего.» Уязвимость этого довода в том, что способность представ­лять все релевантные знания есть нечто иное, чем действительное представление их. Иными словами, чтобы удовлетворить условию Катца и Фодора, единая теория семантики и прагматики не должна действительно представлять все эти знания, так же как семантиче­ская теория типа той, на которую ориентировались эти авторы, не должна действительно представлять значение всех слов некоторого языка. Скорее, в обоих случаях требуется потенциальная способность сделать это. Тот факт, что на практике невозможно точно указать все знания говорящего о мире, не обесценивает предлагаемую нами теорию. Цель такой теории — показать, как некоторая совокупность знаний о мире используется при обработке языковых данных в пред­положении, что говорящий/слушающий эти знания имеет.

Сходное смешение лежит в основе упорного (хотя, вероятно, не преднамеренного) непонимания исследований в области ИИ со стороны некоторых лингвистов и психологов. Для осуществления исследований в области ИИ — по проблемам ли естественного языка, планирования деятельности или решения задач,— нужно выбрать некоторую сферу знания, из которой можно будет черпать примеры и задачи. Сфера эта может оказаться сама по себе интересной, но чаще она скучна (уже задействованы, например, игрушечные кубики, рестораны, детские дни рождения, сборка водяного насоса), и не требуется особого ума для выявления тех фактов из этой сферы, которые должны быть известны для достижения поставленных целей. Суть исследования в этих случаях составляют не факты сами по себе, а методы их представления, организации и применения для понима­ния и синтеза высказываний или для решения задач. Утверждать, что в исследованиях по ИИ изучается «знание правильного пове­дения в ресторанах» (Магsсhаl, 1980), значит просто не понимать, о чем речь.

ВЫВОД УМОЗАКЛЮЧЕНИЙ И КОНЦЕПТУАЛЬНЫЕ ПРЕДСТАВЛЕНИЯ



Как же могут представляться (be represented) и использо­ваться крупные структуры значений типа тех, о которых мы уже упоминали, например сценарий торговой сделки, и почему они не­обходимы для обработки языковых данных? Здесь мы хотим проил­люстрировать тот факт, что учет процедурной проблематики может внести определенный вклад в построение понятийных представле­ний. (Мы называем семантику и прагматику, вместе взятые, концептуальным [3] уровнем.) Хотя мы ограничимся обсуждением сим­вольных, или „препозиционных", представлений, не следует слепо верить, что это оптимальный вариант для любой сферы.

Ключевая роль концептуальных представлений состоит в облег­чении вывода правдоподобных умозаключений и в упрощении про­цессов обработки памяти. Такая точка зрения отличается от принятой в лингвистике идеи, что назначение семантического представления состоит в объяснении таких свойств, как синонимия, аномальность и логическое следование. В конечном счете обе эти точки зрения могут считаться подтвержденными лишь в той мере, в какой успешны основанные на них теории; однако вопрос о том, что считать успехом, является спорным. Если вывод правдоподобных умозаключений и обработка памяти рассматриваются как существенные функции се­мантического представления, то они выдвигаются в центр семанти­ческой теории, которая должна, соответственно, заниматься процес­сами, традиционно не считавшимися „семантическими". Любая се­мантическая теория, не обращающаяся к этим вопросам, вряд ли прольет свет на то, как язык используется для передачи мыслей, а это, можно с уверенностью утверждать,— наиболее фундаменталь­ная научная проблема, связанная с языком.

Может оказаться полезным соотнести этот вопрос со здравой оценкой того, как и почему люди пользуются языком для общения. Неоднократно отмечалось, что высказывания говорящего не сообща­ют в открытом виде, то есть эксплицитно, всего того, что слуша­ющий должен понять в соответствии с намерением говорящего; следовательно, нужно допустить наличие скрытого, имплицитного, содержания. Часто то, что должен вывести слушающий, не выте­кает с необходимостью из услышанного, и требуется вывести правдо­подобное умозаключение о каком-то еще содержании. Отсюда ясно, что концептуальные представления должны способствовать осущест­влению процесса вывода правдоподобных умозаключений. Также очевидно, что цель общения часто не достигается, если слушающий не помнит, что ему было сообщено. Следовательно, концептуальные представления должны играть ключевую роль и в организации памяти.

Изучение того, как можно строить концептуальные представле­ния, чтобы они способствовали проведению процессов обработки памяти и правдоподобного вывода, составляет основу теории кон­цептуальных зависимостей (Sсhаnк, 1975а). Рассмотрение этой процедурной проблематики заставляет немедленно отбросить возможность того, что слова и предложения естественного языка сами являются приемлемыми представлениями значения, так как слова и предложения неоднозначны и эллиптичны. Предложение Mary gave John a million dollars 'Мэри дала Джону миллион долларов' под­разумевает, что у Джона есть миллион долларов, но предложение Магу gave John a kiss 'Мэри поцеловала Джона' (букв. 'Мэри да­ла Джону поцелуй') не подразумевает, что у Джона что-то есть. Трудно предотвратить такого рода ошибочные умозаключения, если соответствующие правила будут формулироваться исключительно в терминах слов как таковых.

Другая серьезная проблема, возникающая при использовании естественного языка в концептуальных представлениях, связана с тем, что одно и то же (в некотором смысле) значение может быть выражено многими способами, внешне весьма различными. Концеп­туальное представление, в котором взаимосвязанные значения пред­ставлены, насколько это возможно, взаимосвязанно, облегчает по­иск в памяти, например при ответе на запрос. Более того, в той мере, в какой сходство значений двух высказываний отражается в их концептуальных представлениях, общие для них правдопо­добные умозаключения могут осуществляться на основании общих правил. Это позволяет сократить общее число необходимых правил вывода. Например, говорите ли вы кому-то, что „Фред купил машину у Джерри", или же что „Джерри продал машину Фреду", вы може­те ожидать, что слушающий поймет, что теперь машина принадлежит Фреду, что Джерри получил от Фреда какую-то сумму денег в обмен на машину, и т. д. Если представления этих высказываний достаточ­но сходны, то в обоих случаях могут быть применены одни и те же правила. Это также позволит получить понятийную информацию, об­щую для разных языков, в модели, охватывающей несколько языков. Экономия такой схемы — не просто эстетическое свойство; она имеет реальные последствия для организации процесса обработки текстов. Например, если имеются общие правила (для сходных значений), то меньшее количество правил подлежит заучиванию, и каждое выученное правило имеет более широкую применимость, следова­тельно — большую силу.

Чтобы удовлетворить вышеуказанным условиям, нужно макси­мально ограничить число элементарных символов, из которых стро­ятся концептуальные представления. «Многословие» или избыточ­ность в словаре представлений дает немедленные результаты, по­рождая большую избыточность и сложность в процессах обработки памяти и вывода умозаключений. Необходимость ограничения слова­ря представлений подтверждается, если рассмотреть вопрос о том, чем определяются сами концептуальные представления. С точки зре­ния ИИ наиболее последовательный ответ таков: значение пред­ставлений обусловлено их функциональной ролью в ментальных процессах. Тогда, в частности, значение некоторого символа в системе представлений зависит от того, в какие структуры представлений он входит и в каких правилах вывода упоминается. Таким образом, как указывал Хейз (Нayes, 1979), каждый символ должен играть какую-то роль во многих структурах и правилах вывода, для того чтобы иметь какое-либо существенное содержание или значение. Путь лежит через выражение максимально возможного числа фактов и правил с использованием минимально возможного числа символов. Неправильно было бы просто объявить каждый английский глагол предикатом лежащего в его основе концептуального представления без всякого дальнейшего анализа.

Концептуальные представления могут также облегчить процесс вывода и в том плане, что они очерчивают круг тех выводов, ко­торые должны быть сделаны. Что уже известно о представляемом высказывании, понятии или пропозиции, а что еще остается обду­мать,— все это, насколько возможно, должно быть очевидно при „просмотре" представления. Если выражаться языком лозунгов, то можно сказать: представления должны поставлять ожидания. Па­дежные фреймы — один из видов представления, выполняющего эту функцию: пустые слоты (незаполненные падежи) указывают, хотя бы частично, на информацию, которой недостает и которую нужно вывести.

На основе этих соображений была выработана система для представления значения естественноязыковых высказываний; она является частью теории концептуальных зависимостей. Элементар­ный словарь системы позволяет представлять действия, объекты, состояния и изменения состояний, а также причинные отношения. (Большая часть усилий была направлена на представление действий и причинных отношений; состояния описаны довольно грубо, а объ­екты и того хуже, хотя некоторые недостатки были устранены Ленерт (Lehnert, 1980).) Каждая единица в элементарном словаре имеет набор связанных с ней концептуальных падежей, определяю­щих наиболее ключевые роли или свойства. У всякого действия, на­пример, есть деятель и объект, у некоторых — источник и цель; фа­культативно может быть указано инструментальное действие. Перво­начально количество элементарных действий в системе колебалось между десятью и пятнадцатью. С течением времени некоторые из них оказались более удачными, чем другие, а с исследованием но­вых сфер были введены новые (см., например, Schank, Carbon ell, 1979). Приведем описания пяти наиболее часто встречаю­щихся и, следовательно, наиболее полезных действий:

PTRANS: осуществить физическое перемещение объекта из од­ного места в другое;

ATRANS : передать абстрактное отношение, как, например, обла­дание объектом или контроль над ним, от донора к реципиенту;

MTRANS : передать информацию (или в пределах психики одного индивида или между индивидами);

ATTEND: сфокусировать орган чувств на стимуле;

PROPEL: приложить силу к объекту в данном направлении.


С каждым элементарным понятием связаны правила правдопо­добных умозаключений, которые могут помочь при актуализации данного понятия или при соотнесении его с другими понятиями. Простой пример: из актуализации ATRANS можно сделать какие-то выводы о том, чем обладают упомянутые деятели. Ригер (Rieger, 1975) установил наличие шестнадцати различных типов вывода прав­доподобных умозаключений и разработал методику их применения в компьютерной программе.

ВЫВОД УМОЗАКЛЮЧЕНИЙ И ПРАГМАТИЧЕСКИЕ ЗНАНИЯ



Представление причинных отношений в виде концептуальных за­висимостей позволяет объединять отдельные представления в более крупные единицы — причинные цепочки (Schank, 1975b). Важ­ность причинных цепочек для процесса обработки текста заключается в следующем: связность текстового описания какого-либо эпизода зависит в первую очередь от того, можно ли построить причинные цепочки, соединяющие описанные события и состояния. Рассмотрим различие между следующими двумя небольшими рассказами:

Мэри дала Джону миллион долларов. Он купил новую машину.

Мэри дала Джону миллион долларов. Она навестила свою те­тушку в Милуоки.


В первом случае связность явно имеет место, во втором же — отсут­ствует. Причина в том, что для первого примера можно построить причинную цепочку, соединяющую описанные события, а для второго — нельзя. Построение представления в виде причинной цепочки в данном случае (как и во многих других) требует вывода промежу­точных действий и состояний, оставленных ,,за кадром" в описании. Здесь следует вывести промежуточное состояние, при котором Джон, в результате получения подарка от Мэри, обладает миллионом дол­ларов, что и порождает возможность последующей покупки машины. Такого рода прагматические выводы равно необходимы для построе­ния концептуальных представлений как текстов, так и предложений. Рассмотрим, например, предложения, полученные путем преобразо­вания наших рассказов:

Мэри дала Джону миллион долларов, и он купил новую машину.

Мэри дала Джону миллион долларов, и (она) навестила свою тетушку в Милуоки.


Опять мы видим связность первого примера и несвязность второго.

Это различие ясно показывает, что наличие или отсутствие при­чинной цепочки может быть ключевым свойством концептуального представления отдельного предложения; построение же таких при­чинных цепочек зависит от прагматического умозаключения. Такое использование умозаключений в построении представления текста в виде причинных цепочек является еще одной иллюстрацией централь­ной роли вывода умозаключений в понимании языка. Эта роль в свою очередь предъявляет новые требования к нашей модели, отражаю­щей способность понимающего субъекта к выводу умозаключений. Нередко умозаключения (относительно условий и результатов неко­торого действия), которые можно вывести по восходящему принципу („снизу вверх") из понятий, эксплицитно выраженных в тексте, вовсе недостаточны для построения причинных цепочек, хотя текст в действительности является причинно-связным. Сравним, например, такие истории из работы Шенка и Абельсона (см. Schank, Abelson, 1977).

Фред пошел в парк. Он попросил карлика принести ему мышь. Он поднял коробку и ушел.

Фред пошел в ресторан. Он попросил официантку принести ему каплуна под винным соусом. Он оплатил счет и ушел.


Внешне эти истории достаточно сходны, но при этом вторая явля­ется связной, а первая — нет. Мы понимаем отношения между собы­тиями, упомянутыми во второй истории, поскольку мы можем вос­пользоваться нашим знанием о том, что обычно происходит в рес­торанах. Это позволяет нам построить представление в виде причин­ной цепочки, основанное на правдоподобных умозаключениях о мно­гих событиях, прямо не упомянутых в истории, например о том, что Фред, вероятно, съел каплуна.

Способность пользоваться знаниями о мире при понимании тре­бует наличия крупных понятийных структур, которые могут в нуж­ный момент поставлять необходимые контекстные знания по нисхо­дящему принципу („сверху вниз"). Практически, простейшая струк­тура такого типа — сценарий (script) (Schank, Abelson, 1977), который используется для представления информации о стереотип­ных эпизодах. Хорошо разработанный сценарий это, в сущности, заранее заготовленная причинная цепочка, представляющая обыч­ную последовательность событий. Используя сценарий, понимающий субъект может связать воедино идеи, которые не могут быть соотнесены по своим внешним чертам; он делает это, опираясь на структуру: памяти, в которой они уже связаны.

Прототипический пример сценария описывает, что происходит в ресторане. Он разбит на сцены, описывающие приход, заказ, еду и уход в терминах действий и состояний, представленных с помощью концептуальных зависимостей, связанных причинными и временными отношениями. В общих чертах сценарии применяются так. Ког­да дается ссылка на некий сценарий, например при употреблении слова „ресторан", он „активизируется" в сознании, и события, опи­санные в тексте, сравниваются с теми, которые зафиксированы в сце­нарии. Если наблюдается достаточное совпадение, то сценарий пол­ностью актуализуется (is instantiated), то есть осуществляется вывод не упомянутых в тексте, но имеющихся в сценарии событий, и в ре­зультате получается полное представление в виде причинной це­почки. Каллингфорд (Cullingfогd, 1978) разработал этот про­цесс в деталях и составил компьютерную программу (SAM), исполь­зующую сценарии для понимания простых газетных сообщений.

ВОССТАНОВИТЕЛЬНАЯ ПАМЯТЬ



В экспериментальном исследовании, направленном на более чет­кое уяснение психологической роли сценариев, Бауэр, Блэк и Тернер (Bower, Black, Turner, 1979) обнаружили следующее: ког­да испытуемым предлагались описания сходных (но различных) эпи­зодов, они обнаруживали затруднения в распознавании того, какое из описаний реально содержало в себе упоминание сцены, наличие которой можно было ожидать в обоих эпизодах. Например, испытуе­мым предлагалось описание посещения врача и другое — посещения дантиста. Если одно (и только одно) из описаний содержало упо­минание приемной, испытуемые в тесте на вспоминание, как пра­вило, ошибочно считали, что такое упоминание содержалось и во втором тексте. Это означает, что разные аспекты описания (или собственного опыта), будучи однажды поняты, откладываются в разных структурах памяти. Например, в случае посещения врача или дантиста та часть опыта, которая касается приемных, откла­дывается, по-видимому, в некую структуру, связанную с приемны­ми, общую в каком-то смысле для концептуальных структур, касаю­щихся врачей и дантистов. Следовательно, извлечение опыта из памяти должно быть восстановительным (reconstructive), оно со­бирает воспоминания из разных структур, что и приводит к воз­можности ошибок, которые наблюдали Бауэр и др.

Такое объяснение предполагает, что структуры, в которых от­кладываются воспоминания об опыте,— те же самые структуры, которые предоставляют нам знания, необходимые для первоначаль­ного понимания этого опыта. Другими еловами, теория концепту­альных структур, используемых в процессе обработки текста, долж­на одновременно быть и теорией памяти. Из всего этого выте­кает такая точка зрения на память: разные структуры памяти организуют разного вида информацию и отвечают за предоставление информации, позволяющей интерпретировать разные аспекты вход­ных данных. Так, например, сценарии не являются статичными структурами данных, которые хранятся в памяти целиком; скорее, они монтируются при необходимости понять нечто на входе. На­оборот, различные аспекты входных данных будут откладываться в разных структурах, которые поставляют информацию, релевантную для этих аспектов. Таким образом, воспоминания об определенном опыте будут расчленяться и распределяться среди структур, исполь­зованных для понимания этого опыта.

Наименьшая концептуальная структура, связным образом орга­низующая набор ожиданий,— это сцена. Сценаэто структура памяти, группирующая действия и состояния, относящиеся к единой цели и к единой обстановке, заданной во времени и в пространст­ве. Отдельные конкретные воспоминания откладываются в сценах с какой-то особой пометой, отличающей их от общих действий и со­стояний, описываемых сценой. Например, сцена ПРИЕМНАЯ органи­зована вокруг некоторой цели (ожидание профессиональной помощи или услуги) и содержит, в частности, информацию о ее внешнем виде (стулья, столик с журналами), о том, что следует делать (отметиться у регистратора и ожидать вызова). Сцена ПРИЕМНАЯ помогает в понимании любой ситуации, связанной с визитом к специалисту за помощью или услугой, когда клиент должен где-то ждать, пока его обслужат. Таким образом, эта сцена является общей для концептуальных структур, представляющих знания о разного рода профессиональных услугах.

Концептуальные структуры, которые группируют разнообразные сцены, необходимые для понимания данной ситуации (или описываю­щего ее текста), мы называем конфигурациями организации памяти или КОП (Sсhanк, 1980) [4]. Например, знания, необходимые для понимания всей информации, связанной с посещением врача, органи­зованы вокруг многих разных целей, нескольких деятелей, функци­онирующих в разное время и в разных местах, например: приемная; врачебный осмотр; назначение даты следующего посещения; оплата счета. Некоторые из этих сцен являются частями КОП посещения врача (в частности, врачебный осмотр). Но и другие КОП также поставляют некоторые сцены; например, оплата счета есть часть договорного соглашения, в которое неявным образом вступает каж­дый обратившийся к врачу. Таким образом, КОП могут содержать ссылки на другие КОП, равно как и на сцены.

Хотя первоначально побудительным мотивом разработок восста­новительной теории памяти была невозможность объяснить с по­мощью сценариев ошибки распознавания, объяснение таких ошибок не является главным в теории. Организуя знания в небольшие сценоподобные „куски", или эпизоды (chunks), которые могут относиться сразу к нескольким КОП, мы достигаем гибкости и эф­фективности (Сharniак, 1978). Но, что еще более важно, при такой общности сцен информация, полученная в какой-то одной ситуации и отложенная в нужной сцене, будет доступна и в другой ситуации, в которой задействована эта сцена. Таким образом, ключевая функция восстановительной памяти состоит в том, что она облегчает обучение (Sсhanк, 1982).

СТРУКТУРЫ ПАМЯТИ И ЗНАЧЕНИЕ



Как же может приведенное выше построение применяться в ре­шении нашей первоначальной задачи — представления значений вы­сказываний естественного языка? Применение будет достаточно про­стым, если какое-либо слово в высказывании прямо указывает, что перед нами актуализация определенной крупной понятийной струк­туры. Рассмотрим предложение

Bruno kidnapped Lindbergh's baby boy. 'Бруно похитил мальчика Линдбергов.'

Слово kidnap 'похищать' однозначно указывает на некоторую КОП (назовем ее К-ПОХИЩАТЬ), которая, по-видимому, содержит (или отсылает к другим КОП, содержащим) следующие сцены: деятель захватывает жертву и прячет ее; связывается с родственниками и требует выкупа; договаривается с родственниками об условиях; получает выкуп; отпускает или убивает жертву; пытается избежать поимки. Мы утверждаем, что лучшим представлением этого выска­зывания является актуализация этой КОП (Schank, Lebowitz, Вiгnbaum, 1980), в которой слоты деятеля, жертвы и родствен­ников заполнены, соответственно, понятиями „Бруно", „мальчик", „Линдберги" и к тому же первая сцена помечена как уже происшед­шая. Тот факт, что первая сцена имеет такую помету, объясняет ано­мальность предложения типа

Bruno kidnapped Lindbergh's baby boy, but failed to grab him. 'Бруно похитил мальчика Линдбергов, но не сумел его поймать.'

Тот факт, что имеются и другие сцены, способные поставлять опре­деленные ожидания, объясняет, почему в предложении типа

Bruno kidnapped Lindbergh's baby boy and left a note. 'Бруно похитил мальчика Линдбергов и оставил запиеку.'

мы так легко понимаем, что слово note означает именно записку, а не музыкальную ноту, и что записка, вероятно, адресована Линдбергам, и что таким образом актуализуется вторая сцена из кон­фигурации К-ПОХИЩАТЬ (вступление в связь с родственниками и требование выкупа).

Более сложны случаи, когда высказывание не содержит слова, прямо указывающего на концептуальную структуру, наилучшим образом воплощающую значение, которое подразумевал говорящий. Рассмотрим следующие два высказывания:

Joe bought his new TV at Macy's. 'Джо купил новый телевизор у Мейси.'

Joe got his new TV at Macy's.

'Джо достал (букв.: 'получил') новый телевизор у Мейси'.


Первое высказывание, используя слово bought 'купил', прямо ука­зывает на принадлежность к сценарию торговой сделки по Филлмору (мы будем пользоваться обозначением К-ПОКУПАТЬ), следо­вательно, наилучшим образом оно может быть представлено как актуализация К-ПОКУПАТЬ, где Джо — покупатель, Мейси — продавец, телевизор — объект. Если мы придерживаемся точки зре­ния, что концептуальные представления должны, насколько возмож­но, отражать сходство значений, то, поскольку эти два высказы­вания синонимичны (или почти синонимичны), их представления должны быть тождественны (или почти тождественны). Следова­тельно, и второе высказывание нужно представлять как актуализа­цию К-ПОКУПАТЬ.

Достичь этого было бы легко, если бы слово got так же указы­вало на К-ПОКУПАТЬ, как и bought. Однако, поскольку достать, получить нечто можно самыми разными путями помимо покупки, такой подход означал бы, что слово got — чрезвычайно много­значное, имеет целый ряд трудно различимых смыслов. Если бы got было единственным таким словом, с последствиями можно было бы смириться. Однако это не так. Взяв любой текст, мы найдем слова с такими же характеристиками. Это take 'брать', use 'исполь­зовать', go 'идти', have 'иметь', hold 'держать', cut' 'резать', send 'посылать', carry 'нести' и т. д. Собственно говоря, эти методи­ческие трудности, связанные с необъятно большим числом различных значений слов (их, между прочим, понимали и пытались преодолеть Ригер и Смолл (R i e g e r, Small, 1979)), возникают потому, что весь подход, по сути, основывается на старом представлении, в соответствии с которым значение высказывания есть простая функция сложения значений входящих в него слов. Если, применяя этот подход, мы возьмем К-ПОКУПАТЬ в качестве представления высказывания „Джо достал новый телевизор у Мейси", а затем вычтем точно установленные значения всех составляющих его слов, то у нас ничего не останется. Все нюансы высказывания, все тонкие оттенки каждого слова в конкретном контексте должны отражаться в одном из бесконечного числа заранее вычисленных смыслов самих слов.

Мы предлагаем альтернативу, основанную на следующих инту­итивных соображениях: проблема со словами типа got заключает­ся не в их необычайной многозначности, не в том, что слово име ет большое количество очень конкретных возможных значений, а, скорее, в нечеткости и большой общности их значения. Слово got передает лишь исходное грубое описание того, что got может зна­чить в данном контексте. Чтобы получить более четкое и точное представление целого высказывания (например, К-ПОКУПАТЬ), это исходное описание нужно использовать как ключ для поиска в КОП, актуализированных контекстом (Schank and Birnbaum, 1984); Хоббз (Ноbbs , 1981) вносит, по сути, такое же предложение, а Марр (Маrг, 1977) отмечает общую важность исходных грубых описаний как отправных точек для понимания.

Чтобы рассмотреть эту идею в действии, положим, что значение got представлено просто как ATRANS (передача обладания или контроля). Далее, полагая, что всем известно, что Мейси — название универмага, получаем, что К-ПОКУПАТЬ потенциально может оказаться релевантным, так как универмаги — обычное место действия для К-ПОКУПАТЬ. К-ПО­КУПАТЬ включает несколько сцен, и две из них сосредоточиваются вокруг образцов ATRANS: одна представляет передачу товара от продавца покупателю, другая — передачу денег от покупателя про­давцу.

Теперь рассмотрим следующее неформальное правило :

Если данное действие происходит в некоторой обстановке, обычно связанной с какой-либо КОП, рассмотри эту КОП и проверь, не может ли это действие служить актуализацией одной из ее сцен. Если это так, актуализируй всю КОП и пометь соответствующую сце­ну как уже происшедшую.

Поскольку факт передачи телевизора в руки Джо соответствует центральной сцене К-ПОКУПАТЬ, то, в соответствии с этим прави­лом, высказывание Joe got his new TV at Macy's. может быть понято как актуализация К-ПОКУПАТЬ, причем не нужно, чтобы got имело возможный смысл, указывающий на К-ПОКУПАТЬ. Та­кой подход не ограничивает значение высказывания простой функ­цией сложения составляющих его слов. Если мы вычтем значения всех слов этого примера, то получим актуализацию К-ПОКУПАТЬ, которая, будучи подсказана словом «Мейси», не утверждается ни им, ни каким-либо другим словом в высказывании.

Высказывания, требующие, по-видимому, такой же обработки, встречаются чрезвычайно часто; мы приведем здесь еще один пример:

John mailed me a postcard from Mexico.

'Джон отправил мне по почте открытку из Мексики.'

John sent me a postcard from Mexico.

'Джон послал мне открытку из Мексики.'


Эти два высказывания также синонимичны (или почти синони­мичны). Значение обоих следует представлять актуализацией кон­цептуальной структуры, которая представляет наши знания о почте (то есть К-ОТПРАВЛЯТЬ ПО ПОЧТЕ). В первом случае на это имеется прямое указание — слово mailed. Во втором случае вместо него употреблено слово sent. Sent, как и got, имеет нечеткое и общее значение. Оно указывает на некое грубое описание того, что оно может значить в каком-то контексте. Положим, что это значение может быть представлено просто как PTRANS (перемена места нахождения). Видимо, слово postcard 'почтовая открытка' подска­зывает, что здесь может оказаться релевантным К-ОТПРАВЛЯТЬ ПО ПОЧТЕ. Поскольку главная цель К-ОТПРАВЛЯТЬ ПО ПОЧТЕ состоит в осуществлении действия PTRANS применительно к какому-то объекту и поскольку действие, задаваемое словом sent,— это PTRANS, то будет вполне просто заключить, что следует актуализо­вать как раз К-ОТПРАВЛЯТЬ ПО ПОЧТЕ.

Такой подход представляет интерес для лингвистики, поскольку он позволяет решить некоторые семантические проблемы с помощью крупных понятийных структур. Рассмотрим, например, пред­ложение «Джо достал телевизор у Мейси за 300 долларов». Правиль­ное понимание выражения «за 300 долларов» зависит от наличия К-ПОКУПАТЬ и от осознания того, что сообщение о получении Джо телевизора актуализирует сцену, в которой продавец передает то­вар покупателю. Если бы мы не актуализировали К-ПОКУПАТЬ, мы бы не поняли, что можем ожидать сцену, в которой покупатель пе­редает деньги продавцу. Можно предположить, что любое выражение вида «за (некую сумму денег)» подсказывает, что К-ПОКУПАТЬ может оказаться релевантным, ибо если говорящий не знает, что за деньги можно что-то купить, то он просто не понимает, что такое деньги. Однако одно это не может объяснить нашу способ­ность определить, что Джо действительно заплатил Мейси 300 дол­ларов. Здесь включаются знания о том, кто продавец, а кто поку­патель, что в свою очередь зависит от осознания того, что сце­на, в которой продавец передает товар покупателю, уже произо­шла (когда Джо получил телевизор). Вообще определение того, кто является продавцом, а кто покупателем, зависит от знания того, что Считается товаром или услугой и кто может их предо­ставить. В данном случае, К-ПОКУПАТЬ уточняет действие ATRANS как услугу. Но в целом проблема достаточно сложна. В высказыва­нии ,,Я покрасил дом Фреда за 500 долларов" кажется очевидным, что говорящий получил 500 долларов, поскольку покраска дома – трудная работа, и это, следовательно, услуга, которую он ока­зал. Однако, если изменить предложение на „Я покрасил свой дом за 500 долларов", это будет означать, что говорящий запла­тил 500 долларов за то, чтобы ему покрасили дом. Чтобы это понять, в К-ПОКУПАТЬ должно быть включено знание о том, что покупатель и продавец, как правило, разные деятели. В предложении „Фред полетел в Лос-Анджелес за 1000 долларов" неясно, является ли Фред продавцом или покупателем услуги, и, следовательно, невозможно определить, заплатил ли он 1000 долларов или получил их.

ЗАКЛЮЧЕНИЕ



Одно из наиболее интересных, хотя и гипотетических, следствий из интегральной концепции состоит в том, что процесс понимания буквальных выражений оказывается весьма похожим на процесс понимания метафорических. (Действительно, накапливается все оольше свидетельств психологии в пользу того, что понимание буквального и небуквального использования языка происходит в виде сходных или даже тождественных процессов; см. Gіbbs, 1982.) Рассмотрим, например, пару предложений:

Joe threw out the garbage. 'Джо выбросил мусор.'
Judge Bean threw out the case.
'Судья Бин отказался от ведения дела.' (букв.: 'Судья Бин выбросил дело'.)


В первом употребление выражения threw out 'выбросил' обычно считается буквальным, а во втором — метафорическим. Однако теория понимания, основанная на процессах обработки, которые описаны в предыдущем разделе, будет действовать более или менее одинаково, получив любое из этих предложений на входе: началом послужит исходное грубое описание значения threw out, которое, в соединении с релевантной КОП, будет использоваться для более точного определения значения всеґо сообщения. В каком-то смысле интегральная теория семантики и прагматики приводит нас к выводу о том, что язык всегда в некоторой степени метафоричен.

* * *

Данная работа была доложена на XIII Международном конгрессе лингвистов в Токио (Япония) в 1982 г. Проведенное исследование отчасти финансировалось Управлением перспективных исследовательских проектов Министерства обороны США (DARPA), а отчасти — Национальным научным фондом.




[1] Roger Schank, Lawrence Birnbaum, Jacob Meу. Integrating semantics and pragmatics.— „Quaderni di Semantica", Vol. VI, no. 2, 1985.
[2] Следует отметить, что английский термин processing 'обработка' (примени­мый и к машинной, и к „человеческой" обработке языковых данных) является производным от слова 'процесс'. Поэтому в переводе, в зависимости от контекста, могут употребляться выражения, построенные на основе либо одного, либо другого из указанных русских корней.— Прим. перев.
[3] Слово conceptual мы переводим как 'концептуальный', а не 'понятийный', потому что в специальной литературе уже утвердилось наименование „теория кон­цептуальных зависимостей Шенка".— Прим. ред.
[4] См. также статью В.Ленерт и др. в настоящем сборнике.— Прим. ред.




Описание Является ли некоторый данный уровень описания языка авто­номным относительно соседнего, более „высокого" уровня — этот вопрос представляет большой интерес для лингвистики независимо от того, о каких конкретно уровнях идет речь. Наиболее очевид­ным примером здесь могут служить разногласия, существующие в генеративной лингвистике по вопросу о соотношении синтаксиса и семантики. Мы уже писали (Schank, Birnbaum, 1984), что, с точки зрения искусственного интеллекта, при построении процес­суальной модели языка эти два уровня должны быть объединены (integrated). Поскольку обработка языковых данных требует объеди­нения знаний, содержание которых чрезвычайно разнообразно, мы должны поверить в возможность того, что между уровнями языка не существует функциональных различий (хотя разграничение их и может быть удобно в целях описания). Соответственно, в настоящей работе мы утверждаем, что семантику и прагматику также следует свести в единое целое. [Новое в зарубежной лингвистике. Вып. XXIV. / Под ред. Городецкого Б.Ю. М., 1989].
Рейтинг
5/5 на основе 1 голосов. Медианный рейтинг 5.
Просмотры 3287 просмотров. В среднем 1 просмотров в день.
Похожие статьи