Роберт Готтсданкер. Основы планирования экспериментов

Роберт Готтсданкер. Основы планирования экспериментов
Добавлено
11.03.2007 (Правка 21.08.2008)

Если вы хотите экспериментально проверить, помогают ли музыкальные радиопередачи заучивать слова французского языка, вы легко сможете сделать это, повторив один из экспериментов, описанных в предыдущей главе. Скорее всего, вы спланируете свой эксперимент по образцу Джека Моцарта. Вы заранее определите оба условия независимой переменной, будете заниматься в одно и то же время дня и каждый этап эксперимента фиксировать документально. Вместо четырех фортепьянных пьес вы могли бы заучивать четыре списка слов следующим образом: слушая радио, без радио, без радио, с радио. Иначе говоря, вы сможете применять ту же экспериментальную схему, что и Джек.


Вполне возможно, что вам будут понятны некоторые основания ваших собственных действий. Но что-то наверняка останется неясным, и прежде всего — последовательность условий независимой переменной, т. е. сама экспериментальная схема. Вашей вины в этом нет, ведь экспериментальных схем вы еще не проходили. В настоящей главе этот недостаток будет устранен. Конечно, можно провести эксперимент и путем простого подражания образцу, но гораздо лучше понимать то, что вы делаете. Двух идентичных экспериментов не бывает, и слепое копирование экспериментальной схемы часто приводит к затруднениям. Например, Йоко могла бы применить в своем эксперименте регулярное чередование двух условий (сортов сока), как это делали в эксперименте с ткачихами (использование или неиспользование наушников). Но тогда она наверняка знала бы название тестируемого сока, а как раз этого она и старалась избежать»-используя случайную последовательность. К тому же если вы не будете знать оснований различных планов и схем, вам трудно будет оценить качество экспериментов, о которых вы будете читать. А, как вы помните, научить вас этому — одна из главных целей нашей книги.


В данной главе мы сравним те планы, по которым строились эксперименты в главе 1, с менее удачными планами проведения тех же экспериментов. Образцом для их сравнения будет «безупречный» эксперимент (который практически неосуществим). Анализ такого рода позволят рассмотреть те основные идеи, которыми мы руководствуемся при создании и оценке экспериментов. В процессе этого анализа мы введем в наш словарь несколько новых терминов. В итоге мы определим, что безупречно и что нет в тех трех экспериментальных схемах, которые использовались в главе 1. А эти схемы представляют три способа упорядочивания, или три вида последовательностей предъявления различных условий независимой переменной, применяемые в эксперименте с одним испытуемым.


После изучения материала этой главы вы сможете компетентно и не подражая чужому эксперименту спланировать свой собственный. В конце главы нам будут заданы вопросы по следующим темам:


1. Степень приближения реального эксперимента к безупречному.


2. Факторы, нарушающие внутреннюю валидность эксперимента.


3. Систематические и несистематические источники нарушения внутренней валидности.


4. Методы повышения внутренней валидности, способы первичного контроля и экспериментальные схемы. 5. Некоторые новые термины из словаря экспериментатора.


ПРОСТО ПЛАНЫ И ПЛАНЫ БОЛЕЕ УДАЧНЫЕ


Несомненно, первое условие проведения эксперимента — это его организация, наличие плана. Но не всякий план можно считать удачным. Предположим, что эксперименты, описанные в главе 1, проводились иначе, по следующим планам.


1. Пусть в первом эксперименте ткачиха вначале носила наушники 13 недель, а затем 13 недель работала без них.


2. Положим, Йоко решила использовать в своем эксперименте только по две банки каждого сорта сока, и весь эксперимент занял четыре дня вместо 36.


3. Джек решил применить частичный метод заучивания к первым двум пьесам, а целостный — к двум следующим.


4. Или же, сохранив ту же последовательность методов, Джек выбрал для эксперимента короткие вальсы, а не более длинные пьесы, которые он разучивал обычно.


Мы довольно ясно чувствуем, что по сравнению с ранее описанными экспериментами все эти планы — неудачны. А если бы у нас был образец для сравнения, то мы совершенно точно могли бы сказать, почему именно первоначальные планы были лучше. Безупречный эксперимент служит таким образцом. В следующем разделе мы подробно обсудим его, а затем посмотрим, как он применяется для оценки наших экспериментов.


БЕЗУПРЕЧНЫЙ ЭКСПЕРИМЕНТ


Теперь у нас есть примеры удачно и неудачно спланированных экспериментов. А можно ли и дальше усовершенствовать хорошо спланированный эксперимент? И можно ли сделать эксперимент абсолютно безупречным? Ответ следующий: любой эксперимент можно улучшать до бесконечности, или — что то же самое — безупречный эксперимент провести нельзя. Реальные эксперименты совершенствуются по мере приближения к безупречному.


Идеальный эксперимент


Лучше всего определить безупречность с помощью понятия идеального эксперимента (Кеппел, 1973, с. 23). В идеальном эксперименте допускается изменение только независимой переменной (и, разумеется, зависимой переменной, которая принимает различные значения при разных условиях). Все прочее остается неизменным, и поэтому на зависимую переменную влияет только независимая. В наших трех хорошо спланированных экспериментах это, конечно, не так. Ткачихи носили наушники и работали без .них в разное время — по четным или нечетным неделям. Пьесы, которые заучивал Джек с помощью целостного и частичного методов, тоже были разными. Йоко никогда не выпивала томатный сок обоих сортов в один и тот же день. В каждом случае помимо независимой переменной изменялось что-то еще. В последующих главах мы расскажем об экспериментах Другого типа, в которых для каждого из условий независимой переменной привлекаются разные испытуемые, что позволяет устранить временные изменения (вроде четных и нечетных недель) и различия с заданиях (заучиваемые пьесы). Но и они не отвечают всем требованиям идеального эксперимента, ведь испытуемые тоже будут разными. Как вы скоро убедитесь, идеальный эксперимент невозможен. Однако сама идея является полезной, именно ею мы руководствуемся при совершенствовании реальных экспериментов.


В идеальном (неосуществимом) эксперименте ткачиха должна была бы работать с наушниками и без них в одно и то же время! Джек Моцарт одновременно заучивал бы одну и ту же пьесу целостным и частичным методами. В обоих этих случаях разница в значениях зависимой переменной была бы обусловлена только независимой переменной, различием ее условий. Иначе говоря, все побочные обстоятельства, все другие потенциальные переменные оставались бы на одном и том же неизменном уровне.


Бесконечный эксперимент


Бедная Йоко! В ее случае даже идеальный эксперимент не будет безупречным. Недаром она опасается, что в разных банках томатный сок одного и того же сорта различается по качеству. Даже если бы она про вела идеальный эксперимент, ухитрившись одновременно из одного и того же стакана выпивать сок двух разных сортов, ее оценки все равно относились бы только к частным примерам каждого сорта. И тем не менее Йоко могла бы устранить влияния изменчивости качества сока в разных банках, совершив иной невозможный подвиг. «Все», что ей нужно, — это не прекращать свой эксперимент после 36 дней и продолжать его до бесконечности. Тогда она смогла бы усреднить не только изменчивость каждого из сортов сока, но и возможные колебания в собственных оценках его вкусовых качеств. Это и есть бесконечный эксперимент. Нетрудно видеть, что он не только невозможен, но и бессмыслен. Ведь общий смысл эксперимента заключается в том, чтобы на базе ограниченного количества данных делать выводы, имеющие более широкое приложение. Однако бесконечный эксперимент, подобно идеальному, также служит нам руководящей идеей.


Собственно говоря, Джеку Моцарту и авторам исследования в ткацком цехе тоже можно было бы предложить провести бесконечный эксперимент вместо идеального. Ведь даже если в идеальном эксперименте Джек обнаружит, что для данной конкретной пьесы частичный метод более эффективен, останется вопрос, сохранятся ли преимущества этого метода при разучивании других пьес. Те же сомнения вызывает и первый эксперимент: а что если ткачиха лучше работала с наушниками только во время его проведения? Однако их (и вас) нужно предупредить, что бесконечный эксперимент тоже имеет недостатки. Сам факт предъявления испытуемым одного из экспериментальных условий может сказываться (в период исследования) на их работе при другом условии. Возможно, частичный метод был более эффективным во время эксперимента только за счет контраста с целостным методом. А после эксперимента будет применяться один-единственный метод, и фактор контраста исчезнет. Все это доказывает, что полностью безупречными не являются ни идеальный, ни бесконечный эксперименты. К счастью, они имеют не только разные недостатки, но и разные преимущества и могут служить для оценки реальных экспериментов, весьма далеких от безупречного.


Эксперимент полного соответствия


Ни идеальный, ни бесконечный эксперименты не позволяют устранить недостатки неудачного варианта исследования Джека Моцарта — заучивания вальсов вместо сонат, В лучшем случае Джек мог бы провести блестящий эксперимент на вальсах — что, однако, не сделает их сонатами!


Чтобы совершенно исключить недостатки такого рода, нужен эксперимент полного соответствия. Этот эксперимент также является бессмысленным, хотя практически он осуществим. В своем исследовании Джек должен был бы заучивать те же самые пьесы, которые он будет разучивать и после него. Никакой пользы от такого эксперимента нет, как и от бесконечного. Но зато уж никто не сможет указать Джеку на несоответствие пьес, которые он разучивал в своем эксперименте.


Все три вида безупречного (почти) эксперимента нереальны. Идеальный эксперимент является невозможным, эксперимент полного соответствия — бессмысленным, а бесконечный — тем и другим вместе. Полезны они как эксперименты «мысленные». Они подсказывают нам, что нужно делать для создания эффективного эксперимента. Идеальный и бесконечный эксперименты показывают, как избежать посторонних влияний и тем самым добиться большей уверенности в том, что экспериментальные результаты действительно отражают связь. независимой и зависимой переменных. Эксперимент полного соответствия напоминает о необходимости контроля других важных переменных эксперимента, которые мы сохраняем неизменными.


ОБОБЩЕНИЕ, РЕПРЕЗЕНТАТИВНОСТЬ И ВАЛИДНОСТЬ


Как мы установили в главе 1, цель любого экспериментального исследования — сделать так, чтобы выводы, основанные на ограниченном количестве данных, оставались достоверными за пределами эксперимента. Это называется обобщением. Выполненный нами анализ безупречного эксперимента показывает, что достоверность экспериментальных выводов определяется по крайней мере двумя требованиями От них же зависит и правомерность возможных обобщений. Первое требование заключается в том, чтобы найденное в эксперименте отношение между независимой и зависимой переменными было свободным от влияния других переменных. Второе требование — чтобы постоянный уровень дополнительной переменной, задействованной в эксперименте, соответствовал ее уровню в более широкой области практики.


Репрезентативность


Мы уже знаем, что безупречный эксперимент невозможен, но он дает нам руководящие принципы для правильного планирования реальных экспериментов. Теперь мы можем задать вопрос о применении этих принципов. Ответ прост — нужно определить, насколько успешно реально проведенный эксперимент репрезентирует (представляет} эксперимент безупречный. Прежде всего посмотрим, в какой мере исключена в наших экспериментах возможность посторонних влияний на зависимую переменную.


В оригинальном исследовании, проведенном в ткацком цехе, испытуемая 13 недель работала с наушниками и 13 чередующихся с ними недель — без наушников. При «неудачном» пересмотре эксперимента она носила наушники в первые 13 недель, а следующие 13 работала без них. В идеальном эксперименте испытуемая должна была бы работать и с наушниками, и без них одновременно. Понятно, что схема чередования недель приближается к этому идеалу в, большей степени. Чередование двух условий, или АБАБАБАБАБ и т. д., более репрезентативно для их одновременного предъявления, чем последовательность, состоящая только из А и Б.


В своем первоначальном эксперименте Джек Моцарт разучивал пьесы в следующем порядке: целостный метод — частичный — частичный — целостный. В «неудачном» эксперимент последовательность была иной: 56целостный — целостный — частичный — частичный. В первом случае усредненные позиции целостного и частичного методов были одинаковы. Целостный метод занимал в последовательности позиции 1 и 4 среднее — 2,5. Позициями частичного метода были 2 и 3, среднее — 2,5. Напротив, в «неудачном» эксперименте целостный метод занимал позиции 1 и 2. среднее — 1,5, а частичный — 3 и 4, среднее — 3,5. Более репрезентативным для одновременного предъявления двух условий вновь оказался оригинальный эксперимент.


В первоначальном варианте своего эксперимента Йоко выпивала оба сорта сока — «Риттенхауз» и «БаддинБидл» — в случайном порядке в течение З6 дней. В "неудачно" измененном варианте она окончилась 4 днями. Ясно, что к бесконечности ближе 36, а не 4. Первоначальный план лучше репрезентирует бесконечный эксперимент, чем план измененный.


Эксперимент полного соответствия лучше представлен в оригинальном исследовании Джека, чем в его измененном варианте с вальсами. Хотя Джек и не разучивал все пьесы, которые он намеревался выучить в дальнейшем, он взял пьесы точно того же типа, т. е. выбрал соответствующий уровень дополнительной переменной. А вариант с вальсами оказывается «неадекватным», поскольку по своему уровню эти пьесы отличаются от тех, которые Джек разучивал бы в эксперименте полного соответствия.


Подводя итоги, можно сказать, что более надежную информацию об отношении между независимой и зависимой переменными дают те эксперименты, которые лучше представляют идеальный и бесконечный эксперименты. А чем ближе уровень значимой дополнительной переменной в проведенном эксперименте к ее уровню в эксперименте полного соответствия, тем лучше представлена в нем изучаемая реальная ситуация.


Валидность


В зависимости от того, насколько реальные эксперименты представляют безупречный, их называют более или менее валидными. Безупречный эксперимент позволил бы безошибочно отделить верную гипотезу от неверной. Если бы Джек Моцарт смог провести безупречный эксперимент, он бы совершенно точно знал, какая из его гипотез верна: частичный метод лучше или целостный метод лучше. Таким образом, говоря о валидности эксперимента, вы оцениваете качество той работы, которую предполагаете провести для определения справедливости одной из конкурирующих гипотез.


Внутренняя валидность


Всем трем описанным нами «неудачным» экспериментам недоставало внутренней валидности. Это значит, что они не позволяют рассматривать полученную картину отношений между независимой и зависимой переменными как достоверную. И виноваты в этом, как мы убедились, всевозможные посторонние влияния. Эксперимент, которому недостает внутренней валидности, не может быть использован для выяснения того, какая гипотеза о связи независимойи зависимой переменных истинна, а какая ложна. Например, если нам не ясно, почему ткачиха работала лучше: потому, что она носила наушники, или потому, что стояла хорошая погода, — мы не вправе считать результаты эксперимента достаточными для определения истинной и ложной гипотез о влиянии наушников на производительность труда.

Термин "внутренний" подчеркивает существо данного вида валидности. Можно сказать, что эксперимент, лишенный внутренней валидности, неудачен, так сказать, изнутри, по самой своей сути. Действительно, если он не позволяет убедиться в достоверности найденного отношения независимой и зависимой переменных, он просто бесполезен.


Внешняя валидность


«Неадекватный» эксперимент, который мог бы провести Джек, разучивая вальсы вместо сонат, не был бы неудачным в принципе. Это был бы вполне нормальный эксперимент по заучиванию вальсов. Бесполезным его считать нельзя. Джек мог бы использовать свои результаты, если бы задним числом решил, что на самом деле он искал наиболее эффективный метод заучивания вальсов. Однако этому эксперименту недостает внешней валидности. Он не обеспечивает достаточных оснований для определения верной и неверной гипотез о лучшем методе заучивания сонат.

Термин «внешний» относится к определению тематики проводимого эксперимента — чему именно он посвящен. В данном случае эксперимент не был внешне валидным потому, что "сонаты" — такая же необходимая составная часть проверяемой гипотезы, как независимая и зависимая переменные.


Общие определения


Понятия внешней и внутренней валидности являются центральными для всей нашей книги. Их применение в последующих главах в основных чертах определяется тем, что мы только что сказали. Сейчас мы приведем и более формальные определения этих понятий. Правда, все их значение вы поймете только тогда, когда познакомитесь с экспериментальными проблемами более высокого порядка. Но у вас уже будет основа для общего понимания и дальнейшего уточнения того, что такое валидность и два ее вида.


Начнем со схематического изображения экспериментальной гипотезы:


Независимая переменная ... Отношение ... Зависимая переменная ... Уровни других переменных. Итак, гипотеза включает в себя само отношение и обозначения обеих его сторон. Определение валидности эксперимента, как внутренней, так и внешней, состоит в следующем. Это степень правомерности вывода об экспериментальной гипотезе, которую обеспечивают результаты данного эксперимента по сравнению с результатами эксперимента, безупречного во всех трех аспектах.


Понятие внутренней валидности эксперимента касается только самого отношения и не затрагивает того, что именно соотносится. Отсюда внутренняя валидность — это степень правомерности вывода об экспериментальной гипотезе, основанного на результатах данного эксперимента, по сравнению с тем выводом, в основе которого лежат результаты идеального и бесконечного экспериментов, где изменения независимой и зависимой переменных происходят в одних и тех же условиях, а все другие, побочные факторы остаются неизменными.


Любой эксперимент сталкивается также с проблемой соответствия исследуемой ситуации — реальной. Вопрос о соответствии уровня дополнительной переменкой, типа музыки, уже возникал. Несколько позже мы обсудим подобные вопросы для независимых и зависимых переменных. Понятно, что вопросы о соответствии касаются содержания того, что стоит по обе стороны изучаемого отношения. Это и есть вопросы внешней валидности. Ее можно определить как степень правомерности данного вывода об экспериментальной гипотезе по сравнению с тем выводом, который основан на результатах эксперимента с полным соответствием независимой, зависимой и уровнями всех дополнительных переменных.


В настоящей главе мы обсудим главным образом проблему внутренней валидности. В любом эксперименте вы с самого начала столкнетесь с этой проблемой; если внутренняя валидность не достигнута, рассматривать внешнюю не имеет смысла. Вспомните, что в главе 1 были представлены эксперименты такого типа, для которых вопросы внешней валидности практически не обсуждаются. А в следующей главе мы рассмотрим эксперименты, в которых именно эти вопросы выступают на первый план.


Никаких гарантий


Мы можем сказать, что эксперимент валиден, не зная фактически, правильны ли выводы. Мы можем оказать, что он невалиден, не зная, что выводы ошибочны. Причина в том, что мы не можем знать наперед, какая из двух конкурирующих гипотез верна. Ведь если бы мы об этом знали, нам не надо было выпроводить эксперимент. Если бы Джек заранее знал, какая из двух его гипотез справедлива: (1) частичный метод лучше или (2) целостный метод лучше, — он мог бы не проводить свое исследование.


При определении валидности реальных экспериментов мы должны сравнивать сами процедуры их проведения с процедурами «проведения» безупречного эксперимента. Валидный эксперимент представляет безупречный эксперимент лучше, чем невалидный. следовательно, в валидном эксперименте мы с большей вероятностью можем получить такие результаты, которых могли бы достичь в безупречном эксперимента. При этом важно помнить, что ограниченных — и всегда несовершенных — экспериментальных данных связано с риском. Даже самый высоковалидный эксперимент может дать неточную информацию о правильности экспериментальной гипотезы, а информация, полученная в невалидном эксперименте, может оказаться точной. Причины такого риска и его влияние на интерпретацию экспериментальных результатов мы обсудим в следующих главах, прежде всего — в главе 6 («Значимые результаты»).


ФАКТОРЫ, УГРОЖАЮЩИЕ ВНУТРЕННЕЙ ВАЛИДНОСТИ


Теперь мы можем применить понятие безупречного эксперимента (идеального и бесконечного) для описания того, что мешает достижению внутренней валидности в реальных экспериментах. Как мы увидим, некоторые из таких помех устранить нельзя; они необходимо связаны с процедурами проведения наших не-вполне-безупречных экспериментов. Скажем, если Джеку нужно разучить две пьесы, одну из них он неизбежно будет разучивать первой. Существуют, однако, и такие трудности, которые можно преодолеть, если заранее об этом позаботиться. Так, Джек уже знал, что не стоит применять частичный и целостный методы в разное время дня.


Изменения во времени


Известные побочные факторы. В идеальном эксперименте различные состояния независимой переменной предъявляются испытуемому одновременно. Этого Джек сделать не мог, но он мог по крайней мере заниматься в одно и то же время дня. Время дня — это заранее известная побочная (т. е. отличная от независимой) переменная, которая может повлиять на эффективность занятии, и ее надо охранять неизменной. Если бы Джек был невнимателен, то в разные дни эксперимента он мог бы заниматься то при закрытых, то при открытых окнах. А уличный шум может сильно повлиять на эффективность занятий. Поэтому лучше сохранять его неизменным, держа окна закрытыми. В эксперименте с наушниками, который продолжался более шести месяцев, исследователи знали о возможных изменениях температуры и влажности в ткацком цехе. К сожалению, условия эксперимента не позволяли им исключить эти изменения. Но экспериментаторы фиксировали и старались учесть влияния названных факторов. И что самое главное — чередование двух условий независимой переменной снижало влияние этих факторов, Экспериментатор должен стараться заранее определить все возможные факторы, которые с течением времени могут изменяться. И главное, стараться удерживать их на постоянном уровне при каждой новой пробе.


Нестабильно сть во времени. Но даже стараясь изо-всех сил, экспериментатор не сумеет сделать одну пробу в точности (кроме отличия уровней независимой переменной) похожей на другие. Некоторая нестабильность во времени будет всегда. В эксперименте она проявляется в изменчивости побочных факторов, а также в некоторых вариациях самой независимой переменной. Наконец, всегда остаются совершенно неясные источники сильных колебаний в ответах испытуемых, приводящие к увеличению разброса экспериментальных данных. Давайте рассмотрим конкретные примеры каждой из этих трех форм нестабильности во времени.


Изменчивост ь побочных факторов. Часто бывает так,. что экспериментатор знает о существовании посторонних факторов, влияющих на зависимую переменную, но не может управлять ими непосредственно. Какой-то день в работе ткачихи мог оказаться «не самым удачным» из-за того, что накануне она поздно легла спать. Конечно, экспериментатор мог бы попытаться убедить ее не делать этого, пока эксперимент не завершится. Но ведь эксперимент продолжался шесть месяцев! Поужинав накануне в ресторане, Джек неважно себя чувствовал во время разучивания одной из пьес — в другой раз ему следует быть осторожнее.


От пробы к пробе окружающие условия никогда не остаются неизменными. Описывая эксперимент в ткацком цехе, исследователи утверждают:


«Хорошо известно, что на производительность ткацкого труда могут влиять атмосферные условие. Так, с повышением температуры и относительной влажности уменьшается количество обрывов нити. С другой стороны, дальнейшее повышение того и другого, продолжая благоприятно воздействовать на физические свойства пряжи, неблагоприятно сказывается на физиологическом состоянии людей, работоспособность которых может снизиться так, что это сведет на нет любые положительные влияния» (Уестон и Адаме, 1932, с. 56).


Следовательно, даже измеряя температуру и влажность, нельзя установить точно их влияние на производительность труда. Список побочных переменных можно было бы продолжать до бесконечности, включая в него и субъективные факторы, как, например, хорошее или плохое самочувствие испытуемого в течение эксперимента. Добросовестный экспериментатор может фиксировать некоторые из этих изменений, но не может их избежать. Теперь вам понятно, почему экспериментатор стремится уйти из реального мира в прекрасные звуконепроницаемые лаборатории и иметь дело с такими испытуемыми (белыми крысами), поведение которых он может контролировать 24 часа в сутки. Но даже там калориферы иногда остывают, бутыли с водой засоряются, и крысы подхватывают «насморк».


Само пребывание в ситуации эксперимента может вызвать продолжительные изменения в поведении испытуемого. Таков был главный вывод из знаменитых экспериментов «Хауторн», вывод, важный для всех экспериментальных психологов. На Западном электрозаводе в Хауторне (Иллинойс) было проведено исследование влияния освещения в цехах на производительность сборочных работ. Предварительные попытки установить какую-либо закономерность закончились неудачей. Тогда было предпринято систематическое исследование условий труда рабочих (Роетлисбергер и Диксон, 1946). Основной частью этого исследования были эксперименты с заданием по сборке переключателей. Оно представляло собой «сборку телефонных реле; это операция, которую обычно выполняют женщины: нужно соединить примерно 35 небольших деталей в «сборную арматуру» и закрепить ее четырьмя винтами» (с. 20).


Для эксперимента была оборудована специальная комната, чтобы исследователи могли контролировать условия работы и адекватно оценивать деятельность операторов. В качестве испытуемых в эксперименте приняли участие пять молодых женщин, вполне освоивших данный вид работы. Исследовались две независимые переменные: распределение периодов отдыха, а также длина рабочего дня и рабочей недели. Оплата труда производилась в соответствии с общим количеством переключателей, собранных бригадой из пяти человек.


Было установлено, что независимо от распределения периодов отдыха и длины рабочего дня и недели производительность труда продолжала расти в течение двух лет! Исследователи сообщают, во-первых, о «постепенном изменении социальных отношений в группе операторов в направлении групповой сплоченности и солидарности и, во-вторых, об изменении отношений между операторами и их контролерами. Организаторы эксперимента стремились создать среди девушек атмосферу взаимной поддержки и сотрудничества, избавить их от излишних волнений и тревог. Эти усилия по созданию необходимых условий эксперимента косвенным путем привели к изменению отношений между людьми» (с. 58—59).


Пользуясь нашей терминологией, эту ситуацию можно описать так. До эксперимента социальные условия работы испытуемых находились на одном уровне. В ситуации эксперимента данная «побочная переменная» перешла на другой уровень. Это привело к продолжительному изменению зависимой переменной — производительности труда, несмотря на то что объективно социальные условия в эксперименте оставались неизменными.


Независимая переменна я. Рассчитывать на полную идентичность каждого из условий независимой переменной на всем протяжении эксперимента мы не можем. В какие-то дни или даже недели наушники могли быть надеты не так удобно, как в остальные. Несмотря на все старания Джека, он может по-разному относиться, например, к частичному методу, разучивая разные пьесы. И Йоко знала о вариациях каждого из условий своей независимой переменной. Сок одного и того же сорта в любых двух банках не бывает одинаков, и раз-яйца подчас очень велика. Какие-то изменения будут встречаться даже в тех экспериментах, в которых, казалось бы, достигнуто полное единообразие условий. Яркость электрического света (как стимула) будет меняться от перепадов напряжения в сети, а они случаются довольно часто. В течение эксперимента могут возникать и закономерные изменения, например с увеличением срока службы лампочки ее свет может становиться все менее ярким.


Зависимая переменная. При действии одной и той же независимой переменной испытуемый не всегда будет давать один и тот же ответ. Так будет даже в том случае, если экспериментатор необычайно искусен и пунктуален в устранении нестабильности побочных факторов и независимой переменной.


Нестабильность зависимой переменной очень эффектно представлена на графиках, отражающих результаты двух экспериментов. На рис. 2.1 показана понедельная выработка испытуемой Д. в эксперименте с наушниками. Как видим, меньше всего ударов она пропускала с десятой по двенадцатую неделю и с восемнадцатой по двадцать вторую. А самые неудачные ее показатели — наибольшее количество пропущенных ударов — приходятся на четырнадцатую неделю и окончание эксперимента. И что особенно интересно — для обоих условий работы кривые поднимаются и опускаются совместно. Изменения в производительности труда, происходившие с течением времени, несомненно, более существенны, чем различия между использованием и неиспользованием наушников.


На рис. 2.2 показаны изменения ответов испытуемого в эксперименте на время реакции выбора. Пробы давались каждые шесть секунд; испытуемый должен был сдвигать рукоятку к себе или от себя и тем самым совмещать две световые точки. Разумеется, точки предъявлялись в случайном порядке. За 70 запланированных последовательных проб во времени реакции испытуемого .наблюдались как непродолжительные колебания, так и более регулярные отклонения. Самое короткое время реакции было показано примерно между тридцатой и сороковой пробами, а самое большое — между шестидесятой и семидесятой. И это увеличение нельзя считать результатом усталости, ведь как раз перед сороковой пробой испытуемый отдыхал. В итоге самые большие показатели несколько превышали 400 мс, а самые малые — 200 мс, т. е. время реакции изменялось в отношении два к одному.














Рис. 2.1. Понедельная производительность труда испытуемой Д. Ось абсцисс — очередность недель проведения эксперимента. Ось ординат — количество пропущенных ударов (в среднем за час). Пунктирная линия — работа без наушников, сплошная — с наушниками



Рис. 2.2. Время реакции выбора для 70 последовательных проб. Ось абсцисс — номера проб (пунктиром отмечен период отдыха). Ось ординат — время реакции (в мс). Пунктирная линия — сдвиг рукоятки к себе, сплошная — от себя; треугольниками помечены ответы с ошибками



Таким образом, в исследовании времени реакции были обнаружены поминутные и даже посекундные его изменения. Они не связаны с усталостью, скорее их можно объяснить колебаниями внимания. На графике результатов ткачихи Д. отражены значительные колебания производительности ее труда. При этом взлеты и падения кривых, по-видимому, не зависят от температуры и влажности. Правда, увеличение числа пропущенных ударов к окончанию эксперимента можно объяснить применением искусственного (газового) освещения; оно было необходимым, так как эксперимент заканчивался осенью.


Даже тогда, когда сами ответы испытуемых постоянны, изменения могут вноситься процедурой их измерения. Счетчик фиксирует каждое передвижение челнока, совершающего новый удар. Однако приборы не всегда бывают исправны. А если измерения связаны с субъективными суждениями, то они непременно окажутся менее стабильными. Джек считал пьесу выученной окончательно после двух безошибочных исполнений наизусть. Однако в исполнении пьес было довольно много небольших погрешностей, почти ошибок. Иногда Джек мог посчитать их ошибками, а иногда нет. И объяснилось это вполне естественными колебаниями его субъективного состояния. Изменения в оценке исполнения пьес могли быть и регулярными. Например, в процессе эксперимента Джек мог все строже относиться к своим ошибкам.


Различия экспериментальных задач


Одну и ту же пьесу нельзя заучить (как в идеале) двумя различными методами одновременно. Но даже если методы следуют один за другим, их все равно нельзя применить к одной и той же пьесе. Если пьеса заучена, она заучена. Существуют эксперименты, в которых необходимо не только предъявлять разные экспериментальные условия в разное время, но и менять трудность задач. Это весьма значительное отличие от идеального эксперимента. Как Джек может убедиться в одинаковой трудности выбранных им пьес? А ведь в любом эксперименте по исследованию научения с участием одних и тех же испытуемых задачи для разных условий независимой переменной с необходимостью будут разными.


Эффекты последовательности


В неудачном варианте своего эксперимента Джек сначала заучивал две пьесы частичным методом, а затем две другие — целостным. Мы уже знаем, что на качество его игры могут повлиять любые (в том числе только что описанные) факторы, изменяющиеся во времени. Однако есть и другие влияния, связанные с положением каждого из условий независимой переменной в последовательности их предъявления. Влияния одного из условий на следующие за ним называются эффектами последовательности, эффектами порядка или эффектами переноса. Они могут быть положительными и отрицательными, иметь общий и специфический характер. Применение частичного метода могло положительно повлиять на дальнейшие занятия Джека по целостному методу за счет увеличения практики или привыкания к режиму эксперимента. Оно могло оказать и отрицательное действие: привычка заучивать пьесы короткими отрывками могла помешать заучиванию больших частей или Джек мог просто устать от занятий.


Предубеждения экспериментатора


Во времена возникновения автомобиля бытовал такой анекдот в форме загадки. Вопрос: Какой самый главный винтик в автомобиле? Ответ: Тот, что держит руль. В том же духе можем спросить и мы. Вопрос: Какой из факторов, угрожающих валидности эксперимента, самый опасный? Ответ: Экспериментатор.


Если у исследователя есть какие-либо ожидания относительно результатов эксперимента, особенно связанные с предпочтением одного из условий независимой переменной, то эти ожидания так или иначе проявятся при проведении опытов, Йоко хорошо знала, что главное — это составить случайную последовательность обоих сортов сока. Ей хотелось исключить любой намек на то, какой именно сорт она оценивала каждое утро. А вот Джек не проявил должной аккуратности. Сначала он подобрал пары пьес, которые казались ему одинаковыми по трудности (с тем, чтобы разучивать каждую из пьес разными методами), а затем сам расположил их в определенной последовательности. Но если при этом он рассчитывал на большую эффективность частичного метода, то мог невольно отобрать для целостного метода более трудные пьесы из каждой пары.


Кроме того, субъективные оценки качества исполнения пьес могли колебаться не случайным образом (как было показано выше). Джек мог невольно отдавать предпочтение одному из методов. Поэтому при оценке исполнения обеих пьес каждой пары Джеку не следует слишком верить в частичный метод, но и применяя целостный, тоже стараться достичь самых высоких результатов.


В эксперименте с наушниками исследователи, естественно, рассчитывали повысить с их помощью производительность труда и вполне могли передать свою уверенность участникам эксперимента. Поэтому, возможно, с наушниками ткачихи (в среднем) старались работать лучше.


Одно из самых коварных следствий предубежденности экспериментатора — это нежелание учитывать некоторые экспериментальные данные, как полученные якобы при нетипичных условиях, например при сильном уличном шуме. К сожалению, мнение экспериментатора о нетипичности условий часто весьма субъективно. Отсюда один и тот же уровень шума будет считаться нетипичным при одном состоянии независимой переменной, но вполне нормальным — при другом.


От предубеждения экспериментатора может зависеть даже точность регистрации данных. Показано, например, что в протоколах экспериментов по изучению экстрасенсорного восприятия встречаются ошибки в пользу наличия соответствующих феноменов, если протоколист верит в их существование. Те же, кто не верит в экстрасенсорное восприятие, не допускают подобных искажений (Кеннеди, 1939). Тщательный анализ этой проблемы в целом представлен в книге "Влияния экспериментатора в психологическом исследовании" (Розенталь, 1976).





Описание Глава 2 учебного пособия Р.Готтсданкера "Основы психологического эксперимента". В публикуемый текст не включены статистические приложения.
Вложенные файлы
  • pic1_gotts.gif
  • pic2_gotts.gif
Рейтинг
5/5 на основе 4 голосов. Медианный рейтинг .
Просмотры 17230 просмотров. В среднем 4 просмотров в день.
Близкие статьи
Похожие статьи