Проблема измерения аттитюдов или социальных установок

Отдельным направлением в изучении аттитюдов или социальных установок является их измерение. Любой исследователь, работающий в данной парадигме, неизбежно сталкивается с проблемой выбора наиболее эффективного метода измерения. Над разработкой измерительных процедур трудилось не одно поколение ученых. В западной школе теория измерения обязана своим становлением и развитием таким выдающимся ученым как Л. Тернстоун, И. Чейв, Д. Фехнер, Л. Гутман, Э. Богардус, Ч. Осгуд, Д. Суси, П. Танненбаум, Р. Лайкерт, А. Анастази, Ч. Джадц, Г. Мак Клелланд, К. Кумбс, Т. Смит, Р. Доз и др. В отечественной психологии проблемы измерения представлены в работах В. А. Ядова, А. И. Худякова, К. Д. Зароченцева, А. Н. Гусева, Ч. А. Измайлова, М. Б. Михалевской, М. И. Зайцевой и др.

В настоящее время техника измерения аттитюдов достаточно разнообразна. Бурное развитие информационных технологий значительно облегчает обработку эмпирических данных, позволяет исследователю подбирать наиболее оптимальный метод измерения, использовать комплексный измерительный инструментарий. Все это повышает надежность и валидность получаемых результатов. Вместе с тем, измерение аттитюдов всегда сопряжено с определенными трудностями, основная из которых обусловлена таким качеством социальных установок, как их латентность. Являясь гипотетическим конструктом, аттитюды не поддаются непосредственному/прямому измерению. Любая попытка оценки аттитюдов является предположительной по своему характеру. Иными словами, мы можем только изучать поведение, которое, как справедливо полагают, свидетельствует о наличии аттитюдов, и квантифицировать эти свидетельства таким образом, чтобы получить представление о том, насколько индивидуумы или социальные группы отличаются по своей психологической ориентации по отношению к конкретному объекту или вопросу. Именно этим определяется то большое значение, которое придается измерению аттитюдов или социальных установок.

Прежде чем рассматривать конкретные методы, использующиеся для измерения установок, мы считаем целесообразным и оправданным остановиться на сложившихся в отечественной и западной психологии подходах к измерению в целом.

Несмотря на то, что «измерение - это один из «богов», которому современные психологи приносят дань с завидной регулярностью, предмет измерения до сих пор остается достаточно неуловимым». Прежде всего, как показывает проведенный автором теоретический анализ, не существует единого похода к измерению и классификации измерительного инструментария.

В западной психологии сложилось две традиции измерения, которые, в свою очередь, повлияли на современные подходы к измерению в социальной психологии. Первый подход - это аксиоматическое или репрезентативное измерение. В контексте данной традиции измерение определяется просто как «присвоение цифровых значений объектам или событиям с соответствии с определенными правилами». Критикуя это определение, ставшее уже классическим, приверженцы другого подхода, названного психометрическим, утверждают, во-первых, что не любое измерение выражается в числах. Более того, по их мнению, правила присвоения числовых значений составляют измерение только тогда, когда в результате получается нечто значимое, некая системность свойств, характеристик и проявления поведения, которая позволяет делать предсказания. Выводя свое определение измерения, сторонники нерепрезентативного подхода к измерению говорят о том, что «сырые» данные социальной психологии, а также других общественных наук, представляют собой бесконечный ряд подробных наблюдений, фиксирующих поведение, свойства и характеристики индивидуумов, социальных групп, социального окружения и других объектов социального мира. И измерение является тем процессом, при помощи которого это бесчисленное множество наблюдений сводится к компактным описаниям или моделям, которые предположительно дают представление о повторяемости свойств или характеристик наблюдаемых объектов и регулярности их поведения.

Дискуссии по поводу достоинств и недостатков аксиоматического и психометрического подходов к измерению порой приобретают очень острый характер. Так некоторые теоретики в области измерения дошли до того, что назвали нерепрезентативный подход оксимороном, т.е. парадоксом, сочетанием несочетаемого, столкновением противоположностей. А измерение с применением широко используемой шкалы Р. Лайкерта, по мнению сторонников этого направления, является «измерением по указу». Что же касается аксиоматического подхода, то в качестве одного из основных его достоинств заявляется возможность проведения более защищенных измерительных процедур. Однако, сравнительно недавно, некоторые из поборников репрезентативной традиции опубликовали работы, в которых аксиоматическое измерение сравнивается ими с революцией, которая не состоялась. К числу причин неудачи этой «революции» ученые относят:

  •  трудности математического порядка;

  •   отсутствие эмпирически доказанного потенциала;

  •   очевидную невозможность избежания ошибок;

  •   конфликт с традиционными стилями исследования в психологии.

Еще одним доводом не в пользу репрезентативного измерения, как утверждают данные исследователи, является ограниченное количество примеров их успешного применения в социальной психологии.

Другая группа психологов, выступая в защиту аксиоматического подхода, утверждают, что «революция переживает всего лишь свои первые этапы, и последние исследования с использованием репрезентативных методов измерения свидетельствуют о том, что именно они составляют ту основу, от которой смогут отталкиваться будущие поколения ученых- психологов».

Таким образом, асксиоматический (репрезентативный) и психометрический (нерепрезентативный) подходы к измерению развиваются параллельно. Каждый из них имеет свои достоинства и недостатки. Задачей же исследователя является выбор наиболее адекватного измерительного инструментария в традиции того или иного подхода, с учетом всех объективных и субъективных факторов, целей и задач конкретного исследования.

Тем не менее, несмотря на непрекращающиеся попытки сторонников аксиоматического измерения доказать неопровержимые, как они полагают, преимущества своих методов, приходится констатировать, что большинство измерений в социальной психологии, включая измерение социальных установок, выполняется в контексте психометрического подхода. Одним из примеров аксиоматического измерения является известная шкала Л. Терстоуна, которая стала первой применяться для измерения социальных установок. К числу наиболее востребованных психометрических методов измерения относятся:

•    шкала Р. Лайкерта;

•    шкала Л. Гуттмана;

•    шкала социальной дистанции Э. Богардуса;

•    семантический дифференциал Ч. Осгуда.

Получение вербального самоотчета от респондента требует от него выполнения одной из следующих задач:

•    оценочного шкалирования;

•    ранжирования;

•    сортировки;

•    выбора на основе сравнения.

Шкалирование предполагает оценку величины характеристики или качества оцениваемого объекта. Процедура ранжирования означает расположение измеряемых объектов в порядке отдаваемого им предпочтения, на основе какой-то характеристики. Сортируя оцениваемые объекты, респонденты, по сути, классифицируют их, подразделяя на несколько (а иногда только две) групп. Выбора на основе сравнения производится между двумя или несколькими альтернативами. Все эти принципы положены в основу выше перечисленных шкал.

Как показал проведенный нами анализ первоисточников, в отечественной и западной психологии применяются две основные классификации измерительных эталонов. Одной из наиболее распространенных является континуальная классификация, предложенная в свое время Стэнли Стивенсом. В этой классификации шкалы упорядочены по мере повышения их способности удовлетворять требованиям многообразных операций с числами. В данной классификации выделяется пять классов шкал:

  •  номинальная шкала (неупорядоченная шкала наименований);

  •  частично упорядоченная номинальная шкала;

  •  порядковая шкала или полностью упорядоченная ординарная шкала (например, шкала рангов или ранговая шкала);

  •  интервальная шкала (шкала равных интервалов);

  •  шкала пропорциональных оценок.

Все эти виды шкал предназначаются для квантификации одномерных распределений, т.е. измерения некой протяженности в одном и только в одном континууме свойств. Фактически же в настоящее время часто используются многомерные измерения, моделирующие объект.

В основу другого подхода заложены сразу два принципа, в соответствии с которыми методы психологического шкалирования классифицируются в зависимости от:

  •  типа построения шкалы, т.е. является ли она шкалой наименований, шкалой порядка и т. д.

  •  степени структурной сложности шкалы (методы измерения чувствительности, методы одномерного шкалирования, методы многомерного шкалирования).

В условиях лабораторного эксперимента для измерения социальных установок активно применяются психологические методы с использованием кожно-гальванической реакции, лицевой электромиографии, электрокардиограммы, фиксирования расширения зрачка, измерения давления крови и др.

Все чаще и чаще исследователи прибегают к использованию нетрадиционных измерительных процедур, среди которых достаточно большое распространение получают так называемые нереактивные или «ненавязчивые» методы измерения. Эти методы не требуют сотрудничества с носителями установок, их непосредственного физического присутствия. Отсутствие необходимости вторжения в социальное окружение человека или группы людей также рассматривается как одно из достоинств нереактивного измерения. «Ненавязчивые» методы подразумевают, в частности, исследование физических следов эрозии, истирания предметов или, наоборот, нароста на них; внимательное исследование частных или общественных архивов и пр. Можно согласиться с М. Арулом, когда он говорит о потенциале использования данных методов. На наш взгляд, однако, представляется достаточно спорным употребление термина «измерение» по отношению к нереактивным методам. Мы полагаем, что было бы более оправданным включать их в методы наблюдения.

Из-за ограниченности объема диссертационного исследования, а также в силу того, что измерение как таковое не является темой нашей научной работы, мы дадим лишь общую характеристику основных методик, используемых и в западной и в отечественной социальной психологии для измерения аттитюдов, обращая особое внимание на преимущества и слабые стороны каждой них.

Шкала равнокажущихся интервалов Л. Терстоуна. Чикагский психолог и социолог Л. Тернстоун впервые изложил общие принципы измерения отношения людей к различным социальным явлениям в своей статье «Аттитюды могут быть измерены», опубликованной в 1928 году. Созданная ученым шкала «равнокажущихся интервалов» стала одним из основных методов при измерении отношения людей к власти, расизму, национализму, общественным организациям и процессам.

Особенностями шкалы Терстоуна являются равенство расстояний между единицами шкалы и одномерность, или однородность вопросов, суждений. В основе шкалы служат категориальные суждения, отобранные и классифицированные по результатам предварительного опроса экспертов. Задача экспертов - отсортировать суждения в определенном порядке в соответствии со степенью выраженности в них благожелательного или неблагожелательного отношения к определенному социальному объекту. Шкальное значение высказывания - медианное положение, приписанное группой экспертов. Таким образом, шкала типа терстоуновской представляет собой совокупность высказываний, которые равномерно распределены в континиуме установок. Утверждения в шкале также отбираются на основе их однозначности и их внутренней согласованности. Отвечающий на шкалы установок выбирает все утверждения, с которыми он согласен. Итоговый показатель - медианная шкальная оценка отмеченных высказываний. К недостаткам метода относят его громоздкость, высокую затратность, а также влияние установок эксперта при классификации суждений. Кроме того, в число дополнительных трудностей специалисты включают длительность процедуры с использованием данной шкалы. Тем не менее, шкала Терстоуна дает возможность довольно точно измерить отношение людей к тем или иным событиям и явлениям социальной жизни, исходя из конкретной ситуации.

Шкала суммарных оценок Р. Лайкерта. В 1932 году американский психолог Ренсис Лайкерт опубликовал статью «Техника измерения аттитюдов», в которой он предложил иные принципы построения шкалы и обработки полученных данных. Ученый назвал свою процедуру «шкалой суммарных оценок», что достаточно точно отражает общий принцип ее построения.

В противоположность процедуре равных расстояний высказывания отбираются не на суждениях группы экспертов, а на основе ответов испытуемых, которые предъявляются им в процессе разработки теста.

Выделение категорий высказываний осуществляется по степени их интенсивности. Критерием отбора суждений выступает внутренняя их согласованность (коэффициент корреляции с итоговым показателем), хотя иногда используется и внешний критерий - реальное поведение. Количество суждений, составляющих предварительную шкалу, относится к их числу в итоговой шкале как 4:1. Измерение установки предполагает оценку набора суждений по пятибалльной шкале, включающей пять категорий ответов: полностью согласен, согласен, не уверен, не согласен, полностью не согласен. Кроме пятибалльных используются также семи и девятибалльные шкалы. Достаточно часто данные, полученные с помощью лайкертовских шкал, редуцируют до номинального уровня, объединяя все ответы в две группы - «принимаю» или «отвергаю». Итоговый показатель - суммарная оценка по всем видам суждений интерпретируется в соответствии с установленными эмпирическими нормами.

В настоящее время шкала суммарных оценок Лайкерта является наиболее популярной методикой для измерения социальных установок. Ее преимущество состоит, прежде всего, в том, что она относительно надежна даже при небольшом количестве высказываний. Кроме того, шкалы типа лайкертовских не требуют больших трудовых и материальных затрат. Критикуют данную методику за то, что она обычно достигает лишь порядкового типа шкал, хотя процедура построения претендует на интервальную шкалу.

Шкала социальной дистанции Э. Богардуса. Шкалу социальной дистанции Богардуса часто правомерно называют первым инструментом, разработанным специально для измерения социальных установок и разного рода предубеждений, в первую очередь этнических и религиозных. Хотя в качестве официальной даты чаще фигурирует 1933 год, фактически шкала была создана в 1920-е годы, когда Эмори Богардус возглавлял национальное исследование по проблемам взаимоотношения между этническими группами, проживающими в Тихоокеанском регионе США.

С помощью и при активной поддержке Роберта Парка, Эмори Богардус разработал классическую методику, при помощи которой, как уже понятно из самого названия шкалы, можно измерить степень толерантности или интолерантности одной этнической группы по отношению к другой. Респондентам предлагается выразить свое согласие или несогласие с семью монотонными (кумулятивными) суждениями, относящимися к определенной социальной/этнической группе: от «желательно установление близкого родства путем брака» до «не должны проживать в моей стране». Предполагается, что эти суждения отражают соответствующие «социальные дистанции», желательные для респондента по отношению к типичным членам изучаемой группы, что психологическое расстояние между последовательными суждениями одинаково, и групповая оценка определяется как сумма или среднее по группе. Особенностью этой шкалы является то, что каждая оценка автоматически включает в себя все последующее и исключает все предыдущее.

Шкалограммный анализ Л. Гуттмана

Американский психолог Луи Гуттман в 1941 году предложил методику шкалограммного анализа. Цель Гутмана заключалась в построении гомогенных (однородных) шкал посредством кумулятивных высказываний. Он критиковал все существующие шкалы за их многомерность и отмечал, что если мы имеем ряд каких-то показателей, то в нем наблюдается определенная последовательность. Шкалограммный анализ Гуттмана предполагал такой порядок расположения пунктов по шкале, чтобы в зависимости от ответов все опрошенные могли быть размещены на ней в один ряд - «по ранжиру». Это означает, что балл установки респондента однозначно отображается на шкальном континууме. Все отвечающие положительно на данный вопрос размещаются в начале ряда, а отрицательно — в конце.

В основе шкалирования по Гуттману лежит схема ответов, допускающих следующие операции:

1. Балл установки респондента равен сумме положительных реакций (числу знаков +) на высказывание.

2. Балл установки позволяет воспроизвести реакции на отдельные суждения.

Годными для шкалирования признаются лишь те суждения, которые дают монотонную последовательность ответов.

В последние годы наблюдается падение популярности шкалы Гутмана, что связано, прежде всего, с тем, что очень сложно построить шкалу, содержащую более 5-6 позиций удовлетворяющую всем критериям кумулятивности шкалы Гуттмана. Шкалу также критикуют за относительную неустойчивость. Однако данной методике достаточно часто отдается предпочтение при разработке коротких опросников с хорошей дискриминационной способностью. Исследователи также отмечают, что шкала Гуттмана работает лучше всего с конструктами, которые иерархичны и высоко структурированы, например социальная дистанция.

Семантический дифференциал Ч. Осгуда

Ставшая уже классической, ассоциативная методика семантического дифференциала была разработана американским психологом Чарльзом Осгудом совместно с его коллегами Д. Суси и П. Танненбаумом в 1957 году. Этому предшествовало серьезное факторно-аналитическое кросс-культурное исследование, показавшее, что люди понимают или присваивают значение словам и понятиям в соответствии с тремя доминирующими аспектами - оценкой (хорошо-плохо), потенциальной силой (сильный-слабый), и активностью (активный- пассивный). Кроме того, было установлено, что сумма баллов по одному из трех аспектов высоко коррелирует с измерениями по двум другим аспектам. Основываясь на полученных результатах, ученые создали шкалу, с помощью которой стало возможным измерение аттитюдов исходя из того значения, которое человек придает слову или понятию, ассоциируя его при этом с объектом своей оценки.

Пары противоположных эмоционально-оценочных прилагательных располагают на числовой оси, в результате чего для каждой пары антонимов получают пяти- или семи- балльную шкалу. Оценки, данные по каждой шкале, переводятся в баллы. Далее вычисляется средняя оценка по всем шкалам семантического дифференциала. Она и является количественной характеристикой общего эмоционального отношения респондента к объекту установки. Отношение считается положительным, если средняя оценка также положительная; отношение рассматривается как отрицательное, если соответствующая средняя оценка отрицательная. Сила эмоционального отношения, соответственно, отражается в абсолютной величине полученной средней оценки.

Популярность методики семантического дифференциала заметно возросла в последние годы. Как считают специалисты, основным преимуществом данного измерительного инструмента является предоставляемая им возможность для измерения имплицитных аттитюдов. Кроме того, семантический дифференциал очень хорошо зарекомендовал себя при проведении кросс-культурных исследований. Методика также популярна в силу того, что она может быть достаточно легко модифицирована, и использование специально отобранных исследователем прилагательных позволяет разрабатывать целевые шкалы, ориентированные на конкретные группы респондентов.

Графические шкалы. Очень широко для измерения социальных установок применяются графические шкалы. Респондентам предлагается графическое изображение континуума, на котором они могут выбрать любую точку в качестве индикатора своей установки по отношению к какому-то объекту. Одним из вариантов подсчета баллов является измерение длины в миллиметрах от начала континуума до обозначенной точки.

Большой популярностью пользуются графические шкалы-рисунки, например, часто используются изображения лестницы-стремянки и термометра. Считается, что шкалы-рисунки обладают большим коммуникативным потенциалом.

К числу достоинств графических шкал относят то, что исследователь может выбрать любой интервал. Основным недостатком данного измерительного инструмента является отсутствие стандартных ответов.

Шкалирование на основе данной фиксированной суммы.

Респонденту предлагается определенная сумма баллов, например 100 баллов, которую он должен распределить между несколькими вариантами ответов в зависимости от своего предпочтения.

Эта методика, по мнению исследователей, лучше всего работает с респондентами, имеющими более высокий образовательный уровень. Кроме того, увеличение стимулов, между которыми распределяется фиксированная сумма, также может осложнять процедуру.

Измерение с использованием процедуры сортировки

Наиболее распространенная методика с использованием процедуры сортировки предусматривает простое подразделение карточек с написанными на них словами или же фотографий (часто и то и другое) на несколько подгрупп или классов.

Одной из наиболее востребованных на сегодняшний день методик для измерения аттитюдов является Тест Имплицитных Ассоциаций (IAT) - компьютерная методика, в основу которой также заложен принцип сортировки или классификации. Тест Имплицитных Ассоциаций (IAT) был разработан и впервые апробирован в 1998 году известным американским психологом Энтони Гринвальдом и его коллегами. Данная методика предназначена для измерения силы автоматических или имплицитных ассоциаций. Респондентам предлагается сортировать или классифицировать целевые концепты (в оригинальном исследовании Э. Гринберга это были «цветы» и «насекомые») и атрибутивные концепты - приятные и неприятные потенциальные дескрипторы целевых концептов. Так, например, в одном из вариантов Теста Имплицитных Ассоциаций, предназначенного для измерения этнических установок между белым и чернокожим населением США, респонденту предлагают классифицировать приятные слова («любовь» и пр.), неприятные слова («бомбы» и пр.), а также типичные характеристики (или фото- образы) афро-американцев и белого населения.

Классификация или сортировка осуществляется путем нажатия одной из двух клавиш, причем респонденты вынуждены в принудительном режиме ассоциировать сначала чернокожих и приятные слова (и, соответственно, белых и неприятные слова), а затем наоборот - чернокожих и неприятные слова (и, соответственно, белых и приятные слова). Так же принудительно они должны производить и категоризацию фотографий-образов. Кроме слов и фотографий-образов в подобных тестах очень часто используются символы конкретных стран. При измерении установок учитывается время с момента предъявления стимула до реакции путем нажатия клавиши и ошибки в отнесении слов или образов к определенному классу. Чем меньше времени нужно респонденту, чтобы соединить стимулы из одной целевой категории с позитивными дескрипторами и чем больше времени ему нужно, чтобы соединить стимулы из этой же категории с негативными дескрипторами, тем более позитивными являются его имплицитные установки по отношению к этой целевой категории по сравнению с установками к другой целевой категории.

Использование данной методики позволяет исследователю измерять имплицитные установки респондентов. Именно это считается основным достоинством Теста Имплицитных Ассоциаций [Olson, Fazio, in press].

Таким образом, методологический инструментарий, используемый в настоящее время для измерения аттитюдов или социальных установок, представлен аксиоматическими, психометрическими, психологическими и нереактивными методами. Выбор метода, прежде всего, зависит от целей и задач конкретного эмпирического исследования, а также характеристики респондентской группы. Достаточно часто исследователь не ограничивается одним лишь методом и применяет целый комплекс методик. В этой связи нельзя обойти вниманием публикацию известного индийского психолога М. Арула, который ставит под сомнение целесообразность множественного подхода при измерении установок. Ссылаясь на мнение своих коллег, ученый обращает внимание на то, что увеличение количества инструментов не гарантирует само по себе лучших и более точных результатов. Более того, если используемые измерительные инструменты окажутся не подходящими, то любое увеличение их количества автоматически приведет к увеличению ошибок при измерении установок.