Анализ эмпирических данных социологии
С формальной точки зрения при сравнении эмпирических данных должны соблюдаться следующие правила, необходимые в логике экспериментального анализа:
- два состояния одного процесса сопоставимы, если они содержат хотя бы одно общее свойство или показатель;
- ни один фактор не может быть признан причиной сравниваемых явлений, если в одном случае при регистрации изучаемого явления он имеет место, а в другом - нет (правило согласия Милля);
- вместе с тем данный фактор не может быть причиной изучаемого явления, если в одном случае (исследовании) он имеет место, а само явление не фиксируется, хотя в другом случае (исследовании) дело обстоит так, что регистрируются и явления, и данный фактор (правило различия);
- некий фактор (условие, обстоятельства) не может достоверно считаться определяющим в отношении изучаемого процесса, если в другом случае (в другом исследовании) наряду с ним изучаемому процессу сопутствуют другие факторы.
Эти логические правила, напоминающие о строгости экспериментального вывода, нельзя игнорировать. В зависимости от программных целей исследования анализ полученных данных может быть более или менее глубоким и основательным.
Цель исследования определяет уровень анализа в том смысле, что либо позволяет, либо запрещает прекратить его на какой-то стадии. В полном же объеме, т.е. от первого до последнего шага, последовательность действий социолога при анализе эмпирических данных может быть представлена следующим образом.
Первая стадия - описание всей совокупности данных в их простейшей форме. Предварительно осуществляется общий контроль качества полученной информации: выявляются ошибки и пропуски, допущенные при сборе данных и при вводе их в компьютер для обработки, бракуются какие-то «единицы» выборочной совокупности, не отвечающие модели выборки (коррекция выборки), отсеиваются некомпетентные респонденты (изымаются их данные полностью или частично), производятся другие контрольные действия, которые на социологическом жаргоне называют «чисткой массива». Дальше следует собственно описание: используется аппарат дескриптивной статистики для упорядочения всех данных по отдельным признакам (переменным). Изучаются простые распределения, выявляются аномалии и скошенности, рассчитываются показатели средней тенденции, вариации распределений. Все это необходимо для решения двух задач:
1) общей оценки выборочной совокупности и частных подвыборок (половозрастных, социально-профессиональных и других) с тем, чтобы понять, каким образом особенности выборок будут сказываться на интерпретации того или иного частного вывода и обобщающих заключений;
2) для того чтобы в последующих операциях с данными не утратить представления о составляющих более сложных зависимостей и комбинаций, которыми впоследствии будем оперировать [1, с. 358-387].
Например, в итоговых или промежуточных выводах находят, что такие-то условия деятельности или характеристики людей более важны, чем некоторые другие. Чтобы правильно интерпретировать это заключение, следует вспомнить, каковы основные характеристики выборки, нет ли в ней заметных аномалий. Очень возможно, что в общей выборке доминируют представители определенного социального статуса, возрастной когорты, национальной принадлежности и т.п. С этими их особенностями связаны социальные функции, интересы, образ жизни. В итоге может оказаться, что суммарные выводы неосновательны: они преимущественно объясняются спецификой доминирующей подвыборки обследованных. Чтобы проверить эту рабочую гипотезу, надо расчленить массив информации на соответствующие подвыборки и повторить анализ раздельно для каждой из них, включая доминирующую.
Так устанавливаются ограничения выводов. Обращение к «простой структуре» данных нужно и для того, чтобы при всевозможных комбинациях и сложных построениях не утратить представления об их первооснове. Вдруг «выскакивает» интереснейший факт, какие-то явления неожиданно тесно коррелируют. При попытке объяснить, что происходит, возможно было забыто, что сведения об этих явлениях получены по ответам респондентов на два вопроса одинаковой конструкции, соседствующих в анкете, и что это, видимо, следствие монотонного реагирования на похожие по форме вопросы – они подобны именно в силу психологического эффекта «эхо». Открытия не состоялось. Вторая стадия – «уплотнение» исходной информации, т.е. укрупнение шкал, формирование агрегированных признаков-индексов, выявление типических групп, жестких подвыборок общего массива и т.п.
Генеральная цель всех этих операций - сокращение числа признаков, нужных для итогового анализа. Одновременно достигается первичное обобщение данных, нужное для более глубокого понимания существа изучаемых процессов. Допустим, например, что при контент-анализе по смысловой единице «а» практически информации не было получено (2% всего массива сведений). Сохранив этот пункт, мы потом будем постоянно наталкиваться на нулевые значения. Если можно, целесообразно объединить данную смысловую единицу с подобной ей, укрупнить шкалу. Тогда следует дать уточненную интерпретацию нового признака, теперь достаточно емкого по статистике наполнения. Формирование сводных, агрегатных признаков освобождает от необходимости утомительно интерпретировать малосущественные частности, повышает уровень обобщений, ведет к более емким теоретическим умозаключениям. Одно дело, когда в прикладном – «инженерном» - исследовании анализируют соотносительное значение каждого из элементов производственной ситуации в его влиянии на отношение к работе. И совершенно иначе действуют, если задача состоит в обнаружении социальной закономерности при повторном сравнительном исследовании. Здесь важно обобщить информацию по более емким структурам, например, по всем факторам условий и всем составляющим содержания труда. Поскольку мы знаем частные составляющие того и другого, т.е. аккуратно прошли первый этап анализа, наши дальнейшие операции с данными будут более целеустремленными, экономичными и практичными с точки зрения приближения к основным целям исследования.
На данной стадии, в развитии которой осуществляется переход к анализу взаимосвязей (3-я стадия), будут использоваться довольно сильные операции - факторный анализ, типологизация и подобные им. Очень важно дать необходимые промежуточные истолкования каждого из агрегируемых показателей, ибо это - новые свойства, нуждающиеся в осмыслении, построении соответствующих интерпретационных схем. Как замечает Г. С. Батыгин: «с известной долей преувеличения всю деятельность социолога можно назвать интерпретирующей: случайно попавший в выборку человек интерпретируется как респондент; его жизненные реалии и высказывания интерпретируются в шифрах и «закрытиях» вопросников; первичная социологическая информация интерпретируется в средних величинах, мерах рассеяния и корреляционных коэффициентах; числовые данные должны сопровождаться какими-либо рассуждениями, т.е. опять же интерпретироваться» [8. с. 177]. Тем более нуждаются в построении интерпретационных схем новые емкие признаки, сгруппированные, типологизированные данные. Третья стадия анализа как бы вклинивается в предыдущую. Это - углубление интерпретации и переход к объяснению фактов путем выявления возможных прямых и косвенных влияний на агрегированные свойства, социальные типы, устойчивые образования. Здесь главная опасность - подмена косвенных, опосредованных связей прямыми. Такая ошибка - самая распространенная и менее всего заметная со стороны.
Итак, на данной, вероятно самой ответственной, стадии анализа должны быть получены основные выводы, проверены главные гипотезы, необходимые и для теоретического осмысления проблемы, и для разработки практических рекомендаций.
Четвертая стадия, заключительная, - попытка прогноза развития изучаемого процесса, событий, явлений при определенных условиях [3, 24-25, 212-214]. Лучшим образом решению этой задачи отвечает повторное обследование. При невозможности осуществить повторные исследования на базе разового используют модели мысленного экспериментирования, регрессионные, детермннационные, стохастические и др. Полезно прибегнуть к оценкам экспертов [5] в данном предмете, чтобы проверить надежность прогноза, являющегося результатом квазиэкспериментов.
Общая логика анализа эмпирических данных может быть иллюстрирована схемой 1.
Схема 1 - Последовательность стадий анализа данных
Стадии анализа | Исследовательские задачи данной стадии анализа | Основные приемы анализа |
1 | Выявление аномалий, ошибок и пропусков в исходных данных, коррекция выборки, описание простых распределений | Качественное осмысление сгруппированных данных; использование приемов описательной статистики; расчеты средних тенденций, вариаций, асимметрии |
2-3 | Уплотнение исходной информации и ее описание в зарегистрированных показателях с тем, чтобы избавиться от излишней детализации, избежать ошибок последующего анализа вследствие "провалов" в исходных распределениях, повысить уровень обобщения | Приемы укрупнения исходных шкал, логические комбинации частных признаков, построение индексов, эмпирическая и теоретическая типологизация, факторный анализ |
2-3 | Выявление прямых и косвенных связей, интерпретация и объяснение основных зависимостей и свойств изучаемых явлений, проверка, главных и второстепенных гипотез исследования | Построение двухмерных, многомерных таблиц, расчет корреляций, регрессий, энтропии и ассоциации распределений, использование корреляционных графов детерминационных моделей |
4 | Прогноз изучаемых процессов и явлений на основе объяснительных гипотез | Приемы мысленного и, если возможно, натурного экспериментирования, повторные и сравнительные исследования, контрольные опросы экспертов для проверки итоговых выводов, моделирование динамических процессов |
Не все элементы приведенной схемы должны быть реализованы в каждом исследовании, она иллюстрирует принципиальный порядок аналитических действий. Однако этот порядок остается мертвой конструкцией до тех пор, пока решительно все операции с данными, начиная с первичных измерений и формализации изучаемых объектов, не наполнены содержательным смыслом. Интерпретационная схема - единственное, что в конечном итоге обеспечивает убедительность и теоретико-практическую значимость результатов исследования. Основы интерпретации и объяснения заложены в исследовательской программе. Теперь основная задача, следуя программным целям, - дополнить и уточнить гипотезы, проверить их на материале полученных данных. «Как бы ни была полна и конкретна полученная информация, - пишет Г. С. Ботыгин, - она всегда помещается в определенную «систему координат» и выступает в качестве фрагмента более широкой картины, содержание которой - научный и жизненный опыт социолога» [8. с. 180-181].
Построение интерпретационных моделей - сугубо творческая, неформализуемая операция. Здесь лидируют знания, теоретическая подготовка, практический опыт, лексика, интуиция, гражданская ответственность исследователя. Мы можем заключить: «установлена такая-то связь или закономерность», но мы можем сказать, что подтверждены ранее установленные факты и найдено объяснение тому, что ранее казалось противоречивым; мы можем написать, что выявленные связи имеют место при определенных условиях и в определенной ситуации, а можем и не сделать такой оговорки; сошлемся на другие данные, подкрепляющие нашу объяснительную схему, либо умышленно или по незнанию игнорируем их; сформулируем социальную проблему или не обратим на нее внимания; призовем к действиям или ограничимся констатацией фактов.
В каждом из нюансов интерпретации и в итоговых объяснениях данных проявляется целостная личность исследователя. Он выступает не в роли узкого профессионала, функционирующей электронно-вычислительной машины, но как теоретик и практик, как ученый и гражданин, общекультурный кругозор которого сочетается с богатством ассоциаций и активной гражданской позицией.