Случайные и неслучайные выборки в социологии

Выборка называется случайной, если каждый человек (каждый представитель совокупности) имеет известную ненулевую вероятность быть отобранным. Корни этого определения лежат в теории вероятностей, которая обосновала выборочные методы исследования.

Именно на ее основе было строго доказано, что по ответам относительно небольшого числа людей можно с высокой точностью судить о мнении всех. Обязательным условием этого является случайный характер выборки. Чтобы отличать такие выборки от случайных в обыденном понимании, их еще называют вероятностными выборками.

Выборки, в которых невозможно вычислить вероятность отбора людей, не являются случайными. Математическая теория к ним неприменима. Существует большое многообразие неслучайных выборок, одним из представителей которых является квотная выборка. В реальных исследованиях применяется даже больше неслучайных выборок, чем случайных.

Простая случайная выборка.

Можно без особого труда создать случайную выборку, если в распоряжении исследователя имеется полный список всех людей, мнением которых он интересуется. Множество таких людей называется изучаемой совокупностью, или генеральной совокупностью. Создание списка представителей совокупности возможно, когда, например, планируется проведение опроса на предприятии, руководство которого готово предоставить полный список своих сотрудников. В этом случае надо сначала решить, сколько человек будет опрошено, то есть определить размер выборки (иногда говорят «объем выборки»), а затем последовательно отобрать из списка нужное число людей. Для отбора необходимо использовать случайный механизм, обеспечивающий любому человеку из списка равную вероятность попасть в выборку. Полученная таким способом выборка называется простой случайной.

В качестве случайного механизма для отбора с равной вероятностью используют таблицы случайных чисел или датчики случайных чисел.

Каждый человек в списке имеет свой порядковый номер: 1, 2,..., N, где N равно общему числу людей в списке. Таблица или датчик случайных чисел выдает с равной вероятностью номера в интервале от 1 до N. Люди с соответствующими порядковыми номерами включаются в выборку.

Если какой-либо порядковый номер выпал повторно, то его просто игнорируют, поскольку человек с этим номером уже есть в выборке и второй раз в отборе участвовать не должен. Такой способ отбора называют отбором без возвращения (по аналогии с вытягиванием жребия из шляпы, когда вытянутые листки с номерами обратно в шляпу не возвращают). Случайные числа получают до тех пор, пока не будет выбрано нужное количество людей.

Во многих программах, предназначенных для обработки результатов опросов, есть специальная команда для получения простой случайной выборки. Такая команда есть, например, в программе SPSS. Но и без специальной команды легко получить простую случайную выборку, если в программе имеется датчик случайных чисел. Достаточно рядом с каждым человеком из общего списка записать случайное число, полученное этим датчиком (например, случайное число, равномерно распределенное на отрезке от 0 до 1), а затем пересортировать людей из списка в порядке возрастания (или убывания) значений этих случайных чисел. Теперь, чтобы получить простую случайную выборку нужного размера n, достаточно взять первые n человек из списка, отсортированного в случайном порядке.

В простую случайную выборку всегда попадает ровно столько людей, сколько запланировал исследователь, потому что именно так устроен механизм отбора. Несложно показать, что при размере выборки n каждый из N людей, помещенных в список, имеет равную вероятность по пасть в выборку. Эта вероятность равна f = n/N.

Более того, в выборку могут попасть любые n человек из N, т. е. любая комбинация n людей из N возможна, и даже одинаково вероятна. В математике число различных комбинаций n элементов из N (без повторений) обозначается символом CnN и вычисляется по формуле:

Именно столько существует различных простых случайных выборок размера n. Все они одинаково вероятны.

Простая случайная выборка обладает несомненными достоинствами – такими, как простота реализации, хорошее воспроизведение структуры совокупности, возможность вычисления доверительных интервалов.

Недостатки простой случайной выборки: необходим список всех представителей совокупности; стоимость исследования велика из-за удаленности респондентов друг от друга; статистическая погрешность возникает по всем параметрам выборки, даже по тем, для которых известны истинные пропорции.

Для устранения перечисленных недостатков используются два специальных приема формирования выборки – стратификация и кластеризация.