Схемы отбора в выборку
Схема отбора в выборку — это детальное описание того, какие данные и каким способом будут получены. Есть много схем для отбора в выборку, поэтому нужно выбрать для исследований такую, которая даст наиболее репрезентативные результаты. Репрезентативность выборки — это соответствие характеристик выборки характеристикам популяции.
В идеале лучше работать со всей генеральной совокупностью, но это занимает много времени и ресурсов. Поэтому можно исследовать только ее часть, что и называется выборкой. Затем исследуются элементы, которые попали в выборку. На основе полученных значений оцениваются неизвестные элементы выборки.
Основные принципы отбора в выборку
Идея состоит в том, чтобы перенести результаты на всю генеральную совокупность. Поэтому выборка должна быть репрезентативной. Другими словами она пропорциональна как подгруппам, так и всей совокупности, и не исключает каких-либо отдельных групп.
Выборка должна быть настолько большой, насколько это возможно, чтобы избежать ошибочных суждений. По сути выборкой может быть любое подмножество генеральной совокупности.
Если выборка недостаточно репрезентативна — исследование будет считаться предвзятым. Если она будет недостаточно большой — неточным.
Если правильно подобрать связь между выборкой и совокупностью, тогда можно сделать правильные заключения о природе всей совокупности. Лучше быть возможно правым, чем точно не правым.
Схемы отбора для вероятностных выборок
Вероятностные выборки подразумевают, что исследователь абсолютно уверен в связях выборки с генеральной совокупностью. Если же связи не прослеживаются или в наличии имеются не все элементы генеральной совокупности используется невероятностная выборка.
На основе жеребьевки
Схема отбора состоит в том, чтобы провести ряд испытаний без возвращения элемента в генеральную совокупность. Каждый элемент совокупности имеет одинаковые шансы попасть в выборку.
Из генеральной совокупности N случайным образом отбирается один элемент, вероятность попадания элемента в выборку равна 1/N. Затем из выборки N-1 выбирается второй элемент с вероятностью 1/(N-1) и так далее до n-го элемента с вероятностью 1/(N-n).
Выборка эмпирического исследования
Выборка в дипломной работе по психологии – это испытуемые или респонденты, которые приняли участие в эмпирическом исследовании.
Если говорить более строго, научно, то выборка – это какая-то часть некоторой большой группы (генеральной совокупности), которая отражает ее свойства. В этом случае говорят, что выборка репрезентативна. И поэтому полученные на выборке результаты распространяют на всю генеральную совокупность.
Существуют разнообразные процедуры формирования репрезентативной выборки: простой случайный отбор, стратифицированный случайный отбор и др. Они описываются в книгах по экспериментальной психологии и математической статистике. Выполнение этих процедур важно при проведении серьезных психологических исследований. В практике написания курсовых, дипломных и магистерских работ в современных российских ВУЗзах репрезентативность выборки, как правило, не оговаривается и специальные процедуры не применяются. При этом по умолчанию предполагается, что выборка репрезентативна.
Например, вы исследовали взаимосвязь тревожности женщин и срока их беременности. Вы взяли в качестве испытуемых своих знакомых. Получили результат, что чем выше срок, тем выше тревожность. На защите можно смело говорить о том, что «выявлена положительная взаимосвязь тревожности и срока беременности у женщин среднего возраста». То есть, вы смело распространяете полученный на маленькой группе результат на всех женщин. Хотя, строго говоря, не известно, была ли ваша выборка репрезентативна группе всех беременных женщин среднего возраста в нашей стране.
Очень часто именно выборкой определяется тема исследования. Преподаватели часто расспрашивают студента-психолога об обстоятельствах его жизни (где работает и т.п.). На основании этой информации и делается вывод, на какой выборке удобнее провести исследование.
Например, если вы – педагог, то в качестве выборки могут выступить учащиеся. Сотруднику организации научный руководитель может предложить взять в качестве испытуемых его коллег-сотрудников. Домохозяйка может выбрать в качестве респондентов своих знакомых женщин. Часто студенты берут в качестве выборки тоже студентов и проводят эмпирическое исследование на своих сокурсниках.
В связи с формированием экспериментальной выборки при написании выпускной работы по психологии у студентов могут возникнуть следующие вопросы:
Объем (численность) выборки
Иногда преподаватели уверенно говорят студентам, что результаты их исследования будут недостоверны, если объем выборки будет меньше 30, 50, 70, 100 человек и т.д. Строго говоря, это не корректное утверждение. В данном случае важно понимать, что во всех статистических расчетах действует такое правило: чем меньше объем выборки, тем жестче критерии, при которых результат статистического расчёта считается достоверным.
Например, вы проводите анализ взаимосвязей показателей агрессивности и тревожности младших школьников в группе из 30 человек. Если принять достаточным уровень статистической значимости в 0,05 (5%), то значимыми будут коэффициенты корреляции больше либо равные 0,36. А ваш коллега – студент-психолог – проводит анализ взаимосвязей карьерных ориентаций и стажа сотрудников организации в группе из 10 человек. В его случае значимыми будут считаться коэффициенты ранговой корреляции не ниже 0,64 при том же уровне значимости.
Итак, статистически достоверные результаты эмпирического исследования можно получить на любой выборке (от 10 человек). При этом чем меньше экспериментальная выборка, тем жестче критерии статистической достоверности полученных на ней результатов.
Однако, чем меньше выборка, тем в меньшей степени она отражает генеральную совокупность, тем заметнее в ней влияние отдельных результатов на общий показатель. То есть, формально можно брать выборку в 10 человек, но практически в эмпирическом исследовании этого недостаточно.
Строгих правил по численности выборки для получения статистически достоверных результатов психологического исследования нет, но есть следующие рекомендации:
Есть одна вполне невинная хитрость, позволяющая увеличить численность экспериментальной выборки. Например, если в ВУЗе требуют большие выборки (80-100 человек), а набрать столько испытуемых проблематично, можно сделать следующее. Реальное эмпирическое исследование провести на небольшой выборке, например, 20 человек. А далее увеличить объем выборки в кратное количество раз (2, 3, 4 и т.д.), то есть получить выборку в 40, 60, 80 человек и т.д. Такая процедура существенно не повлияет на результат. В этом случае станут более мягкими критерии значимости статистических критериев (см. выше правило соотношения объема выборки и жесткости критериев статистической значимости результатов).
Например, вы пишете дипломную работу на тему «Исследование взаимосвязи ощущения одиночества и субъективного благополучия у женщин среднего возраста, занимающих руководящие должности». Руководитель потребовала, чтобы выборка была не меньше 60 человек. Вы резво взялись за дело. Но вскоре выяснилось, что найти женщин-руководителей среднего возраста, готовых участвовать в тестировании, не так просто. Вы протестировали 15 человек и больше найти не можете. Что делать?
Берете данные по этим 15 испытуемым в сводной таблице результатов и копируете 4 раза. Получается выборка из 60 человек. Главное, что взаимосвязи, которые вы выявите на этой увеличенной выборке, будут отражать реальные корреляции ощущения одиночества и субъективного благополучия в исходной выборке из 15 человек. Изменения будут незначительны – станут значимыми некоторые корреляции, которые в выборке из 15 женщин были не значимы.
Характеристики выборки
При описании выборки в дипломной работе по психологии указываются социально-демографические характеристики испытуемых: пол, возраст, образование, семейный статус, профессия и пр.
Существует множество характеристик, которые можно указать при описании выборки. Какие включить в описание, а какие – нет?
Строго говоря, нужно указывать характеристики выборки, которые имеют отношение к сути исследования. Например, если сравниваем женщин-руководителей и простых сотрудниц, то важно при описании выборки указать профессиональный статус.
При описании выборки всегда указывают пол, возраст и образование (для взрослых испытуемых). Остальные характеристики указывают по необходимости, если они важны. Например, при исследовании корпоративной культуры сотрудников организации вряд ли необходимо указывать их семейный статус, так как он имеет очень отдаленное отношение к теме исследования.
Некоторые научные руководители требуют описывать выборку с указанием максимального количества характеристик.
Контрольная и экспериментальная группы
В каких случаях в дипломной работе по психологии возникает необходимость введения экспериментальной и контрольной групп? Если тема ВКР связана с выявлением индивидуально-психологических различий испытуемых, имеющих какую-то особенность и не имеющих ее. Например, в качестве таких особенностей могут быть:
Смысл эмпирического исследования с экспериментальной и контрольной группой состоит в том, что различия психологических показателей, выявленные между этими группами, укажут на влияние критерия разделения на личность человека. Например, если лица с заболеванием окажутся более тревожны, чем без заболевания, то можно будет сделать вывод о том, что данная болезнь ведет к росту тревожности или что повышенная тревожность выступает одной из причин данной болезни. Или если окажется, что у семейных выше осмысленность жизни, то вывод будет в том, что семья повышает осмысленность жизни. И, наконец, если выяснится, что у пожарных выше выраженность психологического стресса, то сделаем вывод о том, что работа в МЧС создает предпосылки развития стресса.
Так вот, чтобы выводы о влиянии критерия разделения на группы на выраженность тех или иных психологических показателей были обоснованы, между экспериментальной и контрольной группами не должно быть никаких других различий, кроме того, которое выбрано. Например, состоящие и не состоящие в браке испытуемые не должны различаться ни по каким другим характеристикам. То есть, у них должны быть примерно одинаковые возраст, социальный статус и пр. Только в этом случае можно будет сказать, что выявленный более высокий уровень осмысленности жизни у семейных по сравнению с не состоящими в браке связан именно с тем, что у представителей экспериментальной группы есть семья.
Если экспериментальная и контрольная группа не выровнены по другим социально-демографическим показателям, то, возможно, на осмысленность жизни повлиял какой-то другой фактор. Например, если состоящие в браке работают дизайнерами, а не состоящие в браке – безработные, то различия в уровне осмысленности жизни могут быть связаны не с наличием супруга, а с наличием интересной работы.
Естественно, невозможно выровнять экспериментальную и контрольную группу по всем социально-демографическим показателям. Нужно ограничиться некоторыми ключевыми: возраст, образование, социальный и семейный статус.
Существует устойчивый миф, что для корректной статистической обработки результатов численность выборки в контрольной и экспериментальной группе должна быть одинаковой. В моей практике были случаи, когда научные руководители требовали выравнивать численность испытуемых в контрольной и экспериментальной группе, когда исследование было уже проведено. Такие требования указывают на непонимание сущности статистических расчётов, которые имеют дело с усредненными величинами. А среднее значение величины в группе (среднее арифметическое) не зависит от численности группы, так как при его расчете сумма показателей всех участников группы делится на число человек.
Пример описания экспериментальной и контрольной групп:
Характеристика выборки. В исследовании приняли участие 50 подростков, разделенных на две группы:
Надеюсь, эта статья поможет вам самостоятельно написать диплом по психологии. Если возникнет необходимость, обращайтесь (все виды работ по психологии; статистические расчеты). Заказать
Выборка в социологическом исследовании или как получать достоверную информацию быстро и надежно (часть 2)
Авторы статьи — А.М. Степанов, социолог отдела аналитических и социологических исследований, М.В. Иванов, начальник отдела аналитических и социологических исследований МАУ «ИРСИ».
Параметры расчета выборочной совокупности
Вне зависимости от метода расчета выборки нужно помнить о ключевых параметрах, влияющих на объем выборочной совокупности. Таких параметров мы выделим три – это общий объём, однородность и абсолютная ошибка.
Общий объем генеральной совокупности. Чем больше изучаемая генеральная совокупность, тем больший объем выборки нам может понадобиться для репрезентативного исследования. Однако это утверждение касается лишь определенного числового диапазона! Увеличение выборки идет не пропорционально увеличению генеральной совокупности. Ведь если речь пойдет о генеральной совокупности как о малочисленной величине, исчисляемой десятками и сотнями единиц, то целесообразно предположить, что чем больше будет объем выборки, тем точнее данные. В идеале можно и нужно стремиться, чтобы в таком случае выборка составляла не менее 50%, а то и 2/3 изучаемой генеральной совокупности. Если же (а чаще всего это так и есть) мы имеем дело с генеральными совокупностями, исчисляемыми десятками, сотнями тысяч и миллионами (например, население крупного города, региона, страны), то, конечно же, мы не будем опрашивать ни 50%, ни 25%, ни 10%. Нам понадобится значительно меньшее число участников опроса (респондентов). Стоит отметить, что при сравнении выборки при объеме генеральной совокупности в 100 тысяч и 1 миллион человек, разница в объеме выборки может составить всего несколько десятков респондентов (см. таблицу).
+ В этих случаях достаточным будет более 50% от объема выборки.
Источник: Мангейм Дж.Б., Рич Р.К. Политология: Методы исследования. – М., 1997. С.517.
Однородность генеральной совокупности. В данном случае речь идёт об однородности признаков у единиц генеральной совокупности. То есть чем более схожи между собой единицы генеральной совокупности, тем меньше потребуется объем выборки для представления репрезентативных результатов исследования. Причем под однородностью рассматриваемых признаков мы можем понимать и социально-демографические характеристики (пол, возраст, уровень образования, район проживания, социальное положение), ценностные и социально-политические ориентации, культурно-языковые различия, материальный достаток и т.д.
Размер ошибки (погрешности) выборки. Задачи и характер исследования определяют допустимый размер погрешности полученных данных. Самым оптимальным и часто используемым вариантом при расчете выборки является ошибка в 5%, она позволяет получить данные с высокой степенью репрезентативности и при этом не затратить много ресурсов на опрос излишнего числа респондентов. Для прикладного исследования нормальной будет выборка с ошибкой 4–5%. Ошибка выборки, рассчитываемой ВЦИОМ, ФОМ (для федеральных исследований), находится на уровне не ниже 2,5%. Стандартные выборки МАУ ИРСИ по г. Ярославлю обеспечивает ошибку выборки в диапазоне от 3,6 до 4,8%. Если говорить простым языком о том, что собой представляет ошибка выборки в 5%, то можно представить, что в случае проведения 100 одинаковых исследований по одной и той же теме и с одинаковым объемом выборки в 95 случаях из 100 результаты исследования будут совпадать с мнением всей генеральной совокупности. Однако в определенных случаях требуется снижение ошибки выборки, которое чаще всего производится посредством наращивания объема выборочной совокупности.
В зависимости от имеющихся ресурсов и задач исследования для формирования выборки существует несколько способов. В первую очередь нужно понимать, что отбор единиц в выборочную совокупность может происходить как случайным образом, так и неслучайным. Случайной или вероятностной выборкой можно назвать только ту выборочную совокупность, в которой соблюдается принцип равной вероятности для каждой единицы генеральной совокупности попасть в выборку. Такой способ формирования выборки наиболее актуален для небольшого объема генеральной совокупности, поскольку при изучении больших групп принцип равной вероятности для всех элементов генеральной совокупности соблюсти крайне затруднительно или нецелесообразно, с точки зрения высоких затрат ресурсов. Для соблюдения принципа равной вероятности случайной выборки зачастую используют механический отбор, такой отбор возможен только при наличии полного списка единиц генеральной совокупности, которые можно упорядочить по определенному признаку. В рамках механического отбора из списка выбирается случайным образом первый элемент, который служит отправной точкой, и каждый последующий выбирается через определенный шаг. Размер шага определяется частным размера генеральной совокупности и размера предполагаемой выборки K(шаг) = N(генеральная совокупность)/n(выборочная совокупность).
Другим способом для соблюдения принципа случайности в выборке может быть стратифицированный (районированный) отбор. Данный метод полезен в случае неоднородной генеральной совокупности и подразумевает разделение единиц генеральной совокупности, на более мелкие группы по определенным признакам. Внутри каждой выделенной группы производится отбор единиц в выборочную совокупность случайным образом или при помощи механического отбора. Наиболее корректно использовать этот метод в том случае, когда в результате разделения на группы по выбранным признакам внутри каждой группы образуется небольшое количество единиц, или когда существует полный список единиц каждой выделенной группы, что позволяет в дальнейшем отборе соблюсти принцип равной возможности для каждой единицы попасть в выборку.
Кластерный (гнездовой) отбор является еще одним методом при формировании случайной выборки, в рамках данного метода производиться случайным образом отбор целых групп (кластеров) из генеральной совокупности. Впоследствии производится отбор единиц из кластеров в выборочную совокупность, в зависимости от объема кластера это могут быть как и все единицы кластера, так и часть из них, отобранная случайным образом. Например, в случае отбора по территориальному признаку кластером могут служить населенные пункты, отобранные в случайном порядке. В зависимости от количества населения производится опрос всех жителей или только жителей, отобранных случайным образом. При наличии полного списка единиц в каждом кластере возможен отбор единиц с применением механического отбора.
В исследованиях, где в качестве генеральной совокупности выступают тысячи или даже миллионы людей, наиболее удобно использовать выборки с неслучайным отбором, где отбор производится по заранее заготовленной схеме или стихийным образом. Стихийная выборка подразумевает опрос по принципу «всех подряд» из наиболее доступных респондентов. Здесь, как правило, производится опрос наиболее удобных для интервьюера респондентов. Зачастую стихийная выборка страдает слабой репрезентативностью по причине несоответствия некоторых признаков выборочной совокупности признакам генеральной. Происходит это вследствие упущения в ходе исследования некоторых значимых категорий респондентов, которые являются труднодоступными для интервьюера. Поэтому данный способ формирования выборки может использоваться в условиях ограниченности ресурсов.
Наиболее предпочтительным выглядит вариант с использованием квотной выборки. Суть данного метода сводится к тому, чтобы выделить несколько интересующих социальных групп по признакам, обусловленным задачами исследования. Далее необходимо рассчитать объем респондентов для опроса в каждой группе, то есть объем квоты для каждой группы, руководствуясь сохранением пропорций признаков генеральной совокупности в выборке. На примере гендерной характеристики можем представить, что если в генеральной совокупности соотношение женщин и мужчин 55% на 45%, то именно такое же соотношение женщин и мужчин должно быть в рамках выборочной совокупности.
Аналогичным образом составляются квоты и по другим признакам. Целью данного подхода является максимальное повторение в рамках выборки свойств и особенностей генеральной совокупности. Иногда для упрощения поиска респондентов, подходящих под критерии отбора, может использоваться метод «снежного кома». Особенность «снежного кома» во многом объясняется названием метода и подразумевает поиск контактов подходящих для опроса людей у респондентов, уже участвовавших в опросе. Как правило, это выглядит следующим образом: по завершении опроса интервьюер интересуется у респондента, нет ли среди его друзей и знакомых, подходящих под параметры исследования, и просит дать контакты подходящих людей. Данная процедура повторяется до тех пор, пока не будет опрошено необходимое количество респондентов. Основной минус данного метода отбора респондентов заключается в предъявлении высоких требований к коммуникативным навыкам интервьюеров, поскольку контакты родственников и друзей являются персональными данными, и многие респонденты отказываются их давать, особенно если интервьюеру не удается расположить собеседника к себе.
Еще одним методом отбора для построения неслучайной выборки является метод основного массива, который подразумевает отбор единиц, имеющих наибольшую удельную значимость, по мнению исследователя; и если существует возможность, то отбирается абсолютное большинство единиц из генеральной совокупности. Данный метод может быть полезен, когда объектом для изучения являются узкая категория людей, специалисты той или иной отрасли. В случае необходимости проведения опроса, например среди медработников в регионе, отбирается несколько наиболее крупных медицинских учреждений как имеющих наибольший вес, и проводится опрос медработников данных учреждений. Но если количество медучреждений не столь велико, и возможен охват абсолютного большинства медработников, то проводится опрос более 50% медицинских работников региона.
Существует еще несколько вариантов составления выборочной совокупности, некоторые методы являются комбинированием уже перечисленных, но хотелось бы рассмотреть применение наиболее оптимальных методов построения выборки на примере населения г. Ярославля. Золотым стандартом, на наш взгляд, при проведении исследования, где в качестве генеральной совокупности выступают все жители Ярославля, является применение квотной выборки. Мы используем при расчете квот трехмерное распределение, а именно распределение по половому признаку, возрасту и району проживания, что позволяет в рамках выборочной совокупности повторить пропорции генеральной совокупности по указанным признакам. Такой подход позволяет учесть мнение всех категорий жителей Ярославля: мужчин и женщин, молодежи, работающего населения, пенсионеров, жителей всех районов города. При этом сохраняется удельная значимость каждой из указанных категорий так же, как в генеральной совокупности. Как это выглядит? Например, если в Ярославле в Дзержинском районе проживает гораздо больше жителей города, чем в Кировском районе города, то мнение жителей Дзержинского района имеют гораздо большее влияние на формирование мнения всего населения города, чем мнение жителей Кировского района. Наша задача состоит в том, чтобы сохранить подобную пропорциональность генеральной совокупности в рамках выборки. Если говорить о конкретных цифрах, то для репрезентативных результатов мнения жителей города с населением более чем 600 тыс. при использовании квотной выборки и соблюдением ошибки не более 5% достаточно опросить 400 человек. В случае, когда проблема исследования носит более дифференцированный характер, и предполагается, что данная проблема может затрагивать различные категории жителей по-разному, целесообразно расширить объем выборки до 500-600 человек.
В случае, когда проблема исследования носит общий или даже глобальный характер, и предполагается, что дифференциация по полу и возрасту, району проживания вряд ли может серьезно оказывать влияние на мнение респондента, может использоваться метод стихийной выборки. Метод стихийного отбора позволяет существенно сократить время и ресурсы на проведение исследования, однако в таком случае рекомендуется расширить объем выборки до 600, а в некоторых случаях до 750 или даже 1000 человек, чтобы минимизировать вероятность потери какой-либо категории респондентов в процессе проведения опроса.
Использование случайных методов формирования выборки для проведения опроса среди населения достаточно крупного города выглядит нерационально и порой даже нереалистично. Ведь жители Ярославля в качестве генеральной совокупности есть величина непостоянная, поскольку ежедневно жители города как приезжают, так и покидают город, и в таких условия обеспечить принцип равного шанса попадания в выборку для всех жителей Ярославля проблематично. Использование механического отбора требует полного списка всех жителей Ярославля с контактными данными, получение которого не представляется возможным в силу федерального закона «О персональных данных», а также выглядит нецелесообразным ввиду высокой трудоемкости процесса и больших временных затрат на построение выборки.
Подводя итог, хочется сказать о том, что грамотно составленная выборка на сегодняшний день — это ключ к оперативному получению достоверной и актуальной информации, которая поможет в принятии правильных управленческих решений. Главное достоинство использования выборки — это, конечно же, экономия времени и трудовых ресурсов. Получаемая информация с течением времени и в зависимости от происходящих процессов в обществе может быстро терять актуальность и уже не отражать полной картины социальной реальности, что в свою очередь может повлечь принятие ошибочных решений. Отсюда можно сделать вывод о том, что исследование, задачей которого является получение объективной информации о текущем положении дел, проведенное в кротчайшие сроки с использованием грамотно составленной выборки, даст более актуальную информацию и объективную картину, чем исследование с большим охватом опроса в 6, 10, 15 и более тысяч человек. Исследование с бОльшим охватом респондентов требует бОльшего времени для проведения опроса, за этот период положение дел может значительно измениться, и ответы, полученные в начале исследования, могут к его окончанию стать устаревшими и неактуальными; как итог — будет потерян весь смысл такого исследования. Желаете получить достоверную, актуальную и надежную информацию по вашей проблеме в результате проведения социологического исследования? Специалисты МАУ ИРСИ помогут вам в этом!