Кластерная выборка
кластерная выборка

Кластерная выборка - метод выборки, который используется, когда «естественные», но разнородные группировки проявляются в статистической совокупности. Такая выборка часто используется в маркетинговых исследованиях. Эта техника разделяет общее количество на группы (или кластеры) и с помощью случайной выборки выбираются элементы из группы. Затем элементы в каждой группе сравниваются. Когда все элементы, отобранные к своему кластера, то это называется «одноступенчатый» дизайн кластера. При случайном сравнении элементов, выбранных из каждой из этих групп - «двухступенчатый» дизайн. Общая мотивация для кластерной выборки является сокращение общего числа бесед и расходов с учетом требуемой точности. При фиксированном объеме выборки, методика дает более точные результаты, когда большая часть изменчивости в популяции находится в пределах групп, а не между ними.

Кластерные элементы

Численность в рамках кластера в идеале должны быть как можно более разнородными, но там должны быть однородны между средними значениями кластера. Каждый кластер должен быть небольшим представительством всего населения. Кластеры должны быть взаимоисключающими и совместно исчерпывающими. Затем методом случайной выборки выбирается из соответствующих кластеры для включения в исследование. В одноступенчатых кластерной выборке используются все элементы из каждого выбранного кластера. В двухступенчатой ​​кластерной выборке метод случайной выборки применяется к элементам с каждого выбранного кластера.

Основное различие между кластерной и стратифицированной выборками является то, что кластер рассматривается в качестве единицы выборки, поэтому анализ проводится в совокупности кластеров (по крайней мере, на первом этапе). В стратифицированной выборке анализ элементов делается внутри слоев. К тому же берется случайная выборка из каждой страты, в то время как в кластерной выборке изучаются только некоторые кластеры. Основная цель кластерной выборки - сокращение расходов за счет повышения эффективности выборки. Это контрастирует с стратифицированной выборке, где основной задачей является повышение точности.

Также существует многоступенчатая выборка, здесь более двух шагов при выборе кластеров.

Аспекты кластерной выборки

Одной версии кластерной выборки является площадь отбора проб или географической кластерной выборки. Кластеры состоят из географических районов, так как географически рассредоточены популяции могут быть дорогими для опроса, более экономные, чем случайная выборка могут быть достигнуты путем обработки нескольких респондентов в местной зоне, как кластер. Для этого, как правило, необходимо увеличить объем выборки для достижения эквивалентной точности оценок, но экономия может сделать это возможным.

В некоторых ситуациях, кластерный анализ имеет смысл, только если кластеры примерно одинакового размера. Это может быть достигнуто путем объединения кластеров. Если это невозможно, вероятность пропорциональна выборке размера. В этом методе вероятность выбора любого кластера зависит от размера кластера, давая более крупным кластерам большую вероятность отбора и небольшим кластерам меньшую вероятность. Однако, если кластеры выбираются с вероятностью, пропорциональной размеру, такое же количество опросов должна быть проведена в каждой выборке кластера, таким образом, что каждая единица выборки имеет одинаковую вероятность отбора.

Кластерная выборка используется для оценки высокой смертности в случаях, таких как войны, голод и стихийные бедствия.

Преимущества

  • Может быть дешевле других методов - например, меньше транспортные расходы, административные расходы.
  • Обоснование: этот метод требует больших популяций во внимание, поскольку эти группы настолько велики, что развернуть любую другую технику будет очень сложно. Это возможно только тогда, когда вы имеете дело с большим населением.
  • Экономика: обычные две основные проблемы расходов, такие как путешествия и листинг, значительно снижаются с помощью этого метода. Например: Составление научно-исследовательской информации о каждом дом, который в этом городе, будет очень сложным, в то время как сбор информации о различных кварталах города будет легче, так как усилия будут значительно сокращены.
  • Снижение изменчивости: когда оценки не рассматривается каким-либо другим способом, снижение вариабельности в результатах не наблюдается.

Недостатки

  • Погрешность выборки, которая может быть выражена в так называемый «эффект дизайна», соотношение между количеством субъектов исследования кластера и количества предметов столь же надежны, как и в случайной выборке вне исследованных кластеров.
  • Смещена выборка: если группа населения, которая выбрана в качестве образца, имеет необъективное мнение, то все население определяется как имеющее такую ​​же мнения. Это не может быть реальный случай.

Ошибки: другие вероятностные методы дают меньше ошибок, чем этот метод. По этой причине, он и не рекомендуется для начинающих.

Подробнее о кластерную выборку

Двухступенчатая кластерная выборка

Двухступенчатая кластерная выборка - это простой случай многоступенчатого отбора, который получают путем отбора пробы кластера на первом этапе, а затем образец элемента из каждой пробы кластера отдельно. Рассмотрим популяции из N кластеров в целом. На первой стадии, N кластеры выбираются с помощью обычного кластерного метода - отбора проб. На втором этапе, обычно случайная выборка используется. Она используется отдельно в каждом кластере и число элементов, выбранных из различных кластеров не обязательно уровне. Общее количество кластеров, N-количество кластеров, выделенных N и число элементов из отдельных кластеров должны быть предварительно определены с помощью конструктора опросов. Двухступенчатая кластерная выборка направлена ​​на минимизацию затрат на исследования и в то же время контроль неопределенностей, связанных с оценками исследований. Этот метод может быть использован в медицинских и социальных науках. Например, исследователи использовали двухступенчатую кластерную выборку для формирования репрезентативной выборки населения Ирака для проведения обследований смертности. Для отбора проб этот метод может быть быстрее и надежнее, чем другие методы, поэтому сейчас этот метод часто используется.