Выборка

Процедура выборки

Формирование выборки первичных выборочных единиц (счетных участков) и домохозяйств осуществляется на основе случайного отбора.

При построении выборочной совокупности используется многофазная выборка с реализацией на последней фазе двухступенчатого отбора (I ступень – случайное построение выборки счетных участков; II ступень – случайный отбор домохозяйств в рамках счетного участка, включенного в выборку на первой ступени).

Применение многофазной выборки обусловлено необходимостью построения на массиве данных базового подмассива информационного массива Всероссийской переписи населения 2020 года множества выборок разного размера, охвата и назначения с непересекающимися элементами.Построение каждой из фаз осуществляется на основе применения схемы случайного отбора (за единицу отбора на каждой фазе принимается счетный участок).

При формировании выборки домохозяйств используется случайный систематический отбор. Элементами основы выборки являются присвоенные домохозяйствам порядковые номера в рамках жилых помещений, входящих в состав счетного участка. Порядковые номера домохозяйств взаимосвязаны с номером жилого помещения и их номерами в рамках жилого помещения. Принятая модель формирования выборки домохозяйств обеспечивает включение в ее состав только одного домохозяйства независимо от количества домохозяйств, проживающих в жилом помещении.

Адресная часть домохозяйства определяется на региональном уровне с помощью Подсистемы «Демография» АС ВПН ИВС Росстата.

В рамках каждого счетного участка отбору подлежат 24 домашних хозяйства (с учетом резерва отбирается 48 домохозяйств), как по городской, так и по сельской местности.

При формировании итогов наблюдения его результаты распространяются на все частные домохозяйства и на все население, проживающее в них.

Процедура распределения общего объема выборки по субъектам Российской Федерации, отдельно по городскому и сельскому населению

В рамках системы федеральных статистических наблюдений по социально-демографическим проблемам определение общего объема выборки в целом по Российской Федерации базируется на знании общего объема выборки домохозяйств, которая установлена постановлением Правительства Российской Федерации от 27 ноября 2010 г. № 946 для каждого из выборочных наблюдений, входящих в общую систему, исходя из имеющихся финансовых ресурсов.

Для определения общего объема выборки первичных выборочных единиц (ПВЕ), т.е. количества отбираемых счетных участков Всероссийской переписи населения (ВПН) в целом по Российской Федерации, при заранее установленном объеме выборки домохозяйств, достаточно знать число домохозяйств, подлежащих отбору в рамках ПВЕ, отдельно по городскому и сельскому населению, т.е. установленную Основными методологическими и организационными положениями соответствующего выборочного наблюдения нагрузку на интервьюера по числу домохозяйств как по городскому, так и по сельскому населению.

Знание общей величины объема выборки ПВЕ (т.е. в целом по Российской Федерации) позволяет определить его значение по субъектам Российской Федерации, отдельно по городскому и сельскому населению (т.е. в рамках аналитических областей разного уровня).

Для распределения объема выборочного массива ПВЕ в субъектах Российской Федерации, отдельно по городскому и сельскому населению, применена комбинированная модель размещения объема выборки по аналитическим областям разного размера и уровня, основанная на сочетании моделей пропорционального размещения и непропорционального размещения (стандартной модели Л.Киша).

Использование комбинированной модели при размещении общего объема выборки, как показали результаты исследований, позволяет:

во-первых, сглаживать недостатки первых двух моделей размещения общего объема выборки (при реализации модели пропорционального размещения крупные аналитические области (субъекты Российской Федерации) аккумулируют в себе наибольшую долю общего объема выборки, а применение модели непропорционального размещения приводит к получению заметно завышенных объемов выборки по аналитическим областям небольшого размера);

во-вторых, нивелировать влияние на величину размещенного объема выборки как высоких, так и низких размеров аналитических областей.

В практическом плане распределение общего объема выборки ПВЕ по всем субъектам Российской Федерации, отдельно по городскому и сельскому населению, сводятся поэтапно к следующему:

Этап 1.Определяется общее количество ПВЕ (n), подлежащих распределению по субъектам Российской Федерации, посредством деления установленного общего объема выборки домохозяйств (т.е. в целом по России) на число домохозяйств, подлежащих отбору в рамках ПВЕ (счетного участка).

Этап 2. Производится размещение общего объема выборки ПВЕ по всем субъектам Российской Федерации. При этом определено, что показателем, на основе которого производится данное размещение, является распределение количества частных домашних хозяйств, согласно данным ВПН.

Этап 3. Строится ряд распределения с применением модели пропорционального размещения. Дробные значения округляются по стандартным процедурам округления и проверяется равенство общего объема выборки ПВЕ сумме объемов выборки ПВЕ по всем аналитическим областям.

Этап 4. Строится ряд распределения с применением модели непропорционального размещения (стандартной модели Л.Киша). Дробные значения округляются по стандартным процедурам округления и проверяется равенство общего объема выборки ПВЕ сумме объемов выборки ПВЕ по всем аналитическим областям.

Этап 5. Для получения результатов по комбинированной модели проводятся вычисления или среднеарифметического или среднегеометрического значения по двум вариантам полученного распределения. Выбор вида средней зависит от значения коэффициента k, который характеризует соотношения между объемами выборки ПВЕ, определенными соответственно по моделям пропорционального и непропорционального размещения. Следует отметить, что упомянутый коэффициент k вычисляется как отношение большей величины объема выборки ПВЕ к меньшей величине.

Если значение k меньше 1.4 (т.е. k < 1,4), то определяется среднеарифметическое значение между двумя объемами выборки ПВЕ в субъекте Российской Федерации.

Если значение k больше 1.4 (т.е. k ≥ 1,4), то рассчитывается среднегеометрическое значение между двумя объемами выборки ПВЕ.

Этап 6. Проводится проверка равенства между общей величиной объема выборки ПВЕ и суммой объемов выборки ПВЕ в субъектах Российской Федерации.

При отсутствии такого равенства реализуются сначала стандартные процедуры округления, а затем методы линейной балансировки.

Распределение общего объема выборки ПВЕ считается завершенным как только будет получено равенство между суммой размещенной величины объема выборки ПВЕ по всем субъектам Российской Федерации и общей величиной объема.

Этап 7. Этот этап является основой для реализации процедуры размещения объема выборки ПВЕ в субъекте Российской Федерации по городскому и сельскому населению, которая аналогична изложенной выше (количество аналитических областей принимается равным 2).

Значение показателя точности является доминирующей компонентой в дизайне выборки, направленной на определение объема выборки, при котором возможно получение репрезентативных данных.

Фактическое значение точности статистического оценивания определяется по данным выборочного наблюдения после его проведения. В целом это значение является основой для оценки репрезентативности результатов выборочного наблюдения.

Оценка статистической точности

Для оценки ошибки выборки или точности статистического оценивания используются количественные меры возможного отклонения выборочной оценки параметра от его действительного значения в генеральной совокупности.

К показателям точности относятся: 1) стандартная ошибка выборки; 2) относительная величина стандартной ошибки выборки (эти два показателя показывают соответственно абсолютную и относительную величину возможного отклонения оценки от параметра); 3) доверительный интервал (диапазон), в котором находится истинное значение параметра при принятом уровне доверительной вероятности (для его расчета применяется величина стандартной ошибки выборки и квантиль нормального распределения, соответствующий установленной доверительной вероятности).

Стандартная (средняя) ошибка выборки – представляет собой среднеквадратическое отклонение возможных значений выборочной средней от генеральной средней, взвешенных по вероятностям их возникновения. Стандартная (средняя) ошибка выборки показывает в абсолютном выражении величину возможного отклонения выборочной оценки от действительного значения параметра в генеральной совокупности.

Относительная стандартная ошибка (коэффициент вариации оценки) - вычисляется как отношение величины стандартной (средней) ошибки выборки к выборочной оценке параметра и показывает, насколько процентов выборочная оценка может отклониться от значения параметра в генеральной совокупности. Значения выборочной оценки показателя и её относительной стандартной ошибки позволяют вычислить стандартную ошибку.

Величина доверительного интервала представляет собой диапазон в абсолютном выражении (интервальную оценку), в котором может быть заключено значение соответствующего параметра генеральной совокупности.

Характеристики точности оценивания итоговых показателей выборочного наблюдения доходов населения и участия в социальных программах рассчитываются с помощью модуля Complex Samples программного продукта IBM SPSS Statistics с учетом плана выборки наблюдения.

Взвешивание

При формировании итогов наблюдения его результаты распространяются на все частные домохозяйства и на все население, проживающее в них, с применением весовых коэффициентов, рассчитываемых как обратно пропорциональные вероятностям отбора.