Размер шрифта
Цвет сайта
Изображения
zoom_in
zoom_out

Будущее России. Национальные проекты – «Глава Росстата: Всероссийская перепись 2021 года будет последней, где используются традиционные данные»

В апреле 2021 года состоится Всероссийская перепись населения, которую называют "первой цифровой"

В апреле 2021 года состоится Всероссийская перепись населения, отложенная в этом году из-за пандемии. Ее называют "первой цифровой": для организации переписи будут задействованы новые технологии, переписчики получат планшеты, а пройти опрос можно будет онлайн. Об искусственном интеллекте в статистике, влиянии пандемии и о переписи будущего в интервью порталу "Будущее России. Национальные проекты", оператором которого является информационное агентство ТАСС, рассказал глава Росстата Павел Малков.

Вы анонсировали перепись как самую технологическую. Мы уже знаем, что будут использованы планшеты, с которыми станут ходить переписчики. Что еще?

Мы говорим, что это первая цифровая перепись в истории России, она отличается беспрецедентным уровнем использования современных технологий. Нами был изучен опыт других стран, собраны абсолютно все лучшие практики.

Цифровая перепись — это оперативность, точность, безопасность и, наконец, основа адресных решений для построения нашего будущего. Мы ценим использование информационных систем за беспрецедентно быстрый сбор, обработку и анализ данных; за удобные и легкие планшеты для более комфортной работы переписчиков, а также за ускорение и упрощение ввода, за контроль ошибок и передачу данных в ускоренном режиме к нам, в центр обработки.

Кроме того, цифровая перепись дает возможность контролировать работу переписчиков в интересах их безопасности. Ну и конечно, технологии — это всегда мотив сделать больше, интереснее, актуальнее с наименьшими затратами по сравнению с ценностью результата. И вот уже мы начинаем экспериментировать с данными операторов мобильной связи, ищем возможности для использования больших данных. Мы создаем новую информационно-аналитическую систему, которая ускорит обработку собранной информации и позволит глубже анализировать данные. То есть практически на каждом этапе, в каждом процессе так или иначе при использовании цифровых технологий мы получаем новое качество сбора и использования данных.

Расскажите подробнее про сбор данных операторов мобильной связи. Как это будет организовано? Данные операторов будут использоваться как ответы на некоторые вопросы в анкете?

Это эксперимент, то есть пока никакие данные, полученные по итогам переписи, не будут замещаться на данные, полученные от операторов мобильной связи. Скорее, это возможность сопоставить данные, полученные традиционным способом, с данными, полученными, по сути, экспериментальным путем — от операторов мобильной связи.

То есть это в большей степени делается для точности результатов?

Вы знаете, сопоставление и сочетание новых способов сбора данных — это не просто про точность, хотя и про нее в частности. Это эволюционная история. Мы понимаем, что несмотря на всю инновационность предстоящей переписи, следующая будет совершенно непохожей на все наши представления о переписи. Поэтому все эксперименты и коллаборации — это история про переход к "переписи будущего", а мы все имеем возможность создать основу для этой эволюции. И да, это про новый уровень корректности и методологических возможностей использования больших данных, чтобы переход на новые методы получения статистической информации прошел максимально корректно.

Пока непонятно, как будут регулироваться большие данные, законопроекта еще нет. Вы уже разговаривали с сотовыми операторами, как они на это смотрят, как вы будете организовывать обмен данными?

У нас были встречи с операторами мобильной связи. Взаимодействие будет строиться на коммерческой основе: по сути, нам предложено покупать эти данные, как и остальным участникам рынка.

Вы правы в том, что сегодня идет формирование рынка больших данных. Они уже есть и их можно использовать. Но завтра они могут выглядеть уже иначе, а послезавтра их может и не быть вообще. Пока недостаточно правовых процедур, которые определяют порядок их хранения или изменения. Мы очень аккуратно подходим к вопросу использования больших данных и начинаем с экспериментов, постепенно встраивая их в традиционную методологию. В 2021 году мы станем анализировать возможности и оценивать потенциал их использования в будущем.

Я думаю, что всероссийская перепись, которая пройдет в апреле 2021 года, будет последней, где используются данные, собранные традиционным способом. В дальнейшем приоритет будет отдаваться другим источникам. А вот каким — это мы поймем позднее. Например, данным операторов мобильной связи. Мы сейчас к этому вопросу только начинаем подходить.

То есть на каком-то более глобальном уровне такой метод может быть включен уже в следующие переписи?

Да, безусловно. Но вот здесь не надо переоценивать данные операторов мобильной связи.

О чем они могут нам сказать? Информацию, сколько людей находится на определенной территории в определенный момент времени, могут дать информацию о миграции. Пожалуй, и все. А вся остальная информация, которую мы собираем по итогам переписи — возрастной состав, уровень образования, брачные структуры, национальности и прочее, — все это пока можно собрать только традиционным способом.

Но надо продолжать экспериментировать, искать возможности использования. Тем более что технологии не стоят на месте. Когда-то в будущем на пересечении нескольких источников административных и больших данных мы должны получить ту информацию, которую сейчас получаем традиционным способом.

А что касается интернет-компаний? Те же соцсети обладают значительным объемом больших данных. Будут ли они как-то участвовать в эксперименте?

В этой переписи пока нет. Там слишком большой круг участников, слишком неопределенные правила игры. Мы тоже проводили переговоры с некоторыми из таких компаний, смотрели, что там можно получить. Пока эти данные очень трудноприменимы для проведения Всероссийской переписи населения. При этом важно, что данные разных операторов мобильной связи в принципе сопоставимы друг с другом, из них можно собрать целостную картину.

С социальными сетями, например, это сделать намного сложней. Рынок получения данных от соцсетей намного менее формализован, чем рынок данных операторов. Информация у соцсетей самая разная, ничем не подтвержденная, ничем не идентифицированная. Поэтому, еще раз, какие-то выводы на основе данных операторов, социальных сетей делать можно, но для проведения Всероссийской переписи населения этот источник пока неприменим.

Перейдем к цифровизации уже вашего ведомства. Бывший министр экономического развития Максим Орешкин как-то говорил, что новый глава Росстата будет заниматься налаживанием IT-процессов и цифровизацией ведомства. Вы не могли бы рассказать, как вы используете технологии уже сейчас? Не в переписи — крупном проекте, а в повседневной деятельности?

Признаться, налаживать пришлось абсолютно все процессы, далеко не только IT заниматься. Но вопрос IT, наверное, один из самых главных в развитии Росстата. И мы идем здесь по двум направлениям.

Первое — мы совершенствуем те информационные системы, которые есть у нас уже сейчас. Мы их дополнительно дорабатываем, переводим в них расчет тех показателей, тех форм, которые все еще рассчитываются по старинке, создаем единое информационное поле, единый справочник, единую систему доступа. Работаем и над предоставлением удаленного доступа для сотрудников, что сейчас особенно актуально — оказалось, что в жизни это очень непростая и нетривиальная задача. То есть, по сути, происходит систематизация всего, что было сделано ранее, и приведение к какому-то общему знаменателю.

Второе направление — это создание новой информационной системы, так называемой цифровой аналитической платформы.

Которая войдет в Национальную систему управления данными, разрабатываемую в рамках нацпрограммы "Цифровая экономика"?

Да, она является частью Национальной системы управления данными. У нее две ключевых задачи. Первая — систематизировать, упростить и привести к единому методологическому знаменателю все статистические показатели, рассчитываемые в России. Не только Росстат является субъектом официального статистического учета. По закону субъектами официального статучета могут являться и другие федеральные органы исполнительной власти.

Если посмотреть на общее количество показателей, которые сегодня рассчитываются, то примерно половина из них приходится на Росстат, а вторая половина — на более чем 60 ФОИВов. Каждый из них считает по своей методологии, с помощью своих информационных систем. Понятно, что где-то есть дублирование, какие-то показатели даже противоречат друг другу. Мы видим случаи, когда используются одни и те же данные, но применяются разные методологии расчета. Или, наоборот, схожие методологии, но разные исходные данные, и так далее. Для того чтобы систематизировать эти огромные объемы данных, которые накапливаются в процессе официального статучета, мы и предложили создать цифровую аналитическую платформу, единую для всех, где будет хранилище данных, федеральный план статработ, переведенный в электронный вид, единая витрина и еще ряд универсальных инструментов. Сейчас мы уже пилотируем эти инструменты вместе с несколькими ФОИВами.

Второе направление цифровой аналитической платформы — это переход к расчету показателей на основе альтернативных источников информации, тех самых административных данных, больших данных, о которых мы сейчас с вами говорили. Канонический пример — это расчет индекса потребительских цен на основе данных налоговой службы. Мы сегодня уже начали обмениваться информацией, стали разбирать те данные, которые получаем, начали экспериментировать с расчетами. Все это происходит тоже на основе цифровой аналитической платформы, которая в принципе предоставляет нам такие возможности.

Пока что это пилоты. А когда это будет уже реализовано полноценно?

Говорить сейчас о какой-то конкретной дате сложно. Идет постоянный процесс совершенствования статистики на основе цифровых технологий. Поэтому какие-то результаты мы сможем показать уже в этом году, а какие-то — в следующем. Но мы никогда не сможем сказать, что достигли всех поставленных целей и можно остановиться, успокоиться. Каждый год появляются новые вызовы, которые требуют от нас реакции, в том числе совершенствования наших информационных систем.

А какие технологии вы уже сейчас используете при анализе данных? Искусственный интеллект?

Да. В том же индексе потребительских цен, который я сейчас приводил в пример. Важно понимать, что данные, полученные с контрольно-кассовой техники, не структурированы: какой-нибудь батончик "Сникерс" только в Москве имеет свыше 1500 вариантов внутреннего наименования или кодировки. То есть вы купите один и тот же товар в нескольких магазинах, а посмотрите на кассовый чек — он везде будет называться по-разному.

Для того чтобы разобрать эти данные и точно идентифицировать товары, как раз и требуется применение технологий искусственного интеллекта. По-другому никак. Мы уже экспериментируем и рассчитываем на то, что в следующем году существенная часть индекса потребительских цен будет рассчитываться с помощью этих технологий.

Учитывая, что эта перепись станет первой цифровой, как будет обеспечиваться безопасность данных? Например, не будет ли рисков утечки данных граждан, решивших проходить опрос онлайн?

Данные могут поступать к нам из трех источников: первое — это портал госуслуг; второе — стационарные переписные участки, например многофункциональные центры; третье — непосредственно от переписчиков.

Давайте разберем каждый из этих способов. На портале госуслуг вы идентифицируетесь с помощью единой системы аутентификации, так называемой ЕСИА, заполняете всю необходимую информацию, после чего она выгружается к нам в Росстат. Но при этом персональные данные, исходные данные к нам не выгружаются — к нам поступает уже обезличенная информация, с которой мы потом работаем. То есть информация передается нам без персональных данных и дальше не хранится на портале госуслуг.

Информация от переписчиков и со стационарных участков поступает по стандартным протоколам: и там и там используется одно и то же решение. Кроме того, персональные данные на этом пути нигде не сохраняются. Мы используем достаточно мощные средства защиты информации и на аппаратном уровне, и на уровне программного обеспечения, но, как я сказал, главная мера защиты информации — это то, что мы не храним персональные данные в наших централизованных базах. Они к нам не поступают.

Для Всероссийской переписи готовят свыше 360 тыс. планшетов. Сейчас обсуждаются различные варианты их дальнейшего использования в других ведомствах уже после переписи. Сколько планшетов останется в Росстате?

Мы рассчитываем, что все наши исследования в дальнейшем будут происходить с помощью электронных планшетов. Сейчас мы опрашиваем десятки тысяч людей с разной периодичностью, и все это происходит на бумаге. Если на эти бланки посмотрит неподготовленный человек, то сходу там разобраться очень сложно: "Если вы заполнили такое-то поле таким-то образом, то перейдите дальше, пожалуйста, к следующему пункту", "Если по-другому заполнили, то переверните три страницы и заполняйте дальше". Конечно, наши специалисты уже научились работать с бумажными формами, но намного удобнее и быстрее это делать с помощью планшета, где будет специальная форма, которая, во-первых, станет сразу проверять вводимую информацию, а во-вторых, будет автоматически переходить к следующему полю, которое должно быть заполнено по заложенному алгоритму. Если что-то неправильно заполнил или недозаполнил, то программа об этом сразу скажет.

Кроме того, один из важнейших моментов — вся информация будет сразу поступать к нам в информационные системы. Не нужно дополнительно прогонять эти формы через сканеры или организовывать ручное перебивание в электронный вид. Это намного быстрее и существенно сокращает количество ошибок. Поэтому Росстат продолжит использовать часть планшетов и дальше в нашей работе. Остальные планшеты будут переданы в другие органы власти для использования в рамках нацпрограммы "Цифровая экономика". Мы ведем диалог с целым рядом ведомств. Думаю, коллеги из Министерства связи и массовых коммуникаций помогут нам с выбором и передачей тем, кому они сейчас нужнее. Планшеты не должны потом лечь мертвым грузом на склады.

Вы говорили, что перепись потребует более 33 млрд рублей. Будет ли эта сумма скорректирована из-за пандемии?

Сумма скорректирована не будет, мы исходим из тех же объемов денежных средств. Естественно, с перераспределением на следующий год. Около 55% уйдет на оплату труда и где-то четверть — на IT-часть.

Как скажется пандемия на организации переписи и ее результатах? Возьмем бытовой пример — переписчики будут ходить по домам. Может ли это отпугнуть людей от участия в переписи?

На самом деле ровно для этого и придуманы другие варианты прохождения переписи. Те, кому некомфортно личное общение с переписчиком, может пройти опрос либо на портале госуслуг, либо в МФЦ. Может быть, еще какие-то удобные способы у нас будут, например выездные участки для крупных предприятий. Если человеку комфортно пообщаться с переписчиком, значит, он откроет дверь и ответит на все вопросы.

Недавно разговаривал с нашими коллегами из Петербурга, выяснилась интересная история. Если в Москве не очень хотят пускать к себе [домой], то в Питере, наоборот, ждут переписчиков, просто поговорить хотят. В небольших населенных пунктах перепись — это большое событие, можно даже сказать праздник, и переписчиков там ждут с нетерпением.

Россия, естественно, не первая, кто будет проводить цифровую перепись. На какие страны вы ориентировались?

Мы смотрели в первую очередь на ведущие страны мира, начиная со Скандинавии и заканчивая США. Надо сказать, что опыт очень разный, не всегда применимый к нашим реалиям. Но, пожалуй, из Европы все лучшее, что там есть, мы собрали, прежде всего как раз в части информационных технологий.

Итоги нашего исследования говорят, что европейские страны сделают упор при проведении своих переписей на использование онлайн-сервисов, цифровых устройств типа планшетов, систем геопозиционирования и больших данных. Например, число стран, которые планируют применять планшеты [в ходе переписи], выросло в три раза, а онлайн-сервисы — более чем в четыре раза.

А опыт какой страны наиболее применим к нам?

Нет какой-то страны, где все сделано идеально. Кроме того, невозможно просто взять технологии другой страны и перенести в нашу. Надо брать лучшие практики и формировать уникальный продукт. Он должен, с одной стороны, соответствовать нашим реалиям, а с другой — быть на самом высоком мировом уровне по качеству и используемым наработкам.

Надо отметить, что ни одна страна в мире еще не отказалась от использования переписчиков, не перешла стопроцентно на цифровой сбор информации. Пока самый высокий уровень цифровизации при переписи — это около 67%, и достигнут он в странах, где на протяжении последних 15 лет активно развивалась цифровая среда, были созданы эффективные сервисы, обеспечивающие взаимодействие государства и общества.

Мы тоже постепенно идем к этому. Применение портала госуслуг для самостоятельного заполнения переписных листов онлайн — пример использования имеющихся у государства информационных ресурсов.

В США, допустим, используются все формы сбора информации: интернет, переписчик, планшет, самостоятельное заполнение анкеты и отправка ее по почте, телефонный опрос, то есть все возможные варианты. Кстати, последний — это тот опыт, который к нашим реалиям, скорее всего, неприменим. В Америке очень распространено самостоятельное заполнение анкет и отправка их по почте. Причем надо сказать, что в США такая брошюра очень большая и непростая к заполнению. У нас, скорее всего, этот способ не сработает.

Мы ездили в Белоруссию, у них прошла недавно перепись, тоже комбинированная — и интернет, и переписчики с планшетами. А кроме этого действовали стационарные участки. По сути, это мобильные бригады, которые приезжают на крупное производство и переписывают всех работающих, их семьи. Людям не надо отрываться от работы, они могут пройти перепись в удобное для них время. Эту идею мы готовы реализовать совместно с предприятиями и организациями, которые захотят пригласить наших переписчиков и организовать условия для их работы.

Я так понимаю, что в будущем как раз будут разные варианты? Мы не сможем отказаться полностью от переписчиков?

У нас сейчас такое интересное время, когда все достаточно быстро и динамично меняется. При этом стремительно развиваются технологии. Сложно предсказать, как будет проходить следующая перепись. Мы понимаем, что, скорее всего, это последняя традиционная перепись. Надо экспериментировать, пробовать, двигаться вперед и быть готовыми к любому развитию событий.

Беседовала Ирина Ли

Будущее России. Национальные проекты, 10 августа

Фото: Екатерина Штукина/POOL/ТАСС


Комментарии пока отсутствуют.


Для того, чтобы оставить свой комментарий, авторизуйтесь в личном кабинете или зарегистрируйте новый аккаунт на сайте Росстата

Получайте только свежую статистику Росстата

Подпишитесь на рассылку и на указанный электронный адрес мы будем присылать регулярную подборку последних новостей