Культура работы с данными
Национальный проект «Экономика данных» пропагандирует переход от накопления данных к их реальному применению. В ситуационных центрах глав субъектов и региональных министерств в онлайн-режиме собираются огромные массивы данных. И они должны не просто красиво отображаться на дашбордах (dashboards) BI-систем в разрезе 20 базовых критериев эффективности высших должностных лиц, а стать ключевым стратегическим активом и источником экономической выгоды для населения и системообразующих предприятий.
Следовательно, данный нацпроект становится катализатором для обогащения/дополнения внедренных BI-решений новыми DSS-системами (Decision Support Systems — системы поддержки принятия решений, или СППР). У этих продвинутых СППР есть инструменты создания хранилищ мастер-данных, которые способны моделировать и решать задачи анализа, управлять и выявлять явные и неявные зависимости в данных, формировать комплексные рекомендации для принятия решений.
Далее на примерах расскажем, как с помощью четырех шагов и систем поддержки принятия решений любой субъект Российской Федерации сможет быстро и уверенно построить датацентричное управление, а новые электронные сервисы и процессы госуправления будут строиться вокруг данных.
Шаг 1. Создание единого хранилища данных
На первый взгляд, задача по созданию единого хранилища данных при ситцентре может показаться трудоемкой и не оправдывающей вложенные ресурсы. Но на самом деле — это базовое условие, без выполнения которого невозможно построение Data Driven культуры и использование всех ее преимуществ.
Независимо от того, на каком уровне внедряется DSS-система, всегда и везде критически важной основой является достоверность и качество данных, которых по факту в современных ситуационных центрах глав субъектов и региональных министерств попросту нет. Так произошло потому, что последние 30 лет информационные системы создавались вокруг бизнес-процессов, что вызвало дублирование запросов и отчетных данных. Многие ведомства и сейчас продолжают собирать и обрабатывать одни и те же сведения для разных форм отчетов, при этом, в зависимости от использованных источников и заданных параметров анализа, полученные результаты нередко противоречат друг другу. Например, статистика рождаемости, собранная на базе роддомов (учитывает количество детей, появившихся там на свет), может отличаться от данных, которые консолидируются в ЗАГСах (количество зарегистрированных детей, которым выданы свидетельства о рождении). Оба источника заслуживают доверия. Но разность в показателях между ними возможна, к примеру, если часть рожениц выбирали роддома в другом регионе, а ребенка регистрировали по месту своей прописки.
Выход из ситуации с повторяющимися данными и показателями, безусловно, есть. Нужно воспользоваться сводом правил DAMA DMBOOK, научиться создавать контекстные диаграммы с описанием каждой области знаний, описывать поставщиков данных, методы, инструменты и метрики, потребителей данных, правил модификации данных и, главное, научиться их правильно интерпретировать. Далее эти знания оцифровываются и переносятся в специализированное хранилище Data Lake, где слой за слоем ведется описание данных, имеющихся в региональном ситуационным центре. Речь идет о нескольких тысячах показателей, собираемых из систем региональных и муниципальных уровней, и для этого потребуется в среднем до 6 месяцев кропотливой работы.
Шаг 2. Настройка сценарного моделирования
Решив проблему с накоплением данных и очистки от дублей, переходим к их реальному применению через сценарное моделирование.
Тема с внедрением систем поддержки принятия решений не нова. Однако на сегодняшний день только в федеральных органах исполнительной власти есть успешные кейсы создания и применения подобных систем, помогающих отвечать на такие вопросы как: «Что произойдет?», «Что будет, если…», «Что предпринять, чтобы…», «Как оптимально распределить ресурсы?» и т.д.
В числе первых, кто внедрил систему DSS-класса, был Национальный центр управления в кризисных ситуациях МЧС, и она успешно работает более 10 лет. На уровне регионов — в Москве, Республике Татарстан, Калининградской области — также есть примеры успешного внедрения СППР-систем, но они пока работают на ограниченном количестве сценариев.
Ограничения сценарного моделирования связаны либо с функциональными возможностями используемых BI-платформ, либо с источниками данных. Продвинутые СППР-продукты позволяют моделировать и решать любые задачи анализа, управлять и находить явные и неявные зависимости в данных с помощью ряда встроенных моделей, таких как «поиск зависимостей», «выявление факторов влияния», «подбор оптимальных параметров», «классификация и ранжирование», «выявление аномалий», «прогнозирование».
Шаг 3. Развитие датацентричного мышления
С 2024 года в России вводится датацентричный менеджмент, где новые электронные сервисы и процессы госуправления будут строиться вокруг данных. В передовых странах цифровое правительство уже построено по принципу оказания клиентоцентричных услуг. Это требует от госслужащих устранения бюрократических процедур, обеспечения горизонтальных межведомственных связей и оперативного взаимодействия между региональными организациями, учреждениями и частным бизнесом, а также создания открытых наборов данных. Так, в Сингапуре приверженность цифровым технологиям пронизывает все уровни государственного управления: правительство постоянно экспериментирует с гибкими технологиями и тестирует сервисы для населения и бизнеса с помощью «песочниц».
В России тоже есть удачные кейсы по клиентоцентричности, но их крайне мало. Поэтому внедрение СППР-систем в рамках цифровой трансформации госуправления способствует созданию датацентричного правительства в каждом субъекте РФ и это вопрос ближайших трех лет.
В Координационном совете при Правительстве Российской Федерации СППР-решения, основанные на применении методов математического моделирования и машинного обучения, активно используются в том числе для прогноза потребительского поведения и его регулирования. Так, например, своевременный анализ данных позволил федеральному правительству во время пандемии избежать реального дефицита продуктов питания, когда наблюдался ажиотажный спрос на товары. На основании достоверных данных, получаемых из различных источников, государство помогало частным торговым сетям скоординировать своевременную доставку товаров, чтобы не допустить ухудшения качества жизни населения.
Среди показательных региональных кейсов можно выделить Республику Татарстан, где в 2020 году реализовали пилотный проект по сбору экологических данных из нескольких источников. В ситуационный центр поступали наборы данных (показатели) качества воздуха как из источников Минэкологии, так и из систем и устройств крупных, системообразующих предприятий. Дообогащение данных позволило оперативно выявлять и реагировать на источники загрязнений до проявления масштабных инцидентов и жалоб населения.
Данные примеры показывают, что аналитики ситуационных центров научились выявлять связность в данных и явную зависимость. Следующим шагом работа с неструктурированными данными и неявными зависимостям будет передана искусственному интеллекту.
Шаг 4. Безопасность и конфиденциальность
Многие разработчики DSS-систем заявляют, что их продукты обладают инструментами, которые предоставляют беспрепятственный и равный доступ к любым данным, обеспечивая «демократизацию данных». Но такой подход не применим в госуправлении.
На мой взгляд, в СППР-системах должны быть реализованы развитые инструменты разграничения прав доступа к моделям и данным на основе областей видимости, создаваемых для разных пользователей, и желательно, чтобы эти средства были сертифицированы в ФСТЭК.
Выводы
В нашей стране более 15 лет проектируются, разрабатываются и внедряются ситуационные центры, соответствующие стандартам, ГОСТам и множеству нормативных документов. Но при этом лишь в отдельных субъектах РФ есть продвинутые СППР-системы, способные предсказать, на какой улице или в каком поселке будет паводок, как лучше построить маршрут транспорта при проведении дорожных работ и с какой скоростью будут развиваться те или иные социально-экономические события. И, что закономерно, региональные правительства, которые успешно внедрили Data-driven-подход в госуправлении, заслуженно занимают первые строчки рейтингов и демонстрируют высокие показатели валового регионального продукта.
Источник публикации