Катастрофоустойчивость
ИТ–инфраструктуры
О решении

Многие заказчики, особенно в регионах, стремятся консолидировать ИТ-инфраструктуры головного офиса и филиалов. Это позволяет получить следующие значительные преимущества:
  • Оптимизировать затраты на приобретение и модернизацию оборудования;

  • Создать наиболее оптимальные инженерные условия для безаварийного функционирования оборудования - ЦОД;

  • Сформировать условия, соответствующие требованиям бизнес деятельности;

  • Оптимизировать операционные расходы, связанные с обслуживающим персоналом и их обучением;

  • Создать квалифицированный центр компетенций для получения более квалифицированного обслуживания ИТ;

  • Сократить возможные места утечки информации и контролируемого периметра ИБ.

Однако в свою очередь это приводит к тому, что несмотря на минимизацию всевозможных источников угроз функционирования остаются риски, которые можно приравнять катастрофе – пожар, затопление, обрыв каналов связи и прочие включая разрушение здания. Если при этом не решать задачу обеспечения катастрофоустойчивости все данные бизнеса могут быть утрачены. При этом даже если есть внешнее хранилище с резервными копями ресурсов для их запуска не будет, а время их приобретения и доставки будет не приемлемым для бизнеса. Так же так или иначе любые инженерные системы ЦОД имеют потребность в обслуживании с полной остановкой функционирования.

Таким образом с учетом риска полной ли долговременной утраты бизнеса необходимо совместно с консолидацией решать задачу обеспечения катастрофоустойчивости ИТ-инфраструктуры.

Задача решается путем реализации второго ЦОД, который в случаи катастрофы запустит на своем оборудовании ИТ-инфраструктуру необходимую и достаточную для продолжения бизнес деятельности.

Оптимальное решение этой задачи требует проектирование и модернизацию ИТ-инфраструктуры с решением следующих задач:
  • определить список критичных ИТ-сервисов и требований по времени их запуска (RTO) и допустимому времени потери данных (RPO);

  • выполнить расчет требуемых ресурсов и мощностей только для критичных ИТ-сервисов в соответствии с требованиями RTO и RPO;

  • модернизацию архитектуры сети таким образом, чтобы утрата ЦОД не приводила к прекращению работы сети пользователей (вынос узлов сети из ЦОД) и незаметное автоматическое переключение сетей в резервный ЦОД;

  • расчет каналов связи необходимых и достаточных для выполнения репликации данных между ЦОДами в соответствии с требованиями RPO;

  • выбор наиболее оптимальных решений по репликации данных для соответствия RPO и уже имеющемуся оборудованию и решениям Заказчика;

  • модернизацию архитектуры прикладных и инфраструктурных ИТ-систем для обеспечения, требуемого RTO.
Результаты и преимущества

Основными результатами и преимуществами являются:
  • обоснованный расчетами проект с временными показателями на восстановление работоспособности и потери данных в случае происшествия катастрофы;

  • план аварийного восстановления, описывающий действия персонала в случае катастрофы;

  • регламент периодического переключения для проверки работоспособности системы обеспечения катастрофоустойчивости.