Rambler's Top100
Статьи
Николай ШЕМЕТОВ   14 апреля 2020

COVID-19 и сохранение непрерывности и безопасности функционирования ЦОДа

Черный лебедь, принесший COVID-19, меняет правила игры – рвутся наработанные цепочки поставок, сокращаются, закрываются или замораживаются бизнесы. Сложившаяся ситуация стала серьезной проверкой организационной зрелости компаний и предприятий.

Прежде всего вызов был брошен принятым стратегиям и системе обеспечения непрерывности бизнеса и восстановления деятельности – инструментам, решающим ключевые задачи руководства компанией в условиях кризиса. Эпидемия COVID-19 стала проверкой готовности персонала и ресурсов для обеспечения заявленного уровня операционной деятельности в условиях чрезвычайных ситуаций.

В частности, в настоящий момент могут реализоваться следующие риски:
  • выбытие персонала вследствие болезни;
  • сбои или прерывание цепочек поставок товаров и оказания услуг;
  • прерывание операционной и производственной деятельности;
  • риски, связанные с ИТ-инфраструктурой и нарушением информационной безопасности.
Каждому руководителю сегодня приходится отвечать на вопрос, насколько его компания оказалась готова к этим и другим рискам. Если говорить о нашей компании, то реализованный план обеспечения непрерывности и восстановления деятельности (ОНиВД) и риск-ориентированный подход в управлении показали свою эффективность. Система управления выстроена и реализуется на методологической базе, содержащей элементы теории надежности, риск-ориентированного подхода в управлении компанией, указаний и стандартов Uptime Institute, ГОСТ 22301, ISO 9001, OHSAS 18001 и др., а также собственных и лучших мировых практик. 

Для коммерческого ЦОДа в условиях пандемии важно сохранить устойчивость, непрерывность и безопасность функционирования, обеспечивающего гарантированный уровень услуг. В связи с тем, что производственные процессы ЦОДа, а также бизнес-процессы его клиентов не могут быть остановлены, необходимо оперативно и детально отслеживать и анализировать развитие ситуации, принимать меры, обеспечивающие непрерывность производственных процессов и оказания услуг клиентам, а также защиту здоровья и безопасности сотрудников, клиентов, партнеров и посетителей. 

В частности, в рамках выполнения задач, связанных с эксплуатацией критических систем ЦОДа, по факту поступления новой информации как из официальных, так и из второстепенных источников, о развитии общемировой ситуации с противодействием распространению вируса, внедрении ограничений на различных уровнях деятельности компаний и логистики, а также в связи с введением режима самоизоляции, командой DataSpace проводится анализ новых возникающих рисков, которые, в свою очередь, способны воздействовать на операционную устойчивость ЦОДа.

Собственной аналитической группой DataSpace был разработан и активирован план обеспечения полной работоспособности ЦОДа на текущий момент и при дальнейшем негативном развитии ситуации, который включает в том числе:
  • перечень работ, влияющих на критическую инфраструктуру ЦОДа;
  • сменность состава;
  • взаимодействия с поставщиками услуг;
  • количество ЗИП на складах;
  • ведение проектов в ЦОДе;
  • безопасное перемещение до и с места работы сотрудников ЦОДа и посетителей. 
Расскажем о некоторых мерах, которые уже реализованы в компании: 
  • Персонал, не отвечающий за операционную деятельность ЦОДа, переведен на удаленный режим работы.
  • Для повышения отказоустойчивости ЦОДа в части людских ресурсов сформирована команда специалистов ЦОДа, переведенная на удаленную работу. В настоящее время эта группа выполняет административные задачи и при необходимости готова восполнить частично или полностью выбывший состав основной группы эксплуатации ЦОДа, поддерживать 100%-ное функционирование ЦОДа до окончания режима самоизоляции. 
  • Организованы резервные смены клиентской поддержки полного цикла, которые могут оперативно заменить весь текущий персонал ЦОДа без какого-либо влияния на процессы обеспечения работоспособности ЦОДа.
  • Разрабатываются мероприятия по доставке всех сотрудников дежурных смен по маршруту дом – работа – дом без использования общественного транспорта.
  • Плановое обслуживание инфраструктуры ЦОДа, там, где это допустимо, перенесено на более поздние сроки.
  • Реализованы мероприятия по контролю над состоянием здоровья как посетителей дата-центра, так и сотрудников компании, – обязательное измерение температуры, ежедневные опросы о состоянии здоровья. 
  • Перенаправление всего потока посетителей в единственный открытый вход в ЦОД, что позволяет оценивать состояние здоровья по внешним признакам у 100% посетителей.
  • Все помещения общего доступа в здании обеспечены дополнительными дезинфицирующими средствами, проводится периодическая санитарная обработка рабочих мест сотрудников. 
  • Клиентам направляются рекомендации воздержаться от посещения дата-центра, если их задачи могут быть выполнены в рамках услуги Remote Hands сотрудниками службы клиентской поддержки DataSpace. 
Основываясь на результатах анализа эффективности вышеописанных мер плана ОНиВД, можно сделать следующие выводы:
  • Критически важно поддерживать в актуальном состоянии планы обеспечения непрерывности бизнеса, планы ликвидации аварий и восстановления бизнес-процессов и критичных ресурсов.
  • Нельзя исключать из рассмотрения маловероятные события.
  • Анализ и планирование реализации сценариев и проведение полномасштабных практических тестов повышают готовность и эффективность действий компании в нестандартных ситуациях.
  • Должная проверка и обучение сотрудников компании, клиентов и контрагентов обеспечивает эффективность функционирования в нестандартных ситуациях.
Николай Шеметов, технический директор, DataSpace
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!