Rambler's Top100
Статьи
Екатерина ШЛЫК  17 марта 2025

Пожарная безопасность ЦОДа: не автоматикой единой

Пожарная безопасность дата-центра должна опираться не только на современные технологические решения, но и на высокую культуру эксплуатации и строго регламентированную работу персонала. Словом, требуется комплексный подход.

За 30 лет (с 1994 по 2024 гг.) в дата-центрах зафиксирован 8 701 инцидент, причем в 12 случаях корневой причиной инцидента был указан огонь, но только в двух случаях возгорание действительно произошло, в остальных срабатывание системы раннего обнаружения пожара оказалось ложным. Такова статистика Uptime Institute, которую в ходе дискуссии «ЦОДы: тушить или не тушить. Мировой опыт и российская практика» на форуме «ЦОД-2024» привел Алексей Солодовников, управляющий директор Uptime Institute в России и СНГ. Эти данные были получены от крупнейших операторов и владельцев ЦОДов – без преувеличения цвета глобального рынка центров обработки данных.

Может быть, дела обстоят иначе, если рассматривать картину в целом, включая «середнячков» рынка? По данным 451 Research, в 2020–2024 гг. в мире насчитывалось от 6,5 тыс. до 7,7 тыс. дата-центров, но зафиксировано лишь 14 крупных пожаров или ложных срабатываний противопожарной системы, повлекших за собой катастрофические последствия (например, такие, как выход залитого оборудования из строя). Как видно, относительное количество инцидентов, так или иначе связанных с пожаром, и здесь очень мало.

Если взять период в пять лет, то вспоминаются единичные случаи крупных пожаров в дата-центрах. В глобальном масштабе самым нашумевшим стал пожар в ЦОДе OVHcloud в 2021 г., в российском – в дата-центре DataLine в 2019 г.
 
Источник: DNA.FR/Jean-Christophe Dorn
Пожар в OVHcloud


Крупные пожары в ЦОДах

2019 г., июнь. Дата-центр DataLine на Боровой (Москва, Россия). Возгорание началось под металлической крышей здания ЦОДа. Вскоре начали взрываться фреонопроводы систем холодоснабжения. Полностью вышли из строя пять кондиционеров, у части кондиционеров сгорели кабели питания внешних блоков. Из 16 машзалов ЦОДа пострадал один. Возникли проблемы с рядом служб и сервисов, сильно пострадали некоторые офисы. Компания выплатила клиентам штрафы за все не работавшие сервисы и простои согласно SLA, предоставила место для резервирования и помогла восстановиться.

2021 г., март. Дата-центр OVHcloud, здание SBG-2 (Страсбург, Франция). ЦОД предоставлял услуги аренды выделенных серверов и облачные сервисы. В результате инцидента частично или полностью прекратили работу веб-ресурсы по всей Европе (по имеющимся сведениям, пострадало свыше 3,5 млн веб-ресурсов). Пожаром были уничтожены 15 тыс. серверов. Больше всего пострадали данные пользователей симулятора выживания Rust – пожар уничтожил 25 серверов онлайн-игры, информация безвозвратно утеряна.

2022 г., октябрь. Дата-центр SK Group (Южная Корея). Пожар начался в комнате c АКБ, затем распространился на остальную часть здания. Пожарным потребовалось около 8 ч, чтобы взять пламя под контроль. Авария вывела из строя десятки тысяч серверов, включая собственные системы SK Group, инфраструктуру самого популярного южнокорейского мессенджера KakaoTalk и инфраструктуру облачного гиганта Naver («южнокорейский Google»). Со специальным заявлением выступил президент страны Юн Сок Ёль, который пообещал провести тщательное расследование причин пожара. Была создана национальная целевая группа по предотвращению аварий и катастроф с участием военных чиновников и национального разведывательного управления.


Если пересчитать количество пожарных инцидентов на количество часов работы ЦОДов и ориентироваться на статистику МЧС, то, по словам А. Солодовникова, российские дата-центры находятся примерно на уровне детских садов и оздоровительных лагерей, где уровень подобных инцидентов крайне низок.

Наконец, согласно исследованию Uptime Institute 2017 Data Center Survey (исследование проводилось однократно, поэтому увидеть ситуацию в динамике не представляется возможным), только 11% опрошенных операторов дата-центров сталкивались с пожарами в ЦОДах, в то время как 89% респондентов такого опыта не имеют. 

Впрочем, несмотря на то что частота возникновения пожаров в ЦОДах сравнительно мала, риски в случае его возникновения слишком высоки, а борьба с последствиями обходится очень дорого. Поэтому вопрос не в том, надо ли тушить, а в том, как вместе с водой не выплеснуть ребенка: как в попытках предотвратить возгорание не нанести оборудованию и помещениям ущерб, сопоставимый с пожаром.

 
Что же такое пожар?

Федеральный закон «О пожарной безопасности» от 21.12.1994 № 69-ФЗ гласит: «Пожар – неконтролируемое горение, причиняющее материальный ущерб, вред жизни и здоровью граждан, интересам общества и государства». 

Сходное определение пожара дает МЧС России: «Пожар – неконтролируемый процесс горения, сопровождающийся уничтожением ценностей и создающий опасность для жизни и здоровья людей, сельскохозяйственных животных, растений и окружающей среды».

 
Когда тушить?

Ни у поставщиков противопожарных решений, ни у операторов ЦОДов не вызывает сомнений необходимость использовать автоматическую систему раннего обнаружения возгорания (например, аспирационную систему), которая должна подать сигнал уже при первых признаках задымления. А вот относительно того, как действовать дальше, мнения расходятся.
Источник: ГК «Пожтехника»
Система раннего обнаружения пожара

Казалось бы, ответ лежит на поверхности – на сигнал нужна незамедлительная реакция, которую может обеспечить система автоматического пожаротушения. Но на практике все несколько сложнее.

Во-первых, серьезная проблема системы раннего обнаружения возгорания – ложные срабатывания. Она может детектировать не только опасный дым от готового воспламениться оборудования, но и дым от источника, не относящегося к дата-центру, скажем, от костра за пределами его территории. Например, в сети дата-центров 3data, по словам ее технического директора Максима Церулева, за все время работы 15 ЦОДов было семь случаев срабатывания системы автоматического пожаротушения и выхода газа, но только два из них произошли по причине реального задымления. Между тем каждый раз после выхода газа систему надо заправлять заново, а это довольно дорогая процедура.

Кроме того, потенциально опасный инцидент, даже детектированный в самом дата-центре, не всегда повлечет за собой возгорание, поэтому «тушить любой ценой» нерационально, так как ущерб от применения автоматического пожаротушения может быть в разы больше, чем от выхода из строя какого-либо оборудования из-за перегрева. На другой чаше весов – огромные риски развития пожара, и пропустить инцидент опасно.

Общее мнение экспертов отрасли таково: в дата-центре непременно должны быть и система раннего обнаружения, и система автоматического пожаротушения, но работа автоматики всегда должна верифицироваться людьми. Ответственные сотрудники, приняв сигнал от системы раннего обнаружения, должны сами оценить ситуацию и решить, по какому сценарию необходимо действовать. 

Система раннего обнаружения пожара, полагает заместитель директора по управлению эксплуатацией ГК Key Point Константин Нагорный, предназначена в первую очередь для информирования людей. А регламент действий в случае инцидента должен определять главный инженер или технический директор, это их зона ответственности. Ведь при ложном срабатывании автоматической системы газового пожаротушения оператор ЦОДа понесет издержки только на повторную заправку системы газом, но если на объекте установлена система тушения водой, то с оборудованием можно попрощаться – по крайней мере, на значительное время, если не навсегда. 

Связку «автоматика – человек» использует на своих площадках DataSpace. Как рассказал Николай Шеметов, технический директор DataSpace, оператор ЦОДа, оказывая услуги размещения клиентского оборудования, порой сталкивается с тем, что оборудование клиента слишком старое или слишком изношенное. Поэтому случаи перегрева и задымления возможны. Но, оценивая корректность срабатывания системы сверхраннего обнаружения и тяжесть случаев, технические специалисты всегда сверяются с данными температурных датчиков, с показателями нагрузки сети (если проблема в оборудовании, то будет скачок напряжения).

Аналогичного подхода придерживаются и в 3data. Если позволяет время и ситуация не критическая, то, как считает М. Церулев, имеет смысл тщательно оценить происходящее – с помощью систем видеонаблюдения, показателей датчиков и графиков электропитания стоек. Сотрудникам технической службы стоит пройти по проблемному участку с тепловизором. И уже в зависимости от полученных данных нужно предпринимать те или иные действия – по каждой из экстренных ситуаций в 3data есть четко расписанные инструкции для персонала. Есть она и на тот случай, когда видно открытое пламя – непременно тушить автоматически, люди к огню приближаться не должны. В такой ситуации использование автоматического пожаротушения более чем оправдано: «Если оборудование горит с пламенем, то когда же его тушить, если не сейчас?», – уверен М. Церулев.
 
Источник: 3data
Система пожаротушения в дата-центре 3data

Очевидно, что на первом месте должна стоять безопасность людей. Поэтому регламенты для технических служб, как указывает Сергей Манаев, заместитель генерального директора ГК «Инновационные системы пожаробезопасности», должны однозначно предписывать, что в случае видимого огня (например, он заметен на кадрах, переданных видеокамерой из проблемного зала) необходим запуск автоматической противопожарной системы. А Михаил Кочетков, генеральный директор Холдинг ОСК групп, полагает, что даже если открытого огня не видно, то ходить и проверять задымления технические специалисты на всякий случай должны с огнетушителями.

Однако аварийное пожаротушение – это крайняя мера, считает Петр Ронжин, заместитель руководителя дивизиона эксплуатации дата-центров «Яндекса». Отказ оборудования не так страшен, как отказ в предоставлении сервисов. Именно сервисы должны быть в приоритете, и ничто не должно мешать их оказывать, даже если для этого придется пожертвовать теми или иными устройствами (естественно, речь не идет о критических ситуациях, когда под угрозой оказывается буквально весь объект). 
Операторы коммерческих ЦОДов придерживаются в этом вопросе противоположной точки зрения, хотя и допускают, что для корпоративного дата-центра подход «Яндекса» правомерен. «Если компания считает для себя возможным пожертвовать установленным в ЦОДе оборудованием, то это ее решение», – отмечает М. Церулев. Но в коммерческом ЦОДе, убежден он, оператор всегда должен исходить из интересов заказчиков и зафиксированных SLA. Например, у клиента может быть очень дорогой «штучный» blade-сервер, который в случае повреждения в нынешних условиях будет практически невосстановим. Так что жертвовать оборудованием клиентов оператор colocation не имеет права. Лучше запустить систему газового пожаротушения, чем рисковать, полагает эксперт.

Таким образом, автоматическое пожаротушение – единственно правильное решение для современного дата-центра. Малое число пожаров в ЦОДах, особенно в ЦОДах крупных мировых игроков, по мнению Натальи Хазовой, генерального директора ГК «Пожтехника», как раз служит лучшим подтверждением необходимости использования систем такого рода: во всех дата-центрах первого эшелона решения для автоматического пожаротушения установлены. Однако речь не идет о немедленном включении автоматики сразу после срабатывания системы раннего обнаружения пожара, подчеркивает Н. Хазова. Временной зазор между срабатыванием систем позволяет людям вмешаться в процесс. Но если людей не оказалось рядом или они не успели среагировать, то автоматика позволит не допустить критической ситуации.

Пожаротушение – задача комплексная

Вопрос «Если тушить с помощью автоматической системы, то какую систему использовать?» не так прост и, следовательно, ответы на него неоднозначны. По данным уже упоминавшегося исследования Uptime Institute 2017 Data Center Survey, 18% опрошенных высказались за использование в системах пожаротушения ЦОДов воды, 54% – газа, 28% – того и другого.

За годы, прошедшие с этого исследования, технологии шагнули вперед, и, в частности, достаточно широкое развитие получили системы тушения водяным туманом, или тонкораспыленной водой. В России такое решение используется, например, в ЦОДе IXcellerate. Так что у воды, по всей вероятности, сторонников теперь будет больше 18%. Правда, отвечая на вопрос, какую систему выбрать для обеспечения пожаробезопасности машинных залов ЦОДов, участники дискуссии на «ЦОД-2024» почти единогласно высказались за автоматические системы газового пожаротушения. Более того, как заметил К. Нагорный, никакой клиент в коммерческий ЦОД не пойдет, если в нем не будет именно такой системы. Если же речь идет о корпоративном ЦОДе, продолжает эксперт, то здесь вариантов может быть множество. Можно заливать водой, засыпать песком, можно даже совсем не тушить – это зависит от корпоративных правил и установок.

Что же касается остальных помещений дата-центра, то здесь единого мнения нет. Скорее, есть понимание того, что установка любой системы должна быть оправдана и экономически, и стратегически. Это ни в коем случае не должна быть система ради системы. Например, разработчики и поставщики систем пожаротушения, стараясь продать свои продукты, нередко, по словам П. Ронжина, упирают на то, что «так прописано в нормах». Спору нет, пожаробезопасность ЦОДа должна быть обеспечена, но это вопрос не только установки той или иной системы. Здесь нужно, с одной стороны, руководствоваться пониманием реальных рисков, а с другой – видеть цель и иметь набор решений для ее достижения. Это комплексная задача, которую надо выполнять на разных уровнях. В частности, отмечает эксперт, в общей пожаробезопасности ЦОДа немалую роль играют дизайн и подбор материалов для каждого помещения. Скажем, отказ от фальшпола в пользу голого бетона, как это реализовано в дата-центрах «Яндекса», сам по себе улучшает пожаробезопасность.
 
Источник: «Яндекс»
Система автоматического пожаротушения в дата-центре «Яндекса»

ЦОД включает в себя множество различных помещений и модулей, каждое из которых имеет свои риски пожаробезопасности, свои особенности работы, свою цену выхода из строя и т.д. Для каждого модуля походят свои системы пожаротушения, полагает П. Ронжин. Поэтому не только тем, кто строит и эксплуатирует ЦОДы, но и тем, кто предлагает системы пожаротушения для объектов, надо исходить из конкретных целей, задач и возможностей.

Кроме того, нужно учесть замечание К. Нагорного, который подметил, что, говоря о пожарах в ЦОДах, все фокусируются на серверных помещениях, в то время как аварийные ситуации чаще всего возникают не там. Поэтому так важна общая культура эксплуатации ЦОДа как целостного объекта.
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!

Продолжение использования сайта пользователем интерпретируется как согласие на обработку фрагментов персональных данных (таких, как cookies) для целей корректной работы сайта.

Согласен