Rambler's Top100
Статьи ИКС № 1 2019
Кевин ХЭСЛИН  21 марта 2019

Система классификации Tier: мифы и заблуждения

Когда дело касается системы классификации Tier, важно отделять желаемое от действительного и истину от заблуждений.

Системе классификации Tier, разработанной Uptime Institute для оценки надежности центров обработки данных, уже более двух десятков лет. С момента создания в середине 90-х годов система Tier прошла путь от отраслевой терминологии до глобального стандарта для независимой аттестации критической инфраструктуры ЦОДов.

Все это время индустрия обработки данных развивалась, и вместе с ней эволюционировала система Tier. Однако параллельно накапливались и всякого рода мифы и заблуждения, затрудняющие понимание этой системы классификации.

В Uptime Institute давно знают, что есть специалисты, которые не до конца представляют себе концепцию стандартов Tier или не согласны с некоторыми определениями. При этом часто возникает ситуация, когда желаемое принимается за действительное. Не стоит также забывать о маркетологах, которые при работе с потенциальными клиентами создают собственные термины, такие как «Tier III+». Подобные термины, как правило, не имеют ничего общего с системой Tier, но могут ввести в заблуждение специалистов по ИТ, коммерческой недвижимости, персонал по закупкам, финансовых директоров – иными словами, всех тех, кто может недостаточно хорошо разбираться в технической стороне вопроса.

Некоторые мифы появляются вследствие того, что часть специалистов работают с устаревшими публикациями и пояснительными материалами.

Uptime Institute создал систему классификации Tier как инструмент для оценки ЦОДов с точки зрения времени бесперебойной работы их инфраструктуры. Система предусматривает четыре уровня, и каждый следующий уровень включает в себя требования, относящиеся к предыдущему:
  • Tier I -- базовый уровень;
  • Tier II -- резервирование активных компонентов инфраструктуры;
  • Tier III -- параллельно обслуживаемая инфраструктура;
  • Tier IV -- отказоустойчивая инфраструктура.
Сложность и стоимость дата-центра возрастают с увеличением уровня Tier, так что будущий владелец ЦОДа должен определить желаемый уровень, исходя из потребностей своего бизнеса.

Только Uptime Institute имеет право сертифицировать ЦОДы по системе классификации Tier. Но сама эта организация не проектирует, не строит дата-центры и не управляет ими. Ее роль заключается в том, чтобы оценивать инфраструктуру, особенности эксплуатации, стратегию управления и развития.

Мы собрали и рассмотрели целый ряд мифов и заблуждений, связанных с системой Tier.

Система Tier не имеет отношения к бизнесу

Неверно. Tier – это система оценки работоспособности и надежности дата-центров, основанная на требованиях бизнеса. Допустимый риск простоя ЦОДа определяет необходимый уровень Tier. Иными словами, уровень Tier определяется, исходя из индивидуальных особенностей производственных и бизнес-процессов каждой конкретной компании. Организации, которые не оценивают все факторы своей деятельности перед выбором целевого уровня Tier, практически наверняка ошибутся в выборе, потеряв при этом значительные средства.


Tier IV – лучший выбор

Неверно. Уровень Tier определяется допустимыми рисками для бизнеса компании или организации. В вопросе выбора уровня Tier не существует универсального ответа. Владельцы должны провести комплексную оценку всех рисков перед определением оптимального уровня Tier. В противном случае существует вероятность неоправданно высоких затрат на создание ЦОДа.

Tier I и Tier II являются больше тактическим выбором, основанным на желании снизить себестоимость и сократить время выхода на рынок, а не на требованиях к оптимизации стоимости в течение жизненного цикла (TCO) и высокой надежности. Бизнес тех, кто выбирает такие уровни, обычно не связан с доставкой продуктов или услуг в реальном времени. Как правило, такие организации защищены страховками от ущерба, вызванного простоем ИТ-системы.

Жесткие требования к бесперебойной работе и долгосрочной живучести ИТ-объекта зачастую являются причиной выбора инфраструктуры ЦОДа уровней Tier III и Tier IV. На объекте Tier III каждый компонент инфраструктуры может быть выведен из эксплуатации для проведения технического обслуживания без какого-либо влияния на работу критических систем или ИТ-процессов. Решения Tier IV еще более надежны, поскольку каждый компонент инфраструктуры и канал распределения может выдерживать сбой, ошибку или любое незапланированное событие без влияния на работу критических систем или ИТ-процессов.

Решение Tier IV не лучше, чем Tier II. Работоспособность и возможности инфраструктуры ЦОДа должны соответствовать требованиям бизнеса, в противном случае компании могут столкнуться с неоправданно высокими затратам или чрезмерными рисками.
Например, прежде чем создавать площадку уровня Tier II, которая по определению не включает в себя резервные мощности во всех критических подсистемах, владелец должен подумать, может ли предприятие в принципе допустить запланированное отключение дата-центра (например, на техническое обслуживание), и как команда по эксплуатации будет координировать такое отключение. Похожие рассуждения должны предварять принятие решения о создании ЦОДов любого уровня.

Уровень Tier определяется количеством резервных компонентов

Неверно. Система Tier – это основанная на характеристиках работоспособности оценка инфраструктуры ЦОДа, а не контрольный список или набор рецептов. Для описания уровня отказоустойчивости в индустрии распространены обозначения типа N + 1, N + 2, 2N или 2(N + 1), где N определяется как минимальное количество компонентов, необходимых для функционирования ЦОДа. Однако увеличение количества компонентов не определяет и не гарантирует достижение какого-либо конкретного уровня Tier, поскольку система Tier также включает в себя оценку путей доставки (электропитания, холодоносителя и пр.) и других элементов системы. Таким образом, можно достичь уровня Tier IV и с помощью N + 1 активных компонентов – все будет зависеть от того, как они сконфигурированы и подключены к резервным путям систем электроснабжения и охлаждения.

Значение имеет только сертификация проектной документации

Неверно. Сертификация проектной документации – только первый шаг в процессе сертификации Tier. Консультанты Uptime Institute рассматривают весь пакет документов, проверяя соответствие электрических и механических систем, а также систем мониторинга и автоматизации требованиям соответствующего уровня Tier и выявляя слабые места в проекте. Сертификация проекта нужна для того, чтобы владельцы ЦОДов могли начать возведение объекта, будучи уверенными в том, что проект соответствует целевому уровню Tier.

Сертификация проекта распространяется только на пакет документов. Она предназначается для проведения предварительной оценки перед сертификацией готового объекта. При сертификации проекта Uptime Institute не проверяет реализованный объект и, следовательно, не может говорить о соответствии созданного дата-центра стандартам Tier. Чтобы подчеркнуть этот момент, Uptime Institute ограничил срок действия сертификатов проектной документации. У всех сертификатов, выданных после 1 января 2014 г., срок действия истекает через два года после даты выдачи.

При сертификации готового дата-центра команда консультантов Uptime Institute выезжает на объект для выявления расхождений между проектной документацией и конкретной реализацией. Консультанты проводят испытания на соответствие заявленному уровню Tier. В этом и заключается ценность сертификации Tier: она находит все слабые места в системе. Консультанты Uptime Institute почти на каждом объекте обнаруживают, что после выдачи сертификата на проект в проектную документацию вносились изменения. При этом, как правило, одна или несколько систем или подсистем перестают соответствовать требованиям Tier.

В 2009 г. Uptime Institute учредил в системе Tier сертификацию эксплуатационной устойчивости (Operational Sustainability), чтобы оценивать, как операторы ЦОДов обслуживают инфраструктуру своих объектов. Без хорошо проработанной комплексной программы управления и эксплуатации даже на самых надежно спроектированных и построенных объектах могут случаться перебои в работе. Сертификация на всех трех уровнях -- проектная документация, построенный объект, эксплуатационная устойчивость -- это гарантия того, что владельцы дата-центров по максимуму реализуют потенциал своих объектов.

Уровень Tier определяет предполагаемое время простоя в год

Неверно. Uptime Institute удалил ссылки на «ожидаемое время простоя в год» из стандарта Tier еще в 2009 г. Более того, этот параметр никогда и не был частью определений Tier. Стандарт Tier Standard: Topology основан на конкретных факторах обеспечения работоспособности, связанных, например, с наличием избыточных компонентов оборудования, обеспечением параллельного обслуживания (возможностью проведения плановых работ с выводом из эксплуатации любых компонентов инженерной инфраструктуры без остановки ИТ-систем) или отказоустойчивости (способностью выдерживать любые незапланированные сбои в инфраструктуре объекта без влияния на работу ИТ-систем). Однако даже в ЦОДе Tier IV, который является отказоустойчивым, могут происходить сбои в работе ИТ-систем, если он неэффективно управляется.

Существуют статистические методы для прогнозирования частоты отказов и времени восстановления. Коэффициент готовности (availability) -- это расчетная величина, характеризующая время, в течение которого объект может быть доступен за некий период. Количество, частота и продолжительность сбоев будут влиять на итоговую готовность. Однако следует соблюдать осторожность при использовании этих величин, поскольку в большинстве статистических моделей не учитывается человеческий фактор. Кроме того, нельзя исключить, что какое-либо маловероятное событие (например, стихийное бедствие) произойдет несколько раз в одном и том же году – пусть даже раньше такое случалось в среднем раз в сто лет.
Уровни Tier применимы только к недавно построенным объектам

Неверно. Uptime Institute сертифицировал множество ЦОДов, уже какое-то время находящихся в процессе эксплуатации. Конечно, процесс сертификации в этом случае усложняется. Для достижения наилучших результатов перед собственно сертификацией рекомендуется пройти процедуру анализа несоответствия требованиям Tier – Tier Gap Analysis. В результате такого анализа владелец получает сводный отчет об основных недостатках существующей системы и может принять взвешенное решение о том, следует ли вообще заниматься сертификацией. Аттестация Tier построенного объекта может быть выполнена с любым профилем нагрузки, включая испытательные нагрузочные стенды, «живую» ИТ-нагрузку или их сочетание.

Система Tier создана для США

Неверно. На текущий момент Uptime Institute предоставляет услуги по сертификации Tier в более чем 85 странах мира. Система Tier допускает множество разнообразных конфигураций, что дает возможность проектировщикам и инженерам подобрать решение, отвечающее местным законодательным и техническим требованиям. До сих пор не зарегистрировано ни одного конфликта между системой Tier и местными строительными нормами, правилами или законами.

Развенчивать мифы о классификации Tier авторы продолжат в следующей публикации.

Кевин Хэслин

В подготовке статьи также принимали участие Крис Браун, Энрике Эрнандес, Джулиан Кудрицки, Эрик Мэддисон, Райан Орр, Сара Томас, Питт Тернер и Рич Ван Лу
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!