Рубрикатор |
Статьи | ИКС № 04 2014 |
Заурбек АЛЕХИН Дмитрий БАСИСТЫЙ | 08 апреля 2014 |
Служба эксплуатации российского ЦОДа. Портрет в интерьере XXI века. Часть 2
Последние штрихи – и портрет готов. Теперь, вглядываясь в черты «объекта», можно искать в нем хорошее и плохое, сопоставлять с идеалом, пытаться понять, как сложится его судьба.
Персонал
Автоматических процессов эксплуатации не существует, любой из них требует участия персонала. Персонал службы эксплуатации ЦОДа – важная часть операционной модели, критичный тип ресурсов, недостаточное внимание к которому приводит к усилению факторов, повышающих частоту отказов и аварий.
Вопросы, связанные с персоналом службы эксплуатации ЦОДа, можно разделить на три категории: численность персонала, квалификация, обучение.
С проблемой численности персонала сталкиваются практически все российские ЦОДы. Как показывают исследования, основные ее причины – минимизация операционных расходов ЦОДа и нехватка квалифицированных специалистов на рынке.
Проблему нехватки персонала в службе эксплуатации решают в основном двумя способами: заключая сервисные контракты и повышая уровень квалификации сотрудников. Третий возможный путь – добиться высокой слаженности работы по подготовленным регламентам – пока еще не снискал популярности среди менеджеров служб эксплуатации дата-центров.
Поскольку научный подход к проектированию процессов эксплуатации не распространен в российских ЦОДах, в подавляющем их большинстве ориентируются на личный опыт менеджеров, на которых возложена ответственность за эксплуатацию. Последние же в оценках необходимой численности службы эксплуатации и ее структуры ориентируются на свой предыдущий опыт. Отметим здесь и еще одну важную проблему, связанную с квалификацией персонала: полностью формализовать квалификационные требования к сотрудникам не удается. В результате имеет место субъективный подход менеджеров ЦОДа при принятии решения о приеме специалистов на работу.
Проблему квалификации персонала службы эксплуатации не удается обойти ни одному ЦОДу. Либо приходится делать ставку на аутсорсинговую модель и тогда уже решать вопросы финансирования услуг внешних подрядных организаций и вопросы взаимодействия с ними, либо – даже при смешанной стратегии эксплуатации, своими силами с привлечением сервисных организаций – заниматься повышением квалификации персонала: его обучением и контролем качества знаний.
В нынешней действительности, как оказалось, сложился стандарт де-факто на частоту обучения персонала: два раза в год. При этом большинство менеджеров российских ЦОДов готовы мириться с тем, что обучение будет проходить с отрывом от производства – в специализированных учебных центрах. Вместе с тем немалая часть менеджеров мечтает об организации обучения на территории самих дата-центров, что называется, без отрыва от производства. Причины вполне прозрачны – менеджерам хотелось бы снизить время реакции обучающегося на возможный инцидент в ЦОДе (с отрывом от освоения новых знаний, конечно), но с точки зрения качества и полноты обучения есть серьезные аргументы «против».
В подавляющем большинстве российских ЦОДов понимают важность планового подхода к вопросам обучения персонала – план обучения и следование ему стали хорошей практикой.
Технологии и инструменты
Вопрос о специальных инструментах для обслуживания более-менее решен в большинстве российских ЦОДов. Если в ЦОДе придерживаются стратегии передачи оборудования на обслуживание вовне, проблема инструмента перестает быть проблемой службы эксплуатации. Для стратегии с опорой на собственные силы (которой, кстати, следуют далеко не в большинстве российских ЦОДов) решение вопроса со специальным инструментом – обязательная часть стратегии.
Отрадно осознавать, что инструментарий мониторинга и управления инженерными системами стал неотъемлемой частью ландшафта эксплуатации российских ЦОДов. С одной маленькой оговоркой: по сути внедренные системы мониторинга и управления – всего лишь системы мониторинга, полноценных функций управления в них немного. Это одна из специфических черт подхода к эксплуатации в российских дата-центрах.
Несомненным прорывом в сознании эксплуатантов стоит считать то, что подавляющее большинство менеджеров признают наличие зависимости частоты отказов от уровня автоматизации: чем выше автоматизация, тем реже отказы. В этом ряду эволюции остается сделать последний шаг – перестать бояться удаленного управления инженерными системами.
Системы управления эксплуатацией – относительно новый класс систем для российской отрасли ЦОДов. Новизна его настолько высока, что ЦОДов, в которых развернуты и используются системы управления эксплуатацией, насчитывается не более полудюжины. Это вполне закономерно: в борьбе за бюджет создания ЦОДа, как правило, удается отстоять систему мониторинга и управления инженерными системами, а вот возбудить интерес к будущей эксплуатации и системам управления ею не удается.
Информация
К ней относятся такие категории, как данные об объекте и работающих в нем системах, документация производителей на оборудование и его обслуживание, процессные инструкции и многое другое.
Начальная порция информации об объекте и его системах содержится в эксплуатационной документации. К сожалению, большинство российских ЦОДов либо вовсе не имеют эксплуатационной документации, либо актуальность ее такова, что она становится совершенно бесполезной. Это очень серьезная проблема, которая усугубляется еще и тем, что в ЦОДах не уделяют внимания актуализации документации на системы в процессе эксплуатации: вносимые после перенастроек оборудования изменения не фиксируются документально.
Документация производителей на оборудование, поставляемая вместе с ним, есть практически у всех ЦОДов, и это отрадный факт, но мануалы не в состоянии заменить полноценную эксплуатационную документацию, подготовленную разработчиком системы (проектировщиком) и организацией – наладчиком систем (субподрядчиком).
В условиях, когда нет традиции формализовать процессы эксплуатации – проектировать их, разрабатывать регламенты и ролевые инструкции, – надеяться на наличие этих процессов на объектах эксплуатации не приходится.
Финансы
От финансового обеспечения эксплуатации ЦОДа зачастую зависит, какой подход к эксплуатации будет применяться. Конечно, в большинстве случаев представители служб эксплуатации заявляют о недостатке выделяемых средств для качественного обслуживания. Это естественно: редко кто готов признать, что денег слишком много или что они расходуются не совсем эффективно. Но тем не менее не стоит воспринимать их заявления излишне поверхностно.
Говоря о финансировании, следует помнить как минимум о нескольких аспектах проблемы, в том числе – об объеме средств, выделяемых на эксплуатацию, структуре статей бюджета, процедурах исполнения бюджета, зависимостях между отдельными статьями и в рамках бюджета организации в целом.
Основные статьи расходов – это коммунальные платежи (главным образом, конечно же, плата за электроэнергию), оплата труда персонала и привлекаемых внешних подрядчиков. Прочие статьи, включая обеспечение ЗИП и расходуемыми материалами или обучение персонала, приоритетными зачастую не считаются. Традиционно при возникновении непредвиденных затрат или изменении экономических условий вторая группа статей наименее защищена от секвестра. Но и в первой группе не так уж все хорошо: как правило, разного рода сокращения не касаются только коммунальных платежей, поскольку правила «а иначе – отключим» никто не отменял.
Таким образом, мы имеем картину скорее не общего недостатка средств, а их структурно-неравномерного распределения и, как следствие, существенного недофинансирования как бы неприоритетных направлений. Добавим, что в целом применяемая оценка приоритетности не является корректной, строится скорее исходя из ощущений или с позиции силы, тем самым создавая действительно серьезные проблемы и риски при эксплуатации.
Например, в среднего размера ЦОДе коммунальные платежи превышают потенциальные затраты на обучение персонала в сотни раз. Тем не менее руководители бизнеса часто с легкостью исключают последние в ходе исполнения бюджета, экономя на общем фоне копейки и своими руками создавая условия, в которых персонал, не имеющий необходимой подготовки, своими неправильными действиями может нанести ущерб на миллионы (то же справедливо и в отношении планового ремонта, который, напомним, должен осуществляться до возникновения аварии, а не после…).
Стоит упомянуть еще об одной частой проблеме: почти все отечественные компании работают в годовом цикле, который начинается в январе и заканчивается в декабре. Именно в декабре становится понятен финансовый результат по году и окончательно определяются допустимые параметры затрат. Соответственно, многие финансовые менеджеры стараются под разными предлогами оттягивать некритичные, на их взгляд, платежи ближе к концу календарного года. Однако по многим статьям бюджета ЦОДа исполнение работ требует времени, не говоря уже о необходимости предварительного заключения договоров. Таким образом, даже в случае фактического выделения средств в конце года редко когда эти средства могут быть потрачены эффективно и по назначению.
Для непрерывного бизнеса, каковым является эксплуатация ЦОДа, такого рода неравномерности создают дополнительные проблемы. Хотя, справедливости ради, следует сказать, что проблема конца года характерна для отечественной экономики в целом, и было бы странно, если бы она отсутствовала в отдельно взятой отрасли.
Quo vadis, Domine?
Итак, придерживаясь выбранной операционной модели эксплуатации ЦОДа и базируясь на полученных в ходе исследования данных, мы составили портрет среднестатистической российской службы эксплуатации ЦОДа. Вот ее основные черты:
-
В корпоративных дата-центрах часто отсутствует единая служба эксплуатации, нет одного ответственного за функционирование ЦОДа в целом. Ответственность за инженерную инфраструктуру в ряде случаев тоже разделена между различными службами.
-
Процессы управления и взаимодействия в целом обозначены, но глубина и полнота их реализации отвечают начальному уровню, формирование и развитие этих процессов остается прерогативой самой службы эксплуатации.
-
Процессы обслуживания организованы в соответствии с пониманием представителей службы эксплуатации, их опытом и квалификацией. Ориентация на нормативы и требования производителей не является установившимся стандартом, преобладают собственные методики и оценки.
-
Обеспечивающие процессы редко ориентированы преимущественно на потребности эксплуатации объекта. Формализация части процессов практически отсутствует, в том числе и для столь значимых процессов, как контроль качества исполнения работ и документирование.
-
Дата-центры комплектуются персоналом в недостаточном для нормального обслуживания объеме; формализованные квалификационные требования зачастую отсутствуют. Подготовка персонала ведется, но единого подхода к управлению квалификацией нет.
-
Применение специализированных технологий для организации обслуживания ЦОДа встречается редко, за исключением средств мониторинга и управления инженерными системами. Степень автоматизации управления остается невысокой, хотя имеется положительный тренд.
-
Документация по объекту и процессам эксплуатации в лучшем случае существует в виде комплекта проектных документов, без надлежащей актуализации. Часто документации вообще нет, знания о системах – в основном в головах специалистов.
-
Финансирование эксплуатации ЦОДа как выделенная дисциплина отсутствует, имеют место финансовые проблемы, общие для отечественных компаний разных отраслей.
В целом можно сказать, что общая зрелость эксплуатации ЦОДа как вида деятельности в нашей стране пока остается на невысоком уровне. Представители отрасли в теории правильно понимают, как должна выглядеть идеальная эксплуатация. К сожалению, пока по разным причинам полноценного воплощения теоретических знаний достичь не удается. По крайней мере, такой вывод следует из данных, полученных в ходе исследования ЦОДов.
В то же время общая зрелость понятий у представителей отрасли, давление рынка, стремление к эф-фективности, понимание проблем и задач эксплуатации позволяют осторожно надеяться, что в целом развитие идет в правильном направлении и ситуация в ближайшие годы будет улучшаться. Этому способствует и формирование эксплуатационной дисциплины, и увеличение числа учебных курсов теоретической и практической направленности, и постепенная стандартизация подходов и к проектированию, и к обслуживанию дата-центров во всем мире и в нашей стране. икс