Rambler's Top100
Статьи
09 июня 2024

ЦОД-прогнозы 2024

Рост спроса на ИИ, повышение плотности ИТ-систем и ужесточение требований, связанных с устойчивым развитием, потребуют новых инвестиций в ЦОДы. Uptime Institute Intelligence выходит за рамки очевидных тенденций и дает свои прогнозы. 

В начале каждого года Uptime Institute Intelligence составляет краткий список тенденций, или прогнозов, которые будут актуальны для сектора цифровой инфраструктуры на ближайший год и даже годы. Наш цель – выделить важные для отрасли, но часто упускаемые из виду вопросы, которые требуют тщательного изучения. Наши прогнозы на 2023 г. (см. Прогноз 1Прогноз 2Прогноз 3Прогноз 4 и Прогноз 5) оказались достаточно точными и останутся актуальными в 2024 г.

Несмотря на заметный рост сектора цифровой инфраструктуры в последние пять лет, глобальные события (включая пандемию COVID-19, конфликт между Россией в Украиной, экстремальные погодные явления) привели к нарушению цепочек поставок, повышению цен на энергоносители, а также стоимости проектов. Вместе с тем многие проблемы этого сектора являются следствием его успешного развития и связаны с разработкой новых технологий (включая искусственный интеллект) и процессоров.

Инвестиции в ЦОДы будут расти. Данные опроса Uptime Institute показывают, что более половины (61%) операторов корпоративных ЦОДов и почти три четверти (71%) операторов коммерческих ЦОДов, предоставляющих услуги colocation, ожидают увеличения расходов в 2024 г. Это обусловлено прежде всего необходимостью наращивания емкости ЦОДов.

Во многих странах и регионах законы, принятые в 2023 г. и запланированные на ближайшие годы, создают дополнительные сложности для операторов. Эти нормативные акты требуют в основном составления отчетности о климатических рисках, повышения энергоэффективности и снижения выбросов углекислого газа. Хотя эти нормы затронут не все организации, эксплуатационные расходы ЦОДов, скорее всего, возрастут.

В дополнение к ужесточению законодательства, связанному с изменением климата, 2023 г. также выявил недостаточную подготовленность отрасли к экстремальным погодным явлениям. В некоторых регионах аномальная жара приводила к проблемам в работе систем охлаждения ЦОДов. Ожидается, что недавние рекорды температур в 2024 г. будут побиты, и это заставит операторов пересмотреть свои стратегии обеспечения отказоустойчивости. Многие ЦОДы уже увеличивают инвестиции в эту область.

Для поиска решений, которые помогут повысить отказоустойчивость и энергоэффективность, организации, возможно, планируют использовать технологии искусственного интеллекта. Однако, согласно данным опроса Uptime, доверие к ИИ как инструменту для принятия оперативных решений за последний год снизилось. Вероятно, это связано с некоторыми непредсказуемыми и неточными результатами больших языковых моделей. Несмотря на это, инновации в других формах искусственного интеллекта и машинного обучения начинают оказывать влияние на сектор ЦОДов.

Обеспечение необходимой инфраструктуры для обучения ИИ стоит дорого и требует мощного ИТ-оборудования. А дополнительные затраты и ограничения в цепочках поставок делают подобные шаги возможными в ближайшей перспективе лишь для нескольких крупных операторов.

Сегодня и завтра перед операторами ЦОДов стоит непростая задача сбалансировать интеграцию новых технологий в существующие системы и дорогостоящее обновление инфраструктуры с учетом требований устойчивого развития, управляя при этом все более сложными системами и минимизируя операционные риски.

ПРОГНОЗ 1. ЦОДы ждут большие сложности на пути к нулевым выбросам

Уже более десяти лет индустрия дата-центров (и в более широком смысле – вся цифровая инфраструктура, опирающаяся на ЦОДы) живет под угрозой ужесточения законодательства в области устойчивого развития и иного обязательного или полуобязательного контроля. В период интенсивного начального развития отрасли подобные опасения были преимущественно фоновыми, поскольку законодатели больше беспокоились о сохранении репутации важного нового сектора. Однако теперь этот «зеленый медовый месяц» подходит к концу, и для некоторых его окончание окажется болезненным и дорогостоящим. 

Евросоюз впервые представил добровольный Кодекс поведения (Code of Conduct) для ЦОДов в 2008 г., предупредив, что если выбросы углекислого газа и расход энергии не будут взяты под контроль, то вслед за добровольными обязательствами последуют законодательные нормы. Некоторые страны, штаты и города, в том числе Сингапур, Калифорния и Амстердам, разработали весьма жесткие ограничения на планирование дата-центров и даже ввели мораторий на новые проекты. 

С 2018 г. Uptime Institute неоднократно предупреждал операторов дата-центров о вероятном ужесточении законодательства и усилении общественного давления для достижения целей устойчивого развития. Эксперты советовали операторам избегать чрезмерно амбициозных заявлений, собирать данные, лучше отражающие реальное положение дел, и готовиться к переменам. Но следование этим рекомендациям не казалось актуальной задачей: повышение энергоэффективности и производительности процессоров вследствие закона Мура, а также массовый переход в облака сдерживали рост потребления энергии и углеродных выбросов, и при этом эффективность ЦОДов постепенно повышалась. 

Но с 2024 г. новые законы и ужесточение существующих требований приведут к более строгой отчетности по углеродным выбросам во многих странах. В отчетах будет учитываться, насколько обещания корпораций одновременно реалистичны и обоснованны, а их применение не будет ограничиваться территорией страны или штата, где документ был принят.

Впереди трудный период

По ряду причин, связанных с готовностью ПО и процессоров к присутствию в энергосистеме возобновляемой энергии, организациям, которые используют цифровую инфраструктуру, станет труднее сдерживать и тем более сокращать потребление энергии и выбросы углекислого газа. Эти затруднения могут привести к выработке более радикальных и продуманных стратегий устойчивого развития, а также побудить повысить эффективность инвестиций.

Но этим дело не ограничится. Согласно прогнозу Uptime Intelligence, в 2024–2030 гг. отрасль ждет трудный период: если организации не достигнут целей устойчивого развития и целей, заявленных ими самими, они могут вступить в конфронтацию с регулирующими органами и даже с некоторыми партнерами.

Примеры такого противостояния уже есть. В августе 2023 г. поддерживаемая ООН группа организаций «Инициатива по достижению научно обоснованных целей» (SBTi) исключила Amazon (включая AWS) из списка доверенных компаний, поскольку последней не удалось подтвердить свою цель по нулевым выбросам в соответствии с критериями SBTi. 

Это лишь часть более глобальной тенденции. Организация Carbon Disclosure Project (CDP), ведущая наиболее полный глобальный реестр корпоративных обязательств по выбросам углекислого газа, недавно заявила, что из 19 тыс. компаний, опубликовавших на данной платформе свои планы сокращения выбросов, заслуживает доверия только 81. 

Явная несогласованность

В ближайшие годы наиболее крупные и котирующиеся на бирже компании в большинстве развитых экономик должны будут сообщать о своих выбросах углекислого газа и климатических рисках. Подобные сообщения могут публиковаться в соответствии как с законами о финансовой отчетности, так и со специальными директивами, например, с Директивой ЕС о корпоративной отчетности в области устойчивого развития или законом Калифорнии об ответственности за климатическую корпоративную отчетность, принятым в сентябре 2023 г. Комиссия по ценным бумагам и биржам США также в конце концов начнет требовать от листинговых компаний раскрытия информации о выбросах и рисках. 

В некоторых юрисдикциях понадобится улучшить энергоэффективность и отчетность по этому параметру. Последняя редакция Директивы ЕС по энергоэффективности (EED), опубликованная в октябре 2023 г., содержит подробные указания относительно отчетности для ЦОДов, включая использование ИТ- и сетевого оборудования. В Германии внедрение EED идет еще дальше, устанавливая уровни PUE и требования к повторному использованию тепла (за некоторыми исключениями). Это заставит владельцев и операторов ЦОДов, оказывающих услуги colocation, вести особую отчетность.

На неправительственном уровне также наблюдается движение к более конкретной отчетности. Принципы измерения и отражения в отчетах объемов выбросов углекислого газа, которые лежат в основе всех корпоративных целей нулевого уровня выбросов, как правило, должны согласовываться на международном уровне такими учреждениями, как Институт мировых ресурсов и Всемирный деловой совет по устойчивому развитию. В свою очередь, эти принципы используют организации, подобные SBTi и CDP. В области неправительственного регулирования стандарты также переписываются. Например, компенсация углеродных выбросов становится менее приемлемой, что вынуждает операторов напрямую покупать безуглеродную энергию. 

При этом разрыв между публичными обязательствами стран и компаний и тем, что большинство владельцев и операторов цифровой инфраструктуры сегодня реально делают или могут сделать, часто весьма велик. Так, в двух крупных опросах, проведенных Uptime Institute и IBM, значительно меньше половины респондентов в ИТ-организациях и операторах цифровой инфраструктуры сообщили о том, что их компании в настоящее время отслеживают выбросы углекислого газа (см. рисунок).
 
Отслеживание выбросов углекислого газа в компаниях, развивающих цифровую инфраструктуру 


 Категории выбросов парниковых газов

Согласно Протоколу по парниковым газам (Greenhouse Gas Protocol), все выбросы делятся на три категории:

Выбросы категории 1 (Scope 1) – прямые выбросы из источников, принадлежащих компании или контролируемых ею. Сюда входят выбросы от топлива, сжигаемого на принадлежащих компании или контролируемых ею активах, например, в зданиях, транспорте и оборудовании. Также эта категория включает случайные или неорганизованные выбросы (утечки и разливы химических веществ и хладагентов).

Выбросы категории 2 (Scope 2) – косвенные выбросы от покупной электроэнергии, пара, тепла и охлаждения, используемых в зданиях и производственных процессах. Например, именно в эту категорию входят выбросы, создаваемые потребителем, когда он оставляет включенным свет.

Выбросы категории 3 (Scope 3) – все остальные выбросы, связанные с деятельностью компании. К этой категории относятся в том числе деловые поездки, поездки сотрудников на работу, транспортировка продукции от поставщиков и до клиентов, утилизация отходов и т.п. Если компания не обладает недвижимостью и не очень активно потребляет энергию, то именно эта категория обычно дает наибольший вклад в ее углеродный след.


Интересно проанализировать, с чем связано расхождение результатов двух опросов. Результаты IBM основаны на ответах ИТ-руководителей и менеджеров по устойчивому развитию. Согласно их ответам, доля организаций, собирающих данные о выбросах углекислого газа, намного выше, нежели та, которая получена в ходе опроса Uptime. В группу Uptime попали респонденты, которые, скорее всего, непосредственно отвечают за счета за электроэнергию, за использование топлива для генераторов и связанные с этим выбросы углекислого газа, следовательно, они с большей вероятностью имеют сведения и инструменты, необходимые для сбора данных. 

Таким образом, одно из объяснений несоответствия результатов заключается в том, что сотрудники отделов устойчивого развития и ИТ-руководители не всегда имеют возможность собирать все базовые данные и часто используют модели и оценки более высокого уровня. Юридически это может быть приемлемо, но такой подход не позволяет получить данные для конкретных улучшений, необходимых для сокращения цифрового углеродного следа. 

В ходе интервью с сотрудниками корпоративных и коммерческих ЦОДов эксперты Uptime также обнаружили, что большинство из тех, кто занимается вопросами снижения энергопотребления или сбора соответствующих данных, весьма ограниченно контактируют с отделами устойчивого развития или руководителями.

Дальнейшие проблемы

Своевременное составление точных отчетов о выбросах парниковых газов будет для многих операторов цифровой инфраструктуры достаточно сложной задачей, особенно когда речь идет о выбросах третьей категории (Scope 3). Но в итоге операторы столкнутся с проблемами, которые не только будут более сложными, но и могут потребовать значительных инвестиций. 

Первая группа проблем связана с ИТ. За последние пять лет повышение производительности процессоров (в соответствии с законом Мура) замедлилось. Кроме того, все больше используется многоядерных и графических процессоров (GPU). Последние потребляют больше энергии, что увеличивает требования к электропитанию и охлаждению как на уровне серверов, так и на уровне дата-центров в целом. Для предотвращения неконтролируемого энергопотребления и выбросов углекислого газа понадобится значительно улучшить системы охлаждения (например, за счет применения прямого жидкостного охлаждения), более эффективно использовать ИТ-ресурсы и интеллектуально управлять рабочими нагрузками. 

Второй комплекс проблем связан с энергетикой. В большинстве регионов потребуются десятилетия, прежде чем энергетические системы смогут работать без выбросов углерода постоянно или хотя бы большую часть времени. Но стандарты отчетности о выбросах будут все чаще требовать использования внутрирегиональной безуглеродной энергии или энергии, полученной из возобновляемых источников. Поскольку все больше операторов ЦОДов стремятся покупать безуглеродную энергию для достижения нулевого уровня выбросов, возобновляемая энергия будет дорожать, если она вообще будет доступна. Так что приобрести безуглеродную энергию в количестве, достаточном для удовлетворения спроса в режиме 24×7, в лучшем случае будет дорого, а в худшем – невозможно. 

Третья проблема – продолжающийся взрывной рост рабочей нагрузки. По оценкам, дата-центры в настоящее время потребляют от 150 до 400 ТВт*ч энергии в год. Даже без учета использования генеративного ИИ аналитики предполагают, что в ближайшие годы энергопотребление значительно увеличится – согласно некоторым прогнозам, после 2030 г. оно вырастет вдвое или даже больше в связи с увеличением рабочей нагрузки. Это приведет к перегрузке электросетей, еще больше затруднит достижение целевых показателей по выбросам углекислого газа, а операторы цифровой инфраструктуры окажутся в центре внимания регулирующих органов, групп экологического мониторинга и экоактивистов.

ПРОГНОЗ 2. Спрос на ИИ окажет ограниченное влияние на отрасль ЦОДов

Ажиотаж вокруг искусственного интеллекта заставляет индустрию ЦОДов готовиться к серь­езному росту спроса на новые емкости и усложнению технических требований к электропитанию и охлаждению.

Интенсивная разработка сервисов на базе ИИ – в значительной степени результат прогресса в архитектуре нейронных сетей и вычислительном оборудовании. В последней области наиболее заметна Nvidia с ее ИИ-ускорителями. Запуск чат-бота ChatGPT в ноябре 2022 г., продемонстрировавший невиданные ранее возможности машинного обучения, спровоцировал «гонку вооружений», и многие организации начали соревноваться в создании сложных приложений на базе искусственного интеллекта. И спрос на ИИ-ускорители пока существенно превышает предложение.

Эксперты прогнозируют рост спроса на емкости ЦОДов для размещения стоек с более высокой плотностью, необходимой для ИИ-систем. Кроме того, налицо тенденция ужесточения требований к инфраструктуре электроснабжения и охлаждения, а также увеличения размеров и веса шкафов повышенной плотности.

Хотя нет никаких сомнений в том, что спрос на вычислительные мощности для ИИ будет расти, Uptime Intelligence считает некоторые ожидания завышенными. 

Спрос на новые емкости будет незначительным

Рост спроса на емкости ЦОДов и стойки с более высокой плотностью будет невелик по двум основным причинам. Во-первых, скорость и масштаб роста инфраструктуры обучения ИИ ограничены мощностями производства чипов. Nvidia смогла увеличить выпуск чипов своим партнером TSMC, но она тщательно управляет этим процессом, чтобы избежать перепроизводства. По прогнозам, в 2024 г. Nvidia поставит 1,5–2 млн чипов H100/H200, которые лягут в основу подавляющего большинства инфраструктур обучения ИИ для больших генеративных моделей.

Предполагая, что большинство этих чипов будут заняты вычислениями для искусственного интеллекта, Uptime Intelligence оценивает дополнительную ИТ-нагрузку в 2000–2500 МВт. Это, конечно, значительный, но не драматичный рост. И затронет он относительно небольшое число операторов. В настоящее время большая часть продаж чипов для ИИ приходится на горстку клиентов во главе с Microsoft, Google, AWS и их коллегами в Китае.

Во-вторых, энергетическая плотность «железа», оптимизированного для искусственного интеллекта, конечно, выше, чем у обычного ИТ-­оборудования, однако отнюдь не экстремальная. Эталонные модели той же Nvidia потребляют до 50 кВт на стойку в самой плотной реализации, но аппаратное обеспечение можно распределить по стойкам с учетом ограничений электропитания и охлаждения. Существуют гораздо более высокоплотные инсталляции (более 100 кВт на шкаф) – это, как правило, мультимегаваттные суперкомпьютеры, для которых принципиальна минимизация длины кабелей для высокоскоростного интерконнекта.

На самом деле большинство недавно построенных ЦОДов с современными системами распределения электроэнергии смогут обслуживать все, кроме, быть может, самых крупных обучающих кластеров искусственного интеллекта. На таких объектах за счет модернизации переключателей (там, где это необходимо) и добавления дополнительных силовых цепей не проблема обеспечить мощность, скажем, 40 кВт на стойку.

Влияние генеративного ИИ: медленно, но долго

Uptime Intelligence ожидает, что генеративный ИИ, помимо повышения спроса на новые емкости и внедрения ИТ-систем высокой плотности, будет оказывать на ЦОДы косвенное влияние.
  • Увеличится дисбаланс спроса и предложения. Сроки поставки оборудования для ЦОДов остаются длительными, особенно когда речь заходит о крупных системах, таких как дизель-генераторы (их можно ждать до двух лет), распределительные устройства, трансформаторы, ИБП, а также некоторое механическое оборудование. Растущие потребности в мощностях ЦОДов для обучения ИИ будут способствовать еще большему дисбалансу спроса и предложения, поскольку еще большая доля поставок оборудования будет приходиться на относительно небольшое число крупных и очень крупных ЦОДов (включая объекты гиперскейлеров).
  • Связанная с ИИ «гонка вооружений» еще больше повысит энергопотребление чипов. Мощность кремниевых микросхем за последние шесть-семь лет заметно выросла. Многие крупные ИТ-заказчики предпочитают более производительные системы, несмотря на их большую мощность. Между изготовителями чипов возобновилось жесткое соперничество в повышении производительности микросхем для ИИ и других вычислительных задач. Облачная инфраструктура также подталкивает к созданию микросхем с большим энергопотреблением. Через несколько лет обычными станут серверы мощностью до 1 кВт.
Эта тенденция влияет на архитектуру существующих и будущих серверных процессоров и ускорителей, а также на формирование модельных рядов и ценовых предложений. Использование лучших в своем классе серверных чипов обходится дорого: сегодня продукты того же класса могут стоить на 50–100% дороже, чем пять или шесть лет назад, несмотря на растущую конкуренцию. Скидку, достаточную для того, чтобы компенсировать эту «кремниевую инфляцию», производители чипов предложат только крупнейшим покупателям.
  • Появятся ЦОДы с неоднородной отказоустойчивостью. Большинство ЦОДов проектируются и строятся так, чтобы объект обеспечивал единый уровень отказоустойчивости. Как правило, они стремятся к высокой доступности услуг, хотя это увеличивает их стоимость (объекты с низкой отказоустойчивостью обычно предназначаются для суперкомпьютеров). Рабочая нагрузка, связанная с ИИ (в частности, обучение), не настолько критична, чтобы оправдать высокие накладные расходы на обеспечение бесперебойного гарантированного электропитания, поддерживаемого ИБП и дизель-генераторами, не говоря уже о резервировании всех компонентов, необходимых для непрерывного предоставления сервисов. Если на выполняющем критически важные функции объекте (корпоративном или предоставляющем услуги colocation) доля сервисов на основе ИИ станет значительной, это может побудить его владельца задуматься о неоднородной отказоустойчивости, т.е. о реализации на одном объекте нескольких уровней надежности.
Окончание следует.

Дуглас Доннеллан, аналитик-исследователь,
Энди Лоуренс, исполнительный директор по исследованиям,
Дэниел Бизо, директор по исследованиям,
Макс Смолакс, аналитик-исследователь,
Жаклин Дэвис, аналитик-исследователь,
Джон О’Брайен, старший аналитик-исследователь, Uptime Institute Intelligence

Публикуется с разрешения Uptime Institute.
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!