AWS делает ставку на жидкостное охлаждение для своих серверов искусственного интеллекта

На этой неделе состоится AWS re:Invent, ежегодная феерия Amazon в области облачных вычислений в Лас-Вегасе, и по традиции компании есть так много анонсов, что она не может уместить все в свои пять (!) основных докладов. В преддверии официального открытия выставки AWS в понедельник подробно рассказала о ряде обновлений своей общей стратегии центров обработки данных, на которые стоит обратить внимание.

Самым важным из них является то, что AWS вскоре начнет использовать жидкостное охлаждение для своих серверов искусственного интеллекта и других машин, независимо от того, основаны ли они на собственных чипах Trainium или ускорителях Nvidia. В частности, AWS отмечает, что таким образом будут охлаждаться ее чипы Trainium2 (которые все еще находятся в предварительной версии) и «решения для суперкомпьютеров на базе искусственного интеллекта, такие как NVIDIA GB200 NVL72».

Стоит подчеркнуть, что AWS подчеркивает, что эти обновленные системы охлаждения могут сочетать как воздушное, так и жидкостное охлаждение. В конце концов, в центрах обработки данных все еще есть множество других серверов, которые, например, обслуживают сети и хранилища и не требуют жидкостного охлаждения. «Эта гибкая мультимодальная конструкция охлаждения позволяет AWS обеспечивать максимальную производительность и эффективность при минимальных затратах независимо от того, выполняются ли традиционные рабочие нагрузки или модели искусственного интеллекта», — поясняет AWS.

Компания также объявила, что переходит к более упрощенным электрическим и механическим конструкциям своих серверов и серверных стоек.

«Последние усовершенствования конструкции центров обработки данных AWS включают упрощенные системы распределения электроэнергии и механические системы, которые обеспечивают доступность инфраструктуры на уровне 99,9999%. Упрощенные системы также сокращают потенциальное количество стоек, на которые могут повлиять проблемы с электричеством, на 89%», — отмечает компания в своем объявлении. Частично AWS добивается этого за счет сокращения количества преобразований электроэнергии на пути от электрической сети к серверу.

AWS не предоставила более подробную информацию, но это, вероятно, означает использование постоянного тока для работы серверов и/или системы HVAC и отказ от многих этапов преобразования переменного тока в постоянный ток (с их потерями по умолчанию), которые в противном случае были бы необходимы.

«AWS продолжает неустанно внедрять инновации в свою инфраструктуру, чтобы создать наиболее производительное, отказоустойчивое, безопасное и устойчивое облако для клиентов по всему миру», — сказал Прасад Кальянараман, вице-президент по инфраструктурным услугам AWS, в заявлении в понедельник. «Эти возможности центров обработки данных представляют собой важный шаг вперед благодаря повышению энергоэффективности и гибкой поддержке новых рабочих нагрузок. Но что еще более интересно, так это то, что они спроектированы как модульные, так что мы можем модернизировать нашу существующую инфраструктуру для жидкостного охлаждения и повышения энергоэффективности, чтобы обеспечить питание генеративных приложений искусственного интеллекта и снизить выбросы углекислого газа».

В целом, по словам AWS, новая мультимодальная система охлаждения и модернизированная система электропитания позволят организации «обеспечить шестикратное увеличение удельной мощности стойки в течение следующих двух лет и еще одно трехкратное увеличение в будущем».

В этом контексте AWS также отмечает, что теперь использует искусственный интеллект для прогнозирования наиболее эффективного способа расположения стоек в центре обработки данных, чтобы уменьшить количество неиспользуемой или недостаточно используемой мощности. AWS также развернет собственную систему управления электрическими и механическими устройствами в центре обработки данных, которая будет оснащена встроенными службами телеметрии для диагностики и устранения неполадок в реальном времени.

«Центры обработки данных должны развиваться, чтобы соответствовать преобразующим требованиям искусственного интеллекта», — сказал Ян Бак, вице-президент по гипермасштабированию и высокопроизводительным вычислениям в NVIDIA. «Благодаря использованию передовых решений жидкостного охлаждения инфраструктура искусственного интеллекта может эффективно охлаждаться при минимизации энергопотребления. Наша работа с AWS над разработкой стойки с жидкостным охлаждением позволит клиентам выполнять требовательные рабочие нагрузки искусственного интеллекта с исключительной производительностью и эффективностью».

Previous post Доллар растет на фоне тарифной угрозы Дональда Трампа по БРИКС и политических проблем Франции
Next post Почему Трамп угрожает ввести 100% тарифы для стран БРИКС?