Разработка рабочих нагрузок искусственного интеллекта – сложная задача –

    0
    1


    Спонсируемая функция Если искусственный интеллект (ИИ) в последние годы посылал ударные волны по миру технологий, то появление генеративного ИИ за последние 18 месяцев стало настоящим землетрясением.

    Для ИТ-лидеров, стремящихся использовать его потенциал в своих организациях, темпы развития могут показаться обескураживающими. Предприятия стремятся как можно лучше использовать собственные данные для создания своих моделей ИИ или перепрофилирования уже имеющихся публичных моделей. Но это может стать серьезной проблемой для команд разработчиков и специалистов по анализу данных.

    Это также может стать своего рода головоломкой для компаний, которые хотят сохранить контроль над инфраструктурой высокопроизводительных вычислений, необходимой для поддержки рабочих нагрузок ИИ. Приложения и сервисы с поддержкой ИИ требуют гораздо более сложного набора кремниевых компонентов, чем традиционные вычисления, а также соответствующей емкости для хранения данных и пропускной способности каналов связи для обработки огромных объемов данных, необходимых на этапах обучения и вывода.

    Лондонские центры обработки данных отражают тенденции развития ИИ

    Потенциал инноваций в области корпоративного искусственного интеллекта и возникающие при этом проблемы отражаются в том, что происходит в центрах обработки данных гиганта колокейшн Digital Realty в Лондоне и его окрестностях по мере того, как искусственный интеллект выходит на первый план в программах клиентов хостинговых компаний.

    В столице Великобритании и ее окрестностях сосредоточено большое количество штаб-квартир и офисов R&D, причем не только в сфере финансовых услуг, но и в других ключевых отраслях, таких как фармацевтика, производство, розничная торговля и технологии.

    Лондон привлекателен политической и правовой стабильностью Великобритании, квалифицированной рабочей силой и развитой технологической инфраструктурой, объясняет технический директор Digital Realty Крис Шарп (Chris Sharp), что делает его превосходной базой как для инноваций, так и для развертывания приложений и рабочих нагрузок искусственного интеллекта.

    Многие предприятия будут остро осознавать проблемы, связанные с общей важностью данных и ИС, а также специфические проблемы, связанные с суверенитетом данных и регулированием, добавляет он.

    “С обучением есть некоторые нюансы”, – объясняет Шарп. “Никто не знает, можно ли это делать где-либо, и в этом случае необходимо соблюдать правила. [local] соответствие [rules].” Кроме того, растет понимание того, что одна модель не обязательно может служить всему миру: “Будет существовать определенная региональность, и это также будет диктовать требования к тренировочным площадкам”.

    В то же время, эти организации сталкиваются с теми же технологическими проблемами, что и другие компании по всему миру, особенно когда речь идет о создании и питании инфраструктуры, необходимой для ИИ.

    Недостаточно просто поставить больше процессоров на эти рабочие нагрузки. Одной из проблем, связанных с конвейерами ИИ и высокопроизводительных вычислений, могут быть различные типы специализированного оборудования, необходимого для эффективной поддержки сложности этих приложений.

    Они варьируются от CPU до GPU и даже специализированных тензорных процессоров (TPU), предназначенных для нейронных сетей. У всех этих устройств разные требования, и все они потенциально могут играть определенную роль в конвейере ИИ клиента. “Способность поддержать полное развертывание этой инфраструктуры – абсолютно первостепенная задача”, – отмечает Шарп.

    Более того, баланс между этими платформами будет меняться по мере того, как проекты ИИ будут выходить за рамки разработки и переходить в производство. “Если Вы сделаете снимок, то сегодня это 85% обучения, 15% умозаключений. Но в течение, возможно, 24 месяцев поддержка умозаключений будет требоваться в 10 раз чаще”, – добавляет он.

    Усовершенствуйте свои умения в области ИИ

    Таким образом, способность изменять и балансировать базовую архитектуру по мере развития моделей имеет первостепенное значение.

    Существует также проблема соединения огромного количества данных и вычислений для обеспечения требуемого уровня производительности ИИ. Несмотря на то, что клиенты в Великобритании будут в значительной степени заботиться о суверенитете данных, им все равно необходимо обрабатывать рабочие нагрузки в международном масштабе, когда это необходимо. И, возможно, им придется использовать океаны данных по всему миру. Как говорит Шарп: “Как соединить все это вместе, ведь Вы не собираетесь владеть всеми данными”.

    Но возможность подключения – это не просто внешняя проблема. “Внутри четырех стен центра обработки данных мы видим в шесть раз больше требований к кабелю. [as] клиенты подключают свои графические процессоры, центральные процессоры, сетевые узлы”. …. Таким образом, если раньше у нас был один кабельный лоток для прокладки оптоволокна, то теперь у нас в шесть раз больше кабельных лотков, просто чтобы сделать это возможным”.

    Над всем этим нависают проблемы, связанные с размещением и питанием этой инфраструктуры. Уже сама плотность требуемых технологий поднимает вопрос о нагрузке на пол, объясняет Шарп. “Просто вес этих возможностей огромен”. И, как выяснила компания Digital Realty, работая с поставщиками облачных услуг, требования к нагрузке на пол могут расти невероятно быстро по мере увеличения масштабов проектов и развития технологий ИИ.

    Охлаждение также всегда является проблемой в центрах обработки данных, и, по мнению Sharp, больше не существует споров о том, на каком охлаждении следует сосредоточиться – жидкостном или воздушном. “Вам нужно уметь эффективно поддерживать и то, и другое”.

    В сочетании с огромной плотностью вычислительной мощности, требуемой рабочими нагрузками ИИ, все это оказывает значительное влияние на спрос на электроэнергию в секторе. По оценкам, опубликованным компанией Schneider Electric в прошлом году, на долю ИИ в настоящее время приходится 4,5 ГВт спроса на электроэнергию для центров обработки данных, и, по прогнозам, этот показатель будет расти со сложной ежегодной скоростью (CAGR) 25-33% и достигнет от 14 ГВт до 18,7 ГВт к 2028 году. Это в два-три раза больше, чем спрос на электроэнергию для ЦОД в целом, который, по прогнозам, будет расти на 10 % в годовом исчислении за тот же период).

    Все это означает, что операторы центров обработки данных должны учитывать “все больше и больше нового оборудования, выходящего на рынок, требующего большей плотности мощности, увеличения площади, необходимой для поддержки этих растущих развертываний”.

    Состояние обновления

    Этот сложнейший комплекс задач лег в основу создания инфраструктуры Digital Realty в Лондоне и его окрестностях, а также ее постоянного обновления и оптимизации по мере того, как предприятия расширяют масштабы своих операций в области искусственного интеллекта.

    Компания располагает шестью хорошо связанными между собой кампусами в районе Лондона, предлагая почти миллион квадратных футов площадей для размещения коло. Но все это не существует в изоляции: в городе насчитывается более 320 различных поставщиков облачных и сетевых услуг. “Сегодня мы видим, что для успешной работы клиентам нужен полный спектр продуктов”, – говорит Шарп.

    Жидкостное охлаждение – особый элемент лондонской инфраструктуры. Поскольку жидкость в 800 раз плотнее воздуха, она может оказывать огромное влияние на эффективность. Центр обработки данных Cloud House компании Digital Realty в Лондоне использует для охлаждения воду из дока Millwall, и эта система в 20 раз эффективнее традиционного охлаждения. Датчики следят за тем, чтобы использовалось только необходимое количество воды, и чтобы она возвращалась в док в неизменном виде.

    Но способность соответствовать требованиям корпораций в Лондоне и его окрестностях сегодня и в будущем также зависит от более широкого видения Digital Realty.

    Вся электроэнергия, потребляемая европейским подразделением Digital Realty, используется из возобновляемых источников благодаря договорам купли-продажи электроэнергии и другим инициативам, а компания в целом заключила контракт на поставку более 1 ГВт новой возобновляемой энергии по всему миру.

    На аппаратном уровне компания разработала такие технологии, как продукт HD Colo, который поддерживает 70 кВт на стойку, что в три раза превышает требования сертификации для систем Nvidia H100, которые в настоящее время лежат в основе передовых архитектур HPC и AI.

    На макроуровне, как объясняет Шарп, компания Digital Realty планирует свои объекты на годы вперед. Это включает в себя “мастер-планирование недвижимости, создание земельных банков и подстанций, чтобы убедиться, что мы заранее спланировали электроснабжение на пять-шесть лет вперед”.

    Это требует тесной координации с самого начала с местными властями и поставщиками коммунальных услуг, включая инвестиции в сами подстанции.

    “Мы активно работаем с коммунальными службами, чтобы убедиться, что есть не только генерация, но и распределение, и чтобы они соответствующим образом укрепили сеть. Я думаю, что это действительно позволяет нашим клиентам и нашим поставщикам, работающим выше по линии, получить много времени, чтобы соответствовать спросу”.

    Сложности управления охлаждением, электропитанием и инфраструктурой

    Трудно решить, что сложнее. Разработка технологий охлаждения и платформ управления питанием, опережающих быстро развивающуюся инфраструктуру ИИ, или взаимодействие с коммунальными службами и муниципалитетами в течение многолетнего периода времени.

    Но решение обеих задач крайне важно, поскольку организации стремятся создать и расширить свой собственный потенциал ИИ как быстро, так и устойчиво.

    Шарп приводит пример одного европейского образовательного и исследовательского учреждения, которому потребовалось нарастить собственную инфраструктуру высокопроизводительных вычислений для поддержки своих амбиций в области ИИ, и он знал, что ему нужно использовать прямую жидкость к чипу. У этого учреждения, безусловно, были технические знания и опыт для создания собственной инфраструктуры. Но как только она начала планировать проект, стало ясно, что начинать с нуля означало бы пять-шесть лет строительства. А в нынешних условиях это целый век. Кроме того, согласно местным нормам, компания должна была сократить энергопотребление на 25 процентов в течение пяти лет.

    Но благодаря сотрудничеству с Digital Realty, объясняет Шарп, компания смогла развернуть систему за один год, а использование 100-процентного жидкостного охлаждения повысило энергоэффективность на 30 процентов. По словам Шарпа, “это действительно помогло им довольно быстро”.

    Учитывая, как быстро изменился мир за последние 18 месяцев, возможность так быстро запустить проект ИИ в производство – это не просто приятная мелочь. Для многих предприятий она станет жизненно важной.

    “Многие проекты по внедрению ИИ провалились, потому что в них много науки и сложности”, – говорит Шарп. Но он продолжает: “Мы тратим много времени на устранение сложности”.

    Спонсор: Digital Realty.

    Предыдущая статьяZTE только что анонсировала множество новых телефонов Android, и они выглядят великолепно
    Следующая статьяHuawei AI Celia Voice получает обновление 12.1.1.400
    Виктор Попанов
    Эксперт тестовой лаборатории. Первый джойстик держал в руках в возрасте 3 лет. Первый компьютер, на котором „работал” был с процессором Intel i386DX-266. Тестирует оборудование для издания ITBusiness. Будь то анализ новейших гаджетов или устранение сложных неполадок, этот автор всегда готов к выполнению поставленной задачи. Его страсть к технологиям и приверженность качеству делают его бесценным помощником в любой команде.