Запускайте сложные модели машинного обучения в производство с помощью бессерверных

    0
    51

    [ad_1]

    Специальная серия Старый трюизм машинного обучения гласит, что чем сложнее и крупнее модель, тем точнее результаты ее прогнозов – до определенной степени.

    Если вы изучаете такие дисциплины машинного обучения, как обработка естественного языка, то именно массивные модели BERT и GPT заставляют практиков падать в обморок, когда дело доходит до точности.

    Однако энтузиазм утихает, когда дело доходит до запуска этих моделей в производство, поскольку их огромный размер превращает развертывание в настоящую борьбу. Не говоря уже о стоимости настройки и обслуживания инфраструктуры, необходимой для перехода от исследования к производству.

    Читая это, заядлые последователи ИТ-тенденций могут вспомнить появление бессерверных вычислений пару лет назад.

    Такой подход в значительной степени обещал большие вычислительные возможности, которые можно было бы автоматически масштабировать вверх и вниз для удовлетворения меняющихся требований и сохранения низких затрат. Это также дало возможность освободить команды от бремени заботы о своей инфраструктуре, поскольку в основном это было в форме управляемых предложений.

    Что ж, serverless с тех пор никуда не делся и на первый взгляд кажется почти идеальным решением. Однако если копнуть глубже, то ограничения на такие вещи, как занимаемая память и размер пакета развертывания, мешают сделать это простым вариантом. Однако интерес к сочетанию бессерверного и машинного обучения растет. А вместе с ним и количество людей, работающих над способами создания моделей BERT и совместимых со спецификациями поставщиков, чтобы облегчить бессерверное развертывание.

    Чтобы узнать больше об этих разработках, мы приветствуем Марека Шуппу в четвертом выпуске нашей серии веб-лекций MCubed для практиков машинного обучения 2 декабря. Шуппа возглавляет отдел данных в компании Slido, разработчик приложений для вопросов и ответов и опросов, где он и некоторые коллеги использовали в прошлом году, чтобы исследовать способы изменения моделей для анализа и классификации настроений, чтобы их можно было использовать в бессерверных средах – без серьезного снижения производительности.

    В своем выступлении Шуппа немного расскажет о сценарии использования своей команды, о вещах, которые заставили их считать бессерверными, о проблемах, с которыми они столкнулись во время своих исследований, и о подходах, которые они сочли наиболее многообещающими для достижения уровней задержки, подходящих для производственных сред. их развертывания.

    Как обычно, веб-трансляция 2 декабря начнется в 11:00 по Гринвичу (12:00 по центральноевропейскому времени) с обзора новостей о машинном обучении, связанных с разработкой программного обеспечения, что даст вам пару минут, чтобы освоиться, прежде чем мы погрузимся в тему модели. развертывание в бессерверных средах.

    Мы будем рады видеть вас там; мы даже отправим вам быстрое напоминание о текущем дне, просто зарегистрируйтесь прямо здесь. ®

    [ad_2]

    Предыдущая статьяКак заработать 100000 долларов в GTA Online на этой неделе
    Следующая статьяFinal Fantasy 14: Как получить маунта Кирин
    Виктор Попанов
    Эксперт тестовой лаборатории. Первый джойстик держал в руках в возрасте 3 лет. Первый компьютер, на котором „работал” был с процессором Intel i386DX-266. Тестирует оборудование для издания ITBusiness. Будь то анализ новейших гаджетов или устранение сложных неполадок, этот автор всегда готов к выполнению поставленной задачи. Его страсть к технологиям и приверженность качеству делают его бесценным помощником в любой команде.