Путь к здоровым MLOps –

    0
    2


    Рекламное издание Могут существовать явные пробелы и постоянные точки трения, которые препятствуют способности организации быстро масштабировать и предоставлять ценность. Некоторые из них включают сложность инструментов и моделей, отсутствие автоматизированных рабочих процессов и монолитный подход. Организациям может понадобиться новый современный подход для масштабирования и восстановления контроля над распространением своих моделей и аналитики.

    В этой статье подробно рассказывается о том, как Dataiku может помочь ИТ-лидерам уникальным образом решить эти насущные проблемы MLOps.

    Построение унифицированного контура

    При обсуждении платформ с лицами, принимающими решения, мы в Dataiku часто сталкиваемся с такими вопросами – которые в конечном счете связаны с проблемами MLOps – как:

    – Как в многопрофильном проекте обеспечить максимальную эффективность работы членов команды, чтобы каждый специалист не ждал, пока предыдущий выполнит свою часть работы?

    – Как я могу избежать громоздких и хлопотных интеграций специализированных инструментов, созданных специально для каждой команды?

    – Как я могу внедрять инновации, не выбрасывая уже разработанные модели?

    Проекты по ИИ и аналитике по своей природе являются итеративными, т.е. они обычно требуют постоянного уточнения и улучшения с течением времени. Без единого подхода к MLOps производительность может снизиться, а преимущества ИИ могут быть упущены. Успешная MLOps предполагает объединение людей и этапов, участвующих в цепочке создания стоимости ИИ, создавая непрерывный цикл, который обеспечивает учет итеративного характера проектов ИИ. Все – от специалистов по обработке данных и инженеров до бизнес-аналитиков и операционных ИТ-команд – должны быть на одной волне, чтобы обеспечить плавный и эффективный рабочий процесс.

    Демократизация – это ключ к успеху платформы, и ее следует рассматривать в начале инвестиций, а не после. Какой смысл создавать масштабируемую и перспективную платформу, если она не готова к использованию всеми сотрудниками компании, независимо от уровня их квалификации?

    Dataiku предлагает сквозную среду, так что команды могут делать все – от обнаружения данных до мониторинга моделей – на одной платформе. Она также предоставляет общую грамматику для всех – от продвинутых экспертов по данным, таких как data scientists, до специалистов по доменам с низким уровнем или отсутствием кода, объединяя технические и бизнес-команды для совместной работы над проектами.

    Операционализация контура

    Когда речь идет о задачах MLOps в этом разделе, Вы, возможно, задаетесь вопросом: “Как я могу избежать повторного кодирования всего проекта, чтобы запустить его в производство?” или “Как я могу автоматизировать доставку и качество проектов в производстве?”.

    Непрерывный цикл – это важнейший элемент построения и развертывания моделей машинного обучения (ML). Однако сам по себе он недостаточен. Хотя непрерывный цикл может помочь рационализировать процесс, он все равно может выполняться вручную, внося несогласованность, ошибки и задержки. Чтобы действительно соблюсти такие основы MLOps, как контроль, повторяемость и скорость, непрерывный цикл необходимо ввести в действие.

    Это подразумевает автоматизацию каждого этапа процесса и отслеживание каждого из них. Поступая таким образом, Вы можете значительно снизить риск ошибок, повысить повторяемость и ускорить процесс. Операционализация цикла – это важнейший шаг в обеспечении надежности и эффективности Вашего ML-конвейера.

    Как Вы можете видеть в этом видео – Key Capabilities: MLOps With Dataiku” (в котором эта статья изложена за три минуты!) – то, что Вы разрабатываете, Вы и вводите в действие. Dataiku предлагает бесшовную автоматизацию с помощью Flow – от подготовки до переобучения. Команды могут безопасно внедрять систему с помощью защитных ограждений, встроенных средств тестирования и подписания моделей для обеспечения соответствия требованиям. И, наконец, что не менее важно, производство можно контролировать с помощью мониторинга и оповещения.

    С помощью MLOps в Dataiku Вы сможете легко развертывать, контролировать и управлять ML-моделями и проектами в производстве.

    Повторяйте цикл для масштабирования

    На первых двух этапах мы создали и ввели в действие виртуозный цикл, способный безопасно и эффективно осуществлять итерации при создании и развертывании приложений ИИ. Однако наш бизнес требует создания тысяч приложений ИИ, и поэтому нам необходимо иметь возможность повторять этот процесс многократно.

    Чтобы достичь этого, Dataiku позволяет нам материализовать цикл в модуле Govern с помощью чертежа. Этот чертеж служит шаблоном для других проектов, позволяя нам безопасно ускорить количество проектов, которые мы можем реализовать.

    В рамках каждого проекта мы собираем ряд артефактов, включая наборы данных, модели, блокноты кода и плагины, используя функцию Flow. Эти артефакты каталогизируются в платформе, их можно искать и повторно использовать в других проектах. Чем больше компонентов становится доступным на платформе, тем проще и быстрее становится создавать новые проекты.

    Используя возможности Dataiku, мы можем эффективно и безопасно повторять цикл для нескольких проектов, ускоряя нашу способность создавать огромное количество приложений ИИ. Функции каталогизации и повторного использования платформы позволяют нам оптимизировать процесс и повысить производительность. Наконец, руководители могут контролировать ценность всех бизнес-инициатив с помощью реестра моделей и соответствующих аналитических проектов.

    Унификация, операционализация, повторение

    Путь к эффективной MLOps требует обеспечения того, чтобы развернутые модели хорошо поддерживались, работали так, как ожидалось, и не оказывали негативного влияния на бизнес. ИТ-лидеры могут использовать перспективную платформу Dataiku, чтобы:

    – Охватить весь жизненный цикл проекта (от подготовки данных до производительности и мониторинга модели), обращаясь при этом к многочисленным заинтересованным сторонам

    – Устраните трения и ускорьте процесс с помощью автоматизации и упрощенного развертывания

    – Переход от установки по принципу “один раз и готово” к стандартизированному подходу к масштабированию

    Watch полное видео MLOps в действии – Key Capabilities: MLOps With Dataiku – здесь. За три минуты Вы получите полезный обзор того, как Dataiku действует в качестве инструмента для развертывания, мониторинга и управления ML-моделями и проектами в производстве.

    Спонсор: Dataiku.

    Предыдущая статьяЗабудьте о iPhone Flip – рулонный iPhone может быть на подходе
    Следующая статьяПуть к звуку MLOps
    Виктор Попанов
    Эксперт тестовой лаборатории. Первый джойстик держал в руках в возрасте 3 лет. Первый компьютер, на котором „работал” был с процессором Intel i386DX-266. Тестирует оборудование для издания ITBusiness. Будь то анализ новейших гаджетов или устранение сложных неполадок, этот автор всегда готов к выполнению поставленной задачи. Его страсть к технологиям и приверженность качеству делают его бесценным помощником в любой команде.