Анализ Компания Databricks объявила о приобретении стартапа по созданию генеративного ИИ MosaicML за 1,3 миллиарда долларов в рамках сделки, которая облегчит частным организациям обучение и запуск собственных моделей машинного обучения.
Сделка представляется логичным шагом, обеспечивающим рост для обеих сторон. Базовая платформа Databricks помогает клиентам хранить и сортировать входящие данные из разных источников в своих собственных облачных кластерах, а MosaicML предлагает инструменты для развертывания пользовательских моделей ИИ по низкой цене.
Вместе эти два подразделения обладают технической инфраструктурой и опытом для привлечения крупных предприятий, которые хотят использовать свои собственные данные для обучения и развертывания генеративных систем искусственного интеллекта. Многие малые и средние предприятия хотят внедрить машинное обучение, но опасаются обращаться к готовым моделям, созданным частными компаниями.
Прежде всего, они не хотят делиться конфиденциальной информацией с потенциальными конкурентами и не уверены в использовании своих моделей, если точно не знают, как они себя поведут. OpenAI и Googleнапример, не раскрывают, какие именно данные используются для обучения их моделей, и вполне возможно, что они могут действовать таким образом, который трудно предсказать.
«Какие бы данные ни использовались для обучения модели, эта модель теперь представляет эти данные, и поэтому куда бы ни пошли веса модели, данные исчезли. Поэтому, чтобы предприятия действительно начали внедрять эти возможности, необходимо уважать право собственности на модель, чтобы уважать свои данные. баланс конфиденциальности», — сказал ранее Навин Рао, генеральный директор и соучредитель MosaicML. Регистр.
Databricks и MosaicML обеспечивают уверенность в том, какие данные используются для обучения модели. Это приобретение означает, что у Databricks будут лучшие ресурсы искусственного интеллекта, а MosaicML получит доступ к более качественным данным для создания пользовательских частных моделей.
За последние пару месяцев MosaicML выпустила две большие языковые модели с открытым исходным кодом — MPT-7B и MPT-30B, которые, как утверждается, демонстрируют, что обучение может стоить сотни тысяч долларов вместо многомиллионных, необходимых для альтернативной модели. -производители.
Меньшие модели не так функциональны, как что-то вроде GPT-4, но бизнесу это не обязательно нужно. Многим нужна система, которая хорошо справляется с конкретными задачами, и с удовольствием выберут модели меньшего размера, если они смогут лучше контролировать систему и снизить затраты на разработку.
«Экономика должна быть благоприятной. Все сводится к тому, насколько вы сможете ее оптимизировать», — сказал Рао. Рег.
«Каждый раз, когда вы вводите текст в ChatGPT, он выполняет логический вывод и выдает слова. Каждый из них в основном работает на веб-сервере из восьми графических процессоров. Этот сервер стоит примерно 150 000 долларов. к этому, — сказал Рао.
«Настоящая оптимизация этого стека — объединение нескольких запросов и эффективное использование оборудования — вот суть игры. Гораздо важнее сделать его суперэффективным, чтобы вы не тратили зря время графического процессора на меньший масштаб на запрос».
Рынок пользовательского ИИ накаляется. Работая в Databricks, MosaicML сможет работать с более крупными клиентами в более разнообразных отраслях.
Databricks уже утверждает, что работает с более чем 10 000 организаций по всему миру. С добавлением инструментов MosaicML у него, по-видимому, лучший конвейер машинного обучения, позволяющий привлекать бизнес от своих конкурентов и удерживать клиентов, поскольку они все больше инвестируют в ИИ.
Databricks заявила, что надеется закрыть сделку в июле и что все 64 сотрудника MosaicML перейдут в объединенный бизнес. ®