Bing Chat настолько жаждет графических процессоров, что Microsoft арендует Oracle

    0
    0


    Спрос на услуги искусственного интеллекта Microsoft, по-видимому, настолько велик (а ресурсы Редмонда настолько ограничены), что софтверный гигант планирует перенести некоторые модели машинного обучения, используемые Bing Search, в суперкластер графических процессоров Oracle в рамках многолетнего соглашения, о котором было объявлено во вторник.

    «Наше сотрудничество с Oracle и использование инфраструктуры Oracle Cloud вместе с нашей инфраструктурой искусственного интеллекта Microsoft Azure расширит доступ к клиентам и улучшит скорость получения многих результатов поиска», — пояснил Дивья Кумар, возглавляющий маркетинговую команду Microsoft по поиску и искусственному интеллекту. в заявлении.

    Партнерство, по сути, сводится к следующему: Microsoft нужно больше вычислительных ресурсов, чтобы не отставать от «взрывного роста» своих услуг искусственного интеллекта, а у Oracle просто есть десятки тысяч графических процессоров Nvidia A100 и H100, доступных для аренды. Мы далеки от того, чтобы предположить, что у гиганта баз данных, основанного Ларри-Эллисоном, недостаточно клиентов, чтобы использовать его запасы кремния. Нет, не мы. Вы отлично справляетесь, Ларри и Сафра.

    Microsoft была одной из первых, кто интегрировал чат-бота с генеративным искусственным интеллектом в свою поисковую систему, запустив Bing Chat еще в феврале. Большие языковые модели, лежащие в основе сервиса, требуют не только огромных кластеров графических процессоров для обучения, но и для вывода — процесса запуска модели в работу — для масштабирования. Вы все уже знаете, как это сделать: вы можете вводить подсказки, запросы или запросы в Bing Chat, и он будет пытаться искать информацию, писать плохие стихи, генерировать изображения и другой контент и так далее.

    В последнем сотрудничестве двух облачных провайдеров реализовано преимущество Oracle Interconnect для Microsoft Azure, которое позволяет сервисам, работающим в Azure, взаимодействовать с ресурсами в Oracle Cloud Infrastructure (OCI). Два суперкорпорации ранее использовали эту службу, чтобы позволить клиентам подключать рабочие нагрузки, работающие в Azure, обратно к базам данных OCI.

    В этом случае Microsoft использует систему вместе со своей службой Azure Kubernetes для координации узлов графического процессора Oracle, чтобы не отставать от того, что, как утверждается, является спросом на функции искусственного интеллекта Bing.

    По данным StatCounter, на октябрь 2023 года доля Bing на мировом рынке поиска для всех платформ составляла 3,1 % — это по сравнению с Googleсоставляет 91,6 процента, но выше, чем 3 процента месяцем ранее. На настольных компьютерах доля Bing выросла до 9,1 процента, а на планшетах — до 4,6 процента.

    Мы действительно не видим спроса. Может быть, Microsoft просто хотела большей избыточности?

    Oracle утверждает, что ее суперкластер может масштабироваться до 32 768 процессоров Nvidia A100 или 16 384 графических процессоров H100 с использованием сети удаленного прямого доступа к памяти (RDMA) со сверхнизкой задержкой. Это поддерживается петабайтами высокопроизводительного кластерного файлового хранилища, предназначенного для поддержки приложений с высокой степенью параллелизма.

    Microsoft не сообщила, сколько узлов Oracle GPU ей необходимо для ее сервисов и приложений искусственного интеллекта. Мы запросили у Microsoft и Oracle дополнительную информацию и сообщим вам, если получим что-нибудь в ответ.

    Это не первый раз, когда заклятые враги обращаются друг к другу за помощью. Еще в сентябре Oracle объявила, что разместит свои системы баз данных в центрах обработки данных Microsoft Azure. В этом случае сотрудничество было направлено на сокращение задержки, связанной с подключением баз данных Oracle, работающих в OCI, к рабочим нагрузкам в Azure. ®

    Предыдущая статьяПродолжение Night In The Woods Revenant Hill отменено из-за разработчиков
    Следующая статьяЛучшие корпуса для ПК под открытым небом в 2023 году
    Виктор Попанов
    Эксперт тестовой лаборатории. Первый джойстик держал в руках в возрасте 3 лет. Первый компьютер, на котором „работал” был с процессором Intel i386DX-266. Тестирует оборудование для издания ITBusiness. Будь то анализ новейших гаджетов или устранение сложных неполадок, этот автор всегда готов к выполнению поставленной задачи. Его страсть к технологиям и приверженность качеству делают его бесценным помощником в любой команде.