Google Анонсирован Gemini 2.0 с мультимодальным выводом изображения и звука, агентным

    0
    0


    Google представила Gemini 2.0 — последнее поколение своей модели искусственного интеллекта, которая теперь поддерживает вывод изображения и звука, а также интеграцию инструментов «эпохи агентов». Агентные модели ИИ представляют собой системы ИИ, которые могут самостоятельно выполнять задачи с адаптивным принятием решений. Подумайте об автоматизации таких задач, как покупки или планирование встречи, из подсказки.

    Google Анонсирован Gemini 2.0 с мультимодальным выводом изображения и звука, а также функциями агентного искусственного интеллекта

    Gemini 2.0 будет включать в себя несколько агентов, которые смогут помочь вам во всех сферах: от предоставления предложений в реальном времени в таких играх, как Clash of Clans, до выбора подарка и добавления его в корзину на основе подсказки.

    Как и другие агенты ИИ, агенты Gemini 2.0 демонстрируют целенаправленное поведение. Они могут создать список шагов на основе задач и выполнять их автономно. В состав агентов Gemini 2.0 входит Project Astra, разработанный как универсальный помощник искусственного интеллекта для телефонов Android, с мультимодальной поддержкой и интеграцией Google Поиск, объектив и карты.

    Google Анонсирован Gemini 2.0 с мультимодальным выводом изображения и звука, а также функциями агентного искусственного интеллекта

    Project Mariner — еще один экспериментальный агент искусственного интеллекта, который может самостоятельно перемещаться в веб-браузере. Mariner теперь доступен в форме ранней предварительной версии для «доверенных тестировщиков» в виде расширения Chrome.

    Если не считать агентов искусственного интеллекта, Gemini 2.0 Flash является первой версией Googleновая модель искусственного интеллекта. На данный момент это экспериментальная (бета) версия с меньшей задержкой, лучшей производительностью в тестах, а также улучшенными рассуждениями и пониманием математики и кодирования по сравнению с моделями Gemini 1.0 и 1.5. Он также может генерировать изображения на базе Google Модель преобразования текста в изображение DeepMind Imagen 3.

    Gemini 2.0 Flash Experimental доступен в Интернете для всех пользователей и скоро появится в мобильном приложении Gemini. Пользователям, которые хотят протестировать его, необходимо будет выбрать Gemini 2.0 Flash Experimental из раскрывающегося меню.

    Экспериментальная версия Flash Gemini 2.0 в Интернете

    Экспериментальная версия Flash Gemini 2.0 в Интернете

    Разработчики также могут получить доступ к новой модели через Google AI Studio и Vertex AI. Google также подтвердил, что в январе объявит о новых размерах моделей Gemini 2.0.

    Источник

    Предыдущая статьяРЕДМАГИЯ 10 Pro ранняя распродажа
    Следующая статьяЭксклюзивная скидка 20 % в Nomad для читателей с 9 до 5: Кожа. iPhone 16 корпусов, Apple
    Петр Григорин
    Интересуется софтом, разработкой и использование новых приложений, технология искусственного интеллекта. Этот писатель - человек с техническими знаниями, который увлечен разработкой программного обеспечения и использованием новых приложений. Его особенно интересуют технологии искусственного интеллекта и то, как они могут быть использованы для улучшения различных отраслей промышленности и повседневной жизни. Обладая прочной основой в области информатики и острым взглядом на инновации, этот писатель обязательно привнесет ценные идеи и соображения в любую дискуссию на эти темы. Пишет ли он о последних открытиях в области ИИ или исследует потенциал новых программных инструментов, его работа обязательно будет увлекательной и заставляющей задуматься.