ChatGPT скоро будет принимать голосовые и графические подсказки

    0
    0


    После обновления ChatGPT позволит пользователям загружать изображения, разговаривать с чат-ботом и слышать его ответ.

    Новейшие функции будут доступны платным подписчикам и корпоративным клиентам в течение следующих двух недель в веб-приложениях, приложениях для iOS и Android, а позже и в бесплатной версии, объявила OpenAI в понедельник.

    Разумеется, с появлением новых возможностей появляются и новые способы злоупотреблений. С этой целью OpenAI также сообщила, что они ограничили возможность комментировать определенные типы изображений, чтобы предотвратить появление неуместных, предвзятых и оскорбительных личных замечаний.

    «Модели, основанные на видении, также создают новые проблемы, начиная от галлюцинаций о людях и заканчивая интерпретацией образов моделью в областях с высокими ставками. профессионализм и разнообразный набор альфа-тестеров. Наше исследование позволило нам согласовать несколько ключевых деталей для ответственного использования», — заявили в OpenAI.

    «Мы также приняли технические меры, чтобы значительно ограничить способность ChatGPT анализировать и делать прямые заявления о людях, поскольку ChatGPT не всегда точен, и эти системы должны уважать конфиденциальность людей».

    Обработка типов данных помимо текста значительно расширяет возможности ChatGPT. Например, пользователи могут загружать изображения объектов, таких как исторические достопримечательности, чтобы узнать о них больше, или фотографии внутренней части своих холодильников, чтобы показать чат-боту, что они могут сделать из имеющихся у них ингредиентов. Они также могут указать ChatGPT сосредоточиться на определенных частях изображения, выделив раздел вручную.

    OpenAI интегрировала свою модель распознавания речи Whisper, чтобы дать ChatGPT возможность расшифровывать голос в текст, и добавила новую систему для преобразования текста в речь. Пользователи могут выбирать, как будет звучать чат-бот, используя пять разных голосов, сгенерированных искусственным интеллектом.

    Утверждается, что Spotify использует новую генеративную аудиомодель для перевода подкастов на разные языки, сохраняя при этом звук голосов говорящих.

    На данный момент ChatGPT может расшифровывать речь только на английском языке и неэффективен с другими языками, особенно с теми, которые не используют латинский алфавит, пояснил OpenAI.

    Большие языковые модели — это мощная технология, но они не идеальны и по-прежнему склонны генерировать ложную информацию. Вероятно, лучше не полагаться на чат-бота в принятии рискованных решений, например, в выборе грибов, которые можно есть. Как выразился сэр Терри Пратчетт: «Все грибы съедобны. Некоторые грибы съедобны только один раз».

    Регистр попросил OpenAI разъяснить, будет ли она вообще собирать голоса и изображения пользователей. Ранее компания заявляла, что не будет обучаться на данных своих корпоративных клиентов или разговоров людей, если они отключили историю своих чатов. ®

    Предыдущая статьяЕсть ли iPhone 15 есть проблема с перегревом?
    Следующая статьяA nasty Johnny Silverhand bug nearly derailed my Cyberpunk 2077
    Виктор Попанов
    Эксперт тестовой лаборатории. Первый джойстик держал в руках в возрасте 3 лет. Первый компьютер, на котором „работал” был с процессором Intel i386DX-266. Тестирует оборудование для издания ITBusiness. Будь то анализ новейших гаджетов или устранение сложных неполадок, этот автор всегда готов к выполнению поставленной задачи. Его страсть к технологиям и приверженность качеству делают его бесценным помощником в любой команде.