ChatGPT скоро будет принимать голосовые и графические подсказки

От

25.09.2023

После обновления ChatGPT позволит пользователям загружать изображения, разговаривать с чат-ботом и слышать его ответ.

Новейшие функции будут доступны платным подписчикам и корпоративным клиентам в течение следующих двух недель в веб-приложениях, приложениях для iOS и Android, а позже и в бесплатной версии, объявила OpenAI в понедельник.

Разумеется, с появлением новых возможностей появляются и новые способы злоупотреблений. С этой целью OpenAI также сообщила, что они ограничили возможность комментировать определенные типы изображений, чтобы предотвратить появление неуместных, предвзятых и оскорбительных личных замечаний.

«Модели, основанные на видении, также создают новые проблемы, начиная от галлюцинаций о людях и заканчивая интерпретацией образов моделью в областях с высокими ставками. профессионализм и разнообразный набор альфа-тестеров. Наше исследование позволило нам согласовать несколько ключевых деталей для ответственного использования», — заявили в OpenAI.

«Мы также приняли технические меры, чтобы значительно ограничить способность ChatGPT анализировать и делать прямые заявления о людях, поскольку ChatGPT не всегда точен, и эти системы должны уважать конфиденциальность людей».

Обработка типов данных помимо текста значительно расширяет возможности ChatGPT. Например, пользователи могут загружать изображения объектов, таких как исторические достопримечательности, чтобы узнать о них больше, или фотографии внутренней части своих холодильников, чтобы показать чат-боту, что они могут сделать из имеющихся у них ингредиентов. Они также могут указать ChatGPT сосредоточиться на определенных частях изображения, выделив раздел вручную.

OpenAI интегрировала свою модель распознавания речи Whisper, чтобы дать ChatGPT возможность расшифровывать голос в текст, и добавила новую систему для преобразования текста в речь. Пользователи могут выбирать, как будет звучать чат-бот, используя пять разных голосов, сгенерированных искусственным интеллектом.

Утверждается, что Spotify использует новую генеративную аудиомодель для перевода подкастов на разные языки, сохраняя при этом звук голосов говорящих.

На данный момент ChatGPT может расшифровывать речь только на английском языке и неэффективен с другими языками, особенно с теми, которые не используют латинский алфавит, пояснил OpenAI.

Большие языковые модели — это мощная технология, но они не идеальны и по-прежнему склонны генерировать ложную информацию. Вероятно, лучше не полагаться на чат-бота в принятии рискованных решений, например, в выборе грибов, которые можно есть. Как выразился сэр Терри Пратчетт: «Все грибы съедобны. Некоторые грибы съедобны только один раз».

Регистр попросил OpenAI разъяснить, будет ли она вообще собирать голоса и изображения пользователей. Ранее компания заявляла, что не будет обучаться на данных своих корпоративных клиентов или разговоров людей, если они отключили историю своих чатов. ®

ChatGPT скоро будет принимать голосовые и графические подсказки

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Больницы NHS England будут использовать ИИ для прогнозирования неотложной и неотложной...

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНОЕЩЕ ОТ АВТОРА

Freeing developers from GenAI deployment nightmares

Nvidia unveils 288 GB Blackwell Ultra GPUs

Огромное количество данных подталкивает финансовые службы к более глубокому внедрению ИИ –

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Больницы NHS England будут использовать ИИ для прогнозирования неотложной и неотложной...

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНО ЕЩЕ ОТ АВТОРА