OpenAI объявила о выпуске новейшей версии своей большой языковой модели GPT-4. Который, по утверждению компании, демонстрирует «показатели человеческого уровня» в различных профессиональных тестах. Эта последняя модель больше, чем ее предшественники, она была обучена на большем количестве данных и имеет больший вес в файле модели, что делает ее более дорогой в использовании. Подход, использованный при разработке GPT-4, предполагает «масштабирование» для достижения лучших результатов. Что, по мнению многих исследователей в этой области, отвечает за недавние достижения в области ИИ.
Компания использовала Microsoft Azure для обучения GPT-4, при этом Microsoft инвестировала в стартап миллиарды долларов. Хотя OpenAI не раскрывает подробностей о конкретном размере модели или оборудовании, используемом для ее обучения, ссылаясь на «конкурентную среду», известно, что модель обучалась на тысячах суперкомпьютеров, что может стоить десятки миллионов долларов.
OpenAI: ChatGPT становится намного умнее!
Ожидается, что GPT-4 будет использоваться во многих демонстрациях искусственного интеллекта в ближайшие недели. По словам Microsoft, чат-бот Bing с искусственным интеллектом уже использует его. OpenAI утверждает, что новая модель будет давать меньше фактически неверных ответов и будет реже отклоняться от темы. Он также будет работать лучше, чем люди, во многих тестах, достигая 90-го процентиля на смоделированном экзамене по бару, 93-го процентиля на экзамене SAT по чтению и 89-го процентиля на экзамене SAT по математике.
GPT-4 против GPT-3.5
Согласно OpenAI, хотя разница между GPT-3.5 и GPT-4 может быть не сразу заметна во время обычного разговора, превосходство GPT-4 становится очевидным, когда разговор углубляется. OpenAI утверждает, что по мере усложнения задач искусственного интеллекта ожидается, что GPT-4 продемонстрирует большую надежность и креативность, чем его предшественник. OpenAI также предоставляет результаты испытаний в поддержку этого продвижения, показывая, что GPT-4 превосходит своего предшественника почти во всех областях. Результаты испытаний GPT-4 и GPT-3.5 приведены ниже:
Смоделированные экзамены | ГПТ-4 | ГПТ-4 (без обзора) | ГПТ-3,5 |
Единый экзамен на адвоката (MBE+MEE+MPT) | 298/400~ 90-е | 298/400~ 90-е | 213/400~ 10-й |
LSAT | 163~ 88 место | 161~ 83 место | 149~ 40-й |
SAT Чтение и письмо, основанное на фактах | 710/800~ 93 место | 710/800~ 93 место | 670/800~ 87-й |
СБ Математика | 700/800~ 89 место | 690/800~ 89 место | 590/800~ 70-е |
Экзамен для выпускных экзаменов (GRE) Количественный | 163/170~ 80-й | 157/170~ 62-й | 147/170~ 25-е |
Устный экзамен на выпускной экзамен (GRE) | 169/170~ 99-й | 165/170~ 96-й | 154/170~ 63-й |
Написание выпускного экзамена (GRE) | 4 / 6~ 54-й | 4 / 6~ 54-й | 4 / 6~ 54-й |
Полуфинальный экзамен USABO 2020 | 87/15099–100 | 87/15099–100 | 43 / 15031–33 |
Экзамен местной секции USNCO 2022 | 36/60 | 38/60 | 24/60 |
Программа самооценки медицинских знаний | 75% | 75% | 53% |
Рейтинг Codeforces | 392ниже 5-го | 392ниже 5-го | 260ниже 5-го |
АП История искусства | 586–100 место | 586–100 место | 586–100 место |
АП Биология | 585–100 место | 585–100 место | 462–85 |
AP исчисление до н.э. | 443–59 | 443–59 | 10–7 |
Однако компания предупреждает, что GPT-4 не идеален и во многих сценариях менее способен, чем люди. Модель по-прежнему страдает от «галлюцинаций» или придумывания фактов и не всегда фактически надежна. Он склонен настаивать на том, что он правильный, даже если он ошибочен. OpenAI заявила, что у GPT-4 есть ограничения, над устранением которых она работает, такие как социальные предубеждения, галлюцинации и враждебные подсказки.
Новая модель будет доступна платным подписчикам ChatGPT и как часть API, который программисты могут интегрировать в свои приложения. OpenAI будет взимать примерно 3 цента примерно за 750 слов подсказок и 6 центов примерно за 750 слов ответа.
В целом выпуск GPT-4 представляет собой значительный шаг вперед в развитии ИИ и обработки естественного языка. Несмотря на то, что модель не лишена ограничений, способность модели работать на уровне человека или выше в стандартизированных тестах предполагает, что она может стать ценным инструментом для широкого круга приложений, от чат-ботов до поисковых систем и многого другого. OpenAI продолжает совершенствовать и совершенствовать свою технологию. И мы можем ожидать еще более впечатляющих успехов в области ИИ в ближайшие годы.