Это новое обновление ChatGPT сногсшибательно!

От

14.03.2023

OpenAI объявила о выпуске новейшей версии своей большой языковой модели GPT-4. Который, по утверждению компании, демонстрирует «показатели человеческого уровня» в различных профессиональных тестах. Эта последняя модель больше, чем ее предшественники, она была обучена на большем количестве данных и имеет больший вес в файле модели, что делает ее более дорогой в использовании. Подход, использованный при разработке GPT-4, предполагает «масштабирование» для достижения лучших результатов. Что, по мнению многих исследователей в этой области, отвечает за недавние достижения в области ИИ.

Компания использовала Microsoft Azure для обучения GPT-4, при этом Microsoft инвестировала в стартап миллиарды долларов. Хотя OpenAI не раскрывает подробностей о конкретном размере модели или оборудовании, используемом для ее обучения, ссылаясь на «конкурентную среду», известно, что модель обучалась на тысячах суперкомпьютеров, что может стоить десятки миллионов долларов.

Содержание скрыть

1 OpenAI: ChatGPT становится намного умнее!

1.1 GPT-4 против GPT-3.5

OpenAI: ChatGPT становится намного умнее!

Ожидается, что GPT-4 будет использоваться во многих демонстрациях искусственного интеллекта в ближайшие недели. По словам Microsoft, чат-бот Bing с искусственным интеллектом уже использует его. OpenAI утверждает, что новая модель будет давать меньше фактически неверных ответов и будет реже отклоняться от темы. Он также будет работать лучше, чем люди, во многих тестах, достигая 90-го процентиля на смоделированном экзамене по бару, 93-го процентиля на экзамене SAT по чтению и 89-го процентиля на экзамене SAT по математике.

GPT-4 против GPT-3.5

Согласно OpenAI, хотя разница между GPT-3.5 и GPT-4 может быть не сразу заметна во время обычного разговора, превосходство GPT-4 становится очевидным, когда разговор углубляется. OpenAI утверждает, что по мере усложнения задач искусственного интеллекта ожидается, что GPT-4 продемонстрирует большую надежность и креативность, чем его предшественник. OpenAI также предоставляет результаты испытаний в поддержку этого продвижения, показывая, что GPT-4 превосходит своего предшественника почти во всех областях. Результаты испытаний GPT-4 и GPT-3.5 приведены ниже:

Смоделированные экзамены	ГПТ-4	ГПТ-4 (без обзора)	ГПТ-3,5
Единый экзамен на адвоката (MBE+MEE+MPT)	298/400~ 90-е	298/400~ 90-е	213/400~ 10-й
LSAT	163~ 88 место	161~ 83 место	149~ 40-й
SAT Чтение и письмо, основанное на фактах	710/800~ 93 место	710/800~ 93 место	670/800~ 87-й
СБ Математика	700/800~ 89 место	690/800~ 89 место	590/800~ 70-е
Экзамен для выпускных экзаменов (GRE) Количественный	163/170~ 80-й	157/170~ 62-й	147/170~ 25-е
Устный экзамен на выпускной экзамен (GRE)	169/170~ 99-й	165/170~ 96-й	154/170~ 63-й
Написание выпускного экзамена (GRE)	4 / 6~ 54-й	4 / 6~ 54-й	4 / 6~ 54-й
Полуфинальный экзамен USABO 2020	87/15099–100	87/15099–100	43 / 15031–33
Экзамен местной секции USNCO 2022	36/60	38/60	24/60
Программа самооценки медицинских знаний	75%	75%	53%
Рейтинг Codeforces	392ниже 5-го	392ниже 5-го	260ниже 5-го
АП История искусства	586–100 место	586–100 место	586–100 место
АП Биология	585–100 место	585–100 место	462–85
AP исчисление до н.э.	443–59	443–59	10–7

Однако компания предупреждает, что GPT-4 не идеален и во многих сценариях менее способен, чем люди. Модель по-прежнему страдает от «галлюцинаций» или придумывания фактов и не всегда фактически надежна. Он склонен настаивать на том, что он правильный, даже если он ошибочен. OpenAI заявила, что у GPT-4 есть ограничения, над устранением которых она работает, такие как социальные предубеждения, галлюцинации и враждебные подсказки.

Это новое обновление ChatGPT сногсшибательно!

OpenAI: ChatGPT становится намного умнее!

GPT-4 против GPT-3.5

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Netflix снова поднимет цены после успеха Squid Game 2

OpenAI: ChatGPT становится намного умнее!

GPT-4 против GPT-3.5

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНОЕЩЕ ОТ АВТОРА

6 вещей, которые я бы делал по -другому при строительстве домашнего офиса с нуля

Umidigi сияет на гонконгской мобильной электронике с A100 5G и G100

Мой выбор для лучшей бесплатной альтернативы TeamViewer

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Netflix снова поднимет цены после успеха Squid Game 2

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНО ЕЩЕ ОТ АВТОРА