
Материалы, размещенные на Reddit, включаются в ChatGPT, Reddit и OpenAI объявили в четверг. Новое партнерство предоставляет OpenAI доступ к API данных Reddit, предоставляя фирме, занимающейся генеративным искусственным интеллектом, доступ в режиме реального времени к сообщениям Reddit.
Содержимое Reddit будет включено в ChatGPT «и новые продукты», говорится в сообщении в блоге Reddit. Компания, занимающаяся социальными сетями, утверждает, что партнерство «позволит инструментам искусственного интеллекта OpenAI лучше понимать и демонстрировать контент Reddit, особенно по последним темам». OpenAI также начнет рекламироваться на Reddit.
Сделка аналогична той, которую заключил Reddit. Google в феврале это позволит технологическому гиганту создать «новые способы отображения контента Reddit» и предоставить «более эффективные способы обучения моделей», заявил тогда Reddit. Ни Reddit, ни OpenAI не раскрыли финансовые условия своего партнерства, но партнерство Reddit с Google Сообщается, что его стоимость составила 60 миллионов долларов.
В рамках партнерства OpenAI Reddit также получает доступ к моделям больших языков OpenAI (LLM) для создания функций для Reddit, включая модераторов-добровольцев.
Reddit продвигает лицензирование данных
Эта новость появилась примерно через год после того, как Reddit начал войну API, начав взимать плату за доступ к своему API данных. Это привело к закрытию многих любимых сторонних приложений Reddit и массовым протестам пользователей. Reddit, которая вскоре стала публичной компанией и еще не получила прибыли, заявила, что одной из причин внезапного изменения было запретить компаниям, занимающимся искусственным интеллектом, использовать контент Reddit для бесплатного обучения своих LLM.
Ранее в этом месяце Reddit опубликовал Политику публичного контента, в которой говорится: «К сожалению, мы видим, что все больше и больше коммерческих организаций используют несанкционированный доступ или злоупотребляют авторизованным доступом для массового сбора общедоступных данных, включая общедоступный контент Reddit. Хуже того, эти организации считают, что у них нет ограничений. об использовании этих данных, и они делают это, не обращая внимания на права пользователей или конфиденциальность, игнорируя разумные запросы по закону, безопасности и удалению пользователей.
В своем сообщении в блоге в четверг Reddit заявил, что сделки, подобные OpenAI, являются частью «открытого» Интернета. Он добавил, что «отчасти открытость означает, что контент Reddit должен быть доступен для тех, кто способствует обучению людей и исследует способы создания сообщества, принадлежности и расширения прав и возможностей в Интернете».
Reddit открыто заявляет о своей заинтересованности в заключении сделок по лицензированию данных как основной части своего бизнеса. Построение партнерских отношений в области ИИ вызывает дискуссию вокруг использования пользовательского контента для поддержки моделей ИИ без выплаты пользователям компенсации, а некоторые потенциально не учитывают, что их публикации в социальных сетях будут использоваться таким образом. В начале этого месяца OpenAI и Stack Overflow столкнулись с сопротивлением при интеграции контента Stack Overflow с ChatGPT. Некоторые представители сообщества пользователей Stack Overflow в ответ саботировали свои публикации.
OpenAI также приходится работать с данными Reddit, которые, как и большая часть Интернета, могут содержать неточности и неприемлемый контент. Одними из крупнейших противников изменений правил API Reddit были модеры-добровольцы. С тех пор некоторые покинули платформу, и после изменения правил Ars Technica поговорила с давними пользователями Reddit, которые были обеспокоены развитием качества контента Reddit.
Тем не менее, компании, занимающиеся генеративным искусственным интеллектом, стремятся воспользоваться доступом Reddit к беседам в реальном времени с множеством людей, обсуждающих почти бесконечный спектр тем. И Reddit, похоже, в равной степени стремится лицензировать данные из постов своих пользователей.
Advance Publications, которой принадлежит Condé Nast, материнская компания Ars Technica, является крупнейшим акционером Reddit.