Лауреат Пулитцеровской премии американский писатель Майкл Шейбон и несколько других писателей подали коллективный иск, обвиняя OpenAI в нарушении авторских прав за то, что они якобы втянули свои работы в наборы данных, используемые для обучения моделей, лежащих в основе ChatGPT.
В иске утверждается, что OpenAI «раскинула широкую сеть по Интернету», чтобы захватить наиболее полный набор доступного контента для лучшего обучения своих моделей GPT, якобы «обязательно» заставляя его «захватывать, загружать и копировать письменные произведения, пьесы и произведения, защищенные авторским правом». статьи».
Одной из наиболее интересных частей иска является утверждение о том, как, по мнению авторов, бизнес ИИ заполучил «два интернет-книжных корпуса», которые, как отмечается, OpenAI называет просто «Книги1» и «Книги2». В документе утверждается, что в июльском документе 2020 года, представляющем GPT-3, «Языковые модели изучаются немногими», OpenAI раскрыла, что в дополнение к наборам данных веб-страниц «Common Crawl» и «WebText» «16 процентов набора обучающих данных GPT3 пришло из… «Книги1» и «Книги2».
Далее в иске авторов утверждается, что в общедоступном Интернете есть лишь несколько мест, содержащих такое количество материалов, утверждается, что набор данных OpenAI Books1 «основан либо на стандартизированном корпусе проекта Гутенберг, либо на самом проекте Гутенберг», и обвиняется бизнес ИИ в поиск Books2 из:
В костюм также входит обладатель премий «Тони» и «Грэмми» Дэвид Генри Хван, драматург и сценарист. М. Баттерфляй, Чинглиш, Желтое лицои Танец и железная дорога; Победитель Пибоди и Любовь и другие невозможные стремления автор Айелет Уолдман; Женщины, которых мы похоронили автор Рэйчел Луиза Снайдер; и Кто такой Рич? писец Мэтью Клам.
Авторы утверждают, что поскольку «когда ChatGPT запускается, он генерирует не только сводки, но и углубленный анализ тем, присутствующих в работах истцов, защищенных авторским правом», авторы полагают, что «основная модель GPT была обучена с использованием [the] работы истцов».
Адвокаты писателей также утверждают, что, когда их попросили написать абзац в стиле Удивительные приключения Кавалера и КлеяКнига, которая принесла американскому писателю Шейбону Пулитцеровскую премию, ChatGPT создала отрывок, имитирующий его стиль письма и включающий отсылки к персонажам, имеющим дело с «тяжестью мира в состоянии войны».
Скриншот жалобы, приложение А (нажмите, чтобы увеличить)
Костюм [PDF] Дело было подано в федеральный суд Калифорнии в конце прошлой недели и вчера передано мировому судье Сан-Франциско Питеру Х. Кангу.
OpenAI сталкивается с множеством исков по поводу авторских прав, в том числе два в Сан-Франциско, поданные романистами Полом Трембле и Моной Авад, а также комиком Сарой Сильверман и романистами Кристофером Голденом и Ричардом Кадри. В этих случаях ее юристы утверждали, что бизнес ИИ не нарушил законы об авторском праве, утверждая, что LLM ChatGPT защищены доктриной США о «добросовестном использовании». Их аргумент заключается в том, что способ использования текста в бизнесе соответствует закону США об авторском праве, который допускает исключение из добросовестного использования для так называемых «преобразующих видов использования» произведения – ремикс оригинала, который служит другой цели или аудитории.
Бюро авторских прав США в настоящее время ищет комментарии по поводу исследования закона об авторском праве и политических проблем, возникающих в связи с системами искусственного интеллекта.
Защита OpenAI еще не представила ответ на жалобу Шейбона. Мы попросили OpenAI дать комментарий.
Обвинения по этому делу включают прямое и косвенное нарушение авторских прав, незаконное удаление информации об управлении авторскими правами, недобросовестную конкуренцию и неосновательное обогащение. Они добиваются судебного запрета на нарушение их авторских прав, а также возмещения неуказанного ущерба.
Босс OpenAI Сэм Альтман на прошлой неделе получил первую в истории золотую визу Индонезии – это означает, что теперь он может жить в этой архипелажной стране до 10 лет – в знак признания его потенциала «генерировать входящие инвестиции». ®