Машина против юриста

    0
    1


    Мнение Люди, не являющиеся техническими специалистами, открыли ИИ, и они в волнении. Многое из этого возбуждения связано с тем, как искусственный интеллект собирается перехитрить нас в какой-то голливудской антиутопии, что столь же иронично, сколь и глубоко неправильно. Природа LLM не в самосознании HAL-9000, а в гигантской машине предиктивного ввода текста. Это само по себе и наука, и научная фантастика, где достаточное знание правил и распределений обеспечивает то, что в научной фантастике называется рабочим предвидением, или, как говорят в физике, рабочей моделью.

    Как только вы преодолеете навязчивую идею HAL-9000, станет ясно, что ИИ лучше всего тестировать не с помощью психологического зондирования, а путем анализа выходных данных с помощью вероятностей. Этот подход уже приносит плоды: группа из Калифорнийского университета в Беркли узнает о продуктах OpenAI больше, чем OpenAI обнародует.

    LLM решают, что выводить, в зависимости от правил и распределений, полученных из обучающих данных. Таким образом, исследователи утверждают, глядя на то, что на самом деле производит LLM, вы можете сделать выводы о том, какие данные он получил, особенно если вы можете проверить это на данных, которые вы тоже уже знаете. В данном случае авторские работы.

    То, что ученые обнаружили, что модели OpenAI кормились на диете с преобладанием научной фантастики и фэнтези, одновременно восхитительно, иронично и наименее удивительно после субботнего утреннего похмелья. Если Бог создал человека по своему образу и подобию, тот, кто создал ChatGPT, был одержимым научной фантастикой и фэнтези убергиком с гиперфокусом и нейроразнообразным подходом к эмпатии. Вы можете бросить камень в Долину, не попав ни в один из них, но вам придется бросить его очень сильно в сторону океана.

    Исследователи пришли к хорошим и замечательным выводам об открытых наборах данных и избегании предвзятости, но также коснулись того, что может быть первой настоящей взрывоопасной точкой контакта LLM с миром людей: авторское право.

    Обычно, если вы загружаете книгу или музыкальную пластинку в компьютер, вы делаете копию. Если оригинал защищен авторским правом, правила просты: вы можете делать только то, что позволяет вам правообладатель. Но обучение нейронной сети не создает постоянную копию, а создает математический набор связей и весов, смешанный с созданными из других данных. Это анализ и синтез, то, что мы не только позволяем людям, но и заставляем делать в течение десяти лет их юной жизни в принудительных образовательных лагерях, которые мы называем школами. Или, если использование работ, защищенных авторскими правами, в качестве обучающих данных противоречит закону, у нас большие проблемы.

    И наоборот, если люди узнают что-то дословно, а затем зарабатывают на воссоздании этого, то снова применяется закон об авторском праве: актер не может безнаказанно гастролировать по пьесе, защищенной авторским правом, только потому, что он выучил свои реплики. С производными работами все становится очень мутно, когда что-то, основанное на авторских правах, также требует разрешения этого правообладателя. И каждый бит выходных данных LLM является производным от его обучающих данных: это не может быть ничем другим. Это не только бесспорно, но и обусловлено культурой: если вы хотите увидеть, как закон об авторском праве на производные работы подвергается сомнению в галактическом масштабе в реальном мире, идите на аферу.

    Фэндом дал нам косплей, фанфики, трибьют-шоу, присвоение товарных знаков и одержимость делиться каждым последним кварком франшизы или любимой работы. Время от времени, если что-то приближается к скорости коммерческого ускользания, правообладатели могут вмешаться, но, поскольку массовая, глобальная и публичная демонстрация поведения насмешников, фанатам научной фантастики и фэнтези сходят с рук. Благодаря этому мир стал намного лучше. Дело не в том, что ChatGPT — это научная фантастика, а в том, что это фанат научной фантастики.

    LLM работают как фандомы общего назначения, создавая новые идеи, явно вытекающие из анализа, среди прочего, произведений, охраняемых авторским правом. Как на это отреагирует авторское право? Ирония заключается в том, что, хотя LLM работают с вероятностями, а не с алгоритмами, то же самое относится и к авторскому праву. Производная работа не имеет жестких правил относительно того, в какой степени деривация считается созданием производной работы. Как и его собрат в области интеллектуальной собственности добросовестное использование, существуют общие принципы, в основном полученные из прецедентного права, но серых зон больше, чем туманного дня в Сан-Франциско. Если вам нужно больше иронии здесь, рассмотрите прецедентное право как многовековое упражнение в производной работе в области, где авторское право не применяется.

    Что LLM привносят в бой, так это массовое развертывание. Как показал фэндом, если это делает достаточное количество людей, то это делается. Домашняя аудио- и видеозапись столкнулась с огромным противодействием со стороны звукозаписывающей индустрии — в случае с Sony, в результате которой различные подразделения воевали друг с другом, — но отдали дешевую и популярную технологию в руки миллиардов, и она победила.

    Многие люди, которые думают о таких вещах, ждут судебных процессов, которые помогут определить будущее взаимодействия авторского права с ИИ. Эти вряд ли помогут. Авторское право становится менее полезным и более вредным, чем дальше оно уходит от реальных копий. LLM настолько же генеративны, насколько и производны, а закон об авторском праве просто ужасен в патрулировании генеративных систем, где нечеловеческие сущности создают новые работы. Если горилла фотографирует в лесу, платят ли адвокату? Если ИИ пишет историю о мальчике-волшебнике, и миллиардная часть его обучающих данных получена от Гарри Поттера, на кого подаст в суд Дж. К. Роулинг? Тяжелые дела создают плохой закон, и это действительно будут очень тяжелые дела.

    Подобно морским защитным сооружениям на эродирующей береговой линии, концепции производной работы можно либо защитить за счет разрушительных затрат от растущего уровня автоматизированного несоблюдения требований, либо организовать управляемое отступление по принципу наименьшего ущерба. В любом случае, роботы, как и море, в конце концов победят. Будет новый пейзаж. И это будет вполне обитаемо. ®

    Предыдущая статьяSamsung Chromebook может получить динамические заставки в будущем
    Следующая статьяКак скоро вы можете ожидать Android 14 для вашего Galaxy устройство?
    Виктор Попанов
    Эксперт тестовой лаборатории. Первый джойстик держал в руках в возрасте 3 лет. Первый компьютер, на котором „работал” был с процессором Intel i386DX-266. Тестирует оборудование для издания ITBusiness. Будь то анализ новейших гаджетов или устранение сложных неполадок, этот автор всегда готов к выполнению поставленной задачи. Его страсть к технологиям и приверженность качеству делают его бесценным помощником в любой команде.