Иск NY Times возлагает на OpenAI и Microsoft “ответственность за


    В иске, поданном на прошлой неделе в федеральный суд Манхэттена газетой New York Times, утверждается, что ответчики – компании Microsoft и OpenAI – использовали миллионы ее статей для обучения и создания своих больших языковых моделей (LLM) и других продуктов. Times требует возмещения ущерба на миллиарды долларов, хотя и не называет конкретных цифр.

    Но да, в случае победы она будет претендовать на довольно крупную выплату.

    “Закон не допускает такого систематического и конкурентного нарушения прав, которое совершили ответчики”, – говорится в официальной жалобе (pdf предупреждение). “Этот иск направлен на то, чтобы привлечь их к ответственности за миллиарды долларов в виде установленных законом и реальных убытков, которые они должны выплатить за незаконное копирование и использование уникальных ценных работ The Times”.

    В иске говорится, что New York Times вела переговоры с ответчиками “в течение нескольких месяцев” и что она стремилась достичь соглашения “в соответствии со своей историей продуктивного сотрудничества с крупными технологическими платформами, чтобы разрешить использование своего контента в новых цифровых продуктах”. Идея, изложенная в судебном документе, заключается в том, чтобы получить справедливую стоимость от своего вклада в обучение, поскольку контенту The Times был придан вес во время обучения, а также “способствовать продолжению здоровой новостной экосистемы и помочь развитию технологии GenAI ответственным способом, который приносит пользу обществу и поддерживает хорошо информированную общественность”.

    В свою очередь, в статье The New York Times цитируется заявление представителя OpenAI Линдси Хелд, в котором говорится, что компания считает, что переговоры были конструктивными, и “удивлена и разочарована” иском.

    “Мы надеемся, что найдем взаимовыгодный способ работать вместе”, – цитируются слова представителя компании, – “как мы делаем это со многими другими издателями”.

    Одна из самых интригующих частей иска, и, возможно, та часть, которая заставила The Times засуетиться, заключается в том, что, похоже, OpenAI придавал особое значение контенту издательства при обучении своих магистров.

    В частности, в иске говорится, что во время обучения GPT-3 один из ключевых наборов данных – взвешенный как набор высокого качества – использовал почти 210 тысяч уникальных URL-адресов New York Times, что составило 1,23% от всех источников в наборе данных.

    Скриншот Microsoft Copilot

    (Image credit: Microsoft)

    Однако самый большой и наиболее взвешенный набор данных, использованный для обучения GPT-3, включает “не менее 16 миллионов уникальных записей контента из журналов The Times: News, Cooking, Wirecutter и The Athletic”.

    Далее в статье также говорится о том, что сама компания OpenAI заявила, что наборы данных, которые она считает наиболее качественными, затем чаще выбираются в процессе обучения модели. “По собственному признанию OpenAI, – говорится в судебном документе, – высококачественный контент, включая контент из The Times, был более важным и ценным для обучения моделей GPT по сравнению с контентом, взятым из других, менее качественных источников”.

    Это не первый иск против OpenAI за нарушение авторских прав при обучении ее LLM, как отмечает The Times, также был подан иск от 17 авторов, включая Джорджа РР Мартина и Джона Гришема, против компании за “систематическое воровство в массовом масштабе”, а также иск от Getty против Stability AI, создателей генеративного ИИ, Stable Diffusion, за использование ее изображений при обучении модели.

    И вряд ли это будет последний иск против создателей ИИ. Но учитывая кажущееся нежелание ИИ-компаний самостоятельно решать вопросы нарушения авторских прав и справедливой компенсации за обучение своих многомиллиардных продуктов, похоже, что судебные разбирательства могут стать одним из немногих способов удержать их в узде.

    Предыдущая статьяHonor X50 GT представлен с привлекательным дизайном
    Следующая статьяДобавьте Android Auto и CarPlay в любой автомобиль за меньшие деньги со скидкой 40 % на этот 6,8-дюймовый экран.
    Илларион Товаркин
    Илларион Товаркин - талантливый писатель, страстно любящий все, что связано с играми. От захватывающих экшн-игр до сложных ролевых игр, они обладают глубоким пониманием игровой индустрии и того, что делает игру великой. Благодаря острому вниманию к деталям и способности создавать захватывающие сюжетные линии, Илларион Товаркин способен перенести читателей в захватывающие игровые миры, наполненные приключениями и азартом. Пишет ли он о последней игре-блокбастере или углубляются в историю классических игр, его статьи всегда увлекательны и информативны. Так что если вы поклонник игр или просто ищете отличное чтение, обязательно ознакомьтесь с его работами - вы не будете разочарованы!