Reddit собирается зарабатывать $60 млн. в год благодаря сделке с неназванным искусственным интеллектом



    5uhPjUweP3AHvsFS9zSuHL

    Если Вы когда-либо писали на Reddit, велика вероятность того, что Вы помогаете обучать следующее поколение моделей искусственного интеллекта с помощью своих слов, картинок и мемов, потому что компания продает доступ к своему 20-летнему контенту за 60 миллионов долларов. Конечно, есть вероятность, что Вас уже использовали для обучения ИИ, учитывая, что Reddit уже довольно часто используется в качестве обучающих данных для множества различных больших языковых моделей (LLM) и генераторов изображений, но, по крайней мере, теперь кто-то получает за это деньги.

    Генеративные модели ИИ, такие как ChatGPT и Stable Diffusion, необходимо обучать на базах данных, включающих сотни миллионов изображений, книг, видеоклипов, музыки и так далее. Иногда исходный материал находится в открытом доступе и может быть использован любым желающим, а иногда компании, занимающиеся разработкой ИИ, просто “заимствуют” то, что просто лежит в Интернете. Но деньги между двумя организациями передаются редко. Не так с Reddit, который, похоже, заключил сделку, по которой за солидную сумму денег каждый год модели ИИ могут использовать контент сайта для обучения.

    Согласно отчету Bloomberg, сумма сделки составляет 60 миллионов долларов в год. В мире технологий, где сделки исчисляются миллиардами долларов, это может показаться не очень большой суммой, но в сфере обучения ИИ это практически неслыханно. Нет никаких сведений о том, кто является второй стороной в сделке, но вряд ли это маленькая стартап-компания в чьей-то задней спальне.

    Reddit хранит на своих серверах почти 20 лет размещенного контента, так что, кем бы ни была фирма, занимающаяся разработкой искусственного интеллекта, она получила выгодную сделку. OpenAI, разработчики ChatGPT, по сообщениям, заключают лицензионные соглашения с многочисленными медиа-компаниями и издательствами, что, похоже, не сильно отличается от сделки с Reddit.

    Однако такие издатели обычно оплачивают работу создателей контента или, по крайней мере, непосредственно нанимают людей для создания материала, который OpenAI хочет использовать. Reddit, с другой стороны, ничего подобного не делает, хотя сам сайт совершенно бесплатен для использования. Не существует такого понятия, как repas gratuit, конечно, и Reddit получает доход за счет рекламы и платных пользовательских функций.

    Если предположить, что сделка состоится (а я не вижу причин, почему бы ей не состояться), то я не сомневаюсь, что произойдет еще одна реакция пользователей, подобная той, что наблюдалась, когда Reddit изменил плату за API. Однако последствия той реакции со временем исчезли, и сайт практически вернулся к тому состоянию, в котором он был до того, как многие разделы стали темными.

    Хотя на первых порах будет много шума, в результате Reddit будет выглядеть и работать так же, как и сейчас. Ни один пользователь не будет знать, что его посты активно отбираются и используются для обучения моделей. Так что все это просто небольшая суета вокруг ничего, да?

    Это может быть не так, если Вы когда-либо использовали Reddit для демонстрации своих писательских способностей, произведений искусства или музыки. Вы можете думать, что этот контент принадлежит Вам и защищен законами об авторском праве, но все становится очень туманным, когда речь заходит об обучении генеративного ИИ. Вы делаете всю тяжелую работу, но кто-то другой получает все преимущества от этого, и, что еще более важно, не признает и никак не компенсирует Вам это.

    Все это, несомненно, положит начало потоку сделок между компаниями, занимающимися ИИ, и другими социальными сетями. Я подозреваю, что крупнейшие из них уже соскабливают контент для обучения и скрывают детали этого в мельчайших деталях своих огромных соглашений с конечными пользователями. Но, возможно, настало время уделять гораздо больше внимания тому, что и где Вы размещаете свои творческие работы, особенно если Вы надеетесь сделать на этом карьеру.

    Предыдущая статьяXiaomi 14 утечек ультрасинего варианта
    Следующая статьяD&D Lego делает полный круг, изображая самую смертоносную настольную игру
    Илларион Товаркин
    Илларион Товаркин - талантливый писатель, страстно любящий все, что связано с играми. От захватывающих экшн-игр до сложных ролевых игр, они обладают глубоким пониманием игровой индустрии и того, что делает игру великой. Благодаря острому вниманию к деталям и способности создавать захватывающие сюжетные линии, Илларион Товаркин способен перенести читателей в захватывающие игровые миры, наполненные приключениями и азартом. Пишет ли он о последней игре-блокбастере или углубляются в историю классических игр, его статьи всегда увлекательны и информативны. Так что если вы поклонник игр или просто ищете отличное чтение, обязательно ознакомьтесь с его работами - вы не будете разочарованы!