Заказной Сказать, что данные имеют ценность, не революционное заявление – сколько раз мы слышали, что это новая нефть? Но что может быть не совсем очевидно, так это то, что насколько велика.
До сих пор огромные объемы данных – и отсутствие инструментов для их эффективного анализа – делали их практически невозможными для масштабного анализа. Но все меняется благодаря генеративному ИИ (GenAI), а также более широким прорывам в области ИИ, которые ожидаются на горизонте. Более важный вопрос заключается в том, как нам измерить его? Как мы начнем его понимать? На какие примеры мы можем указать, чтобы показать, насколько масштабной стала ценность данных?
Хорошая новость заключается в том, что Интернет, возможно, самый большой источник данных на Земле, представляет собой отличный пример изучения данных, их использования и экспоненциально растущей ценности. Давайте рассмотрим, почему Интернет может быть наиболее наглядным и своевременным полем битвы для анализа и изучения того, насколько критически важными будут данные в новой эре ИИ.
Прилив и отлив Интернета
Мы начали со ссылок и поисковых систем. Ранние порталы уступили место Google доминированию поиска – странице с единственной строкой поиска, которая вела Вас туда, куда Вы хотели попасть. Вскоре это уступило место платформам социальных сетей, которые вернули Ваше внимание к централизованным узлам, где Вы могли пролистывать курируемые списки контента, которые попадали в Вашу ленту. В попытке создать свободу от платформ и их алгоритмов и демократизировать доступ и владение цифровым контентом мы увидели подъем Web3 и обещание того, что Интернет будет двигаться в сторону децентрализации. Однако движение Web3 опиралось на развитые технические навыки и доверие к широкому сообществу, которое в последние годы столкнулось с рядом громких проблем.
Может ли GenAI стать следующей итерацией Web? Web4?
GenAI ворвался на сцену и стал сенсацией, на которую сейчас обращают внимание все организации. Он меняет методы работы разработчиков и операторов. Каждая организация спешит изучить, как он может повлиять на их бизнес, причем во многих областях. Давайте разберемся, как это изменит игру для Интернета.
GenAI предлагает простоту использования. Именно поэтому он привлек внимание пользователей и организаций во всем мире, и именно поэтому он обладает потенциалом для изменения структуры Интернета. Поскольку GenAI предполагает возврат к централизованному потреблению веб-ресурсов, неудивительно, что поисковые системы ухватились за эту тенденцию и пытаются укрепить свои позиции. Проще говоря, они делают то, чего никогда не делал Web3: значительно облегчают пользователям доступ к тому, что им нужно.
Вот как это работает: вместо того, чтобы переходить к рекомендованному месту, где пользователь должен сам найти ответ, он просто задает вопрос приложению GenAI, и ответы приходят к нему в разговорной форме. Это потенциально сокрушительный уровень изменений в Интернете.
Обучение GenAI и скраппинг в Интернете
При создании и обучении базовой модели GenAI количество и качество данных имеет решающее значение для достижения наилучших результатов. Поэтому Интернет был одним из первых мест, к которому обращались многие модели ИИ. Где еще Вы можете получить столько данных от стольких активных участников? Кроме того, эти данные находились в свободном доступе, и во многих случаях пользователи этих платформ активно отдавали свои данные.
Но все становится еще более туманным, поскольку право собственности на данные и наличие защиты интеллектуальной собственности до сих пор не вполне понятны и не проверены юридически. Добавьте к этому, что многие из первых игроков в этой области были стартапами с менталитетом “двигайся быстро и ломай вещи”, а ИИ и Интернет – это в значительной степени дикий Запад.
Мы уже видели, как на ранних этапах сражаются такие компании, как Getty Images, которые рассматривают изображения GenAI, взятые из их архивов, как производные работы и утверждают, что эти инструменты больше похожи на Napster, чем на что-то новое и новаторское. Но, возможно, наибольшие сейсмические сдвиги происходят в социальных сетях, где, как правило, платформам предоставляется определенный уровень доступа и передаются права в соответствии с условиями предоставления услуг, и в результате они предлагают бесплатную платформу. Проблема здесь заключается в том, что многие из них создали расширения для своих платформ с помощью API или предоставили пользователям неограниченный доступ, и теперь они рассматривают GenAI как серьезную угрозу их усилиям и стоимости.
Социальные сети наносят ответный удар
В последнее время мы наблюдаем, как многие компании, работающие в социальных сетях, перешли в наступление, ограничивая доступ к GenAI и оставляя своих пользователей под перекрестным огнем. Нетрудно понять, почему это происходит; эти ИИ могут собирать и потреблять огромное количество контента и обеспечивать контекстный поиск по этому контенту, который полностью персонализирован.
Какое ценностное предложение для аудитории. С помощью таких вещей, как GitHub Copilot, простой запрос GenAI может за считанные секунды вывести на экран документацию или фрагменты кода. Stack Overflow, Reddit и Twitter начали взимать плату за API-доступ к содержимому своих сайтов. В этом есть смысл; если предполагаемый конкурент собирает и использует все Ваши данные для получения конкурентных преимуществ, почему бы Вам не потребовать компенсации или ограничить доступ?
Reddit также недавно ввел ограничения на использование приложений сторонних разработчиков, и, что интересно, это иногда ставит их в противоречие с модераторами сообщества. Есть еще Twitter. В выходные 4 июля эта социальная медиа-платформа начала временно ограничивать доступ пользователей к своему контенту. Мы также начинаем наблюдать, как эта борьба переходит на другие веб-объекты, например, новостные издания и поиск на основе GenAI, преодолевающий платные стены. В мире, где контент и данные сами становятся продуктами, мы будем продолжать наблюдать это перетягивание каната. Принимаются решения, которые сотрясают Интернет до основания, и единственная причина всего этого – то, насколько ценными являются эти данные.
Что Интернет может рассказать Вам о Ваших собственных данных
Когда Вы думаете о данных Вашего предприятия или бизнеса в сравнении с тем, что обычно можно найти в Интернете, подумайте вот о чем: Ваши данные, вероятно, намного ценнее. Мы видим, как технологические гиганты борются за защиту своих данных и IP, даже если они созданы пользователями и потенциально доступны во многих других платформах и формах, или полны низкокачественных данных, таких как спам и сети ботов. С появлением GenAI доля данных, обладающих ценностью, увеличилась в геометрической прогрессии. Это означает, что организациям, возможно, придется пересмотреть свои существующие представления о данных, поскольку GenAI изменил уравнение.
Если компании, работающие в социальных сетях, прилагают столько усилий, чтобы ограничить доступ и укрепить свои конкурентные позиции с помощью данных, то лидеры, внедряющие ИИ, должны предпринять аналогичные шаги. Погрузитесь в мир неопределенности – возможно, сценарии использования еще не очевидны, но ответ будет заключен в данных, и в результате политика хранения данных должна измениться. Подумайте, где хранятся Ваши данные и как лучше всего подвести к ним ИИ, поскольку притяжение данных все еще будет играть определенную роль. Поймите, как она используется. Необходимо избегать утечки данных и интеллектуальной собственности; сами данные и потенциальное обучение, которое они предлагают базовой модели, могут потенциально снизить Вашу дифференциацию.
В конечном счете, то, что мы наблюдаем сейчас в социальных сетях, повторится и в других пространствах; данные станут великим дифференциатором. В этом пространстве это означает, что Вы должны внимательно изучить свои решения в области искусственного интеллекта и убедиться, что Вы ограничиваете области воздействия. Мы стремительно приближаемся к миру, в котором каждая организация будет опираться на данные и использовать ИИ. Это означает, что сейчас как никогда важно защищать свой самый ценный актив – данные – и никогда не передавать на аутсорсинг свои ключевые компетенции.
Узнайте, как GenAI и автоматизация снижают планку управления центрами обработки данных в нашем последнем подкасте, The Great Equalizer: GenAI и ИИ, преобразующие центр обработки данных и узнайте, как внедрить генеративный ИИ в Вашу организацию.
Предоставлено Вам компанией Dell Technologies.