YouTube экспериментирует с музыкой, созданной искусственным интеллектом, в некоторых тестах

    0
    2


    YouTube экспериментирует с программным обеспечением, генерирующим музыку с использованием модели искусственного интеллекта под названием Lyria, созданной Google ДипМайнд.

    GoogleПринадлежащий компании гигант домашнего видео объявил в четверг о двух функциях, которые он предлагает небольшой группе тестировщиков: Dream Track и Music AI Tool.

    Dream Track преобразует текстовую подсказку в короткий аудиофрагмент, имитирующий голос и стиль различных поп-звезд, а именно Алека Бенджамина, Чарли Пута, Чарли XCX, Деми Ловато, Джона Ледженда, Сиа, T-Pain, Троя Сивана и Папуз. Выбор артиста пока ограничен этими исполнителями, поскольку Google пришлось вести переговоры о лицензиях на обучение Лирии своей музыке, чтобы избежать войны за авторские права.

    Вы можете послушать, что генерирует Dream Track для подсказки «Солнечное утро во Флориде, R&B» в стиле T-Pain – исполнителя, известного тем, что изменяет свой голос с помощью автонастройки – ниже.

    YouTube видео

    Это определенно звучит как T-Pain, и текст уместен и соответствует подсказке. Dream Track в настоящее время доступен только «ограниченному кругу авторов», которые могут создавать 30-секундные клипы из треков, созданных искусственным интеллектом, которые можно публиковать в виде коротких видеороликов на YouTube – обычно это видеоролики продолжительностью в минуту.

    Music AI Tool кажется более интересным и полезным. Это позволяет людям, особенно тем, у кого нет или многих инструментов, преобразовать аудиоклип – например, аккорд или кто-то, напевающий мелодию – во что-то, что сохраняет исходный звук, но воспроизводится в форме другого инструмента.

    Самая впечатляющая демо, пожалуй, преобразует набор певческих звуков «на-на-на» в оркестровую партитуру, дополненную струнными инструментами, которая, кажется, могла бы стать несколько убедительным саундтреком к фильму. Вы можете услышать это ниже.

    YouTube видео

    YouTube предоставляет Music AI Tool только избранным артистам, авторам песен и продюсерам, которые сейчас участвуют в его программе Music AI Incubator.

    Music AI Tool позволяет людям создавать музыку в новых формах, не особенно хорошо умея петь или играть на музыкальных инструментах – подобно тому, как каждый может использовать модели преобразования текста в изображение для создания произведений искусства, не умея рисовать.

    Это напоминает нам много лет назад, во времена расцвета электронной музыки, когда циники жаловались, что синтезаторы и компьютерное секвенирование позволяют любому штамповать треки, как так называемые настоящие музыканты.

    «Эти эксперименты исследуют потенциал функций искусственного интеллекта, которые помогут артистам и создателям расширить свое воображение и улучшить свои творческие процессы», — объяснили Лиор Коэн из YouTube и Тони Рид, глобальный руководитель музыкального направления и вице-президент по новым впечатлениям и продуктам сообщества соответственно.

    «И, в свою очередь, поклонники смогут по-новому общаться с любимыми творческими людьми, сближая их с помощью интерактивных инструментов и опыта. Все это поможет нам совершенствовать и совершенствовать технологию, информируя приложения для будущего».

    Однако с генеративным искусственным интеллектом и музыкой дело обстоит особенно сложно. Трудно не только создать модели, способные создавать звук, который действительно звучит хорошо, но и обеспечить безопасность данных для обучения систем. Звукозаписывающие компании, как известно, очень спорны, когда дело доходит до защиты их авторских прав, и YouTube это хорошо знает. Видеосайт заявил, что работает над решением этих проблем и пытается заключить лицензионные соглашения, чтобы выплачивать артистам компенсацию за их музыку.

    «Несмотря на огромные возможности, которые предоставляет искусственный интеллект, мы также понимаем, что это быстро развивающаяся сфера, которая ставит сложные задачи. Одной из самых сильных сторон YouTube являются наши прочные отношения с партнерами в музыкальной индустрии. Мы стремимся сотрудничать с ними, вступая в эту новую эру». совместно критически изучать новые возможности и разрабатывать разумные и устойчивые системы контроля, монетизации и атрибуции», — добавили Коэн и Рид.

    Тем временем исследователи из Google DeepMind решает проблему фальшивого звука, генерируемого искусственным интеллектом, который можно использовать для манипулирования или введения в заблуждение слушателей. Треки, созданные с использованием модели Lyria, будут нести незаметные водяные знаки из инструмента SynthID, используемого для идентификации синтетического контента. SynthID, очевидно, работает путем преобразования аудиоданных в двумерную спектрограмму, применения цифрового водяного знака к этому представлению и преобразования его обратно в аудио.

    «Водяной знак предназначен для обеспечения обнаружения, даже когда аудиоконтент претерпевает множество распространенных модификаций, таких как добавление шума, сжатие MP3 или ускорение и замедление дорожки. SynthID также может обнаруживать присутствие водяного знака на протяжении всей дорожки, чтобы помочь определить, части песни были созданы Лирией», — объяснил DeepMind. ®

    Предыдущая статьяOnePlus 11 получает стабильное обновление Android 14
    Следующая статьяЭто не бычий рынок, а просто «закуска», говорят криптоаналитики
    Виктор Попанов
    Эксперт тестовой лаборатории. Первый джойстик держал в руках в возрасте 3 лет. Первый компьютер, на котором „работал” был с процессором Intel i386DX-266. Тестирует оборудование для издания ITBusiness. Будь то анализ новейших гаджетов или устранение сложных неполадок, этот автор всегда готов к выполнению поставленной задачи. Его страсть к технологиям и приверженность качеству делают его бесценным помощником в любой команде.