Сделайте свою шумную запись похожей на профессиональный звук с помощью бесплатного инструмента искусственного интеллекта от Adobe.

    0
    115
    Иллюстрация микрофона предоставлена ​​Adobe.
    Служба Adobe Enhance Speech может удалять фоновый шум из определенных голосовых записей.

    Недавно Adobe выпустила бесплатный инструмент для обработки звука на базе искусственного интеллекта, который может улучшить некоторые некачественные голосовые записи, удалив фоновый шум и сделав голос более громким. Когда это работает, результат звучит как запись, сделанная в профессиональной звуковой кабине с высококачественным микрофоном.

    Новый инструмент под названием Enhance Speech был создан в рамках исследовательского проекта ИИ под названием Project Shasta. Недавно Adobe переименовала Project Shasta в Adobe Podcast.

    Использование Enhance Speech бесплатно, но требует создания учетной записи Adobe и лучше всего работает с настольным веб-браузером. После регистрации пользователи могут загружать файлы MP3 или WAV продолжительностью до одного часа или размером 1 ГБ. Через несколько минут вы можете прослушать результат в своем браузере или загрузить полученный очищенный звук.

    В наших тестах с сервисом Enhance Speech лучше всего работал со звуком, который содержал голос без перекрестных помех или чрезмерного шума. Например, мы записали звук со встроенного микрофона iMac человека, стоящего на расстоянии 10 футов, включая шум вентилятора поблизости, и полученный звук (после обработки с помощью Enhance Speech) звучал так, как будто он был записан с близкого расстояния в бесшумной среде. студия с профессиональным микрофоном.

    Enhance Speech позволяет загружать файлы MP3 или WAV размером до 1 ГБ или продолжительностью до одного часа.
    Увеличить / Enhance Speech позволяет загружать файлы MP3 или WAV размером до 1 ГБ или продолжительностью до одного часа.

    Adobe

    Как это работает? Adobe не предоставила никаких подробностей, но мы подозреваем, что компания обучила модель глубокого обучения на многих (возможно, тысячах) часах чистого и шумного звука. Затем модель могла бы «научиться» различать частоты человеческого голоса и синтезировать факсимиле, точно соответствующее источнику. Это предположение, пока Adobe не предоставит больше технических деталей, и мы обратились к компании за комментариями.

    В связи с этим некоторые комментаторы Hacker News сообщают о галлюцинациях — неожиданных результатах, таких как фантомные голоса, когда ИИ неправильно интерпретирует входной звук — от чрезвычайно шумного звука (например, речи, записанной рядом с водопадом) или от неанглоязычных источников, что предполагает, что Enhance Speech делает больше, чем просто обычная техника шумоподавления.

    Enhance Speech — не первый инструмент, обеспечивающий такую ​​​​возможность шумоподавления на основе ИИ. Например, пакет с открытым исходным кодом mayavoz и коммерческая служба Audo Studio делают что-то подобное.

    Стоит отметить, что Enhance Speech является частью более крупной группы инструментов для подкастинга на базе искусственного интеллекта от Adobe, включая инструмент Mic Check (в настоящее время также доступен бесплатно) и инструмент для редактирования аудио на основе расшифровки, который все еще проходит только по приглашению. бета-тест.

    Предыдущая статьяAetherSX2 — лучший способ играть в игры для PlayStation 2 на Android
    Следующая статьяMacBook Pro 14 теперь стоит 400 долларов в течение ограниченного времени.
    Петр Григорин
    Интересуется софтом, разработкой и использование новых приложений, технология искусственного интеллекта. Этот писатель - человек с техническими знаниями, который увлечен разработкой программного обеспечения и использованием новых приложений. Его особенно интересуют технологии искусственного интеллекта и то, как они могут быть использованы для улучшения различных отраслей промышленности и повседневной жизни. Обладая прочной основой в области информатики и острым взглядом на инновации, этот писатель обязательно привнесет ценные идеи и соображения в любую дискуссию на эти темы. Пишет ли он о последних открытиях в области ИИ или исследует потенциал новых программных инструментов, его работа обязательно будет увлекательной и заставляющей задуматься.