[ad_1]
Мысль о том, что наши гаджеты шпионят за нами, неприятна, поэтому группа исследователей из Колумбийского университета создала то, что они называют «нейронным голосовым камуфляжем».
Эта технология не обязательно помешает слушателю-человеку понять кого-то, если он шпионит (вы можете прослушать записи и просмотреть исходный код по ссылке выше). Скорее, это система, предназначенная для предотвращения передачи автоматически расшифрованных записей устройствами, оснащенными микрофонами. Он тихий — чуть громче шепота — но может генерировать звук, специально смоделированный для того, чтобы скрыть речь в реальном времени, так что разговоры не могут быть расшифрованы программным обеспечением и не могут быть обработаны, а текст не может быть отправлен обратно на какой-либо удаленный сервер для обработки.
Возможности в режиме реального времени — это то, где проект, по-видимому, совершил прорыв: хотя алгоритмы маскирования речи не новы, им обычно нужно было прослушать всю запись, чтобы скрыть ее. Это означает, что он практически бесполезен для защиты реальных разговоров в реальном времени.
«Главная техническая задача для достижения этого заключалась в том, чтобы заставить все это работать достаточно быстро», — сказал Карл Вондрик, доцент компьютерных наук в университете США и один из исследователей проекта.
По словам Вондрика, алгоритм, разработанный его командой, может помешать модели искусственного интеллекта с микрофоном интерпретировать речь в 80% случаев, и все это без необходимости слышать всю запись или знать что-либо о гаджете, выполняющем прослушивание.
Миа Шикье, кандидат наук и ведущий автор исследования, описывает алгоритм маскирования речи как «прогностическую атаку», потому что он использует предыдущие две секунды звука для прогнозирования того, что, вероятно, будет сказано дальше, а затем генерирует звук, который будет нарушить то, что он предсказывает, или похожие по звучанию слова.
«Эта атака научит «хеджировать ставки», находя единственный минимальный шаблон, который надежно блокирует все возникающие возможности», — говорится в документе проекта, который будет представлен на Международной конференции по обучающим представлениям на следующей неделе.
Конечно, гаджет может записать звук какой-нибудь болтовни и отправить ее, скажем, человеку для просмотра; этот проект направлен на предотвращение автоматического распознавания и транскрипции речи в режиме реального времени.
Тестируя свой метод, команда обнаружила, что он работает в реальных условиях в различных помещениях с различной геометрией. Шикье сказал, что модель работает с большей частью английской лексики, и что команда работает над ее расширением на другие языки.
В исследовательском документе отмечается, что проект был полностью основан на этических соображениях вездесущей технологии распознавания речи, которую, по словам профессора Пенсильванского университета и исследователя машинного обучения Цзяньбо Ши, необходимо переформулировать аналогично исследованию Сикье и Вондрика.
«Их работа заставляет многих из нас думать в следующем направлении: спрашивайте не о том, что этический ИИ может сделать для нас, а о том, что мы можем сделать для этического ИИ… как сообщество мы должны сознательно думать о влиянии ИИ на человека и общество. технологии, которые мы разрабатываем на самой ранней стадии разработки исследований», — сказал Ши. ®
[ad_2]