[ad_1]
What3Words, веб-сайт и приложение, которое переводит физические координаты в короткие запоминающиеся комбинации слов, на протяжении многих лет хвалили и критиковали.
Теперь ученый-компьютерщик из Эксетерского университета в Великобритании официально описал в статье, как путаница может возникнуть из-за алгоритма геокодирования, используемого What3Words, и поставил под сомнение его пригодность для направления экстренных служб к местам происшествий.
What3Words (W3W) появилось в 2013 году. Это приложение, которое использует запатентованную систему геокодирования для сопоставления географических координат с набором из трех слов, поскольку людям, как правило, труднее запоминать и передавать длинные числа, чем слова.
Система работает путем деления мира на сетку из трехметровых квадратов и присвоения каждому квадрату трех слов из набора данных, состоящего примерно из 40 000 слов. Таким образом, широта и долгота мэрии Нью-Йорка (40.712772, -74.006058) сопоставляются с clip.apples.leap, который обычно легче вызвать, скажем, или ввести на мобильном устройстве.
Приложение, по данным компании, используется в 170 странах тысячами предприятий, а также правительствами и неправительственными организациями. В Великобритании оно получило одобрение от Автомобильной ассоциации (AA) и некоторых групп экстренных служб, которые посоветовали путешественникам использовать приложение W3W на случай, если им понадобится сообщить о своем местонахождении. Создатели самого приложения описали W3W как «дополнительный инструмент», который службы экстренной помощи по всему миру могут использовать для обнаружения звонящих.
Но приложение также является объектом постоянной критики, документированной на сайте What 3 Words is a Mess. На сайте перечислены различные новости и сообщения из социальных сетей, в которых упоминаются проблемы, возникающие в результате использования адресов W3W.
Указывая на эти опасения, Руди Артур, старший преподаватель по науке о данных в Университете Эксетера, проанализировал алгоритм геокодирования W3W, описанный в патентной заявке компании, поскольку код компании закрыт для проверки.
«Если W3W будет широко принят службами экстренной помощи, он должен подвергнуться тщательной оценке», — объяснил он в препринте под названием «Критический анализ алгоритма геокодирования What3Words».
Регистр связался с Артуром, чтобы рассказать о своих выводах, но тот отказался, заявив, что надеется, что статья будет опубликована в академическом журнале, и что он предпочел бы дождаться завершения процесса рецензирования, прежде чем обсуждать работу.
Артур в своей статье говорит, что, хотя он не знаком с предыдущим формальным академическим анализом W3W, были публичные сообщения технических экспертов, в которых выражалась обеспокоенность по поводу схемы геокодирования. Например, два года назад тестер на проникновение Эндрю «Кибергиббонс» Тирни утверждал, что алгоритм может создать путаницу, если люди неправильно ставят слова во множественное число или деплюрализуют его или неправильно интерпретируют произносимые слова как омофонные варианты написания.
Тирни отметил, что W3W утверждает, что «люди путают множественное число только примерно в 5 процентах случаев, когда слышат, как они читают вслух», что, по его словам, означает, что вероятность того, что адрес W3W будет перепутан только из-за множественного числа, составляет один из 27.
W3W, с другой стороны, утверждает, что возможность путаницы гораздо более отдаленна.
«Допустим, в Великобритании существует 10 000 потенциально запутанных комбинаций, неоднозначно близких друг к другу», — заявила компания, решая эти проблемы в 2021 году. «Это составляет 1 из 2,5 миллионов (0,00004 процента) общего шанса попасть в квадрат, который можно было бы считать иметь поблизости площадь со сходным до смешения адресом».
W3W также заявил: «Подавляющее количество комбинаций из трех слов со схожим звучанием будут настолько далеко друг от друга, что ошибка будет очевидна».
Последствием такой путаницы в контексте экстренных служб могут быть такие сценарии, как направление машин скорой помощи не в то место, что может нанести вред тем, кто нуждается в помощи.
В статье Артура определены 14 различных способов возникновения ошибок при устной или письменной передаче троек слов. К ним относятся опечатки, омофоны, автозамены, региональные варианты написания, неопределенность границ слов («dogs.tart» или «dog.start») и т. д.
В качестве примера, взятого из статьи Артура о возможных ошибках только омофонов, местоположение «arose.recede.home» имеет набор путаницы, состоящий из «arrows.recede.home», «arose.reseed.home» и «arrows.reseed». .дом.” Другими словами, это потенциальные звуковые ошибки, которые могут возникнуть при попытке передать адрес W3W другому человеку.
По моим оценкам, 20-25 процентов адресов имеют более трех других адресов, с которыми их можно спутать.
По словам специалиста по данным, сложно оценить частоту этих ошибок из-за ограничительных условий лицензии W3W. Однако он обнародовал код своего анализа данных.
«По моим оценкам, 20–25 процентов адресов имеют более трех других адресов, с которыми их можно спутать, если принять во внимание только омофоны и опечатки», — говорит Артур в своей статье. «Таким образом, может быть очень сложно, если не невозможно, расшифровать неправильно переданный адрес с помощью нынешней системы».
«Вопреки утверждениям W3W, эта работа показала, что существует множество спутанных адресов W3W, и выявила некоторые серьезные проблемы с алгоритмом W3W. Однако, хотя и показано, что существует множество спутанных пар, эта работа не показывает, что они воля запутаться».
Указывая на различные другие используемые системы геокодирования — GeoHash, коды природных территорий, коды Plus (также известные как открытый код местоположения), справочную систему военной сетки и систему локации Мейденхеда — Артур предполагает, что справочная система национальной сетки разведки боеприпасов будет больше подходит для служб экстренной помощи Великобритании.
What3Words не ответил на запросы о комментариях, но ранее сообщил BBC, что человеческая ошибка «возможна при использовании любого типа инструмента». ®
[ad_2]