IBM и NASA объединили и выпустили Prithvi: модель искусственного интеллекта с открытым исходным кодом, которая может помочь ученым и другим людям анализировать спутниковые снимки.
Модель преобразователя зрения, выпущенная под лицензией Apache 2, относительно невелика и содержит 100 миллионов параметров. Она была обучена на годичных изображениях, собранных в рамках программы Harmonized Landsat Sentinel-2 (HLS) американских специалистов в области космонавтики. Помимо основной модели доступны три варианта Prithvi, настроенные для выявления затопления; шрамы от лесных пожаров; и сельскохозяйственных культур и других видов землепользования.
По сути, это работает следующим образом: вы передаете одной из моделей снимок со спутника сверху, и она помечает области на снимке, которые понимает. Например, вариант, настроенный для сельскохозяйственных культур, может указать, где, вероятно, есть вода, леса, кукурузные поля, хлопковые поля, освоенные земли, водно-болотные угодья и так далее.
Мы полагаем, что эта коллекция будет полезна, скажем, для автоматизации изучения изменений земли с течением времени, например, для отслеживания эрозии от наводнений или того, как засуха и лесные пожары поразили регион. Big Blue и NASA не первые, кто сделал это с машинным обучением: мы могли бы привести множество предыдущих попыток.
Демонстрацию модели Prithvi, классифицирующей урожай, можно найти здесь. Предоставьте свои спутниковые снимки или используйте один из примеров внизу страницы. Нажмите «Отправить», чтобы запустить модель в реальном времени.
«Мы считаем, что базовые модели могут изменить способ анализа данных наблюдений и помочь нам лучше понять нашу планету», — заявил Кевин Мерфи, главный научный сотрудник НАСА. «А открывая исходный код таких моделей и делая их доступными для всего мира, мы надеемся увеличить их влияние».
Разработчики могут скачать модели из Hugging Face здесь.
Есть и другие онлайн-демонстрации Prithvi, такие как эта для варианта, точно настроенного для водоемов; этот для обнаружения шрамов от лесных пожаров; и этот, который демонстрирует способность модели реконструировать частично сфотографированные области.
Базовая модель — это предварительно обученная обобщенная модель, которую можно настроить для выполнения конкретных задач; это термин, придуманный Стэнфордским институтом искусственного интеллекта, ориентированного на человека. IBM утверждает, что Prithvi до 15 процентов лучше, чем предыдущие (неназванные) современные методы анализа геопространственных изображений, несмотря на то, что он полагается на вдвое меньше размеченных данных.
Есть надежда, что эта модель поможет людям отслеживать изменение климата и землепользование, тем более что количество спутниковых данных, собранных научными зондами, вращающимися вокруг Земли, оценивается. [PDF] к 2024 году достичь 250 000 терабайт.
IBM заявила, что обучила модель с помощью Vela, своего суперкомпьютерного кластера с искусственным интеллектом. Тем не менее, нам также сказали, что Big Blue потребовалось всего около часа, чтобы настроить модель для обнаружения флуда с использованием графического процессора Nvidia V100, поэтому вам может не понадобиться огромное количество железа для создания собственного варианта.
Коммерческая версия Prithvi, какой бы она ни была, должна быть доступна позже в этом году.
«Фундаментальные модели ИИ для наблюдения за Землей обладают огромным потенциалом для решения сложных научных проблем и ускорения более широкого развертывания ИИ в различных приложениях», — сказал Рахул Рамачандран, менеджер и старший научный сотрудник Межведомственной группы внедрения и передовых концепций НАСА (IMPACT).
«Мы призываем сообщества ученых и приложений оценить эту первоначальную модель фундамента HLS для различных целей и поделиться отзывами о ее достоинствах и недостатках», — добавил он. ®