Forbes.ru: искусственный интеллект и нейросети в картографии
На сайте "forbes.ru" опубликована статья Е. Лисовского "Искусственный интеллект и нейросети в картографии — 2: когда «народные» карты круче Google". В ней рассказывается о картографических сервисах. Полностью с материалом можно ознакомиться по ссылке.
Этот материал продолжает тему будущего картографических сервисов. На этот раз мы поговорим об автоматизированных решениях при создании дорожных автомобильных карт. То есть о так называемых автоматических методах маппинга. В первую очередь, автоматическими методами маппинга мы будем называть те методы, где человек выступает в роли разработчика и оператора, управляющего интеллектуальными системами автоматического картирования.
1. Автоматическое распознавание объектов по спутниковым снимкам с использованием нейросетей
Это наиболее перспективный способ автоматического добавления и обновления информации о дорогах и зданиях на обширных участках планеты. Нейросети обучаются на базе уже распознанных вручную участков в OSM.
О разработках в этом направлении на конференции OpenStreetMap в Сиэтле рассказала команда Facebook. Соцсеть использует на входе высококачественные коммерческие данные компании DigitalGlobe (до 30 см на 1 пиксель), и на базе заранее обученной на OpenStreetMap нейросети автоматически определяет на снимках дороги. Facebook использует OSM для сервиса Livemap, однако на поток технология распознавания еще не поставлена, поскольку требует доработки и согласования с сообществом OpenStreetMap (это необходимо, чтобы избежать массовых ошибок при распознавании и загрузке данных в OSM). Технологию машинного обучения и нейросетей использует также компания DigitalGlobe для своего коммерческого B2B продукта GBDX.
Такой метод не идеален и может приводить к значительным погрешностям, поскольку исходные снимки каждой местности уникальны. В разных странах дороги и дома могут строить по-разному, вследствие чего нейросеть, обученная на базе информации об одной стране, может плохо справляться с распознаванием объектов в другой. Кроме того, качества спутниковых снимков не хватает, чтобы распознать на карте дорожные знаки, светофоры и прочие небольшие объекты. Проблему представляет и угол наклона исходного спутникового снимка, при котором часть объектов вообще не видно: они оказываются закрытыми плоской проекцией зданий. Ну и, конечно, спутниковые снимки не позволяют считывать названия улиц, организаций и прочую информацию: для этого нужно так называемое «локальное знание».
Детектирование дороги для деревни в Египте
Загруженные в OSM схемы автоматически распознанных дорог при помощи нейросетей, подсвеченные в зеленый цвет, для удобства проверки мапперами
2. Автоматическая обработка фото- и видеопотока с видеорегистраторов и смартфонов пользователей
Метод подходит для распознавания рядности дорог, считывания дорожных знаков, светофоров и прочих объектов. Если фотокамера широконаправленная, то можно также попробовать распознать вывески вдоль улиц и названия заведений (однако определить тип заведения уже не получится). Этот способ сбора информации уже позволяет использовать системы компьютерного зрения, усиленные обучаемыми нейронными сетями, для улучшения точности распознавания не только дорожных знаков (с ними все как раз достаточно просто), но и прочих, более сложных объектов (вывески, пожарные гидранты, светофоры, заборы). Пример открытого проекта, который позволяет наносить объекты этим способом — Mapillary. С помощью обучаемых нейронных сетей можно распознавать, скажем, сетевые заведения с вывесками и автоматически наносить их на карту; однако через такой сервис почти невозможно наносить на карту организации, находящиеся, в основном, внутри здания и не имеющие вывески на улице.
Определение скоростных ограничений на дороге по дорожным знакам
3. Коммерческое добавление информации об объектах.
В последнее время набирают обороты компании, которые ранее собирали и продавали данные об организациях, а ныне оказывают этим организациям услуги по добавлению и обновлению информации о них на все карты мира. Также компании проверяют актуальность данных, создают отчеты о представленности. Такие сервисы (среди них, например, Navads и Brandify) получают непосредственно от организаций точную информацию о месте расположения, адресе, номерах телефонов и т.д., подключаются по API ко всем популярным открытым и закрытым картографическим базам и загружают туда актуальные данные о предприятиях в автоматическом режиме.
Используется для поиска отсутствующих участков дорог, закрытых дорог, ошибок в направлении движения по дорогам. Дальше всех в этом продвинулась коммерческая компания Mapbox, предоставляющая API/SDK на базе OpenStreetMap.
Mapbox вкладывает немалые ресурсы в обработку обезличенных GPS-треков, поступающих через SDK, для улучшения точности дорог, добавления новых и устранения ошибок в OSM. Кроме того, около 40 штатных картографов компании постоянно работают над уточнением OSM-данных. К примеру, если на OpenStreetMap дорога обозначена как односторонняя, но по данным, поступающим по SDK, на этом участке дороги автомобили движутся в обоих направлениях, то, очевидно, на этом участке дороги было введено двустороннее движение — и картографы внесут соответствующие правки. То же самое касается свежепостроенных дорог, еще не обозначенных на карте: если набирается достаточное количество треков по участку, отсутствующему в OSM, такая дорога будет добавлена. Таким образом, клиенты Mapbox делают свой опосредованный вклад в развитие OpenStreetMap.
5. Автоматический сбор и обработка видео-/GPS-/LIDAR-данных автомобилей и прочих уличных роботов, оснащенных системами полного или частичного самоуправления
Таким роботам требуются как обычные карты для базовой навигации, так и данные в реальном времени для уточнения маршрута. В недалеком будущем, когда самоуправляемые автомобили широко распространятся по миру и будут постоянно курсировать по дорогам, именно они будут генерировать наибольший объем полезной информации об изменениях на дорогах. На текущий момент в направлении самоуправляемых автомобилей движутся сразу несколько гигантов: Google, Intel, Tesla, Uber, Nvidia и еще ряд компаний.
Для более точного распознавания различных дорожных объектов активно используются нейросети. Искусственный интеллект на базе этих нейросетей обучается действовать в различных дорожных ситуациях – обрабатывает входящую информацию и принимает решение о совершении маневра, основываясь на опыте других автомобилей в похожих ситуациях.
На базе этих данных уже создаются специализированные карты, обеспечивающие более высокую точность, чем отрисованные по спутниковым снимкам. Сверхточные карты нужны для навигации роботов будущего, которое уже не за горами. Однако создание такой карты всего мира — весьма дорогостоящие занятие: скажем, Google в свое время потратил примерно млрд на проект StreetView, запустив специализированные автомобили, оснащенные камерами с обзором в 360 градусов, при этом охвачены были только крупные города. Хочется верить, что компании-гиганты, создающие самоуправляемые машины, объединят свои усилия для создания открытых навигационных карт высокой точности, которыми смогут пользоваться любые роботы — скажем, уличный робот-уборщик или патрульный робот-полицейский.
Комментарий CEO Idealab Билла Гросса к фото: «Самоуправляемый автомобиль Google собирает почти 1 Гбайт данных в секунду. И вот что он видит, совершая поворот налево»
Выводы об автоматических методах маппинга
Как видно из перечисленных выше методов, за счет развития технологий машинного обучения, нейронных сетей и компьютерного зрения автоматические методы маппинга позволят уже в перспективе 5-10 лет существенно уменьшить трудозатраты на создание и обновление карт. Поспособствуют этому несколько трендов:
— популяризация самоуправляемых автомобилей, оснащенных системами автоматического сбора огромного количества графической информации вокруг автомобиля, что позволит иметь самую актуальную информацию о дорогах и различных объектах вдоль дорог;
— популяризация и удешевление графических процессоров NVidia и других игроков, широко используемых для анализа графических объектов через нейронные сети, повышая качество и скорость распознавания;
— значительное снижение стоимости запусков геоспутников в космос (благодаря SpaceX), что позволит открыть дорогу на геолокационный рынок коммерческим компаниям и государствам;
— возможность купить доступ к снимкам поверхности от разных поставщиков одних и тех же мест с разных ракурсов, что позволит повысить точность автоматического распознавания;
— появление более свежих снимков менее популярных областей поверхности;
— совершенствование спутниковых систем (увеличение разрешения) позволит повысить разрешение снимков и увеличить точность распознавания более мелких объектов;
— нейросети постепенно научатся распознавать на более детальных спутниковых снимках более сложные объекты и делать это будут точно и быстро.
Выводы о создании карт в целом
Как видно, все перечисленные выше методы автоматического и ручного маппинга пока не решают двух больших проблем картографии: обеспечение актуальности и полноты данных по всему миру, а ведь пользователям нужны самые актуальные и полные карты уже сейчас. Сегодня недостаточно просто сделать детальную карту мира или региона: ее нужно регулярно обновлять, ведь все вокруг постоянно меняется. Эта масштабная и сложная задача не под силу одной коммерческой компании, поэтому такие карты надо создавать всем миром – и делать их открытыми.