Выделение растительности и объектов гидрографии по снимкам городских территорий сверхвысокого разрешения
Для автоматизированного дешифрирования гидрографии и растительности городских территорий по снимкам сверхвысокого разрешения наиболее эффективно применять методы максимального правдоподобия, спектрального угла и дерева принятия решений
Рассматривается опыт использования снимков сверхвысокого разрешения IKONOS (США) для автоматизированного дешифрирования гидрографии и растительности городских территорий на примере центральной части г. Екатеринбурга.
Введение
Развитие компьютерных технологий позволяет упростить процедуры выявления и распознавания объектов местности на космических снимках и перейти от визуального дешифрирования к автоматизированному, что ускоряет проведение географического анализа изображений. В настоящее время разработано большое число алгоритмов автоматизированного дешифрирования (классификации космических снимков), под которым понимается процесс разбиения пикселов изображения на классы, т. е. на однородные по некоторому критерию области[1]. Первичным признаком при классификации объектов космических снимков служит яркость пикселов в различных спектральных диапазонах съемки. В качестве вторичных признаков используются характерный размер, форма и текстура объектов. Полученное в результате изображение называется тематической картой, на которой каждому цвету соответствует определенный класс объектов.
Ниже приводятся описание исследования снимков сверхвысокого разрешения на предмет возможности автоматизированного дешифрирования растительности и объектов гидрографии, а также анализ различных методов классификации с обучением для этих задач.
Исходные материалы
Съемка исследуемой местности проведена в июле 2006 г. с космического аппарата IKONOS. Исходные материалы представляют собой комплекты панхроматических и мультиспектральных изображений с пространственным разрешением 1 и 4 м соответственно. Исходные снимки с использованием технологии паншарпенинга (pan-sharpening) приведены к пространственному разрешению 1 м [2]. Динамический диапазон изображений составляет 11 бит, размерность спектрального пространства снимков равна четырем (голубой, зеленый, красный и инфракрасный диапазоны съемки).
Екатеринбург расположен на восточном склоне Уральских гор на берегах р. Исеть и оз. Шарташ. Площадь города составляет 470 км2, население — 1,3 млн человек. Преобладает многоэтажная квартальная застройка, на окраинах сохранились приусадебные хозяйства, развивается коттеджное строительство. Промышленная зона охватывает значительную часть территории. В городе имеются парки и скверы, идет активное строительство жилых и офисных зданий, торговых центров, дорожных развязок.
Обработка изображений проведена с использованием программного продукта ENVI 4.3 (ITT Visual Information Solutions, США), так как он предлагает наибольшее число методов классификации с обучением.
Классификация с обучением: гидрография
Автоматизированное дешифрирование гидрографии выполнено с использованием всех методов классификации с обучением, заложенных в ENVI (параллелепипедов, евклидова расстояния, расстояния Махаланобиса, максимального правдоподобия, спектрального угла), а также с помощью построения логической конструкции — дерева решений [3].
Перед началом работы проанализировано распределение яркости для объектов, характеризующих гидрографию. На рис. 1 представлены гистограммы распределения яркости в пределах фрагмента водной поверхности для четырех съемочных зон.
Рис. 1. Гистограммы распределения яркости для фрагмента водной поверхности
Как видно из рис. 1, форма гистограмм близка к нормальной, поэтому дополнительная предварительная обработка исходного изображения не проводилась. На рис. 2 представлены гистограммы распределения яркости для фрагментов объектов гидрографии различного типа.
Формы графических отображений распределения яркости на рис. 2 далеки от нормальной, на гистограммах видны несколько мод, разброс средних значений достаточно велик. Это означает, что в выборке присутствуют разделимые в спектральном пространстве классы. Поэтому классификацию гидрографии целесообразно проводить с применением нескольких обучающих выборок, соответствующих различным типам водной поверхности на снимке.
Рис. 2. Гистограммы распределения яркости для фрагментов объектов гидрографии различного типа
При проведении исследований для классификации гидрографии было выбрано семь таких эталонных выборок. После этого космический снимок был классифицирован всеми указанными выше методами. Фрагмент полученной тематической карты с обозначениями классов представлен на рис. 3, где видно, что имеет место ошибочное присвоение класса гидрографии теням от зданий. В связи с последним результаты классификации были подвергнуты пост-классификационной обработке.
Рис. 3. Результат классификации с обучением элементов гидрографии по снимку IKONOS
Постклассификация тематических карт заключается в обработке результатов классификации морфологическими фильтрами. Она позволяет удалить мелкие кластеры, отдельные пикселы, заполнить «дыры» на больших площадях. На конечных результатах классификации устранены группы пикселов, относящиеся к теням зданий, однако вместе с тем утеряны мелкие детали гидрографии и искажены контуры крупных объектов (рис. 4).
Рис. 4. Результат постклассификационной обработки тематической карты гидрографии
Оценка точности классификации с обучением элементов гидрографии проведена путем сравнения площадей водной поверхности на тематической карте и космическом снимке (последняя получена в результате ручного оконтуривания изображений озер, рек и водохранилищ). Ошибка рассчитывалась по формуле:
где S0 — площадь объектов гидрографии на снимке, которая составила 821 261 229 м2; S T — площадь объектов гидрографии на тематической карте. Для характеристики точности метода классификации использована достоверность Ps, связанная с ошибкой соотношением
Результаты оценки точности представлены в табл. 1, где строке с номером 1 соответствует метод параллелепипедов, 2 — метод минимальных расстояний, 3 — метод расстояния Махаланобиса, 4 — метод максимального правдоподобия, 5 — метод спектрального угла, 6 — метод дерева решений.
Таблица 1. Оценка точности классификации с обучением элементов гидрографии
Для удаления ошибочно классифицированных на тематических картах элементов проведена многоитерационная постклассификационная обработка. В результате этого на конечном изображении утрачены мелкие детали и искажена форма крупных объектов. Поэтому выполнена еще и оценка точности по контурам. Иллюстрация этого метода представлена на рис. 5.
Рис. 5. Суть метода контурной оценки тематических карт
На рис. 5 площади фигур 1 и 2 одинаковы, но сами фигуры не являются идентичными. При расчете ошибки по контурам вычисляется заштрихованная площадь и с целью абсолютизации делится на площадь эталонного контура, т. е. применяется следующая формула:
Результаты оценки точности этим методом представлены в табл. 2, где
Из табл. 1 и 2 следует, что наилучшие результаты классификации элементов гидрографии получены при использовании методов максимального правдоподобия, спектрального угла и дерева решений. Их применение позволяет на мультиспектральных снимках IKONOS классифицировать гидрографию с достоверностью не хуже 96% по площади и 95% по контурам. Основная причина ошибок — удаление при постклассификационной обработке элементов гидрографии, ошибочно отнесенных к теням от зданий.
Таблица 2. Контурная оценка тематических карт
Классификация с обучением: растительность
По аналогии с гидрографией перед началом работы проанализировано распределение яркости для объектов, характеризующих растительность. На рис. 6 представлены гистограммы распределения яркости небольшого фрагмента хвойного леса для четырех съемочных зон.
Рис. 6. Гистограммы распределения яркости для фрагмента хвойного леса
Гистограммы на рис. 6 сильно иссечены, что обусловлено высокой детальностью изображения. При классификации с обучением использование эталонных выборок с таким распределением яркости даст некорректный результат, поэтому исходный снимок был обработан сглаживающим фильтром с размером окна 11 ( 11 [4, 5]. На рис. 7 представлены гистограммы сглаженного изображения.
Рис. 7. Гистограммы распределения яркости для фрагмента хвойного леса после обработки сглаживающим фильтром
Для классификации растительности использованы четыре эталонных выборки, соответствующие хвойному, смешанному и лиственному лесу, а также траве. Достоверность выборок подтверждена полевыми исследованиями. На основе опыта классификации элементов гидрографии и с учетом того факта, что по спектральным свойствам растительность является более сложным объектом, чем гидрография, для проведения классификации выбраны методы параллелепипеда, спектрального угла и дерева решений. При попытке построения тематических карт на основе NDVI (нормализованный относительный индекс растительности) установлено, что для дифференциации лиственных лесов и травы использование только красного и инфракрасного каналов является недостаточным [6]. Фрагмент тематической карты с обозначениями классов представлен на рис. 8. Видно, что вокруг кластеров имеет место эффект «тени», обусловленный сглаживающей фильтрацией исходного снимка.
Рис. 8. Результат классификации с обучением растительности по снимку IKONOS
Постклассификационная обработка позволила частично удалить небольшие фрагменты «теней» на полученной тематической карте. Число итераций при этом было невелико, поэтому в основу оценки точности положена формула (1). При отсутствии достоверных данных относительно состава леса оценка по площади проведена только для классов «лес» (суммарно хвойный, смешанный и лиственный) и «трава». Площади леса и травы получены путем ручного оконтуривания объектов изображения и составили 5 467 321,68 (S0F) и 988 741,08 м2 (S0G) соответственно. Результаты оценки точности классификации леса представлены в табл. 3, травы — в табл. 4, где SF и SG — площади леса и травы на тематической карте;
— ошибки классификации для леса и травы;
PSF и PSG — достоверность классификации для леса и травы соответственно. Обозначения методов классификации: 1 — максимального правдоподобия, 2 — спектрального угла, 3 — дерева решений.
Таблица 3. Оценка точности классификации леса
Согласно табл. 3 и 4, лучшие результаты классификации растительности получены при использовании методов дерева решений и максимального правдоподобия. Автоматизированное дешифрирование растительности с помощью этих методов выполнено с достоверностью не хуже 97%. Основная причина ошибок — эффект «тени» вокруг кластеров, что при подсчете площади дало несколько завышенную оценку. Появление «теней» обусловлено сглаживающей фильтрацией исходного высокодетального изображения. Состав леса, отраженный на тематических картах, в целом подтверждается полевыми исследованиями.
Таблица 4. Оценка точности классификации травы
Изложенные результаты получены в рамках ОКР «Разработка технологии топографического мониторинга городских территорий на основе спутниковых изображений сверхвысокого разрешения», выполненной в инфомационно-аналитическом центре «Уралгеоинформ» по заданию Роскартографии.
Список литературы
1. Лурье И.К., Косиков А.Г. Теория и практика цифровой обработки изображений.— М.: Научный мир, 2003.— 167 с.
2. Коберниченко В.Г.,Тренихин В.А. Методы синтеза изображений на основе данных дистанционного зондирования Земли различного разрешения // Успехи радиоэлектроники. — 2007. — № 4. — C. 22 –31.
3. Шахиди А. Деревья решений — общие принципы работы: Эл. ресурс аналитической платформы Deducto. — http://www.basegroup.ru/library/analysis/tree/description .
4. Гонсалес Р., Вудс Р. Цифровая обработка изображений. — М: Техносфера, 2005. — 1071 с.
5. Претт Э. Цифровая обработка изображений. — М.: Мир, 1995. — 312 с.
6. NDVI — теория и практика: Эл. ресурс географических информационных систем и дистанционного зондирования. — http://gis-lab.info/qa/ndvi.html .