Хранилище пространственных объектов в составе регионального узла ИПД УрФО: модели хранилища
В 2009 г. информационно-аналитическим отделом ФГУП «Уралгеоинформ» получены первые значимые результаты в области создания системы «Хранилище пространственных объектов» как одной из компонент регионального узла ИПД
Общепризнанной сегодня является необходимость создания и развития национальной инфраструктуры пространственных данных с целью повышения эффективности территориальных решений, принимаемых на федеральном, региональном и местном уровнях государственного управления. Не менее очевидно, что политика формирования пространственных данных и их межведомственного согласования должна носить инновационный характер.
Согласно Концепции создания и развития инфраструктуры пространственных данных Российской Федерации (ИПД РФ), утвержденной Правительством РФ в 2006 г., любая ИПД независимо от национальных особенностей, наличия предпосылок и условий ее реализации должна включать следующие компоненты (элементы): информационные ресурсы, организационную структуру, стандарты и технологии [1].
Ю.Д. Зраенко
С.В. Серебряков
Доступ к информационным ресурсам ИПД РФ предполагается осуществлять через поисково-обменную среду (систему национальных, региональных и локальных геопорталов сети Интернет), оснащенную инструментами поиска информации по стандартизованным описаниям (метаданным), а так же с помощью распределенных сервисов анализа, обработки и визуализации пространственных данных.
Для перехода к практическому построению ИПД РФ необходимо разработать эффективные типовые решения, содержащие базы пространственных данных, инструменты доступа к ним и особую среду поиска и обмена.
С этой целью в Уральском региональном информационно-аналитическом центре («Уралгеоинформ») с августа 2007 г. ведется проект по созданию регионального узла ИПД Уральского федерального округа. В состав автоматизированной информационно-аналитической системы «Банк пространственных данных
УрФО» входят несколько информационных систем: «Архив», «Хранилище пространственных объектов», «Сервер метаданных» [2], а также геопортал [3].
ИС «Хранилище пространственных объектов» (далее — ИС «Хранилище») предназначена для хранения, анализа и обработки информации о пространственных объектах и основывается на принципиально отличной от общепринятой модели их формирования. Как известно, для производства и хранения пространственной информации широкое применение получила полистная технология, при которой объекты по тематической принадлежности группируются в слои, а совокупность слоев формирует карту. Такая технология сложилась исторически и использовалась в течение нескольких десятилетий, перевод карт в цифровой вид коренным образом не изменил подхода к их созданию. Описанный подход имеет ряд существенных недостатков, таких как [4, 5]:
— избыточность объектного состава;
— частичное дублирование информации на картах разных масштабов;
— сложность интеграции и слабая интероперабельность данных (разобщенность и разнородность информационных ресурсов существенно затрудняет обмен пространственными данными и их совместное использование);
— низкая эффективность картографического мониторинга для актуализации пространственных данных (вследствие дублирования объектов на картах разных масштабов и нестандартизированного представления информации).
После скрининга подходов и технологий, анализа первых результатов работ по созданию компонент узла региональной ИПД стало очевидным, что пространственные данные в том виде, в котором они были подготовлены, не пригодны для достижения поставленных целей. Решением проблемы представляется постепенный переход от полистного хранения пространственной информации к единому массиву данных, в котором основной единицей хранения является пространственный объект. ИС «Хранилище» призвана реализовать принципиально новое представление пространственной информации, соответствующее современным требованиям и уровню развития информационных технологий.
Цели создания ИС «Хранилище»:
— оптимизация мониторинга информации о пространственных объектах;
— исключение дублирования работ по подготовке пространственных данных;
— облегчение актуализации данных по результатам мониторинга;
— упрощение разработки новой картографической продукции (цифровых и бумажных карт, Web-публикаций и т. п.);
— переход к базовым пространственным объектам;
— обеспечение интероперабельности пространственных данных.
Создание ИС «Хранилище» — чрезвычайно сложный процесс, как с концептуальной, так и с технологической точек зрения.
Составляющие ИС «Хранилище пространственных объектов». Основными составляющими этой информационной подсистемы (рис. 1) являются:
— модель пространственного объекта;
— информационная модель пространственных данных;
— сервисы;
— нормативная база.
Рис. 1. Основные составляющие ИС «Хранилище»
Ниже рассматриваются первые результаты по разработке системы, полученные специалистами «Уралгеоинформ» в отношении моделей пространственных объектов.
Модель пространственного объекта
Одним из базовых терминов ИС «Хранилище» является пространственный объект, под которым понимается отнесенная к одному из классов информационная единица, содержащая пространственные координаты на местности (метрику), определенный набор свойств (семантику) и уникальный идентификатор.
В ИС «Хранилище» для описания пространственных объектов принята модель (рис. 2), где каждый пространственный объект характеризуется:
— множеством идентификаторов;
— метрикой или координатным описанием;
— атрибутивным описанием;
— метаинформацией на координатные и атрибутивные описания.
Рис. 2. Модель пространственного объекта, реализованная в ИС «Хранилище»
Выделены два уровня объектов: экземпляры и типы. На уровне экземпляров пространственный объект представлен как дискретная сущность, ассоциированная с конкретными географическими и временными координатами, и может отображаться специальным графическим символом. Индивидуальные экземпляры объектов группируются в классы с общими характеристиками — типы объектов, которые задаются каталогом.
Множество идентификаторов пространственного объекта включает глобальный уникальный идентификатор (GUID) и ведомственный идентификатор.
Каждый идентификатор пространственного объекта является уникальной характеристикой, используемой для фиксации связи координатных и описательных данных объектов, контроля взаимного их соответствия и обеспечения непротиворечивости пространственных данных. Идентификаторы играют ключевую роль при организации обмена пространственными данными.
Для достижения уникальности идентификации объектов в подсистеме «Хранилище» используются уже существующие ведомственные системы идентификации и псевдослучайная генерация.
В настоящее время существует ряд систем идентификации пространственных объектов, формируемых в рамках отраслевых систем учета объектов, которые имеют статус государственных и обеспечивают уникальную идентификацию объектов на всей территории Российской Федерации.
Однако такие системы установлены далеко не для всех пространственных объектов, поэтому ведомственная идентификация используется лишь на первых этапах создания ИС «Хранилище», в последующем основным становится уникальный идентификатор, генерируемый псевдослучайным образом по единому правилу, не зависящему от принадлежности объекта к тому или иному ведомству.
При псевдослучайной генерации используется алгоритм генерации кодов, который применяется производителями данных без какого-либо контроля за диапазоном значений. Псевдослучайный идентификатор присваивается однократно и является уникальным как во времени, так и в пространстве. Чтобы обеспечить постоянство идентификатора, его необходимо освободить от информации о данных, в противном случае, как показывает мировая практика, возможно изменение идентификатора при неизменности пространственных данных. GUID генерируется по алгоритму создания уникального идентификатора (Universally Unique Identifiers), соответствующего требованиям RFC4122 [6].
При этом ведомственный идентификатор существует как атрибут объекта, а GUID присваивается при внесении объекта в хранилище (или в систему идентификации).
Метрика, или координатное описание, характеризует границы объекта и его положение в пространстве. В ИС «Хранилище» используются точечная (в том числе ориентированная точка), линейная и площадная (полигональная) типы метрик. Предусматривается принципиальная возможность хранения разных версий метрики объекта, а также нескольких метрик различной точности для одного объекта. Для каждой метрики в базе данных (БД) ИС «Хранилище» устанавливаются признаки «Точность» и «Актуальность». Все метрики позиционируются в единой общеземной системе координат WGS–94.
Для использования на разных уровнях абстракции экземпляр объекта в ИС «Хранилище» может иметь сложную структуру. Объект формируется из нескольких координатных описаний (участков), которые затем объединяются одним агрегирующим объектом (рис. 3). Обусловлено это неоднородностью исходных данных. Во-первых, в зависимости от масштаба исходной цифровой карты экземпляр объекта может быть точечным, линейным или площадным. Во-вторых, исходный экземпляр объекта может иметь большую пространственную протяженность и загружаться в информационную систему с нескольких номенклатурных листов разного масштаба, соответственно координатные описания его участков будут отличаться по точности, степени актуальности и т. п. Для взаимной увязки данных вводится агрегирующий объект, который в зависимости от типа может иметь разный характер локализации. Например, для дорожной инфраструктуры это будет линейный объект «осевая линия дороги», для рек — линейный объект «водоток» и т. д. Такой объеект является своего рода контейнером, определяемым GUID2, в который складываются участки объекта. На агрегирующий объект «нанизываются», как бисер на нитку, участки объекта различной точности, и состав его уточняется по мере появления в БД более точных координатных описаний объекта.
Рис. 3. Иерархия объектов в БД ИС «Хранилище» (a — представление объектов в БД; б — комбинация объектов на карте и во входных данных)
Кроме агрегирующего объекта в БД могут создаваться агрегированные объекты (объекты-агрегаты). Примером может служить квартал, метрика которого формируется из метрики зданий. Объекты-агрегаты могут иметь другой тип по каталогу, отличающийся от типа объектов, на основе которых он создается. У образованных агрегатов появляются новые свойства (атрибуты). Метрика агрегатов создается во время генерализации.
Атрибутивное описание объекта определяет его непространственные характеристики. Формально все атрибуты можно разделить на две группы: идентифицирующие (описаны выше) и семантические. Идентифицирующие атрибуты присущи всем типам объектов ИС «Хранилище», описанным в каталоге, а семантические образуют индивидуальное множество для каждого типа объектов.
Имена атрибутов в каталоге унифицированы согласно физическому смыслу параметра, который они обозначают. Например, атрибут с именем length — это абстрактная длина, которая в конкретном случае приобретает свойство длины участка дороги, реки, границы и т. п. Состав атрибутов в каталоге может расширяться, также могут изменяться контекст атрибута и его связи с пространственными объектами.
Метаданные в ИС «Хранилище пространственных объектов». Ведение метаданных в ИС «Хранилище» осуществляется по следующим уровням иерархии:
— метаданные набора объектов;
— метаданные экземпляра объекта;
— метаданные экземпляра метрики;
— метаданные экземпляра атрибута.
На уровне набора объектов метаданные полностью соответствуют метаданным исходного картографического листа, которые могут быть импортированы в ИС «Хранилище» через XML-файл или доступ к которым может быть организован непосредственно в базе ИС «Сервер метаданных» [2] с использованием уникального идентификатора. На уровнях объекта, метрики и атрибута формируются только отличные от верхнего уровня метаданные (при обновлении соответственно отдельных объектов, метрик и атрибутов). Таким образом, при одном и том же распространителе данных нет необходимости прослеживать изменения по всей структуре.
Информационная модель хранилища пространственных данных
Информационная модель хранилища пространственных данных базируется на концептуальной модели пространственного объекта. При этом она охватывает и такие аспекты, как реализация хранения, анализ и обработка пространственных данных. Под последними понимаются данные о пространственных объектах, включающие сведения об их местоположении, форме и свойствах, представленные в координатно-временной системе [1].
Информационная модель (рис. 4) состоит из следующих разделов:
— каталоги объектов;
— идентификаторы объектов;
— атрибутивная информация;
— метаданные;
— метрика объектов;
— наборы объектов;
— служебные данные.
Рис. 4. Схема информационной модели базы ИС «Хранилище»
Все разделы информационной модели проектировалась на основе методологии ER (сущность — связь) c помощью системы ERWin [7–9].
Раздел каталогов объектов является исходной точкой доступа ко всем остальным пространственным данным. Каталог пространственных объектов — это документ, содержащий определения и описания типов объектов, атрибутов и ассоциаций (отношений), встречающихся в одном или нескольких наборах географических данных, с указанием допустимых операций объекта. Широко распространенное понятие «классификатор» является подмножеством понятия «каталог», поскольку оно не включает в себя ни ассоциаций объектов (за исключением иерархических отношений), ни операций.
Раздел каталогов построен в полном соответствии с международным стандартом ISO 19110 Geographic information — Methodology for feature cataloguing (Географическая информация — методология каталогизации объектов; [10]). Согласно стандарту любой каталог пространственных данных описывается следующими элементами информации: тип объекта с его свойствами, ассоциации между типами и ограничения, которые могут накладываться на все элементы информации. Тип объекта характеризуется его свойствами (атрибут, операция и роль ассоциации). Все аспекты пространственных данных структурно описываются с помощью 15 отношений: каталог объектов, тип объектов, отношение наследования, тип свойства, операция объекта, связывание, ограничение, атрибут объекта, роль ассоциации, список кодов для типов ролей, перечислимое значение, ассоциация объекта, источник определения, ссылка на определение, связанный атрибут объекта.
Операции над объектами в каталоге используются для описания динамики системы.
Атрибуты объектов различаются трех типов. Первый выводится непосредственно из операций объектов. Например, интенсивность движения по мосту — это характеристика его работы. Все мосты выполняют операцию перемещения транспортных средств, поэтому это свойство становится частью определения данного объекта. Второй тип атрибутов может выводиться для объекта опосредованно. Например, «подмостовой габарит» является важным атрибутом объекта, потому что он ограничивает высоту судов, способных проходить под мостом. Третий тип атрибутов не имеет отношения ни к одной из операций, определенных в каталоге. Например, каталог может определять объект «гора», который не имеет заданных операций, но включает атрибут «высота».
Отношения объектов в каталоге могут задаваться с помощью определения отношений наследования либо ассоциаций.
Отношение наследования реализует иерархию взаимосвязей между типами объектов. При наследовании представители одного типа объектов по определению являются представителями другого типа. Например, мост — это объект транспортной системы, если он определяется операцией «обеспечивает перемещение транспорта». Понятие «объект транспортной системы», имеющее большую общность, также определяется этой операцией. Обобщение предполагает передачу свойств по наследству (например, операций объекта, атрибутов объекта и ролей ассоциаций) — от общего типа объектов к частным. Многие типы объектов имеют многочисленные операции и атрибуты; обобщение может возникнуть из структуры множественного наследования свойств. Например, тип объекта «мост» может относиться и к общему классу «объект транспортной системы», и к общему классу «препятствия» для движущихся объектов.
В ассоциацию может включаться произвольное число типов объектов, при этом ключевую роль при определении ассоциации играет такое свойство типа объектов, как роль ассоциации. Существуют три типа роли ассоциации: обычная ассоциация, UML-агрегирование и UML-композиция. Считается, что на основе этих типов ролей ассоциаций можно описать все возможные взаимоотношения между типами объектов. Обычная ассоциация между типами объектов не является отношением наследования или агрегированием. UML-агрегирование — это группирование экземпляров различных типов объектов в другие типы с разными свойствами.
UML-композиция — это такой тип объединения объектов, когда объекты, составляющие композицию, не могут существовать отдельно от нее. Например, «шлюз канала» включает стены, ворота и часть канала.
Методология построения каталогов, предлагаемая в ISO 19110, носит универсальный характер. С ее помощью можно сформировать различные каталоги и в рамках информационной системы привести их к унифицированному представлению. Таким образом, в ИС «Хранилище» смогут одновременно существовать:
— каталог базовых пространственных объектов, разрабатываемый «Уралгеоинформ»;
— каталог земельного кадастра;
— каталог пунктов Государственной геодезической сети;
— каталог ОКАТО для единиц административно-территориального деления;
— каталог лесного кадастра и др.
Раздел идентификаторов объектов осуществляет связь между остальными разделами пространственных данных: атрибутивной информации, метаданных и метрик и содержит такие уникальные идентификаторы, как:
— глобальный идентификатор GUID;
— ведомственный идентификатор;
— внутренний номер в ИС «Хранилище».
В разделе также присутствуют идентификаторы, не являющиеся уникальными, в частности:
— код типа объекта по принятому в ИС «Хранилище» каталогу;
— исходный код типа объекта по каталогу, в котором он был первоначально создан.
Раздел атрибутивной информации содержит конкретные значения атрибутов экземпляров объектов согласно заданной в каталоге связи с типами объектов. Механизм связывания атрибутов является гибким и при необходимости позволяет добавить новые, изменить контекст существующих или удалить старые атрибуты. В соответствии с ISO 19110 существует поддержка множественных атрибутов (например, граница принадлежит одновременно нескольким муниципальным образованиям или субъектам Федерации и имеет при этом несколько кодов ОКТМО).
Раздел метаданных содержит метаданные различных уровней: наборов данных, объектов, атрибутов и метрик. В состав метаданных входят:
— сведения о времени появления пространственного объекта в ИС «Хранилище»;
— дата последней модификации;
— сведения о субъекте, осуществившем последнюю модификацию;
— масштаб пространственного объекта;
— год состояния местности первоисточника;
— источник происхождения пространственного объекта и т. п.
В разделе метаданных соблюдена преемственность с базой метаданных, созданной ранее в соответствии с ГОСТ Р 52573 и ISO 19115 [2, 11, 12]. В раздел входят такие отношения, как «Ответственный субъект» (CI_RESPONSIBLEPARTY) со всеми связанными с ним отношениями, «Объект ссылки» (CI_Citation), «Источник данных» (LI_SOURCE) и т. д. В перспективе эти отношения будут интегрированы и станут общими для ИС «Хранилище» и ИС «Сервер метаданных». Общими для этих двух баз является и ряд справочников, например, «Степени секретности» (MD_CLASSIFICATIONCODE) и «Перечень предметных областей» (MD_TOPICCATEGORYCODE).
Раздел метрики объектов содержит геометрическую информацию о пространственных объектах. В ИС «Хранилище» используются модели «картографического спагетти» и цепочно-узловая.
В настоящее время для описания объектов цифровых карт наиболее часто применяется модель так называемого «картографического спагетти». Этот подход можно описать двумя основными правилами: «каждый объект имеет свою метрику» и «у каждого объекта фиксированные свойства». При этом модель не предполагает какого-либо прямого описания связей между объектами. Модель «картографического спагетти» приводит к необходимости дублирования информации внутри цифровой карты: метрики линейных и площадных объектов в местах общих (смежных) границ, семантики (свойств) протяженных объектов по их длине.
Развитием модели «картографического спагетти» является так называемая цепочно-узловая структура описания метрики. В данной модели метрика всех объектов выделяется в самостоятельный информационный блок и описывается в виде отрезков дуг и узлов, их соединяющих. При этом объекты цифровой карты «ссылаются» на дуги, описывающие их метрику. Естественно, что на одну дугу может ссылаться любое количество объектов. При этом дуги и узлы, т. е. метрика объектов, не дублируются. Модель получается более сложной с точки зрения сбора метрической информации об одном объекте, но удобной для обновления метрики, поскольку дуги корректируются отдельно от объектов и не нужно заботиться об отслеживании дублированного описания.
Первые шаги по загрузке информации в ИС «Хранилище» в виде цепочно-узловой модели показали, что возможности СУБД Oracle Spatial 11g не позволяют использовать данную модель, когда динамика изменения пространственных данных достаточно высока. В то же время модель «картографического спагетти» способна обеспечить выполнение всех функций, необходимых для загрузки и замены пространственных объектов в ИС «Хранилище».
Таким образом, на стадии загрузки пространственных объектов основной является модель «картографического спагетти». Цепочно-узловая модель более эффективна на стадиях анализа, обработки и публикации пространственных данных.
Раздел наборов объектов содержит наборы пространственных данных, выгруженные по определенным критериям из ИС «Хранилище» во временные таблицы для редактирования в ГИС-среде. После редактирования наборы снова загружаются в ИС «Хранилище», замещая устаревшие версии пространственных объектов.
Раздел служебных данных содержит таблицы диагностических сообщений, параметров элементов управления, настройки функционирования системы и др.
Выводы
На основе изложенного можно сделать следующие выводы:
1. При создании ИС «Хранилище пространственных объектов» как одной из компонент регионального узла ИПД разработана модель пространственного объекта, которая соответствует всем основным требованиям к идентификации, геометрии, составу атрибутивной информации и метаданным, а также к установлению связей между объектами.
2. Информационная модель пространственных данных регионального узла ИПД УрФО, построенная на основе ISO 19110 и модели пространственного объекта ИС «Хранилище», является достаточно универсальной, чтобы описать пространственные данные различных предметных областей.
3. Реализация в перспективе информационных сервисов ИС «Хранилище» позволит органам власти различных уровней, организациям и ведомствам формировать интегрированные распределенные ресурсы на основе пространственных объектов.
4. Можно утверждать, что выбранные концептуальные решения являются принципиально верными и ИС «Хранилище пространственных объектов» предоставляет пользователям качественно новую технологию создания и мониторинга пространственных данных.
Список литературы
1. Концепция создания и развития инфраструктуры пространственных данных Российской Федерации // Пространственные данные. — 2006. — № 3. — С. 6–9, 11.
2. Анисимова О.Л., Комо-ско В.В., Серебряков С.В. и др. Информационное и программное обеспечение управления метаданными на базе регионального центра Уральского федерального округа // Пространственные данные. — 2009. — № 2. — C. 22–30.
3. Алябьев А.А., Анисимо-ва О.Л., Серебряков С.В., Цереня П.В. Геопортал Уральского федерального округа как прототип узла РИПД // Пространственные данные. — 2009. — № 3. — С. 16–22.
4. Комосов Ю.А. Представление и хранение пространственных данных: изменение взгляда // Вестник геодезии и картографии. — 2008. — № 2. — C. 5–6.
5. Серебряков С.В., Баженова Ю.Д. Новый подход к организации и хранению пространственных данных // Геодезия и картография. — 2008. — № 7. — С. 52–55.
6. Алгоритм RFC4122. — http://ru.wikipedia.org/wiki/UUID .
7. Маклаков С.В. Создание информационных систем с ALLFusion Modeling Suite. — М.: Диалог-МИФИ, 2005. — 432 с.
8. Маклаков С.В. BPwin и ERwin. CASE — средства разработки информационных систем. — М.: Диалог-МИФИ, 2001. — 304 c.
9. Маклаков С.В. Моделирование бизнес-процессов с AllFusion Process Modeler (BRwin 4.1). — М.: Диалог-МИФИ, 2004. — 240 c.
10. ISO 19110:2005 Geographic information — Methodology for feature cataloguing. — http://www.iso.org/iso/catalogue_detail.htm?csnumber=44459 .
11. ГОСТ Р 52573–2006 «Географическая информация. Метаданные». — http://www.usegost.com/catalog/3974.shtml.12 . ISO 19115:2003 Geographic information. Metadata. — https://committees. standards.org.au/COMMITTEES/IT-004/PRIVATE/ I0028/ISO%2019115%20.pdf .