В.Ю. Андрианов Метаданные пространственных данных. Технические регламенты и стандарты создания и обмена пространственными данными
Основой серии публикаций послужили материалы отчета ГИС-Ассоциации о выполнении НИОКР Минэкономразвития России «Разработка концепции формирования инфраструктуры пространственных данных как элемента общегосударственных информационных ресурсов». Автор соответствующего раздела отчета В.Ю. Андрианов (ООО «Дата+»). Руководитель работ С.А. Миллер.
Метаданные пространственных данных
Понятие метаданных пространственных данных
Метаданные определяются чаще всего как «данные о данных». Это краткое определение отражает их сущность, однако из него не очевидны ни функции, ни значимость метаданных, ни причины для их создания и использования.
Для понимания того, что такое метаданные пространственных данных, можно рассмотреть ситуацию с бумажной картой. Собственно картографическое изображение внутри рамки является тем набором данных, который необходимо сопроводить специальным описанием, чтобы им можно было пользоваться. Нам необходимо знать масштаб, проекцию, значения координат, легенду и т. д. Эти элементы описывают основной набор данных и, поскольку они сами тоже являются данными, их называют метаданными.
Пространственные данные не единственный вид данных, описываемый с помощью метаданных. Любой электронный документ является набором данных, а его характеристики метаданными. Самыми очевидными являются название, автор, дата создания. Кстати, названные элементы метаданных приписываются всем данным, включая и пространственные. Для какого-нибудь простого текста этих элементов может быть достаточно, но для более сложных данных может потребоваться большее количество разнообразных элементов.
Сложность и разнообразие пространственных данных приводит к тому, что их метаданные оказываются довольно большим массивом разнородной информации. Для эффективного использования эта информация должна быть систематизирована. Структурирование метаданных обсуждается ниже.
Роль и функции метаданных в инфраструктуре пространственных данных (ИПД)
Роль метаданных в ИПД
Метаданные занимают в ИПД очень важное место. Поскольку инфраструктура имеет распределенный характер, необходимо, чтобы в ней имелись инструменты поиска данных, оценки их пригодности для конкретной задач и доставки потребителю. Информационной основой для функционирования этих инструментов являются метаданные.
Публикация метаданных позволяет производителям и хранителям пространственных данных сообщать потенциальным потребителям о том, какими ресурсами они располагают. Соответственно потребители получают возможность вести поиск данных, которые им нужны для решения своих задач. Причем метаданные важны не только для внешней публикации, но и для ведения каталогов собственных информационных ресурсов организаций. Функции метаданных
Различные источники выделяют различные наборы функций метаданных. Между ними много общего, и в качестве примера можно привести стандарт Федерального комитета по географическим данным США (Federal Geographic Data Committee FGDC) на метаданные пространственных данных (FGDC-STD-001), который выделяет четыре функции (аналогичные функции приведены в стандарте ISO 19115):
поддержка поиска информация, необходимая для определения наборов данных, имеющихся на какую-то определенную географическую область;
назначение и пригодность информация, необходимая для оценки, удовлетворяет ли набор данных определенным потребностям;
доступ к данным информация, необходимая для приобретения (получения) выбранного набора данных;
применение данных информация, необходимая для обработки и использования набора данных. Проблема идентификации наборов пространственных данных
На текущий момент не существует общепринятой системы уникальной идентификации наборов пространственных данных. Но необходимость ее создания очевидна, если провести аналогию с Интернет и бумажными изданиями. В Интернет любой информационный ресурс обладает уникальным именем Universal Resource Locator (URL). Благодаря этому любой пользователь Всемирной сети может найти этот ресурс независимо от физического расположения ресурса и местонахождения пользователя. Пространственные данные также являются информационным ресурсом, поэтому уникальная идентификация каждого набора данных необходима для обмена этими данными, особенно при налаживании торговли этими данными.
Таблица 1. Список утвержденных стандартов и отчетов ISO серии 19100 Geographic information (географическая информация)
Номер
Оригинальное название
Русское название или соотв. российский стандарт
19101:2002
Reference model
Эталонная модель
19105:2000
Conformence and testing
ГОСТ Р ИСО 19105-2003. Соответствие и тестирование
19106:2004
Profiles
Профили
19107:2003
Spatial schema
Пространственная схема
19108:2002
Temporal schema
Временная схема
19111:2003
Spatial referensing by coordinates
Привязка в пространстве по координатам
19112:2003
Spatial referensing by geographic identifiers
Привязка в пространстве по географическим идентификаторам
19113:2002
Quality principles
ГОСТ Р ИСО 19113-2003. Принципы оценки качества
19114:2003
Quality evaluation procedures
Методы оценки качества
19115:2003
Metadata
Метаданные
19116:2004
Positioning services
Услуги определения координат
19120:2001
Functional standards (TR)
Функциональные стандарты (технический отчет)
19121:2000
Imagery and gridded data (TR)
Изображения и растровые данные (технический отчет)
19125:2004
Simple feature access - Part 1: Common architecture
Доступ к простым объектам - Часть 1: Общая архитектура
19125:2004
Simple feature access - Part 2: SQL option
Доступ к простым объектам - Часть 2: Доступ через SQL
Таблица 2. Список стандартов FGDC
FGDC STD 001 1998
Content Standard for Digital Geospatial Metadata
Стандарт содержания цифровых геопространственных метаданных
FGDC STD 001.1 1999
CSDGM Part 1: Biological Data Profile
CSDGM Часть 1: Профиль биологических данных
FGDC STD 002.5 1999
Spatial Data Transfer Standard Part 5: Raster Profile and Extensions
Стандарт передачи пространственных данных. Часть 5: Профиль и расширения для растровых данных
FGDC STD 002.6
Spatial Data Transfer Standard Part 6: Point Profile
Стандарт передачи пространственных данных. Часть 5: Профиль для точечных данных
FGDC STD 002.7 2000
Spatial Data Transfer Standard Part 7: CADD Profile
Стандарт передачи пространственных данных. Часть 7: Профиль CADD
FGDC STD 005
Vegetation Classification Standard
Стандарт классификации растительности
FGDC STD 006
Soil Geographic Data Standard
Стандарт географических данных о почвах
FGDC STD 007 1998
Geospatial Positioning Accuracy Standards
Стандарты точности определения геопространственных координат
FGDC STD 008 1999
Content Standards for Digital Orthoimagery
Стандарт содержания цифровых ортоизображений
FGDC STD 009 1999
Content Standard for Remote Sensing Swath Data
Стандарт содержания сканерных данных дистанционного зондирования
FGDC STD 010 2000
Utilities Data Content Standard
Стандарт содержания данных инженерных коммуникаций
FGDC STD 011 2001
United States National Grid
Разграфка США
FGDC STD 012 2002
Content Standard for Digital Geospatial Metadata: Extensions for Remote Sensing Metadata
CSDGM: Расширения для данных дистанционного зондирования
В области торговли книгами и периодическими изданиями хорошо себя зарекомендовали стандартные номера книг и периодических изданий (ISBN и ISSN). Обе системы нумерации являются стандартами ISO и обеспечивают идентификацию книг и периодических изданий при их поиске, заказе, каталогизации.
При развертывании обмена пространстве
нными данными также нужно решать проблему их однозначной идентификации с помощью соответствующих элементов метаданных.
Стандартизация в области представления и обмена метаданных
Необходимость стандартизации метаданных очевидна: различия в их составе и способе представления попросту не позволят вести эффективный поиск наборов данных и корректно их применять. По этой причине разработка стандартов метаданных ставится на первое место в процессе развертывания ИПД. Стандартизация метаданных в России
Единственным стандартом метаданных, принятым в России, является ГОСТ Р 51353 99 «Геоинформационное картографирование. Метаданные электронных карт. Состав и содержание», разработанный 29-м НИИ МО РФ и внесенный ТК 22 (ПК 051) Госстандарта России. Публичное обсуждение стандарта показало, что многие специалисты по геоинформатике считают его узконаправленным и ориентированным на технологии, используемые в 29-м НИИ. Существенно также то, что стандарт только перечисляет употребимые элементы метаданных, в то время как стандарты FGDC и ISO их четко структурируют, задают обязательность, условность или добровольность их использования, сопровождают большим объемом дополнительной информации, необходимой или полезной в применении стандартов метаданных. Существуют и другие противоречия и проблемы в области стандартизации пространственных данных и элементов Российской инфраструктуры пространственных данных (РИПД), создававшихся до последнего времени.
В настоящее время активную работу по обновлению стандартов ведет Государственный научно-внедренческий центр геоинформационных систем и технологий (Госгисцентр), курирующий Технический комитет 394 «Географическая информация/геоматика» Госстандарта России. Руководствуясь Федеральным законом «О техническом регулировании» и тем фактом, что стандарты ISO стали международным лидером, Госгисцентр занялся выпуском российских версий и профилей стандартов серии ISO 19100 «Geographic information/Geomatics». Опубликован проект российского профиля стандарта ISO 19115 «Metadata», доступный на Web-сайте Госгисцентра. Стандартизация метаданных в других странах
Наиболее весомой национальной попыткой стандартизации метаданных является стандарт Федерального комитета по географическим данным США FGCD-STD-001 «Content Standard for Digital Geospatial Metadata» (CSDGM), который был принят в 1994 г. (в настоящее время действует вторая версия, принятая в 1998 г.). К этому базовому стандарту метаданных разрабатывались специальные и тематические профили, такие, как Профиль биологических данных (FGDC-STD-001.1 1999 «CSDGM Part 1: Biological Data Profile»), Расширение для данных дистанционного зондирования (FGDC-STD-012 2002 «CSDGM: Extensions for Remote Sensing Metadata»), Профиль метаданных береговой линии («Shoreline Metadata Profile»).
Поскольку разработка стандартов является длительным и трудоемким процессом, во многих странах стандарт FGDC использовался в качестве основы национальных стандартов. В связи с тем, что существенно возросло влияние ISO на процессы стандартизации стран-участниц, FGDC предпринимает усилия по гармонизации своих стандартов с международными.
Другой разработчик стандартов для ИПД в США Open Geospatial Consortium, Inc. (OGC) одобрил использование стандарта ISO 19115 в качестве замены тем 9 и 11 своей Абстрактной спецификации и выпустил соответствующий документ с материалами, дополнительными к стандарту ISO. Данный факт существен потому, что OGC объединяет коммерческие и негосударственные организации, не входящие в FGDC, а его спецификации учитываются разработчиками ИПД во многих других странах. Международная стандартизация метаданных
В 2003 г. ISO утвердила международный стандарт ISO 19115 «Metadata». Этот стандарт определяет более 220 элементов метаданных, объединенных в так называемые пакеты. Элементы поддерживают четыре функции метаданных, упомянутые выше. Описание структуры метаданных дано на языке UML, который является стандартом де-факто для моделирования в информационных системах.
В последние годы роль ISO существенно возросла. Многие национальные органы стандартизации предпочитают заниматься не собственной полномасштабной разработкой систем стандартов, а адаптацией международных стандартов и созданием национальных расширений и профилей к ним. Это в полной мере относится и к стандартам метаданных.
Поскольку в процессе разработки стандартов ISO учитывается опыт многих стран, международные стандарты вбирают в себя наработки национальных стандартов. Это относится и к стандарту ISO 19115. Данный стандарт имеет и собственные преимущества: поддержку многоязычных метаданных, использование современных средств документирования (включая словарь данных), поддержку национальных и тематических профилей стандарта, опору на другие международные стандарты (например, для представления дат, времени, координат и др.).
Помимо ISO, вопросами стандартизации ИПД занимается Комиссия стандартов пространственных данных Международной картографической ассоциации. На ее Web-сайте (http://ncl.sbs.ohio-state.edu/ica/home.html) можно найти много полезной информации по опыту стандартизации ИПД в разных странах и ссылки на соответствующие национальные информационные ресурсы. Кроме того, комиссия готовит к публикации книгу «Мировые стандарты пространственных метаданных» (World Spatial Metadata Standards), анализирующую состояние проблемы в более чем 15 странах, а также на международном уровне.
Структура метаданных
Известные стандарты метаданных разбивают множество элементов метаданных на смысловые группы. В стандарте ISO 19115 группы называются пакетами. Идея разбиения, помимо улучшения обзорности большого числа элементов, состоит в том, что параметры (такие, как условия применения, обязательность и др.) можно присваивать как отдельным элементам, так и их пакетам. Разбиение на пакеты удобно для создания профилей стандарта, куда они могут переходить полностью из базового стандарта. Еще одним обстоятельством является то, что в языке моделирования UML, используемом в серии ISO 19100, также присутствует понятие пакетов.
ISO 19115 является абстрактным стандартом, т. е. он не указывает, как метаданные должны кодироваться в файлы или базы данных компьютерных систем (рис. 1). Эту задачу решает другой стандарт (стандарт реализации) ISO 19139 «Metadata XML schema implementation».
Структуру метаданных можно проследить на примере ветви MD_Metadata MD_Identification CI_Citation.
Рис. 1. Общая структура метаданных стандарта ISO 19115
MD_Metadata главный пакет метаданных, агрегирующий другие пакеты, а также отдельные элементы метаданных в виде атрибутов пакета. Двухбуквенные префиксы указывают назначение или область применения пакетов, определяемые в данном или других стандартах серии 19100.
Пакет MD_Identification является абстрактным классом, реализуемым через пакеты, среди которых и CI_Citation. Класс CI_Citation содержит конкретные элементы метаданных (рис. 2).
Важной особенностью данного стандарта является то, что он не только определяет и структурирует элементы метаданных, но и указывает, какие типы данных должны использоваться для записи значений и какие это могут быть значения (так называемые домены значений). Делается это с помощью списков кодированных значений (когда множество значений фиксировано и невелико), указания допустимого числового диапазона и ссылок на другие стандарты ISO, определяющие представление координат, времени и дат, кодировки символов и т. д.
Такая детализация, с одной стороны, усложняет применение ISO 19115, поскольку для этого требуются приобретение других стандартов и включение их в общую методику создания метаданных. С другой стороны, она упрощает реализацию схемы (ISO 19139) и практическое применение стандарта при построении каталогов метаданных, являющихся частью ИПД и использующихся для поиска пространственных данных по запросам пользователей.
Сбор, представление, актуализация и использование метаданных
Общая схема взаимодействия через метаданные
Схема взаимодействия потребителей и поставщиков пространственных данных (data providers) и услуг (service provider) OGС в рамках ИПД представлена на рис. 3.
Поставщики публикуют стандартизованные метаданные в Интернет. Сервер каталога (их может быть несколько) просматривает и индексирует эти ресурсы подобно текстовым поисковым системам WWW (Яндекс, Google, Altavista). Таким образом, сбор метаданных осуществляется в автоматическом режиме, и на сервере всегда хранится наиболее актуальная версия метаданных, опубликованная поставщиком или держателем набора геоданных.
Рис. 3. Общая схема взаимодействия через метаданные
Потребитель, желающий найти геоданные, запрашивает каталог и получает список Интернет-ресурсов с требуемыми данными. Поскольку информация о составе, качестве, цене, свойствах и местонахождении набора геоданных представлена в соответствующих элементах метаданных этого набора, потребитель может оценить имеющиеся предложения и обратиться непосредственно к поставщику за нужным набором данных.
Такая схема взаимодействия реализует принцип «одного окна», где необходимые операции по публикации и обновлению метаданных, их использование для поиска, оценки, заказа и получения наборов геоданных реализуются в единой распределенной среде на основе стандартных протоколов. Интерфейс для потребителя может быть представлен на нескольких страницах в стандартном Web-браузере. Необходимость поощрения создания и использования метаданных
В сложившихся условиях разобщенности производителей и потребителей пространственных данных в Российской Федерации метаданные не играют существенной роли. Обмен идет на уровне личных и коммерческих контактов, а поиск наборов данных превращается в исследовательскую работу. В условиях, когда разрушен монополизм государства на создание пространственных данных, поиск поставщика необходимых данных может затянуться на несколько месяцев. И это при том, что процесс создания аналогичных данных на одни и те же территории дублируется во многих организациях и компаниях.
Здесь имеет место замкнутый круг: с одной стороны, отсутствие стандартизованных метаданных не позволяет потребителям вести поиск нужных наборов данных, с другой производители данных не заинтересованы в создании метаданных, поскольку при существующей практике они не востребованы.
Чтобы решить эту проблему, нужно найти способы поощрения создания метаданных. Хороший пример решения дает FGDC, предлагающий финансовые ресурсы, знания, стандарты и инструменты для развития системы обмена метаданными. Огромную роль играют клиринговые центры обмена пространственными данными, которые позволяют потребителям находить поставщиков.
Технические регламенты и стандарты создания и обмена пространственными данными
Роль технических регламентов и стандартов в РИПД
Мощнейшим импульсом к развитию Национальной инфраструктуры пространнственных данных (National Spatial Data Infrastructure NSDI) и внедрению стандартов FGDC в США явилась их открытая и бесплатная публикация в сети Интернет. Этот момент весьма важен в условиях добровольного применения стандартов.
Приобретение полного комплекта стандартов ISO серии 19100 (по ценам ISO) требует значительных финансовых затрат. Определенных расходов потребует их внедрение в практику производства пространственных данных организации или компании. И если производитель не обязан следовать этим спецификациям, ему проще и дешевле действовать по своему разумению, изобретая собственные «стандарты».
Весьма удачный выход использует Американский национальный институт стандартов (American National Standards Institute ANSI). Он публикует национальные версии стандартов ISO, тексты которых эквивалентны текстам соответствующих международных стандартов. Если стоимость одного стандарта ISO составляет около 100 150 дол., то национальные стандарты продаются по цене 18 дол.
В России подавляющее большинство производителей и потребителей пространственных данных даже не знакомы с полным перечнем стандартов в этой области, поскольку в отличие от таких систем, как ГСС, ЕСКД и др., система стандартов по геоинформационным технологиям и пространственным данным не создавалась. Стандарты ISO по пространственным данным первоначально тоже разрабатывались разрозненно, однако очень быстро были объединены в серию 19100, что позволило лучше структурировать их и существенно упростило поиск для пользователей. В Общероссийском классификаторе стандартов (ОКС) группа для стандартов ИПД не выделена (используются категории 35.240.30 «Применение информационных технологий в области информации, документации и в издательском деле», либо 35.240.70 «Применение информационных технологий в науке»). Данная ситуация унаследована от Международной классификации стандартов (International Classification of Standards ICS), где используются эти же категории. Все это говорит в пользу разработки методического документа, перечисляющего и подробно описывающего стандарты, имеющие прямое отношение к РИПД.
В России стандарты ISO можно приобрести у
ВНИИКИ, входящего в систему Госстандарта России. Однако реальное применение стандартов блокируется тем, что оригинальные англоязычные тексты сложны для понимания и анализа большинству потенциальных пользователей, а русские переводы предлагаются по цене вдвое выше оригинальных текстов (т. е. по 200 300 дол.). Совершенно очевидно, что сохранение такого положения вещей значительно затруднит и затормозит развертывание РИПД, а доход от продажи текстов стандартов никогда не покроет убытки от неразвитости РИПД. Жизненный цикл стандартов (на примере ISO) Активизация стандартизации при продолжающемся развитии ГИС-технологий и усилия по гармонизации национальных и международных стандартов ведут к тому, что разрабатывается большое число новых стандартов, а существующие стандарты нередко пересматриваются. Поскольку процесс разработки стандартов весьма длительный, публикация их проектов позволяет сократить время внедрения утвержденных версий. Чтобы упорядочить этот процесс и обеспечить достоверной информацией пользователей стандартов, ISO разработала удачное описание жизненного цикла стандартов (http://www.iso.org/
iso/en/widepages/stagetable.html). Этот цикл состоит из стадий (stages) и этапов (substages), четко фиксирующих различные подготовительные шаги, работу Технического комитета, обсуждение, утверждение и публикацию. Предусмотрены процедуры пересмотра и отмены стандартов. На каждой стадии возможен возврат к предыдущей или полная отмена проекта. Хотя данная схема актуальна для международной стандартизации, где имеется большое число участников процесса разработки стандартов, она может быть полезна и для разработки стандартов РИПД, поскольку количество квалифицированных организаций и компаний, заинтересованных в создании ИПД в России довольно велико. Формализация жизненного цикла позволит держать процесс под контролем и сократить время развертывания РИПД и получения от нее экономической отдачи.
Стандартизация в области пространственных данных
Для развертывания РИПД имеют значение несколько международных и национальных инициатив в области стандартизации и разработки информационных технологий и моделей ИПД:
ISO/TC211 Технический комитет 211 «Географическая информация» в ISO (табл. 1);
FGDC межведомственный орган, координирующий создание ИПД в США;
OGC консорциум государственных организаций, коммерческих компаний и частных лиц, активно развивающий и стандартизирующий технические средства ИПД в США; признается мировым лидером в данной области;
GSDI базирующаяся в Англии ассоциация организаций, агентств, компаний и частных лиц со всего мира, продвигающая идеи глобальной ИПД, методики создания национальных ИПД и их интеграции в общемировой процесс. FGDC
FGDC был основан в 1994 г. и тогда же начал разработку стандартов для национальной ИПД США. За прошедшее время разработано несколько стандартов, однако многие проекты оказались незавершенными, и сейчас перерабатываются с целью гармонизации с стандартами ISO. Тем не менее принятые стандарты и проекты стандартов представляют значительный интерес как наиболее проработанная национальная система стандартов ИПД. К настоящему времени утверждены следующие стандарты (табл. 2). Смена парадигмы стандартизации в связи с введением Федерального закона «О техническом регулировании»
Конкуренция в области разработки стандартов недопустима в случае, когда стандарты обязательны для исполнения. Так, стандарты ТК-22/ПК-051 и ТК-394 имеют явные противоречия, и потому их совместное выполнение невозможно. Очевидно, что при их обязательности пользователи просто не смогут корректно работать. В случае необязательности у них появляется возможность выбора, какой серии стандартов отдать предпочтение.
Однако в интересах общества лучше иметь одну хорошо организованную, продуманную и полную систему стандартов. Создание такой системы возможно только на основе консенсуса заинтересованных участников, достижимого в случае, если проект стандарта готовится не в ведомственных комитетах, а группами специалистов из разных организаций. При этом должно обеспечиваться публичное обсуждение проектов стандартов и процедуры урегулирования противоречий. Необходимость публичного обсуждения проектов стандартов
Стандартизация катастрофически отстает от развития технических средств работы с пространственными данными. Сообществу производителей и потребителей пространственных данных стало ясно, что два технических комитета Госстандарта выпускают противоречащие друг другу документы.
Оценка целесообразности и степени технического регулирования элементов РИПД
В странах, активно разворачивающих или развернувших национальные ИПД, стандарты и спецификации по работе с пространственной информацией носят добровольный характер. К следованию стандартам вынуждает культура рыночных отношений, где нестандартный продукт находит существенно меньший спрос, нежели стандартный. Поэтому производители данных и программных средств активно участвуют в консорциумах и организациях по стандартизации соответствующего профиля.
В России ситуация со стандартами существенно иная практически отсутствует согласованная система стандартов для РИПД, новые экономические механизмы пока не созрели в достаточной степени, чтобы коммерческие и государственные организации, а также органы государственного управления в равной степени были заинтересованы в скорейшем создании фундамента РИПД. Наконец, отсутствует правовая культура реализации ответственности за несоблюдение технических норм, особенно в области цифровой информации. В таких условиях техническое регулирование может осуществляться только на компромиссной основе, в виде соблюдения баланса интересов и возможностей участников РИПД.
В качестве начального этапа создания системы технического регулирования в области РИПД целесообразно предусмотреть разработку регламентов только для тех элементов РИПД, которые непосредственно влияют на безопасность жизнедеятельности человека. Это требование относится к геоинформационным системам и пространственным данным, используемым для поддержки принятия решений в чрезвычайных ситуациях и размещении потенциально опасных объектов. Технические требования и стандарты для представления и обмена пространственными данными здесь могут использоваться те же, что и в «добровольном сегменте» РИПД, однако, их применение организациями соответствующих видов деятельности должно стать обязательным и подтверждаться соответствующими сертификатами. Разработка системы технического регулирования в области РИПД может строиться на основе соответствующей системы ISO. Пространственные данные как общегосударственный информационный ресурс
При государственном управлении практически по всем направлениям используются объекты, имеющие пространственную привязку (например, земельные участки). Поэтому определенные виды пространственных данных естественным образом играют роль общегосударственного информационного ресурса. Создание единых реестров физических и юридических лиц, земельного, водного и природно-ресурсного кадастра без увязки через единую геоинформационную основу приведет в дальнейшем к необходимости их переработки и согласования. Однозначное (без перекрытий и разрывов) представление границ географических объектов (включая и объекты недвижимости) необходимо минимум для устранения причин споров.
Хотя польза от использования РИПД в задачах управления территориями для многих специалистов очевидна, вопрос о последовательности действий по ее развертыванию вызывает массу дискуссий. С одной стороны, нужна общая информационная основа в виде базовых пространственных данных (БПД), с другой телекоммуникационная среда для обмена этими данными, с третьей стандартизация форматов и протоколов обмена. Создание системы стандартов РИПД
Наиболее важным из первоочередных шагов является разработка системы стандартов, определяющих структуру РИПД, протоколы обмена, используемые форматы данных. Если начать не с этого, то в дальнейшем будет неизбежна переработка уже созданных и работающих элементов РИПД, влекущая дополнительные финансовые расходы, замедляющая ход процесса в целом и, как правило, снижающая конечное качество данных (больше операций больше ошибок).
В настоящее время ситуация для России выгодна тем, что многие страны и ISO уже проделали огромную работу по стандартизации элементов ИПД и эти стандарты можно использовать в качестве основы национальных стандартов. На российском рынке средств работы с пространственной информацией большой сегмент составляют продукты мировых лидеров в этой отрасли, в которых реализованы спецификации ISO, OGC, FGDC. Эти средства активно используются не только в коммерческих компаниях, но и в государственных организациях и органах государственного управления.
Распространением и адаптацией международных стандартов занимаются ВНИИКИ и Госгисцентр. Обе организации, несомненно, вносят полезный вклад в развитие данного направления, однако их усилия совершенно недостаточны. Например, ВНИИКИ предлагает переводы международных стандартов (причем по двойной цене) без разработки сквозной системы русскоязычных эквивалентов терминологии и без их публичного обсуждения среди экспертов данной отрасли. Выполняется техническая работа, которой для поддержки создания РИПД недостаточно.
Другая ситуация с Госгисцентром он адаптирует и разрабатывает профили тех стандартов, которые важны только для ведения государственного картографо-геодезического фонда. Так, Госгисцентр подготовил проект сокращенного профиля стандарта ISO 19115 «Географическая информация. Метаданные». В то же время необходим выпуск полного русскоязычного текста базового международного стандарта, чтобы заинтересованные организации могли ознакомиться с его положениями и оценить качество разработанного Госгисцентром профиля. Понять действия этих организаций не трудно, так как они выполняют возложенные на них задачи, и не имеют стимула для более широкой работы по стандартизации элементов РИПД.
Из вышесказанного следует, что в России имеются предпосылки для быстрого создания системы стандартов РИПД. Вначале это должен быть выпуск российских эквивалентов международных стандартов по доступным ценам, затем разработка национальных профилей, учитывающих исторические особенности создания и использования карт в России. Параллельно с этим должна вестись пропаганда использования стандартов при создании новых пространственных данных. Создание среды обмена пространственными данными
Пространственные данные являются ценным ресурсом и могут широко использоваться в государственном управлении. Однако их потенциал существенно повышается в условиях широкого обмена ими между потребителями и поставщиками. Аналогичную ситуацию можно наблюдать в системе электронных расчетов и платежей, значительно повышающей эффективность финансовой сферы. Точно так же электронный обмен кадастровыми данными повысит эффективность земельной реформы и прозрачность операций с недвижимостью.
Среда обмена пространственными данными строится на основе общей инфраструктуры обмена данными, развитие которой предусмотрено соответствующими положениями Федеральной целевой программы «Электронная Россия (2002 2010 годы)». Помимо базовой информационно-коммуникационной среды для РИПД необходима стандартизация представления пространственных данных с помощью форматов данных, а также стандартизация протоколов обмена этими данными. Соответствующие наработки и утвержденные стандарты имеются и в NSDI США, и в серии стандартов ISO 19100.
Помимо стандартов обмена необходимо создание системы взаимодействующих серверов метаданных, через которую потребители пространственной информации смогут находить поставщиков нужных им данных. При отсутствии этой системы потребителям попросту негде узнать о существовании интересующих их данных. Из-за этого съемочные работы многократно дублируются, а вопросы согласования различных наборов данных на одну территорию не решаются вообще. Подобная система серверов метаданных в США включает около 200 узлов, шесть из которых являются общенациональными «точками входа» в NSDI. Они зарегистрированы в соответствующем реестре FGDC, и обращаться к ним могут любые заинтересованные лица.
На начальном этапе развертывания РИПД нужно обеспечить внедрение подобной среды обмена между органами государственного управления, чтобы исключить дублирование работ по созданию пространственных данных и в дальнейшем обеспечить доступ к ним заинтересованных граждан и организаций. Создание системы БПД
БПД являются необходимой основой практически любого проекта с применением пространственных данных. По сути, в их унификации и использовании заинтересовано все общество, и поэтому целесообразно считать их общенациональным информационным ресурсом. В таком случае создание и актуализацию этих данных следует подвергать техническому регулированию. Должны быть определены технические регламенты создания базовых данных, обязательные стандарты их содержания, полноты и точности. Хотя с технической точки зрения создание БПД может проводиться практически любыми организациями, придание им статуса национального ресурса должно основываться на соответствующей системе сертификации данных, методов их создания и контроля.
Стандарты и форматы хранения и обмена пространственными данными
Обмен пространственными данными важнейшая составляющая ИПД. Соответственно стандартизация моделей, форматов и методов обмена данными является одной из основных задач создания РИПД. К настоящему времени разработаны и активно используются несколько десятков форматов для представления пространственных данных. Большинство из них используется в соответствующих программных продуктах и не доступно для открытого пользования, т. е. их спецификация не публикуется компанией-разработчиком и не гарантируется какая-либо преемственность в жизненном цикле формата. Однако, осознавая, что пользователям программных средств все равно нужна возможность обмена данными с другими поставщиками и системами, разработчики предусматривают обмен данными по открытым спецификациям. Модели данных для представления пространственной информации
Представление пространственной информации может осуществляться с помощью нескольких моделей данных. При этом одна и та же модель данных может записываться в различных форматах. Иными словами, модель данных является абстрактным методом описания географической ситуации, а форматы данных ее цифровыми реализациями. Наиболее часто выделяются следующие модели пространственных данных:
растровая запись пространственной информации в виде регулярной прямоугольной сетки точек измерений. Элементом модели является пиксел точечный элемент изображения, адресуемый номером строки и столбца в матрице значений растра. В каждой точке возможно несколько независимых измерений, каждое из которых называется каналом растра. Применяется для записи аэрокосмических снимков, фотографий, карт непрерывных распределений и поверхностей (рельеф, температура, влажность и т. д.);
векторная (объектная) используется для представления объектов реального мира в виде отдельных информационных сущностей, содержащих координаты, форму, размер, количественные и качественные характеристики представляемых объектов реального мира. Элемент модели пространственный объект, представляемый набором точек или отрезков (векторов) и набором атрибутов (описательных характеристик). Применяется для создания цифровых карт, подобных по структуре бумажным топографическим картам;
покрытия специальная разновидность векторной модели данных, где выделяются не изолированные объекты, а области пространства с единым набором характеристик. Элементом модели является однородный полигон (многоугольник), причем обязательным требованием является отсутствие разрывов и перекрытий между полигонами одного покрытия. Функционально покрытие аналогично растру, но во многих случаях обладает меньшей избыточностью. Наиболее популярным видом является TIN сеть нерегулярной триангуляции, составляемая из непрерывной мозаики треугольников. Применяется для записи непрерывных распределений и поверхностей (рельеф, температура, влажность и т. д.);
модели объемных тел расширение векторной объектной модели, где каждая формообразующая точка объекта имеет три пространственных координаты (в «плоской» векторной модели третья координата может быть атрибутом объекта, а не частью геометрического описания). Трехмерный объект может иметь любое число ребер, соединенных произвольно, и граней, на которые могут накладываться растровые текстуры изображения соответствующих участков объекта реального мира. Обмен растровыми данными
Для растровых данных стандартом обмена де-факто стал формат GeoTIFF. Этот формат позволяет хранить данные любого типа (целочисленные, с плавающей точкой) с любым числом каналов. GeoTIFF основан на спецификации Tagged Image File Format (TIFF), разработанной консорциумом ведущих производителей аппаратного и программного обеспечения для получения и работы с изображениями. Спецификация GeoTIFF добавляет к базовому формату TIFF теги географической привязки изображения.
В версии 6.0 спецификации TIFF выделены следующие классы изображений:
бинарные Class B, черно-белые графические элементы;
в градациях серого Class G, черно-белые фотоснимки;
индексные Class P, цветные графические элементы;
полноцветные Class R, цветные фотоснимки;
факсимильные Class F, факсы;
цветоделенные Class S, полиграфические данные;
цветоразностные Class Y, видеоэлементы.
Легко заметить, что в спецификации отсутствует специальный класс для данных дистанционного зондирования Земли, поэтому на практике для этих данных используются классы G (панхроматические снимки) и R (многозональные снимки). Помимо этого, заметным ограничением формата является предельный размер файла изображения 4 Гб, отсутствие поддержки атрибутов и стандартных метаданных. Преимущества формата в гибкости, возможности непосредственного использования в программных пакетах (без импорта), интеграции со средствами обработки изображений негеографического назначения.
Поскольку ни один из прежде разрабатывавшихся форматов растровых данных не пригоден для обмена в рамках ИПД, организации стандартизации начали разработку специальных обменных форматов и стандартов метаданных для растровой информации. FGDC в США разработал и утвердил стандарт Spatial Data Transfer Standard (SDTS), включающий профиль растровых данных.
Соответствующие стандарты ISO пока находятся в стадии разработки (табл. 3). Обмен векторными данными
Примером такой спецификации может быть формат Shape-файла ESRI, Inc. (США). Это открытая спецификация формата для хранения простых пространственных объектов. Благодаря открытости и простоте эта спецификация приобрела широкую популярность и часто используется для обмена пространственными данными в векторном представлении. Двоичный формат записи обеспечивает быстродействие работы с данными, благодаря чему он используется как внутренний формат в некоторых продуктах. Однако Shape-файл не может играть роль основного обменного формата в ИПД, поскольку он не поддерживает многие важные концепции организации пространственных данных, например, топологию. Кроме того, разработчик (ESRI, Inc.) не связан какими-либо обязательствами, и может менять спецификацию по своему усмотрению.
Пример Shape-файла показывает, что обменные форматы должны ориентироваться не на скорость чтения/записи, а на полноту всестороннего описания пространственных явлений и объектов. По сути, обменных форматов должно быть два один для данных в векторном представлении и другой для данных в растровом представлении.
В национальной ИПД США стандарт SDTS утвержден FGDC как официальный формат обмена пространственными данными. Этот стандарт специфицирует не только типы пространственных объектов, их структуру и отношения, но и значения отдельных атрибутов. Такая подробная спецификация обеспечивает возможность прямого обмена данными при их однозначной интерпретации.
Наиболее перспективным стандартом обмена векторными пространственными данными является географический язык разметки (Geography Markup Language GML). Этот стандарт является расширением стандартного расширяемого языка разметки XML. Основным разработчиком является OGС, утвердивший третью версию спецификации. ISO намерена стандартизовать GML как международный стандарт ISO 19136 Geography Markup Language. Проект находится в начальной стадии рассмотрения См. также: Каталог Организаций: - ДАТА+ Каталог Авторов: - Андрианов В.Ю. - Миллер С.А.