«Кафедра инженерной геологии и охраны недр ГЕОИНФОРМАЦИОННЫЕ СИСТЕМЫ В ГЕОЛОГИИ Учебно-методическое пособие для студентов специальностей 011100 Геология и 011500 Гидрогеология и инженерная геология Пермь 2007 ББК 26.3 ...»
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОУ ВПО «Пермский государственный университет»
Кафедра инженерной
геологии и охраны недр
ГЕОИНФОРМАЦИОННЫЕ СИСТЕМЫ В ГЕОЛОГИИ
Учебно-методическое пособие для студентов
специальностей 011100 «Геология» и
011500 «Гидрогеология и инженерная геология»
Пермь 2007 ББК 26.3 УДК 55:002.6 Г 35 Составители: А.В. Коноплев, И.В.Кустов, П.А.Красильников Научный редактор проф. В.В. Середин Геоинформационные системы в геологии: учебметод. пособие для студентов спец. 011100 «Геология» и 011500 «Гидрогеология и инженерная геология» / сост.:
А.В. Коноплев, И.В.Кустов, П.А.Красильников; науч. ред.
В.В. Середин; Перм. ун-т. – Пермь, 2007. – 100 с.
Учебно-методическое пособие содержит тематический план курса «Геоинформационные системы в геологии», краткое изложение материала курса по темам; контрольные вопросы для подготовки к экзамену; список литературы и интернет-источники.
Учебно-методическое пособие одобрено на заседании методической комиссии геологического факультета Пермского государственного университета Рецензенты:
д-р геол.-мин. наук А.И.Кудряшов (директор ООО НПФ «Геопрогноз»); канд. геол.-мин. наук, доцент Ю.А.Яковлев (начальник отдела промысловой геологии ООО «ПермНИПИнефть») © А.В. Коноплев, И.В.Кустов, П.А.Красильников, составление,
1. ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЙ РАЗДЕЛ
1.1. Цели и задачи дисциплины Геоинформатика – область науки и техники, отражающая и изучающая природные и социально-экономические геосистемы, их взаимодействие и развитие посредством компьютерного моделирования на основе информационных систем и технологий, баз данных и баз знаний. В задачи геоинформатики входит изучение общих свойств геоинформации, закономерностей и методов ее получения, фиксации, накопления, обработки и использования, а также развитие теории, методологии и технологий создания геоинформационных систем с целью сбора, систематизации, хранения, анализа, преобразования, отображения и распространения пространственно-координированных данных.Место и основная роль ГИС в геологических исследованиях определяются как интеграция, анализ и комплексная интерпретация разнотипных данных, разработка прогнозов, моделирование и планирование дальнейших действий, представление результатов в терминах целевого геологического свойства и в картографической форме.
При таком подходе ГИС в геологии будет не только средством преобразования информации и справочно-аналитического обслуживания, а прежде всего средством достижения конечных целей геологических исследований.
Основная цель курса – ознакомление студентов с общими принципами и теоретическими основами геоинформатики, принципами функционирования географических информационных систем (ГИС), возможными путями применения геоинформационных технологий в научных исследованиях и для решения широкого круга практических задач геологии.
Задачи курса состоят в формировании у студентов основных навыков проектирования, создания и использования геоинформационных систем, необходимых для профессионалов разных профилей, работающих по данной специальности. При этом ставится задача максимально полно охватить геоинформационную тематику (спектр возможностей и областей применения ГИС в геологии) и помочь приобрести навыки работы с конкретными программами, используемыми в геологических организациях.
1.2. Требования к уровню освоения содержания дисциплины Студенты, завершившие изучение данной дисциплины, должны:
- представлять себе идеологию геоинформационных систем и место данного курса среди других изучаемых дисциплин;
- обладать теоретическими знаниями о структуре ГИС и их компонентах, об основных принципах функционирования ГИС, об аналитических возможностях современных ГИС и их месте в геологических исследованиях;
- уметь ориентироваться в терминологии ГИС, способах получения, хранения, редактирования различных видов данных, в разнообразии средств и инструментов обработки пространственно распределенной информации, способов анализа данных и представления результатов;
- иметь практические навыки проектирования, создания и использования геоинформационных систем различного назначения;
- иметь практические навыки работы с программами ArcView GIS – ArcMap (включая модули пространственного анализа Spatial Analyst и 3D Analyst) и Easy Trace в объеме практических занятий.
1.3. Объем дисциплины в часах и виды учебной работы* Вид учебной работы Количество Курс Семестр часов Общая трудоемкость дис- 106 / 75 5 циплины Аудиторные занятия 60 / - лекции 30 / - практические занятия 30 / Самостоятельная работа 46 / Вид итогового контроля экзамен * - в числителе специальность 011100, в знаменателе –
2. ПРОГРАММА И СОДЕРЖАНИЕ ДИСЦИПЛИНЫ
понятия геоинформатики. Пространственные элементы реальности. Графическое представление объектов и их атрибутов формации. Подсистема хранения и редактирования ния. Операции наложения ние. Вывод карт и результатов Методы создания, управления и анализа баз пространственно распределенных данных, базовые платформы ГИС, методы автоматизированного сбора картографической информации, особенности геологических ГИС, разработка и мониторинг ГИС-проектов по конкретным регионам.Лекция 1 (2 часа). Введение в ГИС. Основные понятия геоинформатики. Понятие информационных технологий и информационных систем. Понятие геоинформатики и геоинформационных систем.
Определение ГИС на основе четырех подсистем: сбора, хранения и редактирования, анализа, вывода данных. Соотношение понятий «информация», «данные» и «знания». Возникновение и первоначальные задачи ГИС. Классификация программных средств для работы с пространственной информацией. Сравнение методов традиционной картографии и современных ГИС. Применение ГИС в геологии в общем и в гидрогеологии и инженерной геологии в частности.
Пространственные элементы, типы и модели данных. Шкалы (или уровни) измерения данных (дискретных и непрерывных). Модели пространственных данных. Организация данных внутри ГИС и использование стандартных СУБД. Растровые, векторные и векторнотопологические модели данных. Точечные объекты. Линейные объекты. Площадные объекты. Поверхности. Атрибуты пространственных элементов. Связь графических элементов с атрибутами.
В последние годы в связи с появлением новых поколений относительно недорогих, но достаточно мощных персональных вычислительных машин, в различных сферах человеческой деятельности все большее распространение получают геоинформационные технологии.
Они базируются на инструментальных средствах Географических Информационных Систем (ГИС), позволяющих интегрировать в едином программном продукте разнообразные семантически связанные базы картографических и фактографических данных.
Зарубежный и отечественный опыт эксплуатации различных ГИС свидетельствует о том, что необходимость анализа географического расположения явлений и объектов, их количественных и качественных характеристик при помощи карты возникает у представителей различных отраслей народного хозяйства. В то же время ощущается острый дефицит квалифицированных кадров, владеющих современными аппаратно-программными средствами работы с цифровыми пространственными данными, способных эффективно использовать ГИСтехнологии в сфере своей профессиональной деятельности. В частности, геоинформационные технологии вызывают большой интерес в производственных организациях, ведущих разведку, разработку и эксплуатацию месторождений полезных ископаемых, где за долгие годы исследований накоплен огромный фактический и картографический материал, размещенный в многочисленных геолого-геофизических отчетах и отдельных разрозненных базах данных.
Поэтому в учебных планах подготовки специалистов геологогеофизического профиля появились специальные курсы по геоинформационным технологиям.
В настоящее время нет общепринятого определения ГИС. Как и в случае с географией, термин трудноопределим и представляет собой объединение многих предметных областей. Отсутствие общепринятого определения привело к значительному недопониманию того, что такое ГИС, каковы их возможности и для чего такие системы могут применяться. Наиболее популярно определение, которое представляет ГИС как набор подсистем, ее образующих:
- подсистема сбора данных, которая собирает и проводит предварительную обработку данных из различных источников. Эта подсистема также в основном отвечает за преобразования различных типов пространственных данных;
- подсистема хранения и выборки данных, организующая пространственные данные с целью их выборки, обновления и редактирования;
- подсистема манипуляции данными и анализа, которая выполняет различные задачи на основе этих данных, группирует и разделяет их, устанавливает параметры и ограничения и выполняет моделирующие функции;
- подсистема вывода, которая отображает всю базу данных или часть ее в табличной, диаграммной или картографической форме.
Это определение позволяет легко сравнить современные компьютерные ГИС с традиционными бумажными картами, особенно если рассмотреть этапы картографического процесса (табл. 1).
Сбор данных: аэрофотоснимки, Сбор данных: аэрофотоснимки, геодезические работы и др. геодезические работы и др.
Обработка данных: агрегирова- Обработка данных: агрегирование, ние, классификация и т.д.; ли- классификация, плюс анализ; цикнейный процесс лический процесс Производство карты: конечная Производство карты: не всегда костадия (без распространения) нечный этап. Обычно на основе Тиражирование карты Тиражирование карты Ввод: запись (компиляция) на Ввод: запись (кодирование) в пабумаге мять компьютера - цифровое дистанционное зон- - готовые цифровые карты - геодезические работы - цифровые ортофотоснимки - словесные описания и зарисов- - цифровые базы данных - статистические данные и др.
Функции подсистемы хранения и выборки Точки, линии и области рисуют- Точки, линии и области хранятся Выборка – это просто чтение Выборка требует эффективных мекарты тодов компьютерного поиска Требуются линейка, планиметр, Используются возможности комтранспортир и другие инстру- пьютера для измерения, сравнения менты, используемые человеком и описания информации в базе Возможности ограничены дан- Обеспечивает быстрый доступ к ными, сгруппированными и исходным данным, позволяет группредставленными на бумажной пировать и переклассифицировать Только графическое представ- Карта – лишь один из видов вывода Многие формы карт За малыми исключениями, ГИС Модификации могут включать Включают также таблицы, графикартограммы и др. ки, диаграммы, фотографии и др.
Место и основная роль ГИС в геологических исследованиях определяются как интеграция, анализ и комплексная интерпретация разнотипных данных, разработка прогнозов, моделирование и планирование дальнейших действий, представление результатов в терминах целевого геологического свойства и в картографической форме. При таком подходе ГИС в геологии будет не только средством преобразования формы представления информации и справочноаналитического обслуживания, а прежде всего средством достижения конечных целей геологических исследований.
Пространственные объекты реального мира можно разделить на легко идентифицируемые четыре типа: точки, линии, области и поверхности. Описание типов пространственных объектов с примерами их отражения на картах приведены в электронной презентации 01_Что такое ГИС.ppt (см. стр. 98).* Картографические объекты содержат информацию не только о том, как они располагаются в пространстве, но и о том, чем они являются и насколько они важны для нашего рассмотрения. Дополнительная непространственная информация, помогающая нам описывать объекты, наблюдаемые в пространстве, образует набор атрибутов объектов. Но перед тем как присвоить атрибуты объектам, мы должны знать, как их измерять. Основой для измерения практически всех видов данных являются шкалы измерения данных (рис. 1).
_ * - на странице 98 приведен список электронных приложений (презентаций), расширяющих содержание этого учебного пособия и включающих дополнительный иллюстративный материал.
Рис.1. Шкалы измерения картографических объектов Используемая шкала измерений будет определяться отчасти тем, что мы классифицируем, отчасти тем, что мы хотим знать, и отчасти нашими возможностями производить измерения при заданном масштабе наблюдения.
Лекция 2 (2 часа). Карта – модель представления реальности.
Характеристики карты: масштаб, разрешение, точность, экстент. Некоторые понятия теории фигуры Земли: геоид, квазигеоид, эллипсоид вращения, общеземной эллипсоид, референц-эллипсоид, DATUM. Измерения на поверхности Земли, GPS. Сферические и плоские координаты. Картографические проекции. Виды картографических проекций:
планарные, цилиндрические, конические и их разновидности. Масштабный коэффициент. Искажения при проецировании. Системы прямоугольных координат для картографии. UTM. СК-42. Специальные гидрогеологические и инженерно-геологические карты. Тематические карты.
Графическое представление объектов и их атрибутов. Растровые модели данных. Методы сжатия растровых данных. Векторные модели данных. Спагетти-модель. Топологические модели. Понятие линейно-узловой и линейно-полигональной топологии.
Карта является моделью пространственных явлений, абстракцией. Она НЕ является миниатюрной версией реальности, предназначенной показать все детали изучаемой области.
Описание основных характеристик карты и иллюстративный материал содержится в презентациях 02_Введение в ArcViewArcMap.ppt и 04_Информация в ГИС.ppt.
Картографические проекции - набор методов, которые предназначены для изображения с приемлемой точностью сферической Земли на плоском носителе. В буквальном смысле, процесс создания проекции представляется как помещение источника света внутри прозрачного глобуса, на котором размещаются непрозрачные земные объекты, и проецирование их контуров на двухмерную поверхность, окружающую глобус. Возможны разные виды проецирования при окружении глобуса цилиндром, конусом и помещении возле него плоского листа бумаги. Поэтому существуют планарные проекции, цилиндрические и конические проекции (рис.2). Существуют еще азимутальные проекции, они основаны на идее проецирования параллельными лучами света на плоский материал.
Рис.2. Три семейства картографических проекций Проекции - не абсолютно точные представления географического пространства. Каждая создает свой набор типов и величин искажений на карте. Важные характеристики карт, которые должны сохраняться для точных аналитических операций, определяют выбор проекции.
Эти характеристики включают углы (или формы), расстояния, направления, площади объектов. При выполнении проекции невозможно сохранить все эти характеристики одновременно.
На поверхности глобуса направления сторон света всегда отстоят от соседних на 90°. То есть, например, между севером и востоком всегда прямой угол. Проекции, сохраняющие это свойство углового соответствия, называются конформными (равноугольными) картографическими проекциями. Сохранение углов труднодостижимо для больших участков земной поверхности и этого разумно добиваться лишь для малых участков. Этот вид проекций больше всего подходит для производства навигационных карт и когда важна угловая ориентация, как часто бывает с метеорологическими или топографическими данными. Эта группа проекций включает проекции Меркатора, поперечную Меркатора, коническую конформную Ламберта и конформную стереографическую.
Конформные проекции искажают площади. Но равновеликие (равноплощадные) проекции сохраняют площади. Сохраняя площади, мы искажаем углы. Таково фундаментальное соотношение этих двух параметров для проецированных карт - нельзя одновременно сохранять и площади и углы.
Если целью проецирования карты является измерение расстояний, то следует выбрать проекцию, сохраняющую расстояния. Такие проекции, называют равнопромежуточными (эквидистантными).
Проекты, в которых требуется определение кратчайших маршрутов особенно на длинные дистанции, нуждаются в азимутальных проекциях. В них возможно изображение дуг окружностей больших кругов, которые определяют кратчайшее расстояние между двумя точками на поверхности Земли, как прямых линий. Эти проекции используются на картах воздушного сообщения, слежения за спутниками и картографирования небесных тел. Примеры азимутальных проекций - равновеликая Ламберта, стереографическая, азимутальная эквидистантная, ортографическая и гномоническая проекции.
Отметим, что некоторые из них сохраняют как направления, так и площади. Это свойство может оказаться полезным для анализа крупных атмосферных явлений, таких как дымовые следы вулкана, которым свойственно двигаться по маршруту большого круга по мере рассеивания в атмосфере и движения по общим правилам циркуляции на Земле.
Есть много проекций для выбора — гораздо больше, чем перечислено здесь. Некоторые специальные проекции особенно подходят для отображения всей Земли или очень больших ее участков. Другие позволяют лучше координировать крупные картографические программы, такие как создание топографических карт целого континента, которое выполняется небольшими порциями.
Упрощенно, процесс проецирования представляется двумя этапами: вначале преобразуют земной шар в промежуточный глобус в зависимости от выбранного масштаба; затем этот глобус проецируется на плоскую поверхность. Численный масштаб первого преобразования называется главным (общим) масштабом, он равен отношению радиуса промежуточного глобуса к радиусу земного шара. Таким образом получают численный масштаб, постоянный по всей поверхности этого глобуса, поскольку его форма повторяет форму земного шара.
Перед тем, как сделать второй шаг, отметим, что масштабный коэффициент, называемый также относительным масштабом, определяемый как частное отделения местного масштаба на общий масштаб, по определению равен единице по всей поверхности промежуточного глобуса. Когда же переходят от его сферической поверхности к двухмерной карте, относительный масштаб обязательно изменится, поскольку плоская и сферическая поверхности не совместимы. Следовательно, масштабный коэффициент будет разным в разных точках.
DATUM - относительная система отсчетов для исходной точки на Земной поверхности, определяет направление и ориентацию линий широты и долготы, а также определяет эллипсоид и его позицию относительно центра Земли. Создание датумов сводится к выбору эллипсоида и исходной точки на поверхности Земли. Другие контрольные точки рассчитываются относительного локального центра. Центр датума может не совпадать с центром Земли.
Системы координат (datums) можно разделить на геоцентрические и топоцентрические.
В геоцентрической системе размеры эллипсоида, ориентация и положение его центра выбираются следующим образом:
• объем эллипсоида предполагается равным объему геоида;
• большая полуось эллипсоида лежит в плоскости экватора геоида;
• малая полуось направлена по оси вращения Земли;
• среднеквадратичное отклонение поверхности эллипсоида от поверхности геоида минимально по всей территории земного шара.
WGS72 и сменившая ее WGS84 (математическая модель Земли, применяемая в GPS приемниках), а также российская СГС85 являются геоцентрическими системами координат на эллипсоидах WGS72, GRS80 и SGS85 соответственно. В системе NAVSTAR используется WGS84, а в системе GLONASS - СГС85.
Топоцентрическая (национальная) система координат появляется так: вы берете некоторый эллипсоид и располагаете его таким образом, чтобы для заданной территории среднеквадратичное отклонение поверхности эллипсоида от поверхности геоида было минимальным (СК-42, СК-95, ED50). При этом остальная часть мира вас не интересует: отклонения на другой стороне Земли может быть сколь угодно велико.
В России используются несколько геодезических систем координат: Пулково 1942 г., 1963 г. и 1991 г. Система координат 1963 г.
используется военными и ее параметры преобразования засекречены.
Обычно мы пользуемся картами, составленными в системе координат 1942 г. Она базируется на эллипсоиде Красовского.
Проекция Гаусса-Крюгера и Universal Transverse Mercator (UTM) - это разновидности поперечно-цилиндрической проекции (Transverse Mercator) (Табл. 2). Воображаемый цилиндр, на который происходит проекция, охватывает земной эллипсоид по меридиану, называемому центральным (осевым) меридианом зоны. Зона - это участок земной поверхности, ограниченный двумя меридианами. Обе проекции делят земной эллипсоид на 60 зон шириной 6°. Зоны нумеруются с запада на восток, начиная с 0°: зона 1 простирается с меридиана 0° до меридиана 6°, ее центральный меридиан 3°. Зона 2 - с 6° до 12°, и т. д. Нумерация номенклатурных листов начинается с 180°, например, лист N-39 находится в 9-й зоне. Таким образом, для данной долготы номер зоны = (целая часть от деления долготы на 6°) + 1, центральный меридиан = (номер зоны) * 6° - 3° В проекции Гаусса-Крюгера цилиндр касается эллипсоида по центральному меридиану, масштаб вдоль него равен 1 (рис.3).
UTM - это проекция на секущий цилиндр и масштаб равен единице вдоль двух секущих линий, отстоящих от центрального меридиана на 180 000 м (рис.4).
False Northing (юж. полушарие) 10000000 м 10000000 м Цилиндр разворачивают в плоскость и накладывают прямоугольную километровую сетку с началом координат в точке пересечения экватора и центрального меридиана (рис.5). Вертикальные линии сетки параллельны центральному меридиану. Для того чтобы все прямоугольные координаты были положительны, вводится восточное смещение, равное 500 000 м, т. е. координата X на центральном меридиане равна 500 000 м.
Рис.5. 6-градусная зона проекции Гаусса-Крюгера В южном полушарии в тех же целях вводится северное смещение 10 000 000 м.
Важно понимать, что вертикали километровой сетки не ориентированы точно на север (за исключением линии на центральном меридиане), угол расхождения с меридианами может составлять до 3°.
Геоид - фигура сложной формы, образованная поверхностью уровня вод Мирового океана, продолженной под материками. Эта поверхность во всех точках перпендикулярна (нормальна) вектору силы тяжести. Отвес направлен перпендикулярно поверхности геоида, а не к центру Земли! Это связано с тем, что плотность Земли распределена неравномерно.
Эллипсоид - тело, полученное вращением эллипса вокруг его малой оси. Размеры подбирают так, чтобы среднеквадратичное отклонение от поверхности геоида было минимально либо по всей поверхности Земли, либо для заданной территории (табл. 3).
В таблицах эллипсоидов часто указывается не полярное сжатие f, а обратная величина 1/f, например, для эллипсоида Красовского 1/f = 298,3.
Отклонения эллипсоида Красовского от геоида на территории СНГ не превышают 150 м.
Дополнительная информация содержится в презентации 03_проекции и координаты.ppt.
Красовского (1940) Бесселя СССР до 1942 г.
В растровых моделях данных, в отличие от векторных, нет объектов как обособленных сущностей, в них объекты понимаются как области однородных характеристик. Растровые данные всегда обладают собственной системой координат: каждый пиксел адресуется номером ряда и столбца, на пересечении которых он расположен. Эта система координат обычно называется пиксельной. Для всякого растрового изображения известны его размеры по горизонтали и вертикали.
В общем случае значения пикселов могут представляться как целыми числами, так и числами с плавающей точкой. При сканировании карт получается полутоновой растр в естественных цветах (RGB), кодируемых тремя байтами.
При использовании растра в качестве подложки для векторных цифровых карт производится так называемое трансформирование растра, обеспечивающее совмещение обоих изображений. При трансформировании выполняется преобразование координат пикселов из пиксельной системы координат в систему координат карты. Для такого преобразования обычно используются полиномы или более сложные формулы, соответствующие используемым проекциям. Трансформирование растра может производиться "на лету", в процессе отображения цифровой карты. Другим вариантом работы является передискретизация (rectification в терминологии ARC/INFO) – пересчет значений пикселов с одной матрицы растра на другую. Матрица пикселов трансформированного растра обычно не является ортогональной и равномерной; передискретизация строит такое же изображение на ортогональной и равномерной матрице.
Векторные модели данных. Модель данных имеет в основе так называемую линейно-узловую топологию, или структуру узлов и дуг.
Дуги являются основным (базовым) типом линейных объектов, узлы – это специальный тип точечных объектов, существующий совместно с дугами.
В основе линейно-узловой структуры лежит принцип последовательного конструирования линейных объектов из точечных и площадных из линейных. Так, два несовпадающих узла определяют начальную и конечную точки одного линейного объекта (дуги); при этом они могут также соединяться с одной или несколькими другими дугами.
Узел – это либо свободное окончание или начало каждой дуги, или точка пересечения дуг.
Дуга – это самостоятельный линейный объект, состоящий, как минимум, из двух узлов – начального и конечного. Этот линейный объект может иметь также промежуточные формообразующие точки (не являющиеся узлами), задаваемые упорядоченным списком пар координат. В большинстве ситуаций эти формообразующие точки рассматриваются не как самостоятельные объекты, а только как составная часть линейного объекта – дуги.
В свою очередь, границы площадных объектов (полигонов) описываются как наборы ссылок на дуги, слагающие их контур. Благодаря этому в линейно-узловой структуре ARC/INFO отсутствует необходимость в дублировании линий, слагающих общие границы соприкасающихся полигонов.
В векторно-топологической модели данных ARC/INFO хранятся, помимо геометрических объектов и их описательных характеристик (атрибутов), также и топологические взаимоотношения между объектами. Эти топологические взаимоотношения устанавливаются в результате специальных операций, называемых условно "построением топологии" (операции CLEAN и BUILD).
Графическое редактирование покрытия, такое как добавление или удаление объекта, объединение или разделение объектов, делают текущий вид топологического описания некорректным, а перемещение и изменение формы объектов – возможно некорректным. Поэтому после таких операций требуется повторное построение топологических отношений для обеспечения всех функциональных возможностей векторно-топологической модели данных.
В векторно-топологической модели данных ARC/INFO поддерживаются следующие основные типы топологических отношений (Рис.6):
• Связность. Выражает то, что дуги соединяются друг с другом только в узлах. Реализуется списком пар идентификаторов начальных и конечных узлов для каждой дуги.
• Направление. Все дуги имеют начальный и конечный узлы и, таким образом, имеют направление. В модели данных обеспечивается различением двух видов узлов для каждой дуги – начального и конечного с ведением двух раздельных списков их идентификаторов.
• Прилегание (примыкание) и различение левой и правой стороны дуги. Различение левого и правого обеспечивается различением направления дуги. В модели данных обеспечивается ведением списка номеров полигонов, прилегающих слева и справа к каждой дуге.
• Замкнутая область (площадной объект). Представление площадного объекта обеспечивается в модели данных ведением упорядоченного списка номеров дуг, слагающих его контур.
В векторно-топологической модели данных ARC/INFO атрибутивная (описательная) информация об объектах связывается с их графическим представлением на базе так называемой геореляционной, или гибридной, модели. Сущность ее заключается в раздельном хранении (в разных файлах) атрибутивной и графической информации при том, что связь между ними осуществляется при помощи уникального идентификатора каждого объекта. Данный идентификатор служит ключом для связывания таблицы, содержащей атрибуты объектов, с таблицей, определяющей их геометрическое выражение. Например, для случая площадных объектов, идентификатор полигона связывает запись, содержащую список идентификаторов дуг полигона, с записью значений атрибутов этого полигона. Связывание таблиц по ключу может быть применено в ARC/INFO более широко. Так, любой атрибут, имеющий уникальные значения, может служить ключом для связывания с ним другой таблицы, содержащей колонку с тем же самым атрибутом.
Рис.6. Топологическое представление векторных объектов Топология - одна из ключевых концепций ГИС. Это пространственные взаимоотношения межу смежными и близлежащими объектами. Топология отражается в структуре данных. Топологические структуры более предпочтительны.
Типы топологий:
1. Линейно-узловые топологические отношения;
2. Объектные топологии:
2.1. Внутриобъектные топологические отношения;
2.2. Межобъектные топологические отношения:
2.2.1. Узловые топологические отношения, 2.2.2. Межобъектные топологические отношения в пределах одного 2.2.3. Межслойные топологические отношения между объектами.
3. Топологические межобъектные ресурсные связи;
4. Концептуальные топологические отношения (отношения между классами объектов, или логические связи).
Основные топологические концепции покрытий линейноузловой топологии:
1. Дуги соединяются между собой в узлах (связанность);
2. Дуги, ограничивающие фигуру, определяют полигон (определение фигуры);
3. Дуги имеют направление, а также левую и правую сторону (непрерывность);
4. Сохранение местоположения всех узлов;
5. На основе узлов определяются дуги;
6. Полигоны определяются дугами путем их перечисления по часовой стрелке вокруг объекта;
7. Для каждой дуги можно определить, какой полигон находится слева и справа от направления ориентации.
Дополнительная информация содержится в презентации 06_Топология.ppt.
Лекция 3 (2 часа). Подсистема сбора и ввода информации.
Традиционные ручные и современные автоматизированные и автоматические методы сбора данных, включая получение и ввод изображений со спутников. Устройства ввода. Дигитайзеры, сканеры. Средства распознавания и векторизации. Пространственная привязка данных.
Интерполяция и экстраполяция, организация выборок. Базы данных и СУБД. Неупорядоченные структуры файлов. Последовательно упорядоченные файлы. Индексированные файлы. Виды СУБД: иерархическая, сетевая, реляционная, объектно-ориентированная. Стандарты государственные и корпоративные. Унификация и стандартизация геологических данных. Требования к цифровому описанию. Классификаторы.
Подсистема хранения и редактирования. Важность редактирования БД ГИС. Типичные ошибки при вводе пространственных данных и построении топологии, методы их устранения и мероприятия по уменьшению их частоты. Графические ошибки в векторных системах.
Векторная трансформация. Конфляция. Преобразование проекций, сшивка листов карты и совмещение покрытий.
Общие преставления о создании цифровых карт (ЦК) Основным источником данных для ЦК на сегодня являются карты и расчлененные (цветоделенные) пластиковые оригиналы. Однако, длительный цикл создания бумажных карт и их неспециализированный характер требуют привлечения других источников. Оптимальным источником данных для обновления ЦК являются данные дистанционного зондирования (ДДЗ) – космические и аэроснимки. По мере развития цифровой картографии и средств дистанционного зондирования Земли, ДДЗ становятся общепризнанным источником также и для создания как топографических, так и тематических цифровых карт.
Для уточнения координатной информации может использоваться съемка на местности, возможно, с применением GPS-приемников, обеспечивающих наиболее высокую точность координат. Эти же работы могут совмещаться со сбором атрибутивных данных в поле – традиционными полевыми исследованиями для получения наиболее точной описательной информации о местности. В тех случаях, когда цифровые карты уже существуют в составе других систем, может быть гораздо более эффективным импорт данных из этих систем в форматы ЦК. ARC/INFO позволяет импортировать многие форматы, включая DXF, DWG, GEN – текстовые форматы пространственных данных, MOSS и другие. Атрибутивная информация может использоваться напрямую или импортироваться в формат INFO как из текстовых файлов, так и из всех СУБД, использующих стандартные протоколы обмена данными.
Данные с карты могут быть введены различными способами:
либо путем поочередной оцифровки каждого объекта, либо путем сканирования всего листа карты (типографского оттиска или расчлененного оригинала на пластиковой основе) электронным сканером. Кроме того, если известны точные координаты каких-то объектов, можно ввести эти координаты с клавиатуры или преобразовать данные из текстовых файлов формата ASCII, содержащих пары координат X и Y, в покрытие ARC/INFO, либо автоматически создать покрытие, задав размер ячейки, например, координатной сетки.
Технологии цифрования бумажных карт Дигитайзерная - представляет процедуры ввода с помощью цифратора последовательности координат точек и линий карты, закрепленной на планшете дигитайзера. При нажатии кнопки цифратора компьютер регистрирует координаты X и Y текущей позиции перекрестья в единицах дигитайзера. Эти данные становятся координатами точечного объекта или одной из точек или линии или полигона.
Сканерная - представляет альтернативный метод ввода данных.
Сканирование, как правило, выполняется гораздо быстрее, чем оцифровка, но требует значительных затрат времени на подготовку карты к векторизации и ее чистки от шумов. Сканерная технология включает следующие режимы векторизации данных:
• ручная прорисовка – оцифровка растрового материала в интерактивном режиме с возможностью редактирования векторных примитивов;
• автоматическая векторизация – автоматическое формирование векторных данных по растру;
• полуавтоматическая векторизация – предусматривает интерактивный режим отслеживания и разрешения неоднозначных ситуаций.
Пример аппроксимации прямыми отрезками при дискретизации кривой линии (рис.7). Записываемые точки выбираются в зависимости от изменения направления линии. Каждая точка – дополнительная порция информации, содержащейся на карте.
Существуют два принципиально разных подхода к оцифровке в векторную форму бумажных топографических (и других) карт.
Первый подход – документографический (формально– картографический), концентрирует свое внимание на бумажной карте как картографическом практическом документе. При этом подходе стремятся максимально полно отобразить в векторном представлении графический образ карты, включая и элементы рамок и зарамочного оформления. Никакие видоизменения и дополнения недопустимы.
Подписи на карте цифруются самостоятельно, независимо от объектов, к которым они относятся, с сохранением положения, ориентировки и начертания букв. Условные знаки оцифровываются в точности в том виде, как они изображены на карте – например, изолинии рельефа с разрывами на месте подписи значения высоты рельефа, с бергштрихами, с разрывами на месте скальных обрывов с заполнением этих участков знаком обрыва. Проходимые болота и солончаки – как совокупность отдельных линейных элементов – голубых коротких линий, расположенных в точности там, где и соответствующие их графические элементы на карте. Для текста задается фиксированный размер. В предельном случае даже внемасштабные условные знаки цифруются как совокупность элементарных графических примитивов – отрезков линий и т.д. Никакая описательная атрибутивная информация никак не фиксируется вне ее графического образа – подписи на карте.
Например, знак отметки уреза воды цифруется как маленький голубой кружок, а отдельно от него и как текст подписи – значение отметки уреза воды. Все графические элементы никак не связаны со своими подписями, и какая-либо БД атрибутов объектов отсутствует.
Деление на тематические слои может вообще отсутствовать, или может быть задано произвольно, например, в соответствии с цветом графического образа на бумаге.
Результирующая ЦК может идеально передавать графический образ исходной бумажной карты, но моделью местности, с которой можно выполнять операции, моделирующие операции на местности, не является. Т.е. она является моделью карты как документа, а не моделью местности, полученной с использованием карты. По своим функциональным возможностям такая ЦК подобна растровой отсканированной ЦК за исключением того, что она может быть удобнее отредактирована вручную и с меньшими потерями качества поддается редактированию.
Второй подход - фактографический (подход ГИС), акцентирует внимание не на карте как на законченном картографическом документе, а на карте как модели реальной местности и стремится, используя эту картографическую модель, построить максимально адекватную цифровую модель местности, пригодную для моделирования на ней операций, проводимых на местности. При использовании данного подхода подлежит оцифровке только информация внутри внутренней рамки, зарамочное оформление, как правило не цифруется (отдельная содержащаяся там информация может быть сохранена вне использования в качестве метаданных).
Информация подразделяется на слои с учетом смысловой группировки объектов. Все графические объекты карты цифруются как один из трех элементарных типов графических объектов: точечный, линейный, площадной. Объекты, представленные на карте внемасштабными условными знаками цифруются как точечные, причем положение точки привязки вне конкретного вида условного знака. Линейные объекты цифруются как линии без дополнительных элементов их графического оформления (удвоенность линий маркера на линиях и т.п.) Площадные объекты цифруются как замкнутые площадные объекты.
Текст, являющийся подписями к показанным на карте и подлежащим оцифровке объектам, может не оцифровываться отдельно как текст, а переходит в значение одного или нескольких полей в таблице описательных атрибутивных характеристик объекта. Подлежит обязательной самостоятельной оцифровке только текст, относящийся к несуществующим в виде самостоятельного графического образа на карте объектам, таким как урочище. Все отличительные черты конкретных объектов (как их индивидуальные признаки, такие как собственные имена, так и видовые групповые характеристики) заносятся при изготовлении ЦК в таблицах описательных атрибутивных характеристик, связанных с каждым объектом.
Полная характеристика типовых и видовых характеристик объектов организуется в десятичный код иерархического классификатора объектов и тем самым может сопровождать объект даже при извлечении его из того тематического слоя, к которому он принадлежит.
Необходимое соответствие графического отображения ЦК при выводе на экран и на бумагу достигается использованием стандартных наборов условных знаков, графические образы которых соответствуют условным знакам на бумажной карте. Соответствие конкретного условного знака и его переменных характеристик (например, размера) достигается за счет установления соответствия условного знака и значений определенных атрибутивных характеристик объекта.
Как уже говорилось, большинство подписей не цифруется и не хранится как графический объект, а средствами программного обеспечения выводится, исходя из содержания атрибутивных характеристик объекта. При этом возможно варьирование как начертанием, так и расположением и содержанием подписи. Стандартно содержание отвечает таковому на бумажной карте, но в ГИС по желанию пользователя можно подписать объект, используя значения любой из связанных с ним атрибутивных характеристик.
При данном подходе к оцифровке ЦК не является полной копией бумажной. Так, например, для площадных объектов с неопределенными границами, отсутствующими на бумажных картах (такими как болота и солончаки) они оконтуриваются условной границей и цифруются как площадные объекты. Линии дорог соединяются условными линиями на участках мостов и населенных пунктов, где на карте они могут иметь разрывы. Участки, где объекты на бумажной карте закрыты подписями или прерываются для размещения подписи, условно соединяются линиями, чтобы обеспечить представление объекта как единого целого. Помимо упомянутых трех элементарных видов геометрических объектов? На карте могут присутствовать и с ложные неэлементарные, наложенные графические объекты? Такие как объединения неодносвязных площадных объектов (регионы), наложенные вторичные линейные объекты, такие как секции и маршруты. Подобные объекты обеспечивают дополнительные удобства манипулирования, визуализации ТЦК и дополнительные функциональные возможности моделирования местности с ее помощью.
При данном подходе все время не упускается из вида тот факт, что карта – это только модель местности. Цель создания ЦК при данном подходе – через модель местности одного типа (бумажную карту) построить модель местности другого типа, достаточно функциональную для ее использования в задачах, решаемых ГИС.
В качестве стандартного принимается комбинированный подход с ведущей ролью второго (фактографического) и вспомогательной ролью первого (документографического). Использование документографического подхода в отдельных оговоренных случаях (оцифровка бергштрихов на изолиниях, оцифровка некоторых позиций как текстовые объекты (аннотации), оцифровка отдельных графических элементов, заполняющих контуры объектов с нечеткими границами (отдельных штрихов – составных частей условного знака проходимых болот)) обусловлено потребностью в максимально возможной степени сочетать как широкие функциональные возможности модели местности, обеспечиваемые ЦК, так и максимальное подобие графических образов бумажной карты ЦК.
Качество данных ЦК, соответствующей одному номенклатурному листу исходной бумажной карты (при условии правильности формы организации) слагается из нескольких составляющих. Это правильность и полнота метаданных по номенклатурному листу ЦК, полнота основного содержания ТЦК (отсутствие пропусков объектов), позиционная точность представления объектов ТЦК, правильность значений атрибутов, связанных с объектами, внутренняя логическая непротиворечивость (выражающаяся в корректности топологических отношений внутри покрытия и согласованности между собой слоев (покрытий) одного номенклатурного листа ЦК). Согласованность между номенклатурными листами ЦК, произведенными от номенклатурных листов бумажных карт различных масштабов, равно как и согласованность по рамке с соседними номенклатурными листами ЦК, не являются оценкой качества одного номенклатурного листа ЦК, а рассматриваются отдельно как показатели качества группы из произвольного числа сведенных (по рамке и по пирамиде масштабов) ЦК или всей совокупности БД сведенных номенклатурных листов ЦК.
Составляющая 1. Качество метаданных, описывающих ЦК и исходные данные (бумажные карты) для ее получения.
Метаданные должны включать описание исходных данных (исходной бумажной карты), этапов и методов ее преобразования в текущую цифровую форму, а также необходимую справочную информацию по самой ТЦК как целиком, так и по отдельным ее покрытиям (тематическим слоям). Описание должны включать необходимую временную информацию – даты как издания, так и компиляции исходной бумажной карты, даты, на которую карта актуально передает состояние местности. Если карта составлена по информации из нескольких источников, они должны быть описаны по отдельности, так, чтобы для каждого участка территории и каждого объекта было бы ясно, каков действительный источник информации для него на ЦК. В этих случаях, помимо словесного описания, может потребоваться включение в состав метаданных специального индексного покрытия (с полигональной топологией). В метаданных должны описываться все процедуры, использованные для перевода бумажной карты в векторную и растровую формы ЦК, включая все преобразования координат, соответствующие ошибки трансформирования и prj файлы. Должны приводиться величины всех допусков и журналы процедур окончательной обработки покрытий ЦК в системе ARC/INFO.
Составляющая 2. Полнота основного содержания ЦК.
Отсутствие пропусков объектов или частей объектов. Критерий проверки – сопоставление векторной формы ЦК с растровой формой ЦК. Стандарт требует абсолютного отсутствия пропусков объектов.
Составляющая 3. Позиционная точность.
Точность планового положения всех объектов на векторной форме ЦК и их элементов должна соответствовать стандарту. Основной метод оценки позиционной точности, принятый в данном документе – сравнение векторной формы с растровым представлением, которое принимается за точное. При наложении векторного представления на растровое ни в одном случае не должно наблюдаться выхода точки, узла, формообразующей точки линии или прямого сегмента линии между двумя формообразующими точками за пределы растровой формы представления соответствующего условного знака. Для точечных объектов действует аналогичное правило. Точность положения полигона определяется точностью положения его границ. В любом случае позиционная точность должна обеспечивать ошибку определения положения объекта на векторной ТЦК по отношению к исходной карте (тиражному оттиску или отсканированному оригиналу) не хуже графической точности оригинала, т.е. 0.2 мм.
Составляющая 4. Полнота и правильность описательных (атрибутивных) характеристик объектов карты.
Стандарт требует полного отсутствия ошибок в значениях атрибутов, включая коды классификатора, и отсутствие ошибочно присвоенных (неправильно связанных с объектом) атрибутов. Основной вид контроля – визуализация покрытий векторной ЦК на базе значений атрибутов и сопоставление результатов с растровой формой представления ЦК, а также проверки на диапазоны допустимых значений атрибутов.
Составляющая 5. Внутренняя логическая непротиворечивость и топологическая корректность.
Внутренняя логическая непротиворечивость относится как состоянию одного покрытия векторной ЦК, так и к согласованности между собой покрытий одной ЦК (различных тематических слоев). Понятие топологической корректности относится только к топологическим отношениям объектов внутри одного покрытия. Логическая непротиворечивость предусматривает, что все объекты представлены в векторной форме в точности теми геометрическими типами объектов, как это предусмотрено стандартом, и что все тематические слои (все покрытия) одного номенклатурного листа ЦК согласованы между собой. Согласование предусматривает, что все являющиеся общими линии и границы на различных покрытиях (различных тематических слоях) совпадают полностью и выполнены другие правила согласования.
Топологическая корректность предусматривает, что для покрытия после последнего его графического редактирования построено топологическое описание соответствующего имеющемуся в нем геометрическому типу объектов типа (типов). При этом ни один из линейных, точечных или площадных объектов не был введен дважды, все объекты, которые должны логически представлять из себя площадные объекты, действительно таковыми являются (все контура замкнуты), отсутствуют ошибочные недоводы или переводы линий при их пересечении (в том числе по отношению к линии внутренней рамки), разрешение карты (fuzzy tolerance) при построении топологии (выполнении операции CLEAN) было таким, что не произошло непреднамеренного слипания линий или схлопывание в точку полигонов.
Простейшей структурой файла является неупорядоченный массив записей. Это аналогично созданию отдельной карточки для каждого имени в картотеке, причем пользователь помещает карточки в картотеку в последовательности их ввода. Единственным преимуществом такой структуры файла является то, что для добавления новой записи нужно просто поместить ее в конец файла, позади все других записей. Большинство картотек упорядочены по алфавиту. Этот метод использует сравнение каждой новой записи с имеющимися для определения того, где ее место. Последовательно упорядоченные файлы могут использовать числа, которые тоже имеют определенную последовательность. Обычной стратегией поиска здесь является так называемый поиск делением пополам (или дихотомия). Поиск начинается делением всего массива записей на две половины и выборкой записи в середине. Индексированные файлы основаны на внешнем индексе.
Строится он вот как: из исходного файла в новый файл копируются значения одного атрибута для всех записей вместе с положениями этих записей. То есть каждая запись в новом файле состоит из значения атрибута и адреса записи в исходном файле, из которой это значение было взято. Затем нужно упорядочить записи нового файла в соответствии со значениями атрибута. Теперь, чтобы найти запись с заданным значением атрибута, мы можем в новом файле использовать поиск делением пополам. Найдя нужные записи в индексном файле, мы получим адреса записей исходного файла, по которым можем получить все атрибуты объектов. Таким образом, для поиска в основном файле используется дополнительный индексный файл, который называется внешним индексом, а сам исходный файл, таким образом, стал индексированным. Очевидно, что мы можем выносить в индексный файл несколько атрибутов, чтобы организовывать поиск сразу по значениям этих нескольких атрибутов. Использование внешнего индекса имеет три условия. Во-первых, нужно знать заранее критерии, по которым будет производиться поиск: для каждого критерия строится свой индексный файл. Во-вторых, ссылки на все добавления в исходный файл должны помещаться в соответствующие места индексных файлов, чтобы не нарушать их упорядоченность. В-третьих, если пользователь не предусмотрит некоторый критерии поиска, то придется использовать последовательный перебор для получения нужной информации.
Организованный набор взаимосвязанных файлов данных называется базой данных. Управление БД реализует система управления базой данных (СУБД). Рассмотрим виды СУБД. Иерархическая основана на том, что во многих случаях существует взаимосвязь между данными, называемая отношением "один ко многим". Это отношение подразумевает, что каждый элемент данных имеет прямую связь с некоторым числом так называемых "потомков", и, конечно каждый такой потомок, в свою очередь, может иметь связь со своими потомками и т.д. Предки и потомки напрямую связаны между собой, что делает доступ к данным простым и эффективным. Сетевые структуры используют отношение "многие ко многим", при котором один элемент может иметь многие атрибуты, при этом каждый атрибут связан явно со многими элементами. Для реализации таких отношений вместе с каждым элементом данных может быть связана специальная переменная, называемая указателем, которая направляет ко всем другим элементам данных, связанным с этим. В реляционной БД данные хранятся как упорядоченные записи или строки значений атрибутов. Атрибуты объектов группируются в отдельных строках в виде так называемых отношений, поскольку они сохраняют свои положения в каждой строке и определенно связаны друг с другом. Реляционные системы основаны на наборе математических принципов, называемых реляционной алгеброй или алгеброй отношений, устанавливающей правила проектирования и функционирования таких систем.
Стандарты государственные и корпоративные Качество ЦК включает общую оценку источника ЦК, оценку позиционной точности отображения объектов, полноты и логической непротиворечивости содержания, корректности атрибутивных данных.
Общая оценка источника ЦК проводится до начала работ по созданию ЦК, в соответствии с существующими требованиями по актуальности и точности, предъявляемыми к ним при создании карт определенного масштаба. Результаты оценки заносятся в метаданные ЦК.
Непригодными для создания ТЦК считаются источники с устаревшими данными, с данными не соответствующими по полноте и точности масштабу, деформированные твердые носители, растровые материалы с неустраняемыми искажениями, а также данные, полученные в полевых условиях приборами, не соответствующими по точности предъявляемым к ним требованиям.
Позиционная точность ТЦК включает:
• точность положения и формы графических объектов относительно местности;
• точность положения и формы графических объектов относительно источника ЦК.
Предельная точность положения и формы графического объекта ЦК относительно местности наследуются от источника данных, используемых при ее составлении (табл. 4). Например, точность ТК, ее деформированность, искажение растрового изображения или погрешности измерительных приборов.
Точность геодезической основы и средние ошибки положения объектов при разных масштабах карт Масштаб ТК Предельная точ- Средние ошибки положеность геодезиче- ния объектов относительской основы (ГО) но ГО Позиционная точность ЦК оценивается по отклонению регистрационных точек, снятых с карты, от их истинного положения (принимаемого за истинное).
Точность положения регистрационных точек на карте определяется как отклонение координат положения каждой точки на ЦК от истинных значений, оцениваемых как среднеквадратичная ошибка координат по всем регистрационным точкам.
Отклонение положения регистрационной точки зависит от точности источника, с которого снимается регистрационная точка, а также от точности ее оцифровки (точность приборов оцифровки и разрешающая способность глаза), установленных допусков обработки цифровых данных и точности хранения координат.
Среднеквадратичная ошибка регистрационных точек рассчитывается по формуле где a1, a2, …an – величина отклонения положения регистрационной точки на карте от истинного; n – число регистрационных точек.
Точность положения и формы объектов относительно источника ЦК зависит от точности положения регистрационных точек и точности положения графических объектов относительно регистрационных точек. Точность положения объектов относительно регистрационных точек зависит от способа и точности цифрования объекта источника.
При оцифровке источника по растровому изображению или с твердого носителя точность оценивается по отклонению положения и формы объектов от их положения и формы на растровом изображении, используемом в качестве подложки при цифровании или при проверке ЦК.
Отклонения в положении объектов не должны выходить за пределы их пиксельного изображения на растре и по возможности быть минимальными по отношению к точке или линии привязки условного знака объекта.
При прямом вводе координат объектов точность их координат будет наследовать точность регистрационных точек.
В процессе создания цифровых карт используется ряд допусков, влияющих на точность цифровых данных. Эти допуски определяют разрешение покрытия и включают: среднеквадратичную ошибку регистрационных точек, допуск совпадения регистрационных точек, расстояние неразличимост, допустимая длина “висячей” дуги, расстояние неразличимости узлов, расстояние слияния дуг, расстояние неразличимости вершин в дугах, “зернистость” линий.
Разрешение покрытия определяет возможность распознавания и различения объектов. На разрешение покрытия влияют три фактора:
заданная точность значений координат, точность устройства ввода и допуски обработки покрытия.
Точность значения координат определяется возможным числом значащих десятичных знаков, хранимых для каждой координаты. Все координаты покрытий ЦК хранятся с двойной точностью, то есть до значащих цифр, что обеспечивает точность менее одного метра на больших расстояниях (более 1000000 метров).
Среднеквадратичная ошибка оцифровки регистрационных точек не должна превышать 0.004 дюйма (0.1 мм) или его эквивалента в единицах хранения координат карты. Расстояние неразличимости – минимально допустимое расстояние между координатами точек (вершин), образующих дугу. При введении координат точки объекта на меньшем расстоянии, они будут слиты с ближайшими. Для исключения значительных смещений это расстояние не должно превышать 0.002 дюйма (0.05 мм) или эквивалента значения в единицах координат ЦК. Длина “висячей” дуги определяет допустимость незамкнутой дуги более установленной длины. Все дуги меньшей длины игнорируются и не записываются в файл. Для линейных объектов значение этого допуска устанавливается равным 0. Для полигональных объектов – рекомендуемый допуск “висячей” дуги – 0.05 дюйма (1.27 мм) – или эквивалент значения в единицах координат ЦК. Расстояние неразличимости узлов – максимальное расстояние, на котором узлы не будут различаться и будут слиты в один. Рекомендуемое значение – 0.05 дюйма (1.27 мм) или эквивалент значения в единицах хранения координат ЦК. Расстояние слияния дуг – максимально допустимое автоматическое продление дуги для пересечения с существующей. Рекомендуемая величина – 0.05 дюйма (1.27 мм) или эквивалент значения в единицах хранения координат ЦК. Расстояние неразличимости вершин дуги – минимально допустимые значения расстояния между вершинами дуги. При меньших расстояниях координаты вершин игнорируются и не записываются в файл. Рекомендуемое значение – 0.02 дюйма (0.5 мм) – или эквивалент значения в единицах хранения координат ЦК. Допуск “Зернистости” линий устанавливается при необходимости соблюдения равномерного расстояния между вершинами (например, при оцифровке окружности или плавной линии). Рекомендуемое значение – 0.02 дюйма (0.5 мм) – или эквивалент значения в единицах хранения координат ТЦК.
Полнота содержания оценивается по наличию или отсутствию на ней объектов по отношению к ее источнику. ЦК не должна включать объекты, отсутствующие на источнике. Исключением являются объекты, связанные с технологией создания и хранения цифровой картографической информации (например, технические линии при восполнении пробелов в местах наложения подписей или условных знаков объектов: дорога через населенный пункт или река под мостом;
контуры площадных объектов, не обозначенных на источнике: населенных пунктов, болот, песков, солончаков и т.п.; дополненные горизонтали, в случае если они сгущены или "брошены" на бумажном источнике). В ЦК не должны отсутствовать основные объекты, имеющиеся на источнике. ЦК не должны объединять раздельные на источнике объекты, препятствуя их отдельному описанию и оперированию.
ЦК не должны разделять на части единые на источниках объекты, если это не диктуется программными ограничениями (например, ограничение количества вершин в дуге).
Логическая корректность оценивается по соблюдению логики организации ЦК и логики взаимоположения объектов. ЦК должны содержать набор покрытий из стандартного перечня, предусмотренного для рассматриваемого масштабного ряда используемым стандартом, в которых имеется хотя бы один основной объект карты.
Покрытия должны иметь стандартное название.
Объекты должны распределяться по покрытиям в соответствии с установленной для них классификацией. Не допускается “повторное” хранение одних и тех же объектов в разных покрытиях.
Все объекты одного покрытия должны соответствовать топологической логике. Покрытия должны отвечать требованиям согласованности.
Корректность атрибутивных данных. Все объекты должны иметь стандартный набор, порядок, название и определения атрибутов для каждого масштаба ЦК. В таблицах атрибутов должны использоваться только коды используемого классификатора.
Подсистема хранения и редактирования, типичные ошибки при вводе пространственных данных и построении топологии, методы их устранения Важность редактирования БД ГИС Подсистема хранения и редактирования ГИС обеспечивает набор средств для хранения и поддержки цифрового представления наших данных. Она имеет также средства для проверки покрытий на ошибки, которые могли проникнуть в наши данные.
При вводе информации в ГИС возможно возникновение трех распространенных типов ошибок. Первый относится главным образом к векторным системам и называется графической ошибкой. Такие ошибки встречаются трех видов: пропуск объекта, неправильное положение объекта и неправильный порядок объектов. Второй тип ошибок – это ошибки атрибутов. Они встречаются и в векторных и в растровых системах. Чаще всего они являются опечатками. Третий тип ошибок – ошибки согласования графики и атрибутов, которые случаются в векторных системах, когда неправильно набранные коды атрибутов связываются с неправильными графическими объектами. Необходимо запомнить, что ошибочные данные ведут к ошибочным результатам анализа.
Графические ошибки в векторных системах. Первым типом ошибок являются псевдоузлы, когда пользователь не трактует линию как две самостоятельных дуги (рис.8).
Другая ошибка, называемая висящим узлом, может быть определена как узел на ни с чем не соединенном конце линии (рис.9). Возможны три вида ошибок, создающих висящие узлы: незамыкание границы полигона; «недолёт», т.е. неприсоединение дуги к объекту, к которому она должна быть присоединена; «перелёт», при заходе дуги за объект, к которому она должна быть присоединена.
При оцифровке полигонов необходимо указывать метку — точку внутри каждого из них, которая служит для связи с связи с атрибутами. Нужна только одна точка. В связи с этим возможны ошибки двух типов - отсутствующие метки и лишние метки (рис.10).
Другой тип ошибок встречается, когда программа использует векторную модель, в которой каждый полигон имеет свою отдельную границу. Появляются крошечные полигоны, называемые осколочными, или рукавными полигонами. Они возникают из-за плохой оцифровки вдоль общих границ, где линия должна вводиться более одного раза (рис.11).
Отдельной проблемой, связанной с полигонами, является создание "странных" полигонов, у которых не хватает узлов (рис.12). В этом случае полигон является графическим артефактом, который выглядит настоящим полигоном с отсутствием одного или нескольких узлов. Обычно это случается, когда пересекаются два или более участков границы.
Проблемы с пропущенными, лишними, смещенными или деформированными объектами легче всего обнаруживаются в результате вывода цифрового покрытия в том же масштабе, что использовался при вводе (рис.13).
Ошибки атрибутов в растровых и векторных системах. Обычные ошибки атрибутов, определяемые по тому, как они искажают изображение: А — пропущенный ряд; В - неправильные или смещенные атрибуты (выглядят как один или более рядов существенно отличных значений); С — одиночные неправильные атрибуты; D — ошибки атрибутов вдоль границ областей (вызываемые чаще всего проблемами оцифровки) (рис.14).
Поскольку зачастую не все вводимые карты имеют одинаковые проекции, потребуется их преобразование для обеспечения возможности сравнения покрытий, полученных с разных карт.
Для географической привязки вводимых карт могут использоваться опорные точки с точно известными географическими координатами, которые имеются на карте. Для пересчета координат могут использоваться афинные, полиномиальные и более сложные преобразования.
Для растровых изображений и карт есть две возможности географической привязки: их можно трансформировать или калибровать. В результате процедуры трансформирования создается новое покрытие, координаты пикселов которого точно соответствуют проекции, в которую производилось трансформирование. В результате калибровки новое покрытие не создается, параметры привязки сохраняются вместе с файлом покрытия или внутри его, если это позволяет используемый формат. Преимущество второго метода состоит в том, что всегда можно изменить проекцию, не затрагивая сами данные.
Стыковка вдоль границ листов карты – физическое связывание двух соседних покрытий для получения большей изучаемой области. Есть два источника трудностей при вводе смежных покрытий. Во-первых, две карты, сделанные в одной и той же проекции, но введенные по отдельности, могут иметь ошибки объектов, оказавшихся несколько различными. Вторая ситуация, требующая выполнения стыковки, возникает либо когда два смежных покрытия вводятся из разных проекций, либо когда проецирование применяется именно к этому покрытию без учета возможного влияния на соседнее покрытие.
Другая проблема возникает, когда должны быть наложены друг на друга два покрытия, возможно представляющих одну территорию, но в разное время. Необходимо закрепить объекты, которые находятся на своих местах, пока пользователь двигает остальные, чтобы они заняли более точные положения в пространстве. Этот процесс называют конфляцией (рис.15). Это интерактивный процесс, в котором пользователь решаете, какое покрытие подогнать, чтобы оно совпало с другими.
Есть две вещи, о которых нужно помнить при выполнении конфляции. Во-первых, конфляция является чисто графической операцией. Она не гарантирует, что действия пользователя приведут к наиболее точному результату в отношении координат. Она обеспечивает получение графически приемлемых результатов, основываясь на предположении пользователя, что выбранное опорное покрытие является наиболее точным в представлении реальной ситуации. Во-вторых, вполне вероятно, что результаты конфляции окажутся хуже, чем исходные данные.
Если посмотреть на несколько покрытий одной темы, относящиеся к разным моментам времени, то можно заметить некоторые графические расхождения. Просматривая эти же покрытия одновременно, можно отметить, что внешние границы области исследования на всех покрытиях отличаются по форме. Если в дальнейшем придется выполнять наложение этих покрытий, то обнаружатся многие области вдоль границ некоторых покрытий, которые не будут иметь соответствующих областей в других покрытиях. Еще раз, необходимо выбрать покрытие, которому пользователь доверяет более всего, и использовать его в качестве шаблона.
Дополнительная информация к этому разделу содержится в презентации 05_Табличные данные.ppt.
Лекция 4 (2 часа). Подсистема анализа. Простейший пространственный анализ. Меры формы: измерения извилистости линейных объектов, меры формы полигонов. Идентификация объектов, поиск объектов по заданным пространственным и атрибутивным критериям, определение близости и распределения объектов, построение окрестностей, количественная оценка геометрических свойств объектов (измерения длин, периметров, площадей, в векторных и растровых моделях), работа с топологией. Классификация и количественная оценка пространственных распределений объектов. Принципы типизации и районирования в гидрогеологии и инженерной геологии.
Поверхности. Способы представления поверхностей. Модель TIN. Структура TIN. Создание TIN. Триангуляция и топология. Преимущества и недостатки TIN. Модель GRID. Значения ячеек в модели GRID. Разрешение GRID. Пирамидные слои. Пространственная привязка GRID. Вычисления на GRIDах. Преимущества и недостатки GRID. Цифровые модели рельефа (векторные и растровые). Дискретные и непрерывные поверхности. Интерполяция: линейная и нелинейная (взвешивание, поверхности тренда и кригинг), оценка ошибки интерполяции, решение проблемы седловой точки. Применение различных методов интерполяции для решения задач гидрогеологического и инженерно-геологического картирования и моделирования. Методы изображения поверхностей на картах с помощью изолиний, плотности точек, методы отображения и преобразования численных параметров областей.
Подсистема анализа – это сердце ГИС, то, ради чего ГИС существует. Общие задачи анализа:
1. Картирование местоположения объектов и явлений.
2. Картирование по величине.
3. Картирование плотности.
4. Поиск объектов, попадающих внутрь других объектов.
5. Поиск объектов, находящихся на определенном расстоянии от других объектов.
Формирование топологии включает определение и кодирование взаимосвязей между точечными, линейными и площадными объектами.
Только лишь возможность находить точечные, линейные и площадные объекты на карте имеет мало ценности. Большинство объектов выбираются не столько по их типу, сколько в зависимости от того, что они представляют в реальном мире. Наибольший интерес представляют их атрибуты, то есть описания. Все объекты (точечные, линейные, площадные) различаются не только по их местоположению, но и, что более важно, по их атрибутам, характеристикам.
Все объекты могут быть разделены по типам (номинальная шкала измерения данных), или могут быть разделены и классифицированы в соответствии с порядковой шкалой.
Подобно точечным, линейные объекты должны разделяться на основе порядкового ранжирования или некоторой иной меры. В некоторых случаях одна линия может иметь изменения в значениях атрибутов вдоль своей длины. Используя узлы для индикации изменений и храня каждый отрезок между узлами с соответствующими атрибутами, мы можем определить каждый сегмент линии как отдельную идентифицирующую сущность, то есть дугу. В векторных системах, использующих топологическую модель данных, отношения между линией и прилежащими к ней полигонами записываются в БД в явном виде во время ввода или построения топологии. Это свойство используется при выполнении операции анализа соседства. Мерой формы для линейных объектов чаще всего является извилистость, определяемая как соотношение суммы длин сегментов линии к расстоянию между ее крайними точками.
В отличие от точечных и линейных объектов площадные объекты имеют дополнительное измерение, которое позволяет присваивать им больше атрибутов на основе их геометрии (рис.16).
Инструменты измерения дают количественные характеристики объектов, которые пользователь сможет использовать в анализе для сравнения объектов в пределах одного покрытия или между покрытиями. Простые меры длины, расстояния, площади и другие измеряемые характеристики могут быть скомбинированы со многими другими аналитическими функциями с целью создания намного более сложных моделей, чем было бы возможно без привлечения ГИС. Именно для того, чтобы получать осмысленные результаты, необходимо знать, как наилучшим образом выполнять измерения.
Рис.16. Пример применения процедуры топологического оверлея «точка-в-полигон» с перестройкой таблицы атрибутов Поверхности - это объекты, которые чаще всего представляются значениями высоты Z, распределенными по области, определенной координатами X и Y. Обычно используется термин "статистическая поверхность", поскольку значения параметра Z часто можно трактовать как статистическое представление величины рассматриваемых явлений или объектов.
Изображение поверхностей на картах. Статистические поверхности могут представляться посредством плотности точек, хороплет, дасиметрии и изолиний. Первые три чаще всего имеют дело с дискретными поверхностями. Четвертый метод наиболее часто используется для непрерывных данных, хотя он может использоваться и для дискретных данных, если принять, что они являются непрерывными. Его можно представить как последовательность линий, окружающих топографическую поверхность. Каждая линия, обычно называемая горизонталью в топографическом контексте, представляет все точки, имеющие одну и ту же высоту.
Карты плотности точек. Этот подход чаще всего использует конкретные области, в которых подсчитываются объекты (число родников на округ). Другая распространенная форма карт плотности точек не использует отобранные области, а обозначает каждый объект одной точкой. Когда точка указывает на более чем одно наблюдение, должны быть заданы три взаимосвязанных вопроса: сколько объектов представляется одной точкой, каков размер точки в связи с единицей дискретности, и где пользователь расположит точки после ответа на первые два вопроса.
Дополнительный иллюстративный материал содержится в презентации 07_Поверхности.ppt.
Методы отображения параметров областей. Существуют два основных метода получения Z-значений поверхности. Первый использует отобранные точки, и в этом случае карта изолиний называется изометрической. Но возможно также работать и с данными, представляющими не точки, а небольшие области. Хотя известно, что эти данные — дискретные, при желании можно обращаться с ними как с непрерывными. Этот тип карт называется картами изоплет. В случае изоплетных карт существуют два подхода к выбору точек измерений.
Первый называется регулярной сеткой (GRID), так как точки расположены в узлах решетки, образованной прямыми линиями (табл.5). Второй метод отбора точек основан на нерегулярной сетке (TIN).
GRID – типы данных: интервальные и относительные данные.
Недостатки GRID - Недостаточно точно передаются точные местоположения объектов (вершины) и линейные объекты (гребни).
В TIN моделях треугольники называют гранями, точки становятся узлами граней, линии граней называют ребрами (рис.17). Грань TIN является частью плоскости в трехмерном пространстве.
Морфология поверхности TIN:
• Точечные пространственные объекты – отражаются узлами треугольника, сохраняя исходное местоположение и высоту.
• Линии перегиба - линейные пространственные объекты представлены связанным набором рёбер треугольника.
– резкие - отражают разрыв в уклоне;
– нерезкие - позволяют добавлять ребра, чтобы показать линейные пространственные объекты, не нарушающие уклон.
• Площадные объекты изображаются замкнутым набором рёбер треугольника.
– Полигоны замещения - задают одно постоянное Z-значение границе и всем высотам внутри ее;
– Полигоны стирания - отмечают все области в пределах полигона как находящиеся вне области интерполяции для данного режима;
– Полигоны отсечения - отмечают все области вне полигона, как находящиеся вне интерполяции для данной модели;
– Полигоны заполнения - назначают целочисленные атрибутивные значения всем граням в пределах полигона. Никакой замены высот, стирания и отсечения не происходит.
Недостатки TIN: нелегко получить и для создания требуется тщательный сбор данных.
Сравнение GRID и TIN для представления поверхностей Парамет- GRID представление TIN представление ры сравнения Точность Зависит от размеров TIN имеет переменную Точность Значение Z растра – ре- TIN предназначен для простран- зультат квантования (де- фиксирования и предственных ления) пространствен- ставления пространстобъектов ных объектов по регу- венных объектов типа Анализ Пространственное сов- Высота, крутизна, выповерх- падение. Близость. Дис- числение экспозиции ности персия. Путь наимень- склона. Получение изоших затрат. линий поверхности. расчеты объемов. Вертикальные профили по Типовые Мелкомасштабное моде- Вычисления объемов приложе- лирование и моделиро- дорожных выемок. Исния вание поверхности. следования системы Идентификация водо- стока для освоения зесборных бассейнов. Гид- мель. Создание точных рологический анализ зон изогипс.
Цифровые модели рельефа (ЦМР) - математические или наглядные, визуальные модели (включая TIN), разработанные для обработки полевых данных или представления на бумажной карте. Хотя математические модели весьма полезны, большинство имеющихся сегодня ЦМР являются моделями изображения. Модели изображения бывают двух типов: основанные на точках и основанные на линиях.
Модели изображения на основе линий — почти что графический эквивалент традиционного метода карт изолиний. В растровой модели данных каждая ячейка может иметь только одно значение высоты и занимает некоторую площадь, с увеличением которой снижается точность представления поверхности.
Линейная интерполяция, используется для определения неизвестных значений высот между точками с известными значениями высоты. Однако, последовательность отсчетов высоты не всегда следует линейному закону. В некоторых случаях она скорее логарифмическая, в других может предсказываться только для небольших участков поверхности. В таких случаях линейная интерполяция не даст адекватных результатов. Три метода нелинейной интерполяции: метод обратных взвешенных расстояний (ОВР), метод поверхности тренда и кригинг. Метод ОВР исходит из предположения, что чем ближе друг к другу находятся точки данных, тем ближе их значения. Значение высоты в каждой точке взвешивается в зависимости от квадрата расстояния, так что более близкие точки вносят больший вклад в определение интерполируемой высоты по сравнению с более удаленными. В некоторых случаях пользователя больше интересуют общие тенденции поверхности, нежели точное моделирование мелких неровностей.
Наиболее распространенный подход к такой характеристике поверхности называется поверхностью тренда. Для поверхностей тренда мы используем наборы точек в пределах заданной окрестности. В пределах каждой окрестности строится поверхность наилучшего приближения на основе математических уравнений, таких как полиномы или сплайны. Метод интерполяции кригинг оптимизирует процедуру интерполяции на основе статистической природы поверхности. Кригинг использует идею регионализированной переменной, которая изменяется от места к месту с некоторой видимой непрерывностью, но не может моделироваться только одним математическим уравнением.
Кригинг обрабатывает эти поверхности так, считая их образованными из трех независимых величин. Первая, называемая дрейфом или структурой поверхности, представляет поверхность как общий тренд в определенном направлении. Далее, кригинг предполагает, что имеются небольшие отклонения от этой общей тенденции, вроде маленьких пиков и впадин, которые являются случайными, но все же связанными друг с другом пространственно (пространственно коррелированны). Наконец, случайный шум, который не связан с общей тенденцией и не имеет пространственной автокорреляции.
Интерполяция полезна для создания изолиний, описывающих поверхности. Она может также использоваться для отображения поверхности средствами блок-диаграмм или карт с отмывкой рельефа.
Проблемы интерполяции. При выполнении методов интерполяции должны учитываться четыре фактора: число исходных точек;
положения исходных точек; проблема седловых точек; область, содержащая точки данных. В общем случае можно сказать, что чем больше исходных точек мы имеем, тем более точной будет интерполяция и тем с большей вероятностью интерполированная поверхность будет хорошей моделью. Однако, существует предел числу отсчетов, которые могут быть сделаны для любой поверхности. Постепенно достигается момент снижения отдачи: большее количество точек не улучшает существенно качество результата, но лишь увеличивает время вычислений и объем данных.
Проблема седловой точки, называемая иногда проблемой альтернативного выбора, возникает тогда, когда две точки одной пары диагонально противоположных Z-значений, образующих прямоугольник, расположены ниже, а две точки другой диагональной пары находятся выше того значения, которое пытается найти алгоритм интерполяции. Простым способом решения этой проблемы является помещение среднего от двух, полученных по диагоналям, интерполированных значений в точке пересечения диагоналей.
Дополнительная информация и иллюстративный материал по этой теме находятся в презентации 08_ГИС-анализ.ppt.
Лекция5 (2 часа). Классификация. Кодирование и перекодирование атрибутов. Статистические поверхности, явления растворения границ и агрегирования, использование функций соседства и смежности, ориентация на общий и целевой анализ, использование фильтров для обработки и подготовки к классификации растровых данных.
Классификация на основе количественных атрибутов. Понятие окрестности. Фильтры. Переклассификация поверхностей: уклон, аспект, взаимная видимость, вычисление объемов. Буферные зоны.
Классификации могут быть простыми, на основе одного критерия или сложными, на основе многих критериев. Число возможных методов классификации и переклассификации бесконечно. Все они зависят от потребностей пользователя. Классификация зависит от типов объектов, которые необходимо группировать. Варианты классификации диктуются масштабом, когда, например, растительность отображается не для малых регионов, а для целой Земли. Другие случаи классификации определяются больше техникой, используемой для получения исходных данных, такой как спутниковое дистационное зондирование. ГИС обеспечивают широкие возможности классификации и переклассификации атрибутивных данных для достижения определенного результата. На самом деле, их работу можно отнести прежде всего к переклассификации, так как данные, вводимые в ГИС, часто уже классифицированы.
Точки и линии могут переклассифицироваться простым перекодированием атрибутов в их таблицах или перекодированием значений ячеек растра для создания новых точечных или линейных покрытий. В этом простом процессе пользователь меняет сами атрибуты и не более того. Процесс — практически такой же при работе с площадными объектами в растровых системах. Выбрав атрибуты нужных областей, пользователь просто изменяет числа кодов или имена атрибутов для этих ячеек растра. В простых растровых системах, где нет привязанных к растру таблиц атрибутов, пользователь должен также изменить и легенду нового покрытия для отражения изменившейся ситуации.
В случае векторов процесс переклассификации требует изменения как атрибутов, так и графики. Во-первых, надо удалить все линии, которые разделяют два класса, которые должны быть объединены.
Эта операция называется растворением границ. Затем атрибуты этих двух полигонов переписываются для нового покрытия как единый новых атрибут для обоих (рис.18).
И в растровой, и в векторной переклассификации полигонов имеется интересная особенность. В обоих случаях по окончании мы имеем меньшее число категорий, чем имели вначале. Этот результат, называемый агрегированием данных, — полезный и распространенный вид переклассификации. Существуют полезные методы выделения большего количества деталей из грубой полигональной информации. Эти методы требуют сравнения двух или более покрытий в процессе, называемом наложением (overlay).
Основные методы переклассификации основаны на атрибутивной информации; на информации о положении; размере и форме.
Рис.18. Пример создания производной карты путем переклассификации пространственных объектов Переклассификация на основе "негеометрических" атрибутов очень полезна, но она ограничивает пользователя атрибутами в пределах каждого объекта. Такие процедуры переклассификации основаны на идее характеризования каждого объекта как части большей окрестности объектов. Окрестности могут определяться в терминах объединяющего атрибута всей области (общий анализ соседства), или фокус может быть направлен на меньшие части всей территории (целевой анализ). Целевой анализ, также называемый непосредственной окрестностью, включает только места, непосредственно прилегающие к целевой области или месту. Анализ общего соседства, называемый также расширенной окрестностью, включает местоположения, которые находятся в непосредственной близости, а также и удаленные на некоторое расстояние. А пока мы посмотрим на функции соседства, имеющие дело с двух и трехмерными объектами. Мы сможем разделить функции соседства, имеющие дело с двух и трехмерными объектами на статические, в которых анализ проводится сразу по всей выбранной целевой области, и функции скользящего окна, где анализ проводится только в рамках окна, которое перемещается по покрытию.
Существуют функции, которые используют окно переклассификации ячеек растра для определения развитости границы области.
Эти оконные функции называются также фильтрами. Довольно часто этот метод используется в обработке изображений дистанционного зондирования, но имеет такую же применимость и в растровых ГИС.
В частности, фильтры используются для выделения краев областей или линейных объектов (фильтры высоких частот (ФВЧ)), усиления общих градиентов и устранения мелких флуктуации и шума (фильтры низких частот (ФНЧ), или даже для подчеркивания ориентации (анизотропные фильтры). Фильтр высоких частот предназначен для выделения деталей в растровом покрытии, которые могут быть незаметны из-за близлежащих ячеек растра, содержащих относительно близкие значения.
ГИС должна быть способна измерять размер полигона, или фрагментированного региона, составленного из нескольких полигонов. Представьте, что нас интересует только идентичность полигонов региона в пределах некоторой окрестности или расстояния.
В предыдущем описании окрестностей рассматривался одиночный атрибут выбранных групп в пределах заданного радиуса. Однако, часто пользователь больше заинтересован в определении сходств и различий в пределах выбранной окрестности, нежели в группах однородных полигонов или групп ячеек растра. Пользователь выбирает радиус поиска, как и раньше, программа просматривает атрибуты всех полигонов участков переписи или ячеек растра, и затем выполняет простое усреднение этих величин.
Возможно вычисление некоторого максимального или минимального значения по окрестности. Другие операции включают подсчеты общего количества всех видов, определение медианы, наивысшей и наинизшей частот, отклонения от центральной точки по отношению к среднему окружающих значений и даже доли окрестности, имеющей те же атрибуты, что и в центральной точке окрестности. Эти операции могут выполняться многими различными способами.
Наиболее широко используются следующие четыре характеристики трехмерных поверхностей для описания окрестностей: уклон, азимут (экспозиция склона), форма и взаимная видимость. Они могут применяться в векторных и в растровых ГИС. Эти характеристики могут быть использованы в сочетании друг с другом.
Уклон. Концептуально процесс довольно прост: нужно узнать связь между расстоянием по горизонтали между точками на местности и соответствующей разницей высот. Отношение второй величины к первой и является способом выражения уклона. Чтобы сделать это в векторной системе, нужна модель данных, подобная нерегулярной сети триангуляции (TIN). Растровая система может сразу же с этим справиться, хотя потребуется некоторая компенсация ошибок из-за дискретности растрового пространства. Обычный метод вычисления уклона состоит в том, чтобы провести наиболее подходящую поверхность через соседние точки и измерить отношение изменения высоты на единицу расстояния. Вернее, ГИС просчитает это отношение по всему покрытию, создавая набор категорий величины уклона. Представление о поверхностях может быть обобщено на любые виды поверхностных данных, которые измеряются в шкалах рангов, интервалов и отношений. Они называются статистическими поверхностями и являются поверхностным представлением пространственнораспределенных статистических данных. Таким образом можно анализировать величину уклона (градиент) в изменении любой величины, которая является или может быть принята непрерывной по покрытию.
Методы переклассификации на основе только лишь уклона могут выполняться и в растровых ГИС. Простейший способ состоит в оценке восьми непосредственных соседей каждой ячейки растрового покрытия.
Экспозиция склонов (аспект). Поскольку поверхности имеют уклон, они имеют также и ориентацию, называемую экспозицией или аспектом. Идеи уклона и экспозиции неразделимы как в физическом, так и в аналитическом плане. Без уклона невозможен топографический аспект. Для геологов преобладающий уклон сдвигов может быть путем к пониманию подземных процессов. В векторных ГИС, использующих модель данных, подобную TIN, работа с аспектами относительно проста. Каждая грань модели TIN имеет определенные уклон и аспект. Аспект определяется как азимут нормали каждой треугольной грани поверхности. Когда производятся вычисления с участием аспекта, эти значения могут выбираться из БД TIN без дополнительных вычислений. И пользователь может группировать их в классы. В случае растра нужно провести анализ по всему покрытию, в котором последовательно все точки как центральные точки окрестности сравниваются со своими соседями.
Профиль поверхности. Другой пример переклассификации статистических поверхностей - оценка их формы. Простейший способ визуализации формы поверхности - ее поперечный профиль. Процесс легко выполняется в векторной ГИС с использованием модели TIN, где линия (необязательно прямая) проводится по какому-то участку покрытия.
Взаимная видимость показывает, что если вы расположены в определенной точке топографической поверхности, то одни области рельефа будут вам видны (области видимости), а другие нет. В векторной системе простейший метод состоит в соединении точки наблюдателя с каждой возможной целевой точкой покрытия. Затем выполняется трассировка лучей, т.е. вы следуете вдоль линии (луча), ища отметки высоты, которые выше этой линии. Более высокие точки будут загораживать для наблюдателя то, что за ними. Существуют многие способы определения областей видимости для векторных структур данных, включая TIN.
Распространенным методом переклассификации является процесс построения буферов. Буфер — это полигон с границей на определенном удалении от точки, линии или границы области. Поскольку он связан с положением, формой и ориентацией объекта, можно отнести буферизацию к методам переклассификации на основе положения.
Однако, буфер может быть больше чем только отмеренное расстояние от двухмерного объекта; он может быть также связан с, и даже управляться, присутствием поверхностей трения, рельефа, барьеров, и т.д.
То есть, хотя буферизация основана на положении, она имеет также и другие существенные компоненты.
Буферизация — дело измерения расстояния от объекта, будь то точка, линия или область. В случае точки мы отмеряем одно расстояние по всем направлениям от этой точки. Буфер площадного объекта строится на заданном расстоянии от его периметра. Может даже понадобиться построить второй буфер вокруг первого, третий — вокруг второго и т.д., которые вместе называются многослойным буфером.
Процедура его построения относительно проста, так как каждый новый слой буфера - всего лишь новый буфер вокруг предыдущего слоя.
Лекция 6 (2 часа). Пространственные распределения. Точечные, линейные и полигональные распределения. Анализ квадратов.
Анализ ближайшего соседа. Распределения полигонов. Распределения линий. Плотность линий. Пересечения линий. Направленность линейных и площадных объектов. Связность линейных объектов. Модель гравитации.
Операции наложения. Наложения в векторных системах. Векторное наложение «точка в полигоне» и «линия в полигоне», наложение полигонов. Ошибки векторного наложения. Наложения в растровых системах. Использование операции наложения в задачах типизации, районирования и прогноза гидрогеологических и инженерногеологических условий.
Пространственное распределение - это расстановка, порядок, концентрация или рассеянность, соединенность или бессвязность многих объектов в пределах заключающего их географического пространства.
Простейшей мерой точечного распределения является плотность точек. Она определяется как результат деления числа точек на общую площадь, на которой они расположены. По форме распределение является равномерным, если число точек на единицу площади в каждой малой подобласти такое же, как и в любой другой подобласти.
Если точки расположены в узлах сетки, разделенные одинаковыми интервалами по всей области, то равномерное распределение называется регулярным. В других случаях равномерно распределенные точки располагаются в случайном порядке по всей рассматриваемой области. Бывают случаи, когда точки собраны в тесные группы, такое распределение называется сгруппированным или кластерным.
Анализ квадратов. Равномерные точечные распределения определяются на основе отношений между одинаковыми подобластями, называемыми квадратами. В стандартном методе анализа квадратов [для равномерного распределения] предполагается, что примерно одно и то же число объектов будет находиться в каждой подобласти, равное общему числу объектов, поделённому на количество подобластей.
Анализ ближайшего соседа - общепринятая процедура определения расстояния от каждой точки до ее ближайшего соседа (РБС) и сравнения этой величины со средним расстоянием между соседями. Вычисление этого статистического показателя включает определение среднего РБС среди всех возможных пар близколежащих точек (такие точки определяются как ближайшие к выбранной).
Точечные распределения могут также характеризоваться с помощью полигонов Тиссена (называемых также диаграммами Дирихле и диаграммами Вороного). Они основаны на идее, что можно нарастить полигоны вокруг точек, чтобы показать их возможные зоны влияния на другие точки покрытия.
Анализ распределения областей проводят через определение плотности полигонов на единицу площади области изучения. Однако, при определении меры плотности полигонов необходимо вначале измерить площадь полигонов каждого класса, из тех, что интересуют нас. Затем поделить суммарную площадь каждого типа полигонов (т.е.
каждого региона) на общую площадь покрытия. Это дает относительную долю полигонов, а не число их на единицу площади. Помимо плотности полигонов, может интересовать расположение и формы распределений, создаваемые группами полигонов.