213
Труды Международной конференции RDAMM–2001 2001 Т. 6, Ч. 2, Спец. выпуск
МЕТОДИКА РЕШЕНИЯ ПРОБЛЕМ ЦИФРОВОГО
ФОТОТРИАНГУЛИРОВАНИЯ
Д.В. КОМИССАРОВ Сибирская Государственная Геодезическая Академия (СГГА), Новосибирск, Россия e-mail: [email protected] At present the most progressive methods of information processing are the digital technologies, the main advantage of which is the possibility of automation of various processing stages. The problems of automation of aerial triangulation, methods of their solution and practical implementation in the form of the software are being considered in this paper.
Введение При решении различных задач природопользования методами дистанционного зондирования часто возникает необходимость геопривязки данных аэро и космических съемок. Для протяженных объектов, изображенных на нескольких снимках, эта задача решается с помощью процесса фототриангулирования. В настоящее время наиболее передовыми являются цифровые технологии построения сетей фототриангуляции, которые дают возможность автоматизировать многие процессы. Принципиально цифровая фототриангуляция не отличается от традиционной аналитической. Основные отличия касаются представления данных и технологии измерений.
На кафедре фотограмметрии и дистанционного зондирования Сибирской Государственной Геодезической Академии разрабатывается программный комплекс для выполнения цифровой фототриангуляции. Программа разрабатывается в системе программирования Delphi для 32-х разрядной среды Windows (Windows NT, Windows 95, Windows 2000 и т.п.).
В данной статье рассматриваются некоторые из проблем и методы их решения, возникающие при создании программ подобного рода.
Организация хранения больших файлов изображений Одной из основных проблем обработки аэро и космических снимков, представленных в цифровой форме, является большой объем исходной информации. Цифровые изображения занимают колоссальные объёмы памяти, что составляет проблему не только их хранения, но и обработки. Например, черно-белый снимок формата 23x23 см при разрешении сканирования 7 мкм будет занимать память около 1 гигабайта. В случае с цветными снимками размер файла увеличится ещё в 3 раза. Порой составляет проблему просто вывести изображение на экран, а при выполнении таких процессов, как стереообработка и фототриангуляция, необходимо одновременно обрабатывать два и более снимков.
Часто для решения проблемы хранения файлов приходится идти по пути сжатия исходной информации.
Наилучшие результаты сжатия фотографических изображений имеют алгоритмы, основанные на представлении изображения с помощью набора базисных функций. Примером такого подхода являются JPEG алгоритмы, основу которых составляют косинусные преобразования [4]. Однако даже при реализации данных подходов исходные файлы изображений остаются довольно большими. С другой стороны, существенным недостатком сжатия исходной информации является то, что после распаковки изображение будет занимать изначальный объем, т.е. таким образом решается только проблема хранения данных, но не обработки.
В связи с этим, обычно в память компьютера считывают не всё изображение, а его часть. Во-первых, это делает возможным выполнять обработку “безразмерно” больших файлов изображений, во-вторых, в большинстве случаев повышает ее скорость.
Реализация данного подхода приводит к необходимости поиска оптимальных способов упорядочения элементов многомерных массивов во внешней памяти. При обработке изображения эта задача возникает, когда размеры обрабатываемых информационных массивов превышают размеры оперативной памяти. В будущем, несмотря на быстрое увеличение объемов доступной памяти, она, по-видимому, все равно будет актуальной.
Практический интерес представляют такие способы упорядочения элементов многомерного массива, которые обеспечивают наибольшую вероятность обнаружения соседних элементов массива на одной и той же странице памяти. Это дает возможность минимизации числа обращений к внешним запоминающим устройствам [3].
Одним из наиболее подходящих способов упорядочения элементов массива является тайловая структура хранения изображений. Для этого исходное изображение делится на блоки (тайлы) (см. рис. 1), размер которых фиксирован. В этом случае хранятся адреса каждого тайла. При необходимости обработки конкретного участка изображения осуществляется перемещение на данный адрес и считывается нужный тайл.
Д.В. Комиссаров, 2001.
214 2001, Vol. 6, Pt 2, Special Issue Proceedings of International Conference RDAMM– Такая организация данных позволяет быстро считывать с диска и отображать на экране отдельные участки изображения и, например, реализована в формате TIFF 6.0.
Другой аспект организации хранения данных связан с возникающей необходимостью вести обработку изображения редуцированного разрешения. Необходимость постоянного вычисление изображений редуцированного разрешения связана с большими затратами машинного времени. Поэтому, обычно, посчитанные один раз изображения уменьшенного масштаба записывают и хранят на диске в виде так называемых пирамид изображений [3]. В этом случае информационное поле описывается упорядоченным набором изображений, располагаемых обычно одно над другим (отсюда и происхождение названия – пирамида изображений, см. рис. 2). На основе пирамидального подхода к представлению видеоданных предложены алгоритмы сжатия, выделения контуров, поиска изображений, привязки сцен, идентификации объектов и др. [3].
Рис.1: Пример цифрового изображения размером 512x512 пикселов, разбитого на тайлы 64x64 пиксела.
Автоматический поиск соответственных точек на снимках Ключевым алгоритмом автоматизации фотограмметрических измерений является поиск соответственных точек на снимках. Поиск соответствия по двум изображениям относится к классу так называемых обратных задач, которые, как известно, не корректны. Задача становится некорректной, если нет гарантии, что решение существует (в нашем случае соответственная точка может быть скрыта каким-либо высотным объектом), или может существовать более одного решения (из-за повторяющихся элементов ландшафта или полупрозрачной поверхности), либо решение неустойчиво по отношению к шумам [2].
Труды Международной конференции RDAMM–2001 2001 Т. 6, Ч. 2, Спец. выпуск Рис.2: Пример пирамиды изображений.
Первые решения автоматической идентификации точек снимков были представлены еще в конце 50-х годов [2], и на сегодня получено громадное множество самых разнообразных алгоритмов решения этой задачи.
Но несмотря на это, все алгоритмы могут быть разделены на два основных класса: алгоритмы площадного сопоставления (area based matching (ABM)) и алгоритмы, основанные на выделении примитивных объектов и характерных точек (feature based matching (FBM)). В первом случае, в качестве примитивов служат пикселы.
Точность этих алгоритмов составляет от 0,1 до 0,2 размера пиксела, как правило они чувствительны к изменению радиометрических и геометрических свойств, требуют больших вычислительных затрат и характеризуются большой вероятностью грубой ошибки идентификации в областях расположения высотных объектов и плохих или повторяющихся структур. Примером площадных алгоритмов могут служить алгоритм взаимной корреляции и метод наименьших квадратов.
Для алгоритмов FBM в качестве примитивов служат предварительно выделенные характерные точки и объекты местности (пресечения дорог, углы домов, заборов и т.п.). Этот класс алгоритмов характеризуется точностью от 0,3 до 0,4 пиксела и высокой степенью устойчивости (более инвариантны по отношению к радиометрическим и геометрическим изменениям), поэтому в качестве связующих точек при фототриангуляции могут выбираться углы домов, заборов и даже деревья [1]. Схемы и алгоритмы выделения характерных элементов на цифровых снимках сложны в реализации, дороги в вычислительном отношении и требуют предварительного задания ряда параметров и порогов чувствительности.
Важную роль при идентификации точек играет стратегия поиска. В частности, значительно повысить скорость идентификации позволяет использование пирамиды изображений. Для этого поиск сначала ведут по самому верхнему изображению пирамиды. Тогда например, при прочих равных условиях зона поиска для пятого слоя пирамиды сократится в 32 раза по оси X и в 32 раза по оси Y, т.е. объем обрабатываемой информации будет уменьшен в 1024 раза. При этом, как правило, достоверность результатов поиска по изображениям низкого разрешения выше, чем для изображений высокого разрешения. Во-первых, при уменьшении разрешения объединением пикселов изображение подвергается низкочастотной фильтрации и, как следствие, снижается влияние шумов. Во-вторых, снижается влияние изменения высоты, т.е. высотные объекты, например здания, будут выглядеть плоскими и алгоритмы корреляции будут работать устойчивей. В-третьих, уменьшается зона поиска (в пиксельном выражении).
После идентификации соответственной точки на изображении низкого разрешения поиск продолжают по изображению более высокого разрешения, зная при этом приблизительную зону поиска из предыдущих вычислений. Этот процесс выполняется до тех пор, пока соответственная точка не будет найдена на 216 2001, Vol. 6, Pt 2, Special Issue Proceedings of International Conference RDAMM– изображении самого высокого разрешения (см. рис. 3). Следует учесть, что если для идентификации используется алгоритм класса FBM, то при смене слоя выделение примитивных объектов нужно произвести заново, поскольку изменение разрешения изображения может привести как к утрате характерных точек так и приобретению новых.
Иногда, после поиска соответственных точек по изображениям низкого разрешения выполняют фототриангуляцию одним из известных способов. В результате уравнивания, во-первых, отбраковываются неправильно идентифицированные точки, во-вторых, уточняются элементы ориентирования снимков.
Например, для снимков, отсканированных с разрешением 15 мкм, после выполнения фототриангуляции по изображениям 5-го слоя пирамиды соответственная точка на соседнем снимке будет определена с точностью 0, мм по обеим осям координат (при условии, что рельеф снимаемой местности плоский).
Рис.3: Схема поиска соответственных точек с использованием пирамиды изображений.
В данной работе в качестве методов автоматического отождествления точек местности выбраны и реализованы методы взаимной корреляции и наименьших квадратов. Первый метод позволяет вести глобальный поиск соответственных точек в пределах выбранного участка изображения с точностью до 0,5-1,0 пиксела.
Второй метод позволяет добиться подпиксельной точности и оценить точность поиска. Использование иерархического поиска соответственных точек позволило осуществить довольно быстрый и достоверный поиск соответствия. Что касается контроля качества измерений, то для предварительной оценки точности измерений используется процесс вычисления элементов взаимного ориентирования пары снимков.
Выбор связующих точек и организация данных Как показывает практика, при создании всевозможных приложений баз данных и геоинформационных систем (ГИС), сложность (и возможность) разработки программного обеспечения во многом зависит от того, насколько удачно запроектирована структура организации данных. В частности, в данной работе возникла необходимость разработки структуры данных для хранения связующих точек и их измерений на снимках.
При выполнении аналитической фототриангуляции связующие точки выбираются в зонах тройного продольного перекрытия снимков, причем стараются, чтобы эти точки были видны на снимках соседнего маршрута. Для четкой идентификации этих точек, их маркируют на специальных приборах. В случае с цифровой фототриангуляцией нет необходимости выполнять маркировку, поскольку все снимки, на которых изобразилась конкретная точка местности, могут быть отображены одновременно. Обычно, при стандартных значениях продольного и поперечного перекрытий снимков, связующие точки отображаются от 2-х до 6-и раз.
Естественно, программа цифровой фототриангуляции не должна ограничиваться измерением ни 2-х ни 6-и точек. Поэтому, для хранения данных измерений, предлагается использовать реляционную модель данных, схема которой представлена на рисунке 4.
Таблица “Ground points” служит для хранения номеров и пространственных координат опорных, контрольных и связующих точек. Номера точек должны быть уникальными и не повторяться в пределах таблицы. Таблица “Photos” предназначена для хранения информации о фотоснимках, используемых в обработке. В качестве данных выступают уникальный идентификатор снимка, элементы внешнего ориентирования, результаты внутреннего ориентирования снимка и т.п. В таблице “Photo measurements” хранятся непосредственно измеренные координаты точек снимков (x, y). Каждому измерению в этой таблице соответствует номер измеряемой точки и идентификатор снимка, на котором производилось измерение.
Такая организация данных позволяет однозначно сопоставить каждому измерению соответствующую точку местности и снимок, на котором выполнено измерение. Кроме того, она позволяет хранить “бесконечное” число опорных, связующих, контрольных точек и их измерений.
Когда выбор связующих точек производится в интерактивном режиме, немаловажной остается технология их измерения. Например, подразумевая, что точка отобразилась на шести снимках, вполне приемлемой является технология, когда измерения производятся на всех снимках одновременно. В этом случае пользователь имеет возможность контролировать видимость точки на всех снимках. Однако может потребоваться технология, при которой измеряются только три или два снимка одного маршрута, поэтому для удобства программа поддерживает несколько режимов измерений.
Выводы Представленные алгоритмы и концепции организации данных, а именно реализация потайлового считывания изображения, использование пирамид изображений для целей автоматизации фотограмметрических измерений, автоматическое отождествление связующих точек, реляционная модель организации данных измерений были реализованы автором на практике. Естественно данные подходы решения поставленных проблем не являются единственными, однако результаты исследований доказывают их работоспособность и высокую эффективность.
Библиография [1] Ackermann F. Some consideration about automatic digital aerial triangulation // OEEPE – Workshop on Application of Digital Photogrammetric Workstations, OEEPE Official publications. 1996. No. 33. P. 157-164.
[2] Heipke C. Overview of image matching techniques // OEEPE – Workshop on Application of Digital Photogrammetric Workstations, OEEPE Official publications. 1996. No. 33. P. 173-189.
[3] Александров В.В., Горский Н.Д. Представление и обработка изображений: Рекурсивный подход. Л.: Наука, 1985, 189с.
[4] Климов А.С. Форматы графических файлов. К.: НИПФ “ДиаСофт Лтд”, 1995, 480с.