На правах рукописи
Экз. №
Чжи Я Аунг
МЕТОДИКИ И АЛГОРИТМЫ АВТОМАТИЗАЦИИ
ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ ВИЗУАЛИЗАЦИИ, ОБРАБОТКИ
И ПОИСКА ИЗОБРАЖЕНИЙ В ГРАФИЧЕСКИХ БАЗАХ ЗНАНИЙ
Специальность 05.13.06 –“Автоматизация и управление технологическими процессами и производствами” (приборостроение).
Автореферат диссертации на соискание ученой степени кандидата технических наук
Москва –2010 г.
Работа выполнена на кафедре “Информатика и программное обеспечение вычислительных систем” Московского государственного института электронной техники (технический университет) доктор технических наук, профессор
Научный руководитель :
Портнов Е.М.
Официальные оппоненты: доктор физико-математических наук, профессор Рычагов М.Н.
кандидат технических наук Артюшенков С.Н.
Ведущая организация: ГУП НПЦ «ЭЛВИС», г. Москва
Защита диссертации состоится “_” 2010 г.
в _ часов на заседании диссертационного совета Д.212.134.04 при Московском государственном институте электронной техники (техническом университете) по адресу : 124498, Москва, Зеленоград, проезд 4806, д.5, МИЭТ.
С диссертацией можно ознакомиться в библиотеке МИЭТ.
Автореферат разослан “_” 2010 г.
Ученый секретарь диссертационного совета Д.212.134. доктор технических наук, профессор А.И. Погалов
Общая характеристика работы
Актуальность работы.
Автоматизация технологических процессов обработки изображений является одной из центральных и практически важных задач в приборостроении и других отраслях промышленности. Проблема носит комплексный характер и включает ряд основных этапов: восприятие поля зрения, сегментация, нормализация выделенных объектов, распознавание, визуализация и поиск изображений.
Результаты исследований, направленных на создание эффективных методов визуализации и обработки изображений, изложены в работах зарубежных и отечественных ученых: W.K.Pratt, R. Jain, R.W Floyd, J.M.S. Prewitt, J.F. Jarvis, B.E. Bayer, Т Pavlidis, В.Ф.Нестерук, И.А.Богуславского, A. Rosenfeld, В.А.Сойфера, Л.П.Ярославского, Ю.И. Журавлева.
Задача автоматизированной обработки изображений продолжает оставаться крайне актуальной на протяжении последних десятилетий. Несмотря на неослабевающий интерес исследователей и большое количество работ в данной области есть еще много открытых вопросов и нерешенных задач. В настоящее время существует и активно развивается целая отрасль автоматизированных систем, предназначенных для поиска, обработки и визуализации изображений: в частности системы распознавания образов, системы визуализации изображений, информационнопоисковые системы, системы сжатия и кодирования изображений и др.
Однако ни одну из таких систем нельзя назвать полностью универсальной и обеспечивающей весь необходимый функционал по эффективной обработке изображений, включая задачи поиска, визуализации и распознавания изображений с высокими характеристиками, прежде всего быстродействием и качеством обработки.
Существует ряд проблем, одна из основных состоит в том, что задача построения оптимальной функции преобразования для любого изображения, подлежащего обработке, с учетом способа его воспроизведения в общем случае не решена, её лучше конкретизировать и связать с определёнными выводными устройствами. Разнообразие устройств визуализации требуют разработки эффективных методов и алгоритмов визуализации изображений (ВИ). К методам ВИ предъявляются специфические требования: с одной стороны улучшение качества воспроизведения изображений, с другой сторонывысокая скорость обработки изображений. Ряд устройств визуализации воспроизводят меньшее количество цветовых оттенков, нежели само изображение. В связи с этим возникает задача имитации недостающих оттенков цветов при формировании выходной информации.
Необходимо осуществить преобразование многоуровневого изображения в такое, число оттенков которого соответствует числу оттенков устройства визуализации.
В связи с вышесказанным требуется разработать методы, корректирующие погрешности визуализации, и учесть факторы, зависящие от техники и от характера воспроизводимых изображений. Разрабатываемые методы должны осуществлять визуализацию изображений на различных устройствах с качеством и временем визуализации более высоким, чем дают известные методы.
С распространением Internet наблюдается тенденция к накоплению информации, представленной в виде изображений, и к созданию графических баз знаний изображений. При этом проблемы эффективного поиска изображений до сих пор полностью не решены. Необходима разработка методов, обеспечивающих высокие показатели быстродействия, точности и полноты поиска изображений.
Таким образом, актуальными являются исследования, направленные на разработку методик и алгоритмов для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний.
Цель работы. Целью диссертационного исследования является разработка методик и алгоритмов для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний, обеспечивающих повышение качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышение быстродействия и точности поиска изображений без заметного снижения полноты поиска. Указанная цель достигается созданием методик и алгоритмов управления яркостью изображений; методик компенсации искажений при визуализации изображений; средств для сглаживания границ локальных областей изображений и снижения краевых эффектов; методик эффективного поиска изображений; имитационных моделей автоматизированной обработки, визуализации и поиска изображений в многомодульных графических базах знаний.
Задачи исследования. В соответствии с указанной целью в работе решаются следующие задачи:
автоматизированной обработки, визуализации и поиска изображений;
разработка методики и алгоритма локальных гистограммных преобразований уровней яркости при обработке и визуализации изображений;
создание методики компенсации искажений при визуализации изображений;
разработка средств для сглаживания границ локальных областей изображений;
создание алгоритмов визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов;
имитационное моделирование, программная реализация и экспериментальное исследование эффективности предложенных методик и алгоритмов.
Методы исследования. В диссертационной работе использованы методы системного анализа, теории информационных систем, методы математического и имитационного моделирования, модели и методы теории распознавания образов, теории цифровой обработки сигналов.
Научная новизна работы состоит в создании новых методик и алгоритмов, обеспечивающих автоматизацию технологических процессов обработки, визуализации и поиска изображений в графических базах знаний, повышение качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышение быстродействия и точности поиска изображений без заметного снижения полноты поиска. При этом получены следующие научные результаты.
1. На основе локальных гистограммных преобразований разработан алгоритм управления уровнем яркости при визуализации изображений, обеспечивающий снижение вычислительных затрат и сохранение яркостного баланса визуализированного изображения с высокой точностью.
2. Предложены методика компенсации искажений при визуализации изображений на терминальных устройствах вывода, алгоритм выявления перепадов контуров в локальных областях изображений и совокупность функций для сглаживания границ локальных областей изображений, снижающих краевые эффекты.
3. Созданы алгоритмы автоматизированной визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов, обеспечивающие повышение эффективности воспроизведения при визуализации изображений с большим количеством мелких деталей, а также когда разница между глубиной цветов входных и выходных изображений велика.
4. Разработана модель многомодульной графической базы знаний с динамически конфигурируемой структурой, основанной на вероятности обращения как к отдельным модулям, так и содержащимся в них медиадокументах и изображений.
5. Разработан программный комплекс, созданы и верифицированы имитационные модели для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний.
Практическая значимость работы заключается в повышении эффективности средств автоматизированной обработки, визуализации и поиска изображений в графических базах знаний. Гибкость предложенных решений делает возможным их применение в системах технического зрения, системах контроля качества продукции приборостроения, системах распознавания образов, системах компрессии подвижных и неподвижных изображений, системах управления и поиска изображений в мультимедийных и графических базах знаний.
Предложена и программно реализована система автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний. Система обеспечивает возможность:
видоизменения гистограмм полутоновых и цветных изображений, нахождения изображения, отвечающего определенным критериям, навигации по категориям изображений; формирования визуального запроса с полным или частичным перечнем всех возможных свойств; накопления и выдачи оценок результатов поиска.
Создана структура базы знаний для подготовки и обработки миниизображений в среде Linux. Для снижения вычислительных затрат и простоты наращиваемости системы поиска изображений все признаки, используемые при вычислении меры релевантности, определяются только на основе сохраненных в БЗ миниизображений. Получена и экспериментально обоснована рациональная с точки зрения быстродействия и качества визуализации структура фильтра для рассеяния ошибок визуализации.
Результаты экспериментальных исследований предложенных в работе средств автоматизированной обработки, визуализации и поиска изображений в многомодульных графических базах знаний показали, что обеспечивается снижение средней относительной погрешности визуализации изображений в 2 раза, повышение быстродействия поиска изображений на 11,6 %, точности поиска на 2,7 %, при снижении коэффициента полноты поиска всего на 0,8 % по сравнению с традиционными методами.
Достоверность определяется корректным применением строго математического аппарата и подтверждается результатами имитационного моделирования, доказавшими преимущества предложенных в работе методик и алгоритмов, выразившимися в повышении качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышении быстродействия и точности поиска изображений без заметного снижения полноты поиска.
Личный вклад автора. Все основные результаты получены автором лично. Главными из них являются:
разработка алгоритма управления уровнем яркости при визуализации изображений;
создание методики компенсации искажений при автоматизированной визуализации изображений на терминальных устройствах вывода;
разработка алгоритма выявления перепадов контуров в локальных областях изображений и совокупности функций для сглаживания границ локальных областей изображений;
создание алгоритмов автоматизированной визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов;
разработка модели многомодульной графической базы знаний с динамически конфигурируемой структурой;
разработка программного комплекса и имитационных моделей для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний;
внедрение результатов диссертационной работы в учебный процесс кафедры МИЭТ.
Внедрение результатов работы. Все работы по реализации и внедрению проводились под руководством или при непосредственном участии автора. Результаты диссертационной работы используются в учебном процессе Московского государственного института электронной техники (технический университет).
На защиту выносятся:
алгоритм управления уровнем яркости при визуализации изображений;
методика компенсации искажений при визуализации изображений на терминальных устройствах вывода;
алгоритм выявления перепадов контуров в локальных областях изображений и совокупность функций для сглаживания границ локальных областей изображений;
алгоритмы визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов;
модель многомодульной графической базы знаний с динамически конфигурируемой структурой;
программный комплекс для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний;
результаты экспериментальных исследований эффективности предложенных методик и алгоритмов;
результаты внедрения и апробации материалов диссертационной работы.
Апробация работы. Основные положения и результаты диссертационной работы были доложены на Всероссийских межвузовских научно-технических конференциях "Микроэлектроника и информатика” (Москва, Зеленоград, МИЭТ, 2007- 2009 г.г.), Научной сессии МИФИ (Москва, МИФИ, 2008-2009 г.г.), Всероссийской межвузовской научнопрактической конференции “Актуальные проблемы информатизации.
Развитие информационной инфраструктуры, технологий и систем” (Москва, Зеленоград, МИЭТ, 2007-2008 г.), Всероссийской межвузовской научно-практической конференции «Актуальные проблемы информатизации в науке, образовании и экономике» (Москва, Зеленоград, МИЭТ, 2009 г.) Публикации. Основное содержание диссертации отражено в опубликованных работах, в том числе 2 статьи в ведущих научных журналах, утвержденных ВАК. Без соавторов опубликовано 10 работ.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложений. Работа содержит 145 страниц основного текста, включая 32 рисунка, 5 таблиц, а также список литературы из 109 наименований и 2 приложения.
Во введении обосновывается актуальность темы диссертации, формулируются общие проблемы, цели и задачи исследования, научное и практическое значение полученных результатов, рассматривается структура диссертации и взаимосвязь отдельных глав.
В первой главе представлен анализ современного состояния методов и средств автоматизированной обработки, визуализации и поиска изображений. Проведенный обзор существующих методов обработки и визуализации изображений показал, что при обработке изображений, содержание которых существенно различается по своим характеристикам на различных участках целесообразно применить локальные гистограммные преобразования, а также необходимо разработать методы, корректирующие погрешности визуализации и учесть факторы, зависящие от техники и от характера воспроизводимых изображений. Определены основные требования к автоматизированным системам поиска изображений, а именно, высокая скорость индексирования и вычисления меры релевантности изображения эталону; простота модификации системы поиска; учет особенностей психовизуального восприятия человека. Сформулирована цель диссертационной работы, состоящая в создании эффективных методов и средств для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний.
Во второй главе разработаны методики и алгоритмы обработки и визуализации изображений на основе локальных гистограммных преобразований.
Известные методы гистограммных преобразований (сглаживающие, выравнивающие, с понижением количества уровней яркости) не позволяют достичь качественной ВИ в соответствии с современным уровнем развития техники, в связи с чем в диссертации предложен алгоритм локальных гистограммных преобразований уровней яркости при обработке и визуализации изображений (рис.1). Алгоритм основан на сравнении исходной гистограммы с результирующей в процессе ее построения, что ведет к сокращению объема вычислений и обеспечивает сохранение яркостного баланса с высокой точностью где H n и H m - значения исходной и построенной гистограмм в точках n и m, соответствующих определенному уровню яркости n 0, 255.
Особенностью методов визуализации изображений на печатающих устройствах является то, что они дают искажения в связи с растискиванием точек при печати или с растеканием краски и перекрытием точек.
Определение переменных установка начальных значений H1=0, H2=0, n=0, m=0, массив соответствия яркостей или уровней серого входного и выходного