WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

Pages:     || 2 | 3 | 4 | 5 |

«Методы и алгоритмы автоматической обработки изображений радужной оболочки глаза ...»

-- [ Страница 1 ] --

Федеральное государственное бюджетное учреждение наук

и Вычислительный

центр им. А.А. Дородницына Российской академии наук

На правах рукописи

Матвеев Иван Алексеевич

Методы и алгоритмы автоматической обработки

изображений радужной оболочки глаза

05.13.11 – Математическое и программное обеспечение вычислительных

машин, комплексов, систем и сетей

ДИССЕРТАЦИЯ

на соискание ученой степени доктора технических наук

Научный консультант д. ф.-м. н., проф.

Цурков Владимир Иванович Москва – 2014 Содержание Введение.................................... Глава 1. Модели радужной оболочки глаза............. 1.1. Глаз как объект распознавания................... 1.2. Модели радужной оболочки глаза.................. 1.2.1. Моделирование толщины радужки............. 1.2.2. Модели конформного преобразования........... 1.3. Общая схема распознавания по радужке.............. 1.4. Некоторые основные понятия и методы............... 1.5. Методы предобработки изображений................ 1.5.1. Калибровка изображений.................. 1.5.2. Удаление бликов....................... 1.6. Выводы к первой главе........................ Глава 2. Выделение области радужки на изображении...... 2.1. Проекционные методы выделения областей............. 2.1.1. Метод проекций яркостей.................. 2.1.2. Метод проекций градиентов яркости............ 2.1.3. Метод связанных максимумов круговых проекций.... 2.2. Методология Хафа.......................... 2.2.1. Выделение центра методом Хафа.............. 2.2.2. Метод триангуляции..................... 2.2.3. Метод Хафа для границ компонент связности....... 2.3. Морфологические методы...................... 2.3.1. Метод рекурсивной эрозии.................. 2.3.2. Поиск окружностей по совокупностям сегментов..... 2.3.3. Анализ направлений градиентов.............. 2.4. Методы оптимизации контуров................... 2.4.1. Метод адаптивных контуров................. 2.4.2. Метод оптимального кругового пути............ 2.5. Корреляционный поиск и слежение................. 2.5.1. Использование оптических потоков............. 2.5.2. Слежение за границами радужки.............. 2.6. Выводы ко второй главе....................... Глава 3. Система методов выделения области радужки..... 3.1. Схема методов сегментации радужки................ 3.2. Экспериментальная проверка.................... 3.2.1. Сравнение с экспертной разметкой............. 3.2.2. Сравнение с иными методами................ 3.2.3. Оценка по результатам распознавания........... 3.3. Выводы к третьей главе........................ Глава 4. Методы оценки качества выделения радужки на изображении................................... 4.1. Показатели качества, основанные на яркости........... 4.2. Показатели качества, основанные на геометрических характеристиках.................................. 4.3. Показатели качества, основанные на форме............ 4.4. Оценка условий регистрации..................... 4.5. Оценка методов определения качества............... 4.6. Совместное использование характеристик качества........ 4.7. Методы защиты от подделок..................... 4.7.1. Зернистость искусственного изображения......... 4.7.2. Движения глаза........................ 4.8. Выводы к четвёртой главе...................... Глава 5. Методы создания и сравнения эталонов радужки... 5.1. Полярное преобразование....................... 5.2. Преобразование Хаара для выделения признаков......... 5.3. Использование последовательностей изображений......... 5.4. Большие базы эталонов........................ Приложение А. Использованные базы данных........... С развитием технических средств регистрации и цифровой обработки изображений класс задач с использованием цифровых изображений, доступных решению и практическому применению, стремительно расширяется. Одним из новых направлений является регистрация и обработка изображений радужной оболочки глаза человека и животных. Постановки этой и близких задач возникли в последние два десятиления, а практические приложения — около десяти лет назад. Задачи этого направления делятся на два основных класса: связанные с распознаванием (идентификацией, аутентификацией) индивидуума и медицинские.

Идентификация личности человека по изображению радужной оболочки глаза (РОГ) — быстро развивающийся метод биометрии, уже имеющий широкое применение в системах контроля доступа. Он основан на том, что рисунок РОГ имеет индивидуальную, слабо меняющуюся со временем структуру. Уникальность структуры РОГ известна с древнейших времён [18]. Идея идентификации личности по радужной оболочке глаза была предложена офтальмологами в 1936 году. В 1958 году писатель Ян Флеминг высказал её в одном из своих детективов о Джеймсе Бонде «Операция ’Шаровая Молния’». По мотивам этого произведения в 1984 году был снят фильм «Никогда не говори никогда». В году Леонардом Фломом и Араном Сафиром была подана заявка на патент (выдан в 1987 г.) на распознавание человека по характеристикам зрачка и радужки на изображении [268]. В 1992 году Джон Даугман опубликовал работу, в которой показал высочайшую теоретически достижимую точность распознавания по радужке [254]. В 1994 году система идентификации личности по изображениям РОГ на основе исследований Даугмана была запатентована. В том же году Вильдс предложил альтернативный метод сегментации радужки и хранения информации о её текстуре [467]. В 1998 еще один метод был предложен Боулсом [219]. В 2000-х годах произошёл взрывной рост интереса к идентификации по РОГ. Можно выделить три основные причины этого. Во-первых: развитие технических средств регистрации (доступных камер с хорошими характеристиками) и средств обработки изображений (вычислительных устройств обладающих достаточной мощностью для нетривиальной обработки видеопотока). Во-вторых: ускоренное введение развитыми странами контртеррористических усилий и полицейских мер (в частности, биометрической паспортизации). В-третьих:



распознавание по радужке оказалось наиболее точным среди всех биометрических модальностей [382, 383, 394].

В 2000-х годах к решению задач распознавания по РОГ подключилось множество научных лабораторий, наибольших результатов добились: группа, возглавляемая Prof. J.Daugman в Cambrige University, UK; группа, возглавляемая Prof. K.Bowyer в University of Notre Dame, IN, USA; Prof. Hugo Proenca, University of Beira Interior, Portugal; Prof. Adam Czajka, Warsaw University of Technology, Poland. Обзоры [222, 223, 333, 390] представляют более двухсот работ по этой тематике, и это лишь малая часть исследований. В середине 2000-х годов начали появляться программно-аппаратные комплескы распознавания по РОГ, из них наиболее известными являются системы Panasonic, LG, OKI. Системы распознавания по РОГ применяются на практике. В ОАЭ такая система используется для идентификации на пунктах пограничного контроля [190] на протяжении последних десяти лет. Заявлено, что в последнее время на собранной базе даных производится «около 2.7 миллиардов сравнений биометрических эталонов каждый день» [257]. Индия использует распознавание по радужке как одну из технологий идентификации в проекте биометрической паспортизации населения, в котором на конец 2011 года было зарегистрировано более 300 миллионов человек [179]. Таким образом, в настоящий момент распознавание по РОГ является одним из основных и первым по точности методом аутентификации, вызывающим большой интерес как в практическом, так и в теоретическом аспектах.

Актуальность темы исследования. Аутентификация человека, то есть подтверждение того, что он является тем, за кого себя выдаёт, вне всяких сомнений является актуальной задачей, практическим решением которой заняты тысячи и миллионы человек по всему миру: паспортные столы, контрольнопропускные пункты и т.п. Автоматизация этого процесса, в том числе при помощи новейших технологий — важная составляющая развития современного общества. То же самое можно сказать и о задаче идентификации, то есть установлении личности человека путём поиска его записи в базе данных. Развитие систем компьютерного зрения, цифровой обработки изображений, увеличение мощности вычислительных средств в последнее десятиление дало возможность ставить и решать задачи автоматической регистрации, выделения, распознавания таких сложных, изменчивых, трудно моделируемых и формализуемых объектов как биометрические признаки живых организмов. Таким образом, задачи аутентификации и идентификации человека теперь решаются при помощи автоматических биометрических систем, составляя одну из новых областей прикладной математики, биометрическую идентификацию.

Предложено, исследуется, практически используется большое количество типов биометрических признаков, называемых биометрическими модальностями: рисунок папиллярных линий пальца, изображения лица, радужки глаза, рисунки вен сетчатки глаза, форма кисти руки, особенности походки, почерка, характеристики голоса. Многие из этих модальностей использовались в целях идентификации задолго до появления электроники и вычислительных средств.

Изображения радужки глаза среди прочих модальностей выделяются в двух отношениях. С одной стороны, практическое распознавание по радужке реализовано совсем недавно, на рубеже столетия, с появлением электронных цифровых камер и достаточно мощных ЭВМ. С другой стороны, именно распознавание по радужке на сегодняшний день — признанный лидер по точности и надёжности среди биометрических признаков. Таким образом, обработка изображений радужки является наиболее быстро развивающейся областью систем биометрической идентификации.

Основные научные коллективы в России, занимающиеся проблемами обработки и распознавания изображений, формировались в: Вычислительном Центре РАН (под руководством академика РАН Ю. И. Журавлёва); Институте систем обработки изображений РАН (под руководством член-корреспондента РАН В. А. Сойфера); Государственном НИИ авиационных систем (под руководством член-корреспондента РАН Г. Г. Себрякова); Научно-исследовательском институте системных исследований РАН (под руководством академика РАН В. Б. Бетелина); Институте системного анализа РАН (под руководством членкорреспондента РАН В. Л. Арлазарова); Институте математики им. С. Л. Соболева СО РАН (под руководством д.т.н. Н. Г. Загоруйко); Военно-воздушной инженерной академии им. Жуковского (под руководством д.т.н. И. Н. Белоглазова); Курском государственном техническом университете (под руководством д.т.н. В. С. Титова); Владимирском государственном университете (под руководством д.т.н. С. С. Садыкова); Институте проблем управления РАН (под руководством д.т.н. В. Н. Вапника); МГУ им. М. В. Ломоносова (под руководством д.ф.-м.н. Ю. П. Пытьева); Институте проблем передачи информации РАН (под руководством д.ф-м.н. Л. П. Ярославского).

В России и Беларуси проблемами обработки и распознавания изображений радужки занимаются: коллектив лаборатории математических методов обработки изображений факультета вычислительной математики и кибернетики МГУ им.М.В. Ломоносова под руководством проф. А.С.Крылова; исследовательская группа в Институте физики имени Б.И.Степанова Национальной академии наук Беларуси под руководством д.ф.-м.н. Г.И.Желтова; ЗАО «ПАПИЛОН», Институт систем обработки изображений РАН.

Большое внимание уделяется распознаванию по радужке за рубежом. Основные исследовательские группы работают в США (University of Notre Dame, P.J.Flynn, K.W.Bowyer, Michigan State University, A.Ross), Англии (University of Cambridge, J.Daugman), Португалии (University of Beira Interior, H.Proenca), Польше (Warsaw University of Technology, A.Czajka). Системы распознавания по радужке разработаны фирмами Iritech, LG, OKI, Panasonic, Sagem, Neurotechnology, Morpho.

В целом теория, прикладные методы и системы распознавани по радужке достигли высокого уровня, современные коммерческие системы позволяют производить распознавание с ошибками первого и второго рода (ложный отказ и ложный пропуск), не превышающими таковые для систем с вводом четырёхзначного пин-кода посредством клавиатуры (банкоматы). Основными направлениями развития этой области являются: дальнейшая разработка моделей радужки и её изображения; построение и исследование новых моделей и информативных признаков радужки; создание методов и систем распознавания, работающих в оптическом диапазоне, без сотрудничества распознаваемого человека; разработка методов защиты от подделок, ускорение поиска в больших базах биометрических эталонов.

Цели и задачи диссертационной работы: В работе были поставлены следующие цели:

• Создать методы и алгоритмы, обеспечивающие выделение области радужки на изображении глаза, с показателями точности, надёжности и скорости работы, приемлемыми для практического использования.

• Разработать методы и алгоритмы для генерации биометрических эталонов по изображениям радужки и их последующего сравнения, обеспечивающие характеристики по точности (ошибки первого и второго рода), сравнимые с вводом четырёхзначного пин-кода.

• Создать методы и алгоритмы оценки качества и выявления попыток подделки изображений радужки.

Для достижения поставленных целей были решены следующие задачи:

• Создание, исследование и подбор методов обработки изображений по критериям соответствия задачам выделения элементов радужки и временным ограничениям.

• Исследование и разработка методов выделения признаков с целью создания биометрического эталона и сопряжённых методов сравнения эталонов.

• Создание методов обработки изображений, пригодных для позиционирования при вводе изображений радужки, в том числе на изображениях низкого качества.

• Исследование и разработка методов противодействия подделкам изображений радужки.

• Сбор и разметка базы данных изображений радужки глаза, в которой представлены изображения и последовательности изображений, реализующие приведённые выше задачи.

• Создание тестовых приложений и проведение вычислительных экспериментов по определению работоспособности перечисленных методов с опорой на собранную базу изображений.

Научная новизна диссертационной работы состоит в следующем:

1. Созданы модели радужной оболочки глаза, позволяющие с большой точностью описывать движения её элементов при изменении размеров зрачка;

2. Созданы новые методы выделения области радужки на изображениях, отличающиеся высокой устойчивостью и работающие с низкокачественными изображениями;

3. Разработана система методов выделения, основанная на начальных приближённых оценках с последующими уточнениями;

4. Созданы методы определения качества исходных изображений, найденных областей радужки, эталонов радужки;

5. Разработаны методы распознавания поддельных изображений радужки (определения живости глаза);

6. Разработаны новые методы генерации эталонов радужки;

7. На основании собранной базы данных изображений проведены статистические исследования характеристик радужки и апробация методов.

Теоретическая и практическая значимость. Результаты, изложенные в диссертации, применены для создания систем ввода и обработки изображений радужной оболочки глаза.

Рекомендации автора, основанные на результатах, представленных в диссертации, использованы при создании международного стандарта на запись и передачу изображений радужки в целях идентификации: «ISO/IEC 19794- Automatic identication. Biometrics. Biometric data interchange formats. Part 6.

Iris image data», а также его российского аналога «ГОСТ Р ИСО/МЭК 19794-6-2006. Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Часть 6. Данные изображения радужной оболочки глаза».

Cистема методов и алгоритмов сегментации радужки неоднократно прдставлялась на международные тесты IREX, проводимых Национальным институтом стандартов и технологий США (NIST). В тестах 2009 года система заняла первое место по точности сегментации изображения глаза на низкокачественных изображениях и точности распознавания.

Результаты работы реализованы и используются в следующих системах:

• Устройства ввода и распознавания изображений радужки глаза серии IriShield, монокулярное (IriShield USB MK 2120U) и бинокулярное (IriShield • Бинокулярная система ввода изображений радужки глаза IriMagic;

• Модуль ввода изображений радужки глаза IriHerald;

• Программное обеспечение IrisSDK, предназначенное для разработки систем распознавания по радужке на платформах Intel-x86 и AMD64 под управлением операционных систем Windows и Linux, равно как и отдельно поставляющиеся подсистемы IriCore, IriMatchEnhancer, IriVerier, IriTemplateG IriTracker и основанное на IrisSDK серверное решение IriMaster.

Устройство IriShield USB BK 2121 выбрано и сертифицировано правительством Индии для участия в программе создания биометрических документов UIDAI (Unique Identication Authority of India).

Результаты работы применены в устройствах диагностики функционального состояния человека по зрачковой реакции SM2010 (Iritech), SSAS (Sambon).

Положения, выносимые на защиту.

• Осуществлены исследование и анализ характеристик радужки глаза человека и её изображений как объекта распознавания, представлены статистические характеристики изображений радужки, на их основе разработаны статическая модель изображения радужки и модели движения её элементов.

• Исследована и разработана группа методов обнаружения радужки на изображении и выделения её информативной части, основанных на моделях радужки и полученной статистике, описаны соответствующие алгоритмы и осуществлена их программная реализация, выполнены численные эксперименты с базой изображений радужки, приведены характеристики точности методов, охарактеризованы области их применимости.

• Разработана целостная система алгоритмов поиска и выделения области радужки на изображении, основанная на исследованных методах, выбранных согласно их установленным областям применимости так, что в начале работы системы устанавливаются наиболее общие характеристики радужки, которые затем уточняются на следующих шагах.

• Предложены и программно реализованы методы анализа качества изображений и выделенной на них области радужки с точки зрения точности дальнейшего распознавания, разработано совместное решающее правило для объединения различных показателей качества, предложена методика выбора компромисса между ошибкой отказа в регистрации и ошибкой распознавания.

• Исследованы и разработаны новые методы выделения индивидуальных признаков радужки, создания эталонов радужки, сравнения полученных эталонов с целью идентификации человека.

• Рассмотрена проблема защиты систем распознавания от предъявления поддельных моделей глаза, изучены способы обнаружения таких ситуаций, основанные на различных физических принципах, часть этих способов реализована алгоритмически и программно, осуществлена проверка работоспособности на собранной базе данных поддельных изображений.

Апробация работы. Основные результаты диссертации докладывались на следующих конференциях: 23rd International Congress on High-Speed Photography and Photonics - Москва, 1998; 5th International Conference on Pattern Recognition and Information Processing - Минск, 1999; International Conference on Computer Vision and Graphics, Graphicon’99 - Москва, 1999; 5-я Международная конференция «Распознавание образов и анализ изображений: новые информационные технологии» - Самара, 2000; 6th Open Russian-German Workshop on Pattern Recognition and Image Understanding - Алтай, 2003; Всероссийская конференция BIOMETRICS 2003 AIA - Москва, 2003; Samsung developers conference г.Сеул, Республика Корея, 2004; 4-я Международная биометрическая конференция BIOMETRICS AIA «Транспортные и пассажирские системы» - Москва, 2006; 5-я Международная биометрическая конференция BIOMETRICS AIA «Паспортные и правоохранительные системы» - Москва, 2006; 7-я Международная биометрическая конференция BIOMETRICS AIA «Транспортные и пассажирские системы» - Москва, 2007; 9th International Conference on Pattern Recognition and Image Analysis, PRIA-9-2008 - Нижний Новгород, 2008; 3rd International Workshop on Image Mining. Theory and Applications. IMTA-2010 г.Анже, Франция, 2010; International Conference on Computer Graphics, Visualization, Computer Vision and Image Processing. CGVCVIP-2010 - г.Фрайбург, Германия, 2010; 10th International Conference on Pattern Recognition and Image Analysis, PRIA-10-2010 - С.Петербург, 2010; Международная конференция по прикладной математике и информатике, посвящённая 100-летию со дня рождения академика А.А.Дородницына - Москва, 2010; 11th International Conference on Pattern Recognition and Information Processing, PRIP-2011 - Минск, 2011; International Conference on Computer Graphics, Visualization, Computer Vision and Image Processing, CGVCVIP-2011 - г.Рим, Италия, 2011; Математические методы распознавания образов: 15-я Всероссийская конференция - Петрозаводск, 2011; 4th International Workshop on Image Mining. Theory and Applications. г. Барселона, Испания, 2013; International Conference on Computer Graphics, Visualization, Computer Vision and Image Processing. CGVCVIP-2013 - г.Прага, Чехия, 2013; 11th International Conference Pattern Recognition and Image Analysis.

PRIA-2013 - Самара, 2013; Конференция «Математические методы распознавания образов». ММРО-16 - Казань, 2013; SIAM Conference on Imaging Science.

SIAM-IS14 - г.Гонконг, Китай, 2014.

Публикации. Материалы диссертации опубликованы в 43 печатных работах, из них 13 статей в журналах из списка ВАК.

Личный вклад автора. Содержание диссертации и основные положения, выносимые на защиту, отражают персональный вклад автора в опубликованные работы. Подготовка к публикации полученных результатов проводилась совместно с соавторами, причем вклад диссертанта был определяющим.

Все представленные в диссертации результаты получены лично автором.

Структура и объём диссертации. Диссертация состоит из введения, обзора литературы, 5 глав, заключения и библиографии. Общий объём диссертации 290 страниц, из них 226 страниц текста, включая 70 рисунков и таблицы. Библиография включает 496 наименований на 49 страницах.

Краткая характеристика содержания работы. Диссертация включает в себя пять глав и два приложения.

Глава 1. Модели радужной оболочки глаза. Описан глаз человека с точки зрения автоматической обработки и распознавания фотографических и видео изображений его радужной оболочки (РОГ). Представлены модели РОГ, общая схема биометрического распознавания. Кроме того, кратко описаны основные используемые в работе математические методы обработки данных и предварительная обработка изображений глаза.

Глава 2. Выделение области радужки на изображении. Представлены несколько классов методов обработки изображений, используемых для выделения области радужки: проекционные, оптимизационные, морфологические, методология Хафа и корреляционный поиск. Описаны конкретные алгоритмы, реализующие данные методы и используемые в системах автоматической обработки изображений РОГ.

Глава 3. Система методов выделения области радужки. Представлена система, объединяющая методы главы 2 в единиый комплекс, осуществляющий сегментацию изображений РОГ и результаты работы этого комплекса алгоритмов с базами данных.

Глава 4. Методы оценки качества выделения радужки на изображении. Рассмотрена задача оценки качества изображения и проведённой на нём сегментации РОГ. Представлены методы оценки качества, использующие разнородные признаки как изображения в целом, так и характеристики области РОГ.

Глава 5. Методы создания и сравнения эталонов радужки. Описаны методы выделения признаков, создания биометрических эталонов РОГ, сравнения полученных эталонов. Предложены некоторые решения проблемы ускорения поиска соответствия в больших базах данных.

Приложение А. Использованные базы данных. Описаны базы данных, используемые в работе для проверки методов и алгоритмов.

Приложение Б. Устройства. Представлены приборы, осуществляющие автоматическую обработку изображений РОГ с применением исследованных в диссертационной работе методов и алгоритмов.

Модели радужной оболочки глаза Автоматическая обработка изображений возникла с появлением первых электронных средств регистрации [13]. Эти устройства были аналоговыми, что давало высокую скорость обработки данных, но весьма ограниченный набор методов и получаемых признаков [44]. В области автоматической обработки радужки следует отметить фотоэлектронный и сканирующий пупиллографы (приборы регистрации изменений размера зрачка во времени), разработанные во ВНИИ медицинского приборостроения [18], стр.55-58. Эти приборы созданы на основе фотодиодов, регистрации изображения как такового на них не производилось. Изображения в форме, пригодной для нетривиальной обработки и выделения разнообразных признаков появились в распоряжении исследователей с внедрением цифровых систем.

В классических трудах Розенфельда [118], Ярославского [178], Оппенгейма [104], Хуанга [170], Гренандера [40], Прэтта [112], Марра [76] предложены и обоснованы различные методы автоматической цифровой обработки изображений. Следует отметить, что в этих ранных работах большой акцент делался на автоматизированную (то есть с участием человека), но не полностью автоматическую работу. В связи с этим значительное внимание уделено методам представления видеоданных в форме, пригодной для восприятия человеком, как то процедурам глобальной нормализации, эквализации, гамма-коррекции изображений. Сутью этих процедур является применение монотонной функции преобразования значений яркости элементов изображения, а целью — улучшение восприятия изображения человеком. Поскольку яркости цифровых изображений заданы дискретным набором чисел (как правило, это целые числа в диапазоне [0; 255]), практически любое преобразование яркости f : [0; 255] [0; 255] переводит несколько исходных значений яркости в единственное, то есть преобразование не является взаимно однозначным, обратимым, и следовательно, при его использовании теряется информация. По этой причине такой тип предобработки изображений практически не используется при сегментации и выделении информативных признаков РОГ.

Достаточно быстро обработка изображений разделилась на две части: анализ и синтез [40], при этом анализ изображений становился всё более ориентированным на автоматическую обработку, следуя за развитием вычислительной техники. Большую роль сыграли работы Ю.И.Журавлёва и его учеников [45, 57–61, 208, 283, 285, 286, 487–489, 491–493], В.А.Сойфера [110, 135, 136, 444–447], В.Л.Арлазарова [2–4], Н.Г.Загоруйко [63, 64, 67], Г.Г.Себрякова [126, 127], В.С.Титова [41, 46, 150, 151, 456, 457], С.С.Садыкова [56, 106, 123, 124, 396], Ю.П.Пытьева [113–115, 419, 420] А.В.Гончарского [30], А.Л.Горелика и В.А.Скрипкина [31]. В начале 2000-х произошло обогащение математического аппарата новыми моделями, формирование концепции компьютерного зрения [29, 43, 161, 177, 438]. К трудам, в которых развиваются инженерные и прикладные подходы относятся исследования по цифровой обработке сигналов [7, 20, 128, 139, 142, 209, 210, 242, 473], анализу контуров [92, 163].

Автоматическое распознавание биометрических характеристик привлекло значительное внимание исследователей с появлением достаточно чувствительных детекторов и мощных вычислителей благодаря развитию электроники со второй половины 1990-х годов. Российскими учёными были изучены различные модальности: лицо [5, 6, 15, 55, 98, 125, 439, 440, 449], в том числе его трёхмерное представление [77, 263, 329, 351, 352], радужка [25, 53, 54, 93, 95, 96, 107, 143], глазное дно [137], подпись [380, 450], отпечаток пальца [102, 159, 319, 443], форма кисти руки [201, 328, 364, 365]. Были исследованы возможности объединения различных модальностей, так называемая мультибиометрия [98, 133, 158], в том числе сделаны попытки объединения распознавания изображения лица и отпечатка пальца [155, 156], распознавания изображения лица и голоса [384, 385].

Обработка изображений радужки используется не только в целях идентификации человека. Важным приложением является пупиллодиагностика — определение функционального состояния организма человека по реакции зрачка на раздражитель. Основой пупиллодиагностики служит измерение размеров размеров зрачка — пупиллометрия или пупиллография. По отношению к высшей нервной деятельности, зрачковая реакция — это безусловный адаптивный фазический рефлекс, особенности протекания которого могут соотноситься с теми или иными типологическими особенностями нервной системы. Возможность использования реакций зрачка в качестве объективного критерия для оценки состояния вегетативной нервной системы доказана рядом исследовательских работ [19, 91, 192]. Наблюдение за состоянием зрачка давно используется в медицинской практике. Эмоциональные состояния, концентрация внимания, умственные усилия изменяют тонус того или иного отдела вегетативной нервной системы. Изменение размеров зрачка можно зафиксировать при таких эмоциях как страх, гнев, волнение, печаль, подавленность, удовольствие [389]. Несмотря на кажущуюся доступность, регистрация и математическая обработка зрачкового рефлекса представляют большие трудности в связи со своей быстротечностью и относительно малыми размерами биологического объекта, т.е. зрачка.

История методов фиксации зрачковой реакции началась в конце 19 века, когда Du Bois-Reymond и P.Garten предприняли первые попытки фотографировать зрачок. В России Л.Г.Беллярминов впервые ввёл термины «пупиллограф» и «пупиллограмма» для сконструированного им прибора по регистрации динамики размера зрачка [19]. Пупиллограмма представляет собой кривую, отражающую размеры зрачка на протяжении всей его реакции в ответ на какойлибо стимул, например, световую вспышку. Для оценки состояния определённое значение имеют различные параметры этой кривой: исходный размер зрачка, амплитудный диапазон и частота колебаний его размеров, длительность задержки наступления реакции на световую вспышку, степень и скорость сокращения зрачка, параметры фазы восстановления и др. Основные проблемы, которые возникали в начале применения приборов для регистрации зрачкового рефлекса, связаны с ярким фоновым освещением, необходимым для фото и киносъемки зрачка, вызывавшим его сильное сужение, и с длительностью и трудоемкостью обработки полученных результатов [19]. На сегодняшний день при разработке методов пупиллодиагностики эти проблемы решены. Современные объективные методы регистрации зрачкового рефлекса представляют собой аппаратно-программные компьютерные комплексы, регистрирующие зрачковую реакцию обоих глаз одновременно в режиме «живого видео» с последующей автоматической обработкой. Применение метода регистрации зрачкового рефлекса в наркологической, неврологической клинике, в области спорта доказало высокую степень надежности и валидности его показателей для выявления изменений состояния вегетативной нервной системы [309, 363, 389].

1.1. Глаз как объект распознавания Радужная оболочка глаза, радужка (iris, древнегреческое «радуга») – тонкая подвижная диафрагма глаза у позвоночных. Она составляет самую переднюю часть оболочки глазного яблока и имеет вид круговой, вертикально стоящей пластинки с круглым отверстием, называемым зрачком. Радужка играет роль диафрагмы, регулирующей количество света, поступающего в глаз, для чего зрачок при сильном свете суживается, а при слабом расширяется. Наружным своим краем радужка соединена с ресничным телом и склерой, внутренний же её край, окружающий зрачок, свободен [19, 111]. Пример изображения радужки приведён на Рис.1.1.

В радужке различают переднюю поверхность, обращенную к роговице, и заднюю, прилегающую к хрусталику. Передняя поверхность, видимая через прозрачную роговицу, имеет различную окраску у разных людей и обусловливает цвет их глаз. В радужке присутствуют два основных пигмента: меланин (эумеланин) и липофусцин. Видимая окраска радужки зависит от концентрации и распределения пигментов в её толще. При этом различные спектры поглощения двух пигментов обусловливают изменение видимых интенсивностей деталей радужки при освещении светом с разными длинами волн.

Размеры и форма. Радужка имеет кольцевую форму и размеры в среднем по горизонтали A 12.5 миллиметров и по вертикали B 12.0 миллиметров [19]. Внешний контур радужки, её граница со склерой –– почти идеальный эллипс, и может быть приближённо представлена окружностью. Внешний контур радужки постоянен и имеет практически одинаковую форму и размеры для всех людей. Внутренняя граница радужки задаётся зрачком. У здорового человека зрачок круглый, а его центр несколько смещён относительно центра радужки по направлению к кончику носа [19, 71]. Достаточно часто встречаются незначительные децентрации и отклонения формы зрачка от круговой (См.

Рис.1.2).

Децентрации и отличие от круговой формы определяются патологиями, и нарастают с возрастом. Вариации положения центра и отношения радиуса зрачка в заданном направлении к среднему могут достигать 20% для одного человека.

Проведённые статистические исследования изображений радужки позволяют сформулировать взаимные ограничения на размеры и положение зрачка и радужки:

где (xp, yp ) — координаты центра окружности, аппроксимирующей зрачок, rP — радиус этой окружности, (xI, yI ), rI — координаты центра и радиус окружности радужки, d — расстояние между центрами окружностей зрачка и радужки.

Первое из неравенств (1.1) значит, что радиус радужки не может превосходить радиус зрачка более чем в 7 раз. Второе неравенство ввожит ограничение с другой стороны: зрачок не может занимать больше 75% радужки. Третье неравенство означает, что центр радужки лежит внутри зрачка. Четвёртое — отрезки между окружностями зрачка и радужки, отсечённые прямой, проходящей через их центры, не отличаются по длине более чем в два раза.

Рисунок радужки. Рисунок радужки обусловлен радиально расположенными нитями (трабекулами) переплетёнными между собой соединительнотканными перекладинами, идущими в разных направлениях, и уникален для каждого человека. Рисунок радужки у большинства людей малоконтрастен (диапазон яркостей точек изображения радужки много меньше диапазона яркостей изображения глаза, включающего тёмный зрачок и светлую склеру). Кроме того, некоторые типы радужки имеют тонкую текстуру (на них нет крупных ярких или тёмных элементов). Это выдвигает высокие требования к системе регистрации изображения. В зависимости от длины волны света, в котором регистрируется радужка, на ней проявляются различные детали, причём их выраженность зависит от типа глаз. Например, большинство светлых глаз даёт наиболее чёткий рисунок в видимом свете. При переходе в ИК этот рисунок постепенно размывается и почти исчезает на длинах волн больших 900нм. Напротив, структуры тёмных глаз, характерных для жителей экваториального пояса, практически незаметны в видимом свете, но чётко проявляются в инфракрасном диапазоне. Поэтому до сих пор остаётся не решён о том, какая длина волны оптимальна.

Устойчивость рисунка. Формирование структур радужки в основном заканчивается на восьмом месяце внутриутробного развития и за дальнейшую жизнь практически не претерпевает изменений, за исключением вызванных травмами или патологиями глаза. Изменение цвета радужки (насыщение пигментом) продолжается в первые несколько лет жизни, что, впрочем, не затрагивает форму её элементов. Окончательно цвет глаз устанавливается к 10— годам. У пожилых людей глаза иногда бледнеют, что связано с депигментацией, происходящей по причине развития склеротических и дистрофических процессов. В целом, на протяжении большого периода жизни форма элементов радужки остается постоянной [18, 19, 71, 111, 310, 315]. Это позволяет говорить о высокой устойчивости рисунка радужки.

Информативность. Поскольку радужка является практически плоским объектом простой формы и неизменных размеров, вариации её изображения, создаваемые изменением условий регистрации, малы (относительно других биометрических данных) и легко могут быть скомпенсированы, позволяя отделить информацию, действительно относящуюся к индивидуальности данной радужки, от случайных искажений при наблюдении (выраженность). Радужка имеет сложный рисунок, состоящий из многих деталей. Поэтому из изображения радужки можно получить большое количество параметров (высокая информативность). Как показано в [255], информационная ёмкость изображения радужки радиусом 200 пикселов составляет не менее 200 бит.

Вариации изображений радужки. В идентификации по радужке, как и в любой проблеме распознавания, основная трудность состоит в получении параметров объекта, уникальных в классе ему подобных и инвариантных относительно условий регистрации и изменчивости самого объекта. Таким образом, параметры рисунка радужки необходимо извлечь из её изображения, отсеяв вариации двух классов: вариации самой радужки и изменения условий съёмки.

Изменения радужки как таковой. Изменения РОГ можно разделить на долговременные изменения рисунка и быстрые изменения формы, которые определяются сокращением/расширением зрачка. Радужная оболочка, выполняя функцию диафрагмы, обладает большой подвижностью. Основа радужки состоит из соединительной ткани, имеющей архитектуру решётки, в которую вставлены сосуды, идущие радиально, от периферии к зрачку. Эти сосуды вместе с соединительной тканью образуют эластичный скелет радужки, позволяющий ей легко изменяться по величине. Сами движения радужной оболочки осуществляются мышечной системой, залегающей в её толще. Эта система состоит из мышечных волокон, которые частью располагаются кольцеобразно вокруг зрачка, образуя мышцу, суживающую зрачок (сфинктер), а частью расходятся радиально от зрачкового отверстия и образуют мышцу, расширяющую зрачок (дилататор). Мышцы действуют взаимообратно: при сужении зрачка сфинктер растягивает дилататор, а при расширении дилататор расправляет сфинктер.

Благодаря этому достигается точность и быстрота движений радужки. Cфинктер иннервируется парасимпатической нервной системой, a дилататор — симпатической. Под воздействием изменений освещённости, при перемещении фокуса внимания и в зависимости от физического и психического состояния зрачок живого глаза постоянно меняет свой размер. Зрачок также совершает апериодические самопроизвольные движения (гиппус). В результате этих движений зрачка изменяется размер радужки и, соответственно, деформируется её рисунок. Толщина радужки минимальна вокруг зрачка и возрастает при удалении от него, что схематично представлено на Рис.1.3. При изменении размеров зрачка участки радужки деформируются тем сильнее, чем ближе они к зрачку.

Рис. 1.3. Схематическая модель радужки как эластичного объекта.

Используя модель радужки, можно предсказать, куда сдвинется и какую форму примет данный элемент радужки при том или ином изменении размера зрачка.

Изменения условий регистрации. Роговица глаза отражает окружающие предметы. Эти отражения, особенно блики от источников света, перекрывают картину радужки и могут создавать вариации яркости изображения во много раз большие, чем информативные элементы радужки. Поэтому представляется невозможным не использовать собственную подсветку. В этом состоит принципиальное отличие распознавания по РОГ от систем, использующих изображение лица. Для лица посторонняя засветка также является большой проблемой, тем не менее, на изображении лица, освещённого посторонними, случайно расположенными источниками, можно извлечь инвариантные признаки, как то:

размеры и форму элементов лица, его рельеф и т.п., а для радужки это невозможно. Подсветка должна давать в области регистрации радужек освещённость в несколько раз превышающую ту, что создаётся посторонними источниками.

Видимый свет с такой интенсивностью вызывает большое неудобство. Поэтому во всех современных системах используется инфракрасная подсветка.

Пространственное положение относительно камеры. Так как радужка является объектом небольшого размера, то для получения её изображения приемлемого качества (в фокусе и достаточного разрешения) требуется весьма точное позиционирование глаз (головы) пользователя. Например, даже при получении изображения радужки с диаметром 100 пикселей, определяемого стандартом [32] как низкокачественное, на камере с разрешением 1000 800 пикселов, глаз пользователя должен попасть в зону 9 7 сантиметров.

Угловая ориентация относительно камер. Поскольку клиент системы распознавания по радужке сотрудничает с ней, (иначе трудно себе представить такую систему при нынешнем уровне развития технологии) то есть прилагает осознанные усилия к тому, чтобы зарегистрироваться, его можно инструктировать смотреть прямо в камеру или на фиксатор взгляда, расположенный в непосредственной близости от неё так, что радужка видна в наилучшем ракурсе. Исключения составляют случаи сильного нистагма или косоглазия. К сожалению, статистики по этим относительно редким явлениям и их влиянию на работу систем распознавания в открытом доступе нет. Таким образом, из трёх угловых степеней свободы радужки трудность представляет одна: поворот относительно оси — луча зрения камеры. Точное определение угла этого поворота и, следовательно, нормировка возможны для бинокулярных систем или монокулярных со вспомогательной камерой, снимающей лицо в целях позиционирования. В монокулярной системе возможна угловая нормировка по положению слёзного мешка глаза, но методы поиска слёзного мешка на изображении ненадёжны, а определяемый угол обладает погрешностью в несколько градусов.

Таким образом, в монокулярной системе при сравнении изображений радужек требуется сопоставлять эталон нескольким изображениям, повёрнутым на различные углы в пределах возможных изменений наклона головы пользователя.

Это в соответствующее число раз увеличивает время, затраченное на сравнение, и вероятность ложного допуска.

1.2. Модели радужной оболочки глаза Радужка может изменять свою форму, при этом её элементы смещаются от своих начальных положений, см. Рис.1.4.

Поэтому для распознавания, основанного на текстуре, требуется совмещение (явное или неявное) текстурных элементов для двух разных регистраций, с учётом возможного изменения формы зрачка. Видится два способа решения этой задачи. Во-первых, система может приводить радужку к размеру, который та имела при регистрации, посредством манипуляций с освещением и сравнивать изображения радужек со зрачком одного размера. Это, однако, возможно лишь при сценарии верификации — сравнении с единственным эталоном. Добиться же того, чтобы зрачки всех людей принимали некоторый заданный размер, один для всех, не представляется возможным. Кроме того, такой способ требует подсветки видимым светом, и, следовательно, неудобен для клиента.

Второй путь — использование модели радужки. Поэтому требуются модели, которые учитывают и позволяют скомпенсировать перемещения элементов радужки, связанные с движеиями зрачка, с тем, чтобы на двух изображениях радужки, зарегистрированных с разным размером зрачка, сопоставить соответствующие элементы текстуры. Такие модели можно условно разделить на два класса: основанные на описании физической структуры радужки и работающие только с её изображениями.

1.2.1. Моделирование толщины радужки Радужная оболочка глаза представляет собой кольцо неравной толщины, утоньшающееся во внутренней части. При изменении размеров зрачка радужка испытывает деформации, которые можно описать как ламинарное изменение формы упругого тела, представленного на Рис. 1.3. Это тело обладает радиальной симметрией. Вдоль радиуса жёсткость меняется из-за изменения сечения.

По этой причине относительное смещение элементов радужки различно и зависит от расстояния до центра зрачка. Рассмотрим несколько моделей формы радужки. Начало координат положим в центре зрачка, также будем считать границы зрачка и радужки концентрическими окружностями.

Во-первых, можно предположить, что толщина РОГ одинакова по всей площади, то есть она представляет собой кольцо постоянной толщины. Обозначим толщину, зависисящую от радиуса T (r). Для первой модели T (r) const.

Начальный радиус зрачка rP, конечный rP, радиус радужки rI. В условиях радиальной симметрии и движения элементов радужки вдоль радиусов можно рассматривать поведение системы вдоль некоторой радиальной оси, для единственной координаты r. Общее растяжение, то есть смещение точек, находящихся на границе зрачка A = rP rP. Растяжение в точке r (т.е. в сечении кольца радужки цилиндром такого радиуса) обратно пропорционально площади сечения:

Смещение точки, находящейся на расстоянии r:

Нормировку C2 находим из граничных условий:

Отсюда получаем величину смещения элемента РОГ в зависимости от расстояния до центра зрачка:

Однако, анатомические исследования показывают, что толщина радужки уменьшается вокруг зрачка. Рассмотрим модель линейной зависимости толщины от расстояния до центра. Обозначим TP и TI — толщина радужки около внутренней и внешней границ соответственно. Линейная зависимость T (r) можно определить пропорцией:

откуда Подставляя полученную зависимость T (r) в (1.2), получим:

Находим C2 из условия A(rP ) = rI rI, подставляем в (1.9):

В эту формулу помимо радиусов радужки и зрачка, которые могут быть определены непосредственно, входит выражение включающее — отношение толщин радужки у внешней и внутренней границ.

Этот параметр модели не может быть измерен непосредственно и определялся по экспериментальным данным.

Можно упростить модель, приняв 0, то есть считать зависимость толщины радужки от радиуса не линейной, а пропорциональной. Тогда (1.10) превращается в:

и после нахождения нормировки C3 из краевых условий:

Таким образом, высказывая различные модельные предположения об изменении толщины и упругости радужки в зависимости от расстояния до центра зрачка, можно получить различные модели движения её элементов. Экспериментальная проверка адекватности этих моделей проводилась на базе данных пупиллометрических изображений Iritech (см. Приложение А) с использованием методов оптических потоков и групп корреляторов (см. Главу 2).

При тестировании применялись две методики: прямая и обратная. Использовались последовательности изображений РОГ с меняющимся размером зрачка. На каждом изображении последовательностей были определены окружности радужк и зрачка.

Методика прямого тестирования. При помощи оптических потоков производилось отслеживание движения элементов радужной оболочки на последовательности изображений. Экспериментальные величины смещения элементов радужки, имеющих определённые расстояния до центра при известном размере зрачка, сравнивались со значениями, вычисленными на основании тестируемой модели, и определялась невязка.

Обратная методика. На последовательности изображений одного глаза с постепенно меняющимся размером зрачка были отмечены окружности зрачка и радужки. Первое изображение последовательности бралось в качестве базового.

Для каждого из остальных изображений брались размеры радужки и производился синтез изображеня радужки из базового, деформированного согласно модели. Синтезированное изображение сравнивалось с реальным и определялась невязка.

Оба метода показали наибольшую адекватность третьей модели, задаваемой уравнением (1.13).

1.2.2. Модели конформного преобразования Признаки эталона, используемые для распознавания, вычисляются по так называемому полярному представлению радужки. Это представление является прямоугольным изображением с фиксированного размера. Радужка, заключённая между двумя окружностями (внешней и внутренней границами), конформно отображается в этот прямоугольник, так, что нижняя и верхняя стороны прямоугольника соответствуют внутренней и внешней границам, а правая и левая стороны — правой и левой сторонам некоторого луча, исходящего из центра и секущего кольцо. Простейшей моделью конформного преобразования является полностью радиально-симметричное полярное преобразование. Обозначим rP — радиус зрачка, rI — радиус радужки, [0; 2) — угол и [0; P ] — радиус полярных координат. На Рис. 1.5 представлена радиальна-симметричная модель.

Конформное преобразование записывается как Такое преобразование можно было бы использовать при равномерном растяжении радужки. Для учёта неравномерности, вызванной различной упругостью радужки в цилиндрических сечениях разного радиуса, (1.14) преобразуется:

где T (r) — одна из моделей растяжения (1.5), (1.10) или (1.13).

Рассмотрена модель, основанная на предположении о радиальной симметрии радужки, то есть окружности зрачка и радужки считаются концентрическими. Однако, в общем случае это не так, отклонения центра зрачка от центра радужки могут достигать 10% радиуса радужки и 100% радиуса зрачка (то есть могут возникать ситуации, когда центр радужки лежит на окружности зрачка). Поэтому конформное преобразование кольца радужки в прямоугольник, используемый для вычисления признаков эталона, проводимое без учёта неконцентричности, приводит к ошибкам: захвату части изображения, не являющегося радужкой или пропуску части изображения радужки. Для учёта неконцентричности предложены и испытаны несколько моделей преобразования.

Первая модель сохраняет радиальную симметричность по углу, но учитывает то, что отрезки, отсекаемые на радужке лучами при полярном преобразовании, могут быть разными. Эта модель представлена на Рис. 1.6.

Поместим начало координат в центр зрачка. Окружность зрачка описывается уравнением x2 +y 2 = rP. Центр радужки находится в точке (xI, yI ), окружность радужки: (xxI )2 +(y yI )2 = rI. Точка с углом на окружности зрачка имеет координаты (cos rP, sin rP ), точка на окружности радужки — координаты (xP + cos rP,yP + sin rP ). Прямая, проходящая через центр зрачка под углом к оси абсцисс, задаётся уравнением v = x sin y cos = 0. Эта прямая пересекается с окружностью радужки в точках (x, y) = (cos R(), sin R()), где R() = cos xI + sin yI + rI + v 2. Выражение преобразования (1.14) преобразуется для данной модели в где T (r) — одна из моделей растяжения (1.5), (1.10) или (1.13).

Равномерная по углу модель предполагает, что центр зрачка при изменениях его размера не двигается относительно окружности радужки, то есть xP, yP = const. Однако, как показывают эксперименты, это не так. Зрачок совершает движения таким образом, что все расстояния от точек его границы, отложенных вдоль неё под определённым углом, до соответствующих точек границы радужки, отложенных под тем же углом, меняются пропорционально.

Это можно проиллюстрировать следующим образом, см. Рис. 1.7.

Изначально радужка имеет полностью радиально-симметричную форму, как на Рис.(1.5). При этом точки границы радужки и границы зрачка, имеющие одинаковые угловые координаты (лежащие на одном радиусе), связаны друг с другом радиальными мышцами-сократителями. Затем зрачок смещается относительно радужки, оставаясь круглым, при этом связи соответственных точек сохраняются, хотя и деформируются. При дальнейших движениях граница зрачка перемещается таким образом, чтобы расстояния между соответственными точками изменялись пропорционально. Нетрудно показать, что такое движение порождает окружности зрачка, полученные при сжимающем отображании плоскости с неподвижной точкой, находящейся на линии, соединяющей центры зрачка и радужки. Поместим начало координат в центр радужки. Тогда окружность радужки описывается уравнением x2 + y 2 = rI. Окружность зрачка описывается уравнением (x xP )2 + (y yP )2 = rP. Точка с углом на окружности радужки имеет координаты (cos rI, sin rI ), точка на окружности зрачка — координаты (xP + cos rP,yP + sin rP ). Конформное преобразование задаётся как где T (r) — одна из моделей растяжения (1.5), (1.10) или (1.13).

Экспериментальная проверка адекватности конформных преобразований проводилась методом оценки качества распознавания. Из базы данных изображений были сгенерированы биометрические эталоны, которые далее сравнивались между собой. Эквивалентная ошибка (то есть ошибка первого рода, равная ошибке второго рода) служила мерой адекватности модели: чем ниже ошибка, тем лучше считалась модель масштабирования. Такой тест выявил преимущество последней из моделей (модель эквивалентных углов), которая даёт преобразование (1.17).

1.3. Общая схема распознавания по радужке Радужка является достаточно простым объектом для распознавания (если сравнивать с иными классами объектов). Однако с другой стороны, к системам распознавания по радужке предъявляются жёсткие требования по надёжности, точности и устойчивости выделения при наличии различных помех и изменениях условий съёмки. Устойчивость и точность определения элементов радужки на изображения в современных системах уже превышают эти характеристики для человека-эксперта.

Все существующие в настоящее время методы автоматического распознавания радужки глаза по её изображениям реализуют следующую схему:

• регистрация изображений глаза;

• выделение области интереса (радужки) на изображении;

• оценка качества изображения и качества выделения;

• вычисление признаков и формирование из них эталона радужки;

• сравнение двух наборов признаков.

Эта последовательность представлена блок-схемой на Рис.1.8.

Рис. 1.8. Схема распознавания по радужке глаза.

Блок 1. Регистрация изображения глаза производится специализированной камерой, работающей в ближнем инфракрасном диапазоне (от 850 до нм). Камера снабжена полосовым фильтром, гасящим области спектра вне пределов этой полосы и инфракрасным осветителем, имеющим узкий спектральный максимум в этой полосе. В совокупности хорошо подобранныя комбинация фильтра и осветителя обеспечивает преобладание в световом потоке, поступающем на сенсор камеры, яркости осветителя над посторонними конкурирующими засветками от иных источников света — Солнца, дневного неба, ламп накаливания. В результате блики от посторонних предметов, отражающиеся в роговице и перекрывающие рисунок радужки, подавляются. При этом сохраняется безопасный для здоровья уровень мощности ИК излучения осветителя.

Сразу же после ввода изображения проводится его предобработка с целью удаления некоторых артефактов (пространственной и яркостной дисторсии), что описано далее в этой главе.

Блок 3. Выделение области радужки на изображении (сегментация) не относится к специфичным алгоритмам распознавания. По сути, это поиск на изображении относительно тёмного объекта, близкого по форме к кругу, содержащего внутри себя концентрический более тёмный объект (зрачок). В большинстве систем добавляется ещё одно условие: внутри зрачка должен находиться яркий блик определенной формы (блик от осветителя). Данная задача может быть решена многими способами, например, поиск концентрических окружностей посредством преобразования Хафа или использования коррелятора для поиска блика заданной формы с последующим обнаружением контуров содержащего этот блик зрачка и далее концентрической зрачку радужки. Специфичным для задачи ссегментации РОГ является наличие век, в большинстве случаев закрывающих верхнюю и нижнюю её части. Некоторые системы выделяют веки явным образом и отбрасывают ложные данные с закрытых участков. Другой подход — не выделять веки как таковые, а выявлять закрытые части по большому различию при сравнении нескольких последовательных снимков [321].

Отбраковка участков, закрытых ресницами, возможна лишь при анализе серии кадров, поскольку текстура изображения, создаваемая ресницами, может быть практически неотличимой от собственной текстуры радужки. Методы, используемые для выделения области РОГ, описаны в Главе 2, оптимальная система методов представлена в Главе 3.

Блок 2. Оценка качества изображения и Блок 4. Оценка качества сегментации включают в себя методы определения пригодности изображения и выделенной на нём области РОГ для дальнейшей обработки (то есть создания биометрического эталона). Процедуру выделения признаков РОГ и создания биометрического эталона можно формально применить к любому изображению, получив при этом структуру данных эталона. Однако, полученный на низкокачественном или плохо сегментированном изображении «эталон» не будет соответствовать реальным биометрическим характеристикам РОГ, а значит не будет распознан при сравнении с другим эталоном, построенным для того же глаза (ошибка первого рода). Для предотвращения такой ситуации необходимо оценивать качество изображений, поступающих в систему. Следует отметить, что проводить сегментацию на некачественном изображении всё равно необходимо (даже в случае, если оно не может использоваться для построения эталона) для использования при позиционировании. Поэтому в Блоке 2 происходит отбраковка изображений с очень низким качеством, на которых высока вероятность произвести ошибочную сегментацию. В Блоке 4 используются совместно показатели качества изображения в целом и области РОГ. Методы этих двух блоков описаны в Главе 4.

Блок 5. Построение эталона радужки состоит из двух основных этапов:

нормирования её изображения и вычисления информативных признаков на нормированном изображении. Нормирование размеров изображения радужки необходимо по двум причинам: различие масштабов снимков и изменение относительного размера и формы зрачка. Нормирование к единому размеру производится исходя из результатов сегментации. Устранить вариации, вызванные изменением размеров и формы зрачка достаточно трудно. Это является одним из основных препятствий повышению точности систем распознавания по радужке. Для наиболее адекватного приведения выделенной области радужки к стандартным размеру и форме используются её модели, описанные ранее в этой главе, сама процедура нормирования, представляющая собой конформное преобразование из кольца в прямоугольник, описана в Главе 5. Вычисление информативных признаков производится на нормированном изображении. Эти признаки представляют собой компоненты спектрального преобразования, описанного в Главе 5.

Блок 6. Накопление и выбор лучшего эталона. Этот блок не всегда присутствует в системах распознавания. Например, при работе системы с регистрациями, представленными единственным изображением (как это происходит во многих сравнительных тестах [302]) нет возможности выбрать лучший эталон из множества, можно лишь принять к распознаванию эталон, созданный для единственного изображения, либо отвергнуть такое изображение (что происходит в блоках 2 и 4). При работе систем, допускающих несколько изображений (чего можно добиться в устройствах, выдающих видео-последовательности), накопление и выбор эталона существенно улучшает характеристики точности. Выбор эталона осуществляется на основании показателей качества, а также с использованием матрицы кросс-корреляции между наакопленными эталонами.

Блок 7. Создание записи для базы данных — техническая процедура формирования записи из собственно эталона, времени регистрации и прочих данных, существенных для конкретного приложения. В данной работе не рассматривается.

Блок 8. Сравнение/поиск среди ранее зарегистрированных. Два основных сценария работы биометрической распознающей системы — верификация и идентификация. Верификация — проверка того, что созданный эталон принадлежит конкретному человеку, ранее зарегистрированному в базе данных.

Идентификация — поиск персоны, которой может принадлежать эталон, среди ранее зарегистрированных.

1.4. Некоторые основные понятия и методы Изображением называется функция I(x, y) = I(p), заданная на плоскости. Здесь используются только растровые изображения, где аргументы x и y являются целыми числами: x, y Z. Целочисленная пара (x, y) = p называется пикселем. Эти значения также ограничены горизонтальным и вертикальным размерами изображения: x [0; W 1], y [0; H 1]. Сама функция I также явдяется целой и ограниченной максимальной яркостью L: I(x, y) Z, I(x, y) [0; L 1]. Таким образом, используемые изображения можно также представить как матрицы с неотрицательными целыми ограниченными значениями. Бинарным изображением называется изображение, имеющее только две яркости I(x, y) {0; 1}.

Гистограммой яркости изображения называется функция, определяющая число пикселей, имеющих определённое значение яркости:

Накопленной или интегральной гистограммой называется функция, определяющая число пикселей, имеющих значение яркости, не превосходящее определённого:

Распространённой операцией [282, 284] обработки изображения является выбор порога яркости с использованием гистограммы:

где l — необходимая доля точек (квантиль), W и H — размеры изображения, то есть W H — число пикселей изображения. С использованием такого порога часто производится бинаризация изображения:

По умолчанию считается, что пиксели со значением 1 являются объектами интереса, в то время как пиксели с нулевой яркостью являются фоновыми. Таким образом, бинаризация (1.21) выделяет точки с высокой яркостью. Для выделения точек с малой яркостью используется бинаризация вида:

Важнейшим понятием является градиент яркости — вектор частных производных функции I(p) по направлениям:

Поскольку используется дискретное представление, то (1.23) превращается в На практике также используется вычисление градиентов масками Прюитта:

Собеля:

Робертса:

где и — диагональные направления. Как правило, интерес представляют направление градиента и отношение величин градиентов, но не сами абсолютные величины градиентов как таковые. Поэтому нормировка градиентов, вычисленных согласно (1.24), (1.25), (1.26), (1.27) чтобы их величины соответствовали градиентам яркости, не производится.

По аналогии с гистограммами яркости строятся гистограммы абсолютных величин градиента, простая:

и накопленная:

Аналогично (1.20) по этой гистограмме вычисляется порог из доли точек:

и производится бинаризация изображения.

Кроме величины перепада яркости важное значение имеет его направление. Во задачах выделения окружности часто известно положение её центра (хотя бы приближённое). В этом случае градиенты яркости в пикселях границы окружности направлены вдоль или приблизительно вдоль прямых, соединяющих центр и этие пиксели. Таким образом, пиксели, составляющие границы окружности, можно выделить по направлению градиента, как удовлетворяющие условию где g — вектор градиента в точке p, c — вектор координат центра, T — пороговое значение угла, зависящее от точности определения центра и шума изображения. Как правило, начало координат при решении задач поиска окружности с известным центром переносится в точку c, тогда (1.31) упрощается:

Многие методы поиска объектов на изображении основаны на том, что первоначально из каких-либо соображений выделяются пиксели, которые могут входить в состав искомого объекта с существенно большей вероятностью, чем невыделенные пиксели. Такие пиксели будем называть кандидатами. Например, при поиске тёмного круга кандидатами будут являться пиксели, имеющие малое значение яркости, при поиске окружности (границы круга) кандидатами будут пиксели с высоким градиентом яркости и т.п. Кандидатами могут являться не только отдельные пиксели, но и более сложные объекты, например пары, тройки, группы пикселей. Качество выделения кандидатов существенно влияет на результаты работы методов поиска.

Для уменьшения размерности входных данных и их агрегирования с целью выявления особенностей используется проецирование. Проецирование применяется ко множеству пикселей изображения (пикселей-кандидатов) K = {pi }.

Проекция множества точек на ось, то есть прямую, заданную уравнением = cos x + sin y:

Для дискретного случая пикселей-кандидатов:

При проекции на горизонтальную и вертикальную оси, то есть = /2 и = соответственно, (1.34) упрощается до:

Поскольку границы радужки представляют собой близкие к окружности контуры, большое значение в работе имеют методы поиска и выделения кругов и окружностей на изображении. Мощным методом обработки округлых объектов и контуров является круговая проекция. Пусть на изображении существует округлая область, и каким-либо методом выделены некоторые пиксели её границы, составляющие множество кандидатов K. Во множестве кандидатов неизбежно содержатся и шумовые пиксели. Пусть найден приблизительный центр этой области. Для простоты записи перенесём начало координат в эту точку.

Назовём круговой проекцией функцию Это значит, что для каждого радиуса определяется доля кандидатов среди всех пикселей, лежащих на таком расстоянии от центра. Точки округлой границы лежат на примерно одинаковом расстоянии от центра, поэтому полученные из них кандидаты при вычислении круговой проекции попадут с одну или несколько рядом лежащих точек проекции. Остальные, некруглые, неконцентрические центру глаза контуры образуют достаточно равномерное распределение без сгущений. Таким образом, значительные локальные максимумы на круговой проекцияи могут соответствовать концентрическим контурам.

Если круговая проекция вычислялась как нормированные количества точек-кандидатов в концентрических кольцах (то есть аргументом функции P (r) в (1.36) был радиус), то радиальная проекция вычисляется как количества точек-кандидатов в секторах:

где (p) — угловая координата точки p, — шаг дискретизации при построении проекции. Аргумент — дискретный, можно взять [0; 359], если дискретизовать один градус в один отсчёт, тогда = 1/2, угол измеряется в градусах.

Для описания выделенных объектов используется эквивалентный эллипс — эллипс (точнее, эллипс и ограниченная им часть плоскости), имеющий те же моменты инерции нулевого, первого и второго порядка, что и выделенный объект.

Пусть объект K состоит из пикселей:

Тогда его моментами будут Эллипс можно задать пятью параметрами: двумя координатами центра cx и cy, двумя осями a и b, углом наклона, это наиболее практично с точки зрения его описания и постоения решающих правил на этой основе. Координаты центра вычисляются:

Нормированные вторые моменты

M M M MM M M

Угол наклона Оси эллипса Частным случаем эквивалентного эллипса служит эквивалентный круг, определяемый тремя параметрами (две координаты центра cx и cy и радиус r), вычисляемыми проще:

Рассчитывать моменты второго порядка для построения эквивалентного круга нет необходимости.

Введём морфологические операции над бинарным изображением или, что эквивалентно, над множеством его ненулевых пикселей (1.38). Ядром морфологической операции назовём множество пикселей, заданное подобно (1.38).

Как правило, ядрами являются небольшие, радиально-симметричные множества, например Сдвигом множества J на вектор s = (sx, sy ) назовём множество Дилатацией K по ядру J назовём Эрозией K по ядру J назовём Применяются также операции дилатации и эрозии на одномерных массивах.

1.5. Методы предобработки изображений В задачах обработки изображений и распознавания радужки используется ограниченный набор методов предварительной обработки изображений. Это связано с тем, что современные системы регистрации радужки рассчитаны на сотрудничество человека, поэтому условия съёмки достаточно жёстко заданы и характеристики получаемых изображений глаз находятся в узком диапазоне [32, 306]. Соответственно, нет необходимости применять методы фильтрации, улучшения, подавления шумов и т.п. Однако, некоторые методы предварительной обработки сохраняют свою актуальность. Вопросы различных видов калибровки рассмотрены в работах [147–149, 151, 378].

1.5.1. Калибровка изображений Реальные оптические системы обладают рядом аберраций, которые создают искажения изображений, называемые дисторсиями, по сравнению с идеальной проекцией [44]. Дисторсии, вносимые оптической системой, имеющие значение для работы алгоритмов выделения признаков радужки, можно разделить на пространственные и яркостные. Для компенсации этих искажений и приведения изображений к такому виду, который был бы получен в идеальной системе, применяются, соответственно пространственная и яркостная калибровки.

Ограничимся практически значимым случаем центрально-симметричных искажений, то есть таких, которые возникают в системах, имеющих вращательную симметрию, а значит, выделенную оптическую ось.

Пространственная калибровка Радиальное искажение — тип аберрации, который зависит от расстояния, отделяющего оптическую ось от рассматриваемой точки. Радиальное искажение изображения является центрально-симметричным относительно точки, являющейся проекцией оптической оси. Для облегчения дальнейших рассуждений перейдём в полярную систему координат с центром в этой точке. В такой системе радиальное искажение приводит к смещению точки вдоль луча, соединяющего её с началом координат, без изменения угла, при этом величина смещения не зависит от угла, а зависит только от расстояния до центра. Обозначим несмещённое расстояние (которое получилось бы при регистрации идеальной системой) U, расстояние, полученное реальной системой D. Считается доказанным [269], что несмещённое расстояние при радиальном искажении может быть получено как На Рис. 1.9 схематически показаны реальное и восстановленное изображения квадратной сетки. Показана так называемая бочкообразная дисторсия, для которой в формуле (1.49) k1 > 0.

Рис. 1.9. Компенсация пространственной дисторсии. (а) - схематическое изображение квадратной сетки, полученное оптической системой; (б) - восстановленное изображение, согласно (1.49).

Примем ограничение k 1, то есть представление искажения единственным квадратичным членом. Кроме того, следует заметить, что не все точки исходного искажённого изображения при бочкообразной дисторсии в случае непосредственного применения формулы (1.49) будут отображены на исправленном изображении; часть из них уйдёт за его границу. Это не всегда является желательным, поэтому правую часть (1.49) следует домножить на коэффициент (0; 1). Таким образом, получим При измерении для вычисления дисторсии регистрируется изображение квадратной сетки, зафиксированной в зоне резкости в плоскости, перпендикулярной оптической оси камеры. Определяются координаты узлов сетки (xi, yi ), что можно сделать с высокой, субпиксельной точностью. Координаты точки — проекции оптической оси на изображении (cx, cy ) считаются известными. Рассчитываются расстояния до центра Задавая восстановленный вид этой сетки, дающий расстояния Ui, получаем систему уравнений Ui = Di + Di. Воспользуемся формализмом метода наименьших квадратов. Для N измерений:

Взяв производные по k и, получим систему двух линейных уравнений:

Приведя подобные, получаем систему двух линейных уравнений с двумя неизвестными:

Решение этой системы:

Яркостная калибровка Для корректировки яркостной дисторсии выбрана модель:

где B – яркость пикселя зарегистрированного (искажённого) изображения, I – яркость пикселяч исправленного изображения, R – расстояние от проекции оптической оси, являющейся центром дисторсии. Если снимать равномерно освещённый фон, то можно считать I = const. При этом можно положить Bi /N, чтобы суммарная яркость исправленного изображения была равна суммарной яркости исходного. Взяв значения яркости в пикселях изображения и их расстояние до центра дисторсии, воспользуемся формализмом наименьших квадратов:

Дифференцируя (1.57) по и, получаем систему линейных уравнений:

Решение этой системы:

1.5.2. Удаление бликов Обнаружение и удаление бликов является важной частью предобработки изображений радужки. В силу требований наличия искусственной подсветки появление бликов от осветителя является неизбежным. При этом блики могут располагаться в различных местах изображения. Оптимальным случаем является блик, полностью лежащий внутри зрачка, не соприкасающийся с его границей (см. Рис. 1.10(в)). В этом случае блик не влияет на видимую текстуру радужки. Конструкторы систем регистрации изображений РОГ стремятся именно к этой ситуации, прикладывая специальные усилия для максимального сведения оптичекой оси камеры, направления на осветитель и направления на фиксатор взгляда. В результате расположение блика целиком внутри зрачка является наиболее вероятным. Однако достаточно часто приходится сталкиваться с ситуациями, когда блик от осветителя лежит на границе зрачок-радужка (см.

Рис. 1.10(б)) или на самой радужке (см. Рис. 1.10(а)). В первом случае блик может исказить параметры определяемой границы зрачка. И в обоих случаях он создаёт ложные элементы рисунка РОГ.

Рис. 1.10. Примеры разного расположения бликов на одной последовательности изображений глаза Подходы к учёту и обработке бликов на изображениях РОГ можно разбить на два типа:

• определение присутствия и местоположения бликов, как правило, в виде маски пикселей, составляющих блик;

• удаление блика, то есть восстановление участка изображения, закрытого Первая задача для изображений радужки является достаточно простой. Поскольку сама радужка представляет собой относительно тёмный объект, можно выделять блики, имеющие максимальную и близкие к ней яркости, на основании пороговой обработки. Выбирается порог бинаризации, так что пиксели, имеющие большую яркость, считаются принадлежащими блику. Эти пиксели формируют маску бликов. Обозначим множество пикселей блика F, оно определяется как где Tf — яркостной порог выделения блика.

Определённая сложность возникает из-за того, что на изображениях некоторых устройств регистрации блик бывает окружён ореолом. Для таких систем используется расширение маски бликов при помощи операции дилатации. Маска бликов далее используется или для их удаления с изображения, или непосредственно при расчёте информативных признаков, чтобы предотвратить их вычисление в искажённых областях.

Значительно большие трудности вызывает удаление удаление бликов или компенсация их влияния. Методы восстановления информации на основе анализа структрур разработаны в ВЦ РАН под руководством Ю.И.Журавлёва [495], причём изображения могут быть описаны как частный случай двумерных данных. Значительное внимание вопросам интерполяции и восстановления изображений, в том числе методами нечётких множеств уделяется в работах В.С.Титова [146, 149, 151]. Рассмотрены два основных подхода к решению:

• использование битовой маски бликов для исключения этих областей из расчётов. Преимуществом такого метода является его строгость, недостатком — то, что он подходит не для всех методов обработки.

• интерполяция значений в области блика тем или иным образом. Достоинством является универсальность, недостатком — то, что при этом генерируются ложные данные.

Один из вариантов интерполяции предложен в работе [381].

Интерполяция значений яркости в области блика проводится по значениям в пикселях опорного множества. Это множество может определяться посредством ограничивающего прямоугольника; масштабированного эквивалентного эллипса; дилатированной области блика. Ограничивающий прямоугольник пикселей блика (1.60) задаётся при помощи двух своих углов — левого нижнего и правого верхнего (в прямоугольной системе координат с традиционным расположением осей), или, что то же самое, минимальными и максимальными значениями координат:

x1 = min fx, x2 = max fx +, y1 = min fy, y2 = max fy +, (1.61) где — некоторое дополнительное уширение ограничивающего прямоугольника. Опорное множество в этом случае составляют пиксели, принадлежащие ограничивающему прямоугольнику, но не являющиеся частью блика:

Эквивалентный эллипс вычисляется согласно (1.40),(1.42),(1.43) для моментов, рассчитанных по пикселям (1.60). Как вариант можно использовать эквивалентный круг (1.44).

Используются различные виды интерполяции: линейная; квадратичная;

последовательное заполнение исключённой области.

Линейная интерполяция Линейная интерполяция производится методом наименьших квадратов.

Предполагается, что яркость изображения является линейной функцией координат:

Для пикселей (xi ; yi ) из окрестности блика известны их яркости I(xi, yi ) = Ii.

Применяя формализм МНК, минимизируем невязку Приравнивая нулю частные производные по параметрам модели, получаем систему трёх линейных уравнений:

Решив эту систему, получаем параметры a, b, c, подставляя их в (1.63) получаем значений яркостей в пикселях, закрытых бликом.

Квадратичная интерполяция Предполагаем, что яркость изображения является квадратичной функцией координат:

Применяя формализм МНК для пикселей (xi ; yi ) из окрестности блика, минимизируем невязку Приравнивая нулю частные производные по параметрам модели, получаем систему шести линейных уравнений:

Решив эту систему, получаем параметры a, b, c, d, e, f, подставляя их в (1.66) получаем значений яркостей в пикселях, закрытых бликом. Если левый-верхний минор третьего порядка системы (1.68):

мал, то есть выполняется условие то интерполяция производится по линейной модели (1.63).

Последовательное заполнение Наиболее ресурсоёмким, но при этом наиболее адекватным является последовательное заполнение области блика. Начальная опорная область (1.62), заданная одним из описанных способов, последовательно расширяется за счёт пикселей блика:

где F — блик, Gn — опорная область на n-м шаге, J — одно из ядер дилатации (1.45). Значения яркости в присоединяемых пикселях рассчитываются по значениям в соседних пикселях опорной области:

где (p) — множество соседних пикселей опорной области.

1.6. Выводы к первой главе Описан глаз человека с точки зрения автоматической обработки и распознавания фотографических и видео изображений его радужной оболочки (РОГ). Представлены модели РОГ, общая схема биометрического распознавания. Кроме того, кратко описаны основные используемые в работе математические методы обработки данных и предварительная обработка изображений глаза. Эти методы апробированы и внедрены в системах обработки и распознавания радужки.

1. Разработана модель радужки как радиально-симметричного эластичного объекта переменной толщины. Смоделированы и изучены на практике перемещения элементов радужки при радиально-симметричном изменении размеров зрачка, согласно упругости, задаваемой как функция площади сечений радужки. Рассмотрены различные зависимости толщины радужки от расстояния до центра зрачка, задающие различные законы перемещения элементов.

Произведена экспериментальная проверка, выбрана наиболее адекватная модель толщины радужки. Модель и основанные на ней алгоритмы применяются при создании биометрического эталона радужки для увеличения точности распознавания.

2. Разработана модель перемещения элементов радужки на изображении при изменении размеров зрачка. Рассмотрены различные модели перемещения элементов кольца радужки. Экспериментально выбрана модель, наилучшим образом описывающая реальные перемещения элементов радужки. Использование этой модели наравне с первой позволяет существенно увеличить точность совмещения элементов радужки при сопоставлении двух изображений, снятых так, что зрачок имеет различный относительны размер. Модель и основанные на ней алгоритмы применяются при создании биометрического эталона радужки для увеличения точности распознавания. Радиальные модели РОГ этого и предыдущего пунктов исследованы впервые.

3. Описаны методы предобработки изображений в системах регистрации и распознавания радужки. Разработаны методы детектирования и компенсации бликов от осветителя. Апробированы методы пространственной и яркостной калибровки камер, пригодные для исправления дисторсий в системах ввода изображений радужки.

Выделение области радужки на изображении В последнее десятилетие биометрические системы, основанные на обработке изображения радужки глаза, развиваются быстрыми темпами [222, 223, 333].

Важнейшей проблемой при создании таких систем является метод выделения области радужки на изображении. Основой этого выделения служит определение двух окружностей, аппроксимирующих контуры зрачка и радужки глаза.

Разработано и практически применяется множество алгоритмов, решающих одну или обе эти задачи. Классический метод предложен Даугманом [256], использует интегродифференциальный оператор, выделяющий радиально-симметричные структуры, имеет высокие точность и устойчивость, но обладает неприемлемой для большинства приложений вычислительной сложностью; примеры приведены в [184, 200, 204]. Делаются попытки уменьшить вычислительную сложность, например за счёт применения пирамидальной обработки [435]. Поиск трёх параметров положения окружности (две координаты центра и радиус) осуществляется при помощи следующего интегро-дифференциального оператора:

где I(x, y) — яркость изображения. Оператор ищет область на изображении, где достигается максимум частной производной от нормализованного интеграла по r по направлению увеличения величины радиуса. Различные радиальные фильтры в рамках этого подхода рассмотрены в работах [188, 189, 295, 311, 348] и других.

Большое количество методов основано на бинаризации изображения с последующим выделением единственного [347] или наиболее подходящего [278, 340, 400] объекта в качестве зрачка. Выбор порога бинаризации осуществляется простым методом — как минимума яркости [340, 347, 400], исходя из предположения, что зрачок является наиболее темным объектом изображения, или из более тонкого анализа [278]. Все эти методы показывают хорошие результаты на изображениях с тёмным зрачком [207, 231], но неработоспособны на иных типах изображений [404, 414]. То же самое относится и к морфологическим методам обнаружения зрачка. Как простые способы, например, определение центра зрачка в качестве точки, наиболее удаленной от светлых областей [341], так и изощренные [279, 478] существенным образом полагаются на то, что зрачок — наиболее тёмный или хотя бы один из наиболее тёмных объектов изображения. Интересным расширением здесь является возможность специальной подсветки и использования эффекта «красных глаз» [376]. В этой работе предложен осветитель из двух типов диодов, первый из которых даёт обычное тёмное изображение зрачка на фоне более светлой радужки, а второй — напротив, срвнительно более яркое. Осветители синхронизированы с электронным затвором камеры, сто даёт возможность получать соседние кадры с разным типом освещения. В этом случае, особенно при сравнении соседних кадров, где изменение изображения обусловлено лишь сменой типа освещения, но не геометрии сцены, задача поиска зрачка существенно упрощается. Однако, данный метод имеет большой недостаток: не всегда можно добиться столь отчётливого эффекта «красных глаз». Бинаризация может осуществляться не только на исходном изображении по его яркости, но и иными методами, например, по величине спектральной плотности Фурье-преобразования в скользящем окне [417].

Ещё один значительный класс методов — использование различных видов преобразования Хафа для окружности: от прямого построения трехмерного (две координаты центра и радиус) аккумулятора, как предлагается в классической работе [469], до сложных методов с использованием градиентов [206], предобработки изображения с выделением его областей методами кластеризации [415], преобразования с разделенными аккумуляторами [213]. В таких методах сначала производится градиентное преобразование изображения, то есть приближенное вычисление частных производных яркости изображения в каждой точке. Так как зрачок сильно отличается от окружающей его радужки по яркости, на его границе - окружности - значения градиента принимают большие значения. Затем необходимо найти параметры этой окружности, для чего применяют преобразование Хафа [29], позволяющее найти параметры кривых заданного типа, в данном случае — окружностей. Таковы методы, используемые в [471], [421]. В [224] для ускорения также используется предварительная бинаризация изображения. В работе [195] показана эквивалентность преобразованию Хафа для окружности применению некоторого оператора. Разработаны различные методы уменьшения вычислительной сложности задачи. Так в [194] обсуждается идея ввести комплекснозначный аккумулятор, так чтобы модуль значения был равен количеству поданных голосов, а фаза пропорциональная логарифму радиуса. Предложение выделять центр окружности голосованием вдоль направления антиградиента [367]. В целом методы, основанные на выделении границ, в том числе использующие преобразовании Хафа, обладают несомненным преимуществом: для их корректной работы не требуются зрачок/радужка интегрально более темные, чем остальное изображение, достаточно лишь локального перепада яркости. Важное усовершенствование подхода, применяющего преобразование Хафа, а именно использование направления градиента яркости, предложено в [322] и развито в [251]. В пространстве параметров маркируется не целая окружность с центром в заданной точке (как в обобщенном преобразовании), а единственная точка, отстоящая от рассматриваемой на расстояние R в направлении градиента. Сгущения таких точек дают центры окружностей радиуса R, а для поиска окружностей предлагается перебирать всевозможные радиусы [252]. Можно заметить, что все перечисленные методы не используют дополнительной информации об изображении (и в этом случае сложны вычислительно за счёт большого перебора), или же делается искусственное предположение о том, что радиус искомой окружности известен, что неверно в реальных приложениях, где он может изменяться в широких пределах.

Разработано множество других подходов: получение окружности зрачка как описанной окружности для наборов из трех точек (триангуляция) [273], использование активных контуров [425], классификаторов, в том числе Adaboost [290, 441], метода опорных векторов [454], кратномасштабной обработки [243], в том числе вейвлетов [326], комбинации нескольких методов (например, основанного на выделении областей и на выделении границ) [397, 426]. Однако для проверки работоспособности алгоритма как правило используется лишь одна, в лучшем случае две базы изображений радужек. Каждая такая база содержит изображения одного типа. Обычно используется база CASIA [231], как наиболее доступная и давно существующая. В этой базе зрачок располагается в центре изображения и в такой области (а часто и на всем изображении) является единственным значимым темным объектом. Получить алгоритм, надежно определяющий его координаты и радиус, в этом случае не составляет труда. Следует также отметить, что практически все разработчики методов определения зрачка стремятся сразу (применением одного метода) решить задачу полностью, а именно найти все три параметра аппроксимирующей окружности (x0, y0, r), причем с «окончательной» точностью. Именно по этой причине большинство имеющихся методов непригодно для работы с изображениями UBIRIS, на многих из которых граница зрачка имеет малую контрастность и высокий шум.

Лишь в немногих работах [400, 478] используется отдельный метод для поиска только координат центра глаза (без определения радиуса зрачка), причем приближенно, для последующего уточнения другими методами.

В работе [484] применяются проекции, которые строятся как сумма яркостей всех точек с данной координатой по одной из осей. Для нахождения глаза на фотографии лица человека используется тот факт, что проекции испытывают большие изменения в районе глаз. В работе [374] используется горизонтальная проекция бинаризованного изображения для грубого определения расположения глаза.

Можно классифицировать методы поиска и выделения радужки по природе детектируемого признака на использующие:

• яркостные области (в задаче поиска радужки это, как правило, тёмная область зрачка на относительно более светлом фоне радужки или тёмная область радужки на более светлой склере);

• границы областей (такие методы обычно опираются на производные по яркости).

По методу факторизации (выделения) искомой информации, что также можно сформулировать как приведение изображений к «распознаваемой форме» [490]:

• методы, основанные на подходе Хафа, где поиск происходит в пространстве параметров;

• проекционные методы, уменьшающие размерность пространства поиска;

• подходы на основе кластеризации и иерархического агрегирования.

Структура изображения радужки задаётся двумя окружностями — её внутренней и внешней границами. Поэтому важнейшей частью методов детектирования радужки является поиск окружности на изображении. Методы поиска окружностей можно классифицировать несколькими способами. По используемым данным методы разделяются на:

• методы, не использующие дополнительной информации, входными данными для которых служит лишь исходное изображение;

• методы, использующие дополнительную информацию, а именно положение центра окружности (возможно, прибижённое) и/или радиус окружности (или диапазон требуемых радиусов).

Следует отметить, что последнее ограничение (задание диапазона радиусов) неявно присутствует во всех методах выделения окружности, поскольку на растровом изображении само понятие окружности имеет смысл начиная с радиуса больше единицы, а сверху радиус выделяемых окружностей ограничен размером изображения. Для практических приложений можно накладывать на размер выделяемых окружностей более сильные требования, вплоть до задания их радиусов с точностью в несколько процентов.

По методу факторизации (уменьшение количества обрабатываемых данных) можно разделить на:

• не использующие факторизацию;

• проекции (уменьшение размерности данных);

• группирования (уменьшение количества объектов);

• селекции (уменьшение количества объектов).

2.1. Проекционные методы выделения областей Проецирование изображений, на которых выделены области интереса, на оси позволяет перейти от обработки двумерных данных к обработке нескольких одномерных массивов. При правильном выборе метода прецирования характеристики выделенного объекта суммируются и составляют детектируемые максимумы в одномерных массивах. Таким образом, проецирование можно представить как один из способов факторизации данных [106, 431].

2.1.1. Метод проекций яркостей Зрачок большинства людей имеет форму, близкую к кругу [9], и отражает очень мало света, если направление освещения не совпадает с направлением камеры. Это позволяет искать его как тёмный круг на изображении. Алгоритм состоит из следующих шагов.

• Определение прогоа бинаризации, выделяющего зрачок на изображении;

• Бинаризация изображения с выделением пикселей-кандидатов зрачка;

• Проецирование бинаризованного изображения на координатные оси;

• Поиск координат центра зрачка по максимумам проекций.

Шаг 1. Определение порога бинаризации. Строится гистограмма яркостей исходного ихображения, согласно (1.18). Предполагается, что зрачок, как крупная по площади область с небольшой и практически равномерной яркостью, даст первый достаточно резкий и высокий максимум на гистограмме.

Этот максимум ищется как первая точка гистограммы h(b), отвечающая условиям:

где W, Th,M — эмпирически подбираемые параметры (W — окно, Th — порог, M — перепад). Пенвое неравенство является условием локального максимума, второе — условие достаточной высоты, третье — условие резкости максимума.

Как вариант, можно вычислять порог яркости согласно (1.20), при l = 0.05.

На Рис. 2.1 приведён пример исходного изображения глаза размером, 640 480, 256 градаций серого.

На Рис. 2.2 показана гистограмма (1.28) полученная из изображения Рис.

2.1, первый резкий максимум показан стрелкой.

Шаг 2. Бинаризация. Для выделения точек с малой яркостью используется бинаризация вида (1.22). На Рис. 2.3 дан пример изображения, полученного из 2.1, бинаризованного согласно порогу, выставленному по гистограмме 2.2.

Рис. 2.3. Пример бинаризованного изображения.

Шаг 3. Проецирование на оси. Используются проекции на горизонтальную и вертикальную оси вида 1.35. Поскольку значения пикселей бинаризованного изображения равны 0 и 1, то проекции 1.35 превращаются в Следует отметить, что такого рода проекции благодаря их простоте возможно вычислять «на лету», то есть при получении на шаге бинаризации единичного значения в некотором пикселе (x, y), инкрементировать соответствующие элементы массивов hor (x) и ver (y).



Pages:     || 2 | 3 | 4 | 5 |


Похожие работы:

«ЧУДНОВСКАЯ ГАЛИНА ВАЛЕРЬЕВНА БИОЭКОЛОГИЯ И РЕСУРСЫ ЛЕКАРСТВЕННЫХ РАСТЕНИЙ ВОСТОЧНОГО ЗАБАЙКАЛЬЯ Специальность 03.02.08 – Экология Диссертация на соискание ученой степени доктора биологических наук Научный консультант : Чхенкели Вера Александровна, доктор биологических наук, профессор Иркутск – СОДЕРЖАНИЕ Введение.. Глава 1. Обзор литературы по состоянию проблемы исследований ресурсов лекарственных растений.. 1.1...»

«Гусельников Николай Николаевич МОДЕЛИ И МЕТОДЫ УПРАВЛЕНИЯ ИНФРАСТРУКТУРОЙ ПРОМЫШЛЕННОГО ПРЕДПРИЯТИЯ Специальность 08.00.05 – Экономика и управление народным хозяйством: экономика, организация и управление предприятиями, отраслями, комплексами (промышленность)...»

«КРЫЛОВ ИГОРЬ БОРИСОВИЧ Окислительное C-O сочетание алкиларенов, -дикарбонильных соединений и их аналогов с оксимами, N-гидроксиимидами и N-гидроксиамидами 02.00.03 – Органическая химия Диссертация на соискание ученой степени кандидата химических наук Научный руководитель : д.х.н., Терентьев А.О. Москва – ОГЛАВЛЕНИЕ ВВЕДЕНИЕ ОКИСЛИТЕЛЬНОЕ...»

«Свердлова Ольга Леонидовна АВТОМАТИЗАЦИЯ УПРАВЛЕНИЯ ТЕХНОЛОГИЧЕСКИМИ ПРОЦЕССАМИ РАЗДЕЛЕНИЯ ГАЗОВ В ПРОМЫШЛЕННОСТИ 05.13.06 – Автоматизация и управление технологическими процессами и производствами Диссертация на соискание ученой степени кандидата технических наук Научный руководитель кандидат химических наук, доцент Евсевлеева Л.Г. Иркутск СОДЕРЖАНИЕ ВВЕДЕНИЕ.. ГЛАВА 1. АДСОРБЦИОННЫЙ МЕТОД РАЗДЕЛЕНИЯ ВОЗДУХА НА...»

«Бутенко Светлана Викторовна ВВЕДЕНИЕ ПОТРЕБИТЕЛЯ В ЗАБЛУЖДЕНИЕ КАК АБСОЛЮТНОЕ ОСНОВАНИЕ ДЛЯ ОТКАЗА В ПРЕДОСТАВЛЕНИИ ПРАВОВОЙ ОХРАНЫ ТОВАРНОМУ ЗНАКУ 12.00.03 – гражданское право; предпринимательское право; семейное право; международное частное право ДИССЕРТАЦИЯ на соискание ученой степени кандидата юридических...»

«ИЗ ФОНДОВ РОССИЙСКОЙ ГОСУДАРСТВЕННОЙ БИБЛИОТЕКИ Разинкина, Елена Михайловна Формирование профессионального потенциала студентов вуза с использованием новых информационных технологий Москва Российская государственная библиотека diss.rsl.ru 2006 Разинкина, Елена Михайловна Формирование профессионального потенциала студентов вуза с использованием новых информационных технологий : [Электронный ресурс] : Дис. . д­ра пед. наук : 13.00.08. ­ Магнитогорск: РГБ, 2006 (Из фондов...»

«Еременко Сергей Леонидович ЭКОНОМИЧЕСКОЕ ПОВЕДЕНИЕ РОССИЯН В ГЛОБАЛЬНОЙ КОМПЬЮТЕРНОЙ СЕТИ ИНТЕРНЕТ: СОЦИОЛОГИЧЕСКИЙ АНАЛИЗ 22.00.04 – социальная структура, социальные институты и процессы ДИССЕРТАЦИЯ на соискание ученой степени кандидата социологических наук Научный руководитель – доктор социологических наук Е.О. Кубякин Краснодар – Содержание Введение.. 1. Экономическое поведение россиян...»

«МАКАРЕВИЧ Ольга Владимировна ИНТЕРПРЕТАЦИЯ РЕЛИГИОЗНЫХ ТЕКСТОВ В ТВОРЧЕСТВЕ Н.С. ЛЕСКОВА ВТОРОЙ ПОЛОВИНЫ 1870-х – 1890-х гг.: ВОПРОСЫ ПРОБЛЕМАТИКИ И ПОЭТИКИ Специальность 10.01.01 – Русская литература Диссертация на соискание ученой степени кандидата...»

«Василенко Светлана Владимировна СТАТУСНО-РОЛЕВАЯ ДЕТЕРМИНАЦИЯ КАЧЕСТВА ПРИНЯТИЯ РЕШЕНИЙ СПОРТСМЕНАМИ ГРУППОВЫХ ВИДОВ СПОРТА Специальность 19.00.05 – Социальная психология ДИССЕРТАЦИЯ на соискание ученой степени кандидата психологических наук Научный руководитель : доктор психологических наук, профессор В. Б. Никишина Курск – Содержание ВВЕДЕНИЕ.. ГЛАВA 1. ТЕОРЕТИКО-МЕТОДОЛОГИЧЕСКИЙ АНАЛИЗ ПРОБЛЕМЫ СТАТУСНО-РОЛЕВОЙ ДЕТЕРМИНАЦИИ И...»

«Бузская Ольга Маратовна СОВРЕМЕННЫЕ СОЦИОКУЛЬТУРНЫЕ КОММУНИКАЦИИ: ЭКОЛОГО-АКСИОЛОГИЧЕСКОЕ ИЗМЕРЕНИЕ 09.00.13 – философская антропология, философия культуры ДИССЕРТАЦИЯ на соискание ученой степени кандидата философских наук Научный руководитель – Ивлева Марина Ивановна...»

«СЕРГЕЕВА ЛЮДМИЛА ВАСИЛЬЕВНА ПРИМЕНЕНИЕ БАКТЕРИАЛЬНЫХ ЗАКВАСОК ДЛЯ ОПТИМИЗАЦИИ ФУНКЦИОНАЛЬНО-ТЕХНОЛОГИЧЕСКИХ СВОЙСТВ МЯСНОГО СЫРЬЯ И УЛУЧШЕНИЯ КАЧЕСТВА ПОЛУЧАЕМОЙ ПРОДУКЦИИ Специальность 03.01.06 – биотехнология ( в том числе бионанотехнологии) Диссертация на соискание ученой степени кандидата биологических наук Научный руководитель Доктор биологических наук, профессор Кадималиев Д.А. САРАНСК ОГЛАВЛЕНИЕ ВВЕДЕНИЕ.....»

«Штыковский Павел Евгеньевич Массивные рентгеновские двойные в близких галактиках 01.03.02 Астрофизика и радиоастрономия ДИССЕРТАЦИЯ на соискание ученой степени кандидата физико-математических наук Научный руководитель д.ф.-м.н. М.Р. Гильфанов Москва 2007 2 Эта работа - результат исследований, проведенных в отделе Астрофизики высоких энергий Института Космических Исследований РАН. Я глубоко благодарен своему научному...»

«БЫКОВ Илья Викторович ВСПОМОГАТЕЛЬНОЕ КРОВООБРАЩЕНИЕ НА БАЗЕ ОСЕВЫХ НАСОСОВ (МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССОВ УПРАВЛЕНИЯ) 14.01.24 - Трансплантология и искусственные органы Диссертация на соискание ученой степени кандидата биологических наук Научный руководитель : доктор биологических наук, профессор Г.П. Иткин Москва – Оглавление Введение ГЛАВА 1....»

«Дойкин Алексей Алексеевич РАСЧЕТНО-ЭКСПЕРИМЕНТАЛЬНЫЙ МЕТОД ПРОФИЛИРОВАНИЯ ОБРАЗУЮЩЕЙ ПОРШНЯ ДЛЯ ПОВЫШЕНИЯ РЕСУРСА ТРИБОСОПРЯЖЕНИЯ ПОРШЕНЬ – ЦИЛИНДР ДВС 05.02.02 – Машиноведение, системы приводов и детали машин 05.04.02 – Тепловые двигатели Диссертация на соискание ученой степени кандидата технических наук Научный руководитель : доктор технических наук, профессор Рождественский Юрий Владимирович Научный консультант : доктор...»

«АФОНИНА МАРИЯ ВЛАДИМИРОВНА ФОРМИРОВАНИЕ ГОТОВНОСТИ СТАРШКЛАССНИКОВ К САМОСТОЯТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ ПРИ ПРОФИЛЬНОМ ОБУЧЕНИИ 13.00.01 – Общая педагогика, история педагогики и образования Диссертация На соискание ученой степени кандидата педагогических наук Научный руководитель – доктор...»

«ХИСАМОВ РАИЛЬ ЗАГИТОВИЧ ПРОЯВЛЕНИЕ МЯСНОЙ ПРОДУКТИВНОСТИ И МОРФОБИОХИМИЧЕСКИЙ СТАТУС ЖЕРЕБЯТ ПРИ ИСПОЛЬЗОВАНИИ В РАЦИОНАХ АДАПТИРОВАННЫХ К УСЛОВИЯМ РЕСПУБЛИКИ ТАТАРСТАН МИКРОМИНЕРАЛЬНЫХ ПРЕМИКСОВ 06.02.08 – кормопроизводство, кормление сельскохозяйственных животных и технология кормов ДИССЕРТАЦИЯ на соискание ученой степени кандидата сельскохозяйственных наук Научный руководитель доктор биологических наук, профессор Якимов О.А....»

«ДЕМУРА Татьяна Александровна МОРФОФУНКЦИОНАЛЬНЫЕ И МОЛЕКУЛЯРНОГЕНЕТИЧЕСКИЕ ОСОБЕННОСТИ НЕДИФФЕРЕНЦИРОВАННОЙ ФОРМЫ ДИСПЛАЗИИ СОЕДИНИТЕЛЬНОЙ ТКАНИ В АКУШЕРСКОГИНЕКОЛОГИЧЕСКОЙ ПРАКТИКЕ 14.03.02 - патологическая анатомия...»

«Пономарев Денис Викторович Импульсно-скользящие режимы дифференциальных включений с приложением к динамике механических систем с трением Специальность 01.01.02 Дифференциальные уравнения, динамические системы и оптимальное управление Диссертация на соискание ученой степени кандидата...»

«ТАРАСОВА ЛЮДМИЛА СТАНИСЛАВОВНА Бухгалтерский учет импорта лизинговых услуг у российских лизингополучателей Специальность 08.00.12 - Бухгалтерский учет, статистика Диссертация на соискание ученой степени кандидата экономических наук Научный руководитель : доктор экономических наук, профессор Ж.Г. Леонтьева...»

«Выстрчил Михаил Георгиевич ОБОСНОВАНИЕ СПОСОБОВ ВНЕШНЕГО ОРИЕНТИРОВАНИЯ ЦИФРОВЫХ МОДЕЛЕЙ ГОРНЫХ ВЫРАБОТОК, ПОЛУЧАЕМЫХ ПО РЕЗУЛЬТАТАМ СЪЕМОК ЛАЗЕРНО-СКАНИРУЮЩИМИ СИСТЕМАМИ Специальность 25.00.16 – Горнопромышленная и нефтегазопромысловая геология, геофизика,...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.