WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

На правах рукописи

Вежневец Владимир Петрович

АЛГОРИТМЫ АНАЛИЗА ИЗОБРАЖЕНИЯ ЛИЦА ЧЕЛОВЕКА ДЛЯ

ПОСТРОЕНИЯ ИНТЕРФЕЙСА ЧЕЛОВЕК-КОМПЬЮТЕР

05.13.11 математическое и программное обеспечение вычислительных

машин, комплексов и компьютерных сетей

Автореферат

диссертации на соискание учной степени е кандидата физико-математических наук

Москва 2004

Работа выполнена в Московском государственном университете им.

М.В.Ломоносова.

Научный руководитель: кандидат физико-математических, доцент Баяковский Юрий Матвеевич

Официальные оппоненты: доктор физико-математических наук, профессор Горбунов-Посадов Михаил Михайлович кандидат физико-математических наук, Переберин Антон Валерьевич

Ведущая организация: Государственный Научно - Исследовательский Институт Авиационных Систем (ГосНИИАС)

Защита состоится “ ” 2004 в ч. мин на заседании Диссертационного совета Д 501.001.44 в Московском государственном университете им. М.В.Ломоносова по адресу: 119992, ГСП-2, г. Москва, Воробьевы Горы, МГУ им. М.В. Ломоносова, 2-ой учебный корпус, факультет вычислительной математики и кибернетики, аудитория

С диссертацией можно ознакомиться в библиотеке факультета вычислительной математики и кибернетики МГУ им М.В. Ломоносова.

Автореферат разослан “ ” 2004.

Учный секретарь Диссертационного совета е доктор физико-математических наук, профессор Трифонов Н.П.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Объект исследования и актуальность темы.

В настоящее время вычислительная техника используется во многих областях человеческой деятельности, являясь удобным и многофункциональным инструментом решения широкого круга задач. Однако, в настоящее время пользователи ЭВМ вынуждены использовать способы взаимодействия, слабо адаптированные к возможностям человеческого восприятия и ограничивающие способности человека к обмену информацией. Основная цель усовершенствования и развития интерфейса человек-компьютер заключается в организации обмена информацией с ЭВМ таким образом, чтобы:

• Снизить время освоения программных и аппаратных средств;

• Снизить уровень ошибок при передаче информации;

• Сделать работу с ЭВМ возможной для людей, не имеющим возможности пользоваться традиционными средствами интерфейса;

• Снизить утомляемость, увеличить субъективное удовлетворение пользователя от работы;

Для достижения поставленных целей необходимо применение средств взаимодействия, более полно использующих коммуникативные способности человека. Человек наделен большим количеством возможностей воспринимать и передавать информацию: зрение, слух (в т. ч. устная речь), жесты и движения, мимика, осязание и др. Во взаимодействии человека и компьютера существуют два информационных потока:

• управляющие команды и данные, передаваемые компьютеру для обработки;

• результаты вычислений и другая информация, представляемая компьютером пользователю.

Распространенный в настоящее время человеко-машинный интерфейс использует зрение, как основной канал представления информации пользователю, отображая данные в виде условных знаков на экране компьютера.

Воспринимать информацию естественными для человека способами (распознавать речь, жесты, мимику и т.д.) современные средства интерфейса практически не в состоянии.

Лицо человека является важным источником информации при общении между людьми. Выражение лица, мимика, артикуляция при разговоре, движения головой являются удобным, естественным и, что важно, необременительным способом передачи информации. Неспособность компьютера с одной стороны воспринять, а с другой стороны воспроизвести столь естественные для человека способы общения затрудняет передачу и восприятие информации при работе с ЭВМ.

Для того, чтобы “научить” компьютер распознавать и реагировать на движения головы, мимику, изменение выражения лица, направление взгляда, требуются устойчивые алгоритмы анализа и распознавания изображения лица человека.

Для представления вычислительной системы в качестве партнера, имитирующего аспекты человеческого общения, и превращения взаимодействия пользователя с вычислительный системой в естественное общение с виртуальным персонажем, используются так называемые агенты виртуальной реальности. Для их обозначения в литературе принят термин “аватары” (avatars).

Агентами виртуальной реальности могут быть модели реально существующих людей, управляемые другими пользователями, или виртуальные актеры, управляемые компьютером. Использование таких агентов в системах виртуальной реальности и аудиовизуальных интерфейсах позволяет организовать общение пользователя с системой наиболее естественным образом и облегчить ему освоение. Это особенно актуально для пользователей, не являющихся профессионалами в области информационных технологий.

В рамках данной диссертационной работы будут рассмотрены следующие задачи:

1. Обнаружение и выделение лица на изображении и в видеопотоке.

2. Распознавание антропометрических точек лица на изображении и в видеопотоке.

3. Управление курсором “мыши” с помощью движений головой и мимики пользователя.

Решение двух первых задача является необходимым условием для создания интеллектуальных интерфейсов, распознающих и реагирующих на движения головой и изменение выражения лица пользователя. Решение второй задачи также необходимо для автоматизированного построения фотореалистичных моделей лиц для интерфейсов, использующих агентов виртуальной реальности. Решение третьей задачи делает возможным использование компьютера людьми, неспособными использовать традиционные средства интерфейса по состоянию здоровья.

Использование в системах построения интерфейса накладывает дополнительные условия и требования на методы, которые могут использоваться для решения этих задач, а именно:

• Высокая скорость работы (в ряде случаев - реальное время);

• Функционирование на изображениях низкого (порядка 320x240 пикселей) и среднего (порядка 640x480 пикселей) разрешения;

• Устойчивость к уровню шума, характерному для недорогих бытовых видеокамер, подключаемых к компьютеру.

Цели работы 1. Разработать методы обнаружения и выделения лица на изображении низкого разрешения (порядка 320x240 пикселей) и высокого уровня шума (характерного для бытовых видеокамер), работающие в реальном времени;

2. Разработать алгоритм автоматического выделения антропометрических точек лица (контуров глаз, зрачков, бровей, носа, подбородка, рта) на фронтальной фотографии среднего разрешения (порядка 640x480 пикселей) для построения фотореалистичных моделей виртуальной реальности;

3. Разработать алгоритм управления курсором “мыши” с помощью движений головы и мимики пользователя;

4. Разработать алгоритм автоматического определения положения антропометрических точек лица в видеопотоке низкого разрешения в реальном времени.

Научная новизна работы Разработанные алгоритмы обнаружения и локализации лица человека на основе цветовой сегментации кожи обладают значительно большей устойчивостью обнаружения, сохранив скорость существующих методов.

Предложенные алгоритмы выделения антропометрических точек лица на изображении и в видеопотоке обладают более высокой устойчивостью и точностью распознавания, нежели описанные в литературе аналоги.

Разработан новый алгоритм управления курсором мыши с помощью движений головы и мимики пользователя. Алгоритм предоставляет возможность гибкой настройки метода трансляции движений головы в перемещения курсора, что предоставляет возможность настройки интерфейса на индивидуальные особенности пользователя с нарушениями двигательного аппарата.

Практическая значимость и реализация Разработаны и доведены до реализации методы и алгоритмы решения нескольких актуальных задач машинного зрения и обработки изображений.

Программные реализации описываемых в диссертации методов удовлетворяют требованиям и ограничениям, сформулированным при постановке задач.

Реализована система управления компьютером для детей, страдающих ДЦП. Система успешно прошла экспериментальную проверку и используется в ряде детских учебных учреждений. По заказу Министерства Образования РФ на основе данной системы создан ряд тренажеров и вспомогательных программ для организации дистанционного обучения.

На основе разработанных алгоритмов обнаружения и локализации лица и его антропометрических точек на изображении построена система автоматизированного создания фотореалистичных 3D моделей головы по фотографиям. Система разрабатывалась в лаборатории Компьютерной Графики и Мультимедиа кафедры АСВК факультета ВМиК МГУ им. М.В. Ломоносова по заказу Samsung Advanced Institute of Technology.

Апробация работы и публикации Результаты работы докладывались и обсуждались на:

• 6-ой международной конференции по машинному зрению Asian Conference on Computer Vision (ACCV) 2004, Jeju, Korea, Январь 2004;

• 13-й международной конференции по компьютерной графике и машинному зрению GraphiCon 2003, Россия, Москва, 2003;

• 12-й международной конференции по компьютерной графике и машинному зрению GraphiCon 2002, Россия, Нижний Новгород, 2002;

• 3-ей международной конференции “Цифровая обработка информации и управление в чрезвычайных (экстремальных) ситуациях” ЦОИУЧС 2002, Беларусь, Минск, 2002;

• 10-ой всероссийской конференции “Математические методы распознавания образов-10” (ММРО-10), Россия, Звенигород, 2001;

• семинаре по компьютерной графике и машинному зрению Ю.М. Баяковского (ф-т ВМиК МГУ);

• научно-исследовательском семинаре по автоматизации программирования под руководством проф. М. Р. Шура-Бура (ф-т ВМиК МГУ).

Основные результаты работы изложены в 7-и научных публикациях. Системы, использующие разработанные методы, защищены российскими и международным патентами.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность исследуемой проблемы, сформулирована цель и задачи диссертационной работы, научная новизна, практическая ценность; описана структура диссертации.

Первая глава посвящена задаче обнаружения лица на изображении и в видеопотоке.

Существующие алгоритмы обнаружения лица можно разбить на две категории: методы эмпирического распознавания и методы моделирования изображения лица. К первой категории относятся методы, отталкивающиеся от опыта человека в распознавании лиц и делающие попытку формализовать и алгоритмизовать этот опыт. Вторая категория опирается на инструментарий распознавания образов, рассматривая задачу обнаружения лица как частный случай общей задачи распознавания. По набору тренировочных изображений строится модель изображения лица, и задача обнаружения сводится к проверке входного изображения на удовлетворение полученной модели.

Среди методов эмпирического обнаружения лица выделяется семейство методов, использующих цвет кожи как признак присутствия лица. Данные методы получили широкое распространение, поскольку сочетают в себе несколько важных преимуществ: малая вычислительная сложность, высокая скорость обработки, простота реализации; устойчивость к изменению ориентации и масштаба лица; устойчивость к изменению освещения (за исключением цветного); устойчивость к изменению выражения лица и частичного перекрытия лица другим объектом сцены.

Обнаружение лиц по цвету кожи производится обычно в два этапа:

1. выделение пикселей, близких по цвету к коже;

2. поиск лиц на изображении с использованием априорного знания о структуре человеческого лица.

Для выделения пикселей с цветом кожи используется модель распределения оттенка кожи в цветовом пространстве, получаемая на этапе предварительной тренировки. В литературе предложено большое количество различных типов моделей распределения оттенка кожи (подробный обзор приведен в работе /7/). На основании сравнения существующих методов цветовой сегментации кожи оптимальным представляется метод моделирования распределения с помощью Баейсовской карты вероятностей /7/.

Рис. 1. Результаты цветовой сегментации кожи.

Одной только цветовой информации недостаточно для устойчивого обнаружения лица, поэтому требуется расширить набор признаков дополнительными свойствами изображения лица. Наиболее часто используются ограничения на форму областей лиц (лицо имеет характерную овальную форму).

Большая часть существующих методов выделения лица по цвету сталкивается с проблемами в случае неточного выделения кожи по цвету и присутствия на изображении значительного количества объектов, близких по цвету к коже. Причина заключается в том, что объединение пикселей цвета кожи в области и проверка каждой из полученных областей на удовлетворение ограничениям по форме делаются независимо. У подобного подхода есть существенный недостаток - методы группировки пикселей кожи, не учитывающие ограничения на форму лиц, могут ошибочно сгруппировать в одну область пиксели, реально относящиеся к разным областям.

Перед автором стояла задача разработать метод выделения потенциальных областей лиц, обладающий следующими свойствами: устойчивость к неизбежным неточностям цветовой сегментации, точность выделения областей, высокая скорость работы. Важным требованием является сохранение высокой скорости работы методов наряду с увеличением устойчивости, чтобы сохранить важнейшее преимущество использования цвета кожи для обнаружения лица - быстродействие.

Проблему выделения эллиптических областей цвета кожи можно сформулировать, как задачу оптимизации в пространстве параметров эллипса (xc, yc,, a, b). Однако получение формулы целевой функции в явном виде не является тривиальной задачей. Чтобы избежать трудностей, связанных с поиском явного задания целевой функции и разработки метода оптимизации, не подверженного проблеме локальных экстремумов, было разработано два алгоритма, использующих последовательные приближения с помощью деформируемой эллиптической модели лица, жестко фиксирующие возможную форму областей лиц.

Первый метод (эллиптической деформации) использует деформируемую контурную модель /5/, форма которой задается эллипсом. Вдоль границы модели расположены области (называемые “щупами”), в которых происходит оценка плотности пикселей, близких по цвету к коже. Модель инициализируется вблизи ожидаемого положения лица на изображении, деформация модели производится по шагам. Для каждого “щупа” производится расчет плотности пикселей кожи во внутренней и внешней окрестности границы Рис. 2. Иллюстрации к предлагаемым методам обнаружения лица. (а) Метод эллиптической деформации. (б) Метод статистических моментов пендикулярно границе модели. После того, как на каждом шаге все “щупы” занимают свое новое положение, набор точек центров “щупов” аппроксимируется эллипсом, после чего центры “щупов” проецируются на его границу.

Столь простая схема алгоритма гарантирует возможность получения быстрой программной реализации. Несмотря на простоту, она обладает высокой устойчивостью к различным исходным данным и не требует высокой точности начального приближения. Кроме того, она обладает большой гибкостью и позволяет с легкостью встраивать дополнительные условия и ограничения на возможную форму выделяемых областей (пропорции, положение, ориентации эллипса).

Задача отслеживания перемещения лица в видеопотоке обладает определенным особенностями по сравнению с обнаружением лица на статическом изображении - во-первых, известно положение лица на предыдущем кадре, и во-вторых, требуется быстрая сходимость метода. Учитывая эти особенности, предлагается метод статистических моментов отслеживания перемещения лица. Метод основан на вычислении статистических моментов множества пикселей цвета кожи, попадающих в эллипс большего размера, чем область лица на предыдущем кадре. Для пересчета новых параметров эллипса используются координаты центра масс пикселей с высокой вероятностью кожи µx, µy и центральные моменты второго порядка µ11, µ20, µ02. По ним вычисляются координаты нового центра эллипса (µx, µy ), вектор направления его главной оси (µ11, µ20 µ02 + (µ20 µ02 )2 + 4µ2 ) и длины его осей.

Сравнение предложенных методов с существующими показало, что предлагаемые автором методы обладают существенно более высокой устойчивостью к зашумленным исходным данным и ошибкам цветовой сегментации, сохраняя простоту программной реализации и высокую скорость работы, позволяющую использовать разработанные алгоритмы в системах реального времени.

Рис. 3. Примеры выделения областей лиц на изображениях с помощью предложенных методов Вторая глава посвящена описанию системы автоматического распознавания антропометрических точек лица (контуров глаз, зрачков, бровей, носа, подбородка, рта) на фронтальных изображениях для построения трехмерной модели головы человека по набору фотографий.

Для автоматизированного создания 3D модели по фотографии необходимым является распознавание антропометрических точек лица для последующей адаптации трехмерной модели к индивидуальным особенностям лица.

Большинство существующих систем автоматизированного построения модели головы по фотографиям используют ручное выделение антропометрических точек лица на изображениях. Алгоритмы, разработанные автором, и построенная на их основе система распознавания антропометрических точек лица позволяет в значительной степени автоматизировать этот процесс.

Рис. 4. Типичные примеры выделения антропометрических точек.

ды, описанные в первой главе. Следующим шагом в распознавании является обнаружение положения глаз на изображении. Обнаружение положения глаз производится с помощью поиска областей резкого изменения интенсивности красного канала путем фильтрации красного канала изображения функцией специального вида:

Здесь I - красный канал исходного изображение, p и r обозначают координаты пикселей, Rn,x,y - прямоугольник размера (n 7), с центром в точке (x, y) а Pn,r - эллипс с размерами осей (nn/3), ориентированный по осям изображения, с центром в точке r. Коэффициент и масштаб фильтра n - параметры фильтрации. Использование красного канала сохраняет резкий контраст между интенсивностями пикселей радужной оболочки и ее окружения даже для светлых глаз (голубых, зеленых).

После обнаружения приблизительного положения глаз производится поиск координаты центра зрачка. В случае доминирующего фронтального освещения производится обнаружение пикселей, принадлежащих блику в центре зрачка. В случае освещения, близкого к равномерному, производится свертка изображения функцией, подчеркивающей круговые области темных пикселей.

Параметр c контролирует радиус фильтра и выбирается исходя из соотношения размеров лица и радиуса радужной оболочки. Центр масс наиболее темных пикселей изображения после свертки берется в качестве приблизительного центра зрачка.

Вычисление радиуса радужной оболочки r и точных координат центра зрачка (xc, yc ) производится с помощью следующей функции:

[/4, /6] [5/6, 5/4]. Для заданных координат центра (xc, yc ) наиболее вероятными значением радиуса радужной оболочки r будет величина, соответствующая максимальному значению dr f. После обнаружения точного положения центров глаз производится нормализация изображения (поворот и масштабирование). Отрезок, соединяющий центры глаз, делается горизонтальным, его длина приравнивается к фиксированной величине.

Обнаружение точного контура глаза производится путем поиска точек, являющихся локальными минимумами яркости в области границы глаза. Эксперименты показали, что в отличие от часто используемых точек резкого изменения яркости, точки локальных минимумов являются более устойчивыми признаками для распознавания контуров глаз. Как видно из рисунка 5, области значительных минимумов с высокой вероятностью соответствуют границе глаза и кожи. Обнаружение точек минимума производится отдельно для каждой строки изображения, рассматривая яркость изображения вдоль строки как одномерную функцию fy (x). Для того, чтобы снизить случайные флюктуации fy (x), перед поиском минимумов производится низкочастотная фильтрация функции.

Для обнаружения прямоугольника, ограничивающего область губ, применяется анализ статистики цветов области лица. На основе результатов обнаружения кожи строится гистограмма цветов кожи, попавших внутрь уточненного прямоугольника лица. Используя полученную гистограмму, внутри прямоугольника лица в районе ожидаемого положения губ выделяются пиксели нехарактерных для кожи данного человека цветов. Для вычисления прямоугольника используется итерационный алгоритм, основанный на вычислении центра масс и вторых центральных моментов области пикселей с низкой кожной вероятностью.

Рис. 5. Точки значительных локальных минимумов яркости для обнаружения контуров век Для обнаружения контуров носа используется векторное поле градиента яркости изображения. Для обнаружения границ ноздрей используется метод контурных шаблонов, представляющих собой типичную форму крыльев носа.

Критерий согласия шаблона и изображения вычисляется следующим образом:

Где p, q и r - координаты пикселей изображения, S(q) - множество точек шаблона, (p) - окрестность точки p, I(r) - градиент яркости изображения в точке r, a(p) - вектор касательный к кривой шаблона в точке p. T1 задает минимальную абсолютную величину градиента. F it(p) является индикаторной функцией, проверяющей наличие точек с достаточной абсолютной величиной градиента и направлением, близким к направлению касательной к кривой шаблона в окрестности точки шаблона p. Для обнаружения наиболее вероятной пары анализируются пары координат шаблона с высокими значениями критерия согласия в левой и правой части лица. Вычисление кривых формы носа производится, исходя из полученных координат крыльев носа, контуров глаз и априорных знаний о пропорциях черт лица.

Обнаружение контура лица (линии щек и подбородка) осуществляется с помощью деформируемой контурной модели. Как и в случае с контуром носа, обычно признаками обнаружения границы лица служили точки резкого изменения яркости, вычисляемые на основе абсолютной величины градиента яркости изображения. Как показали тесты описанных в литературе методов, использование такой информации в большом количестве случаев недостаточно для устойчивого распознавания. Во-первых, фон изображения, или его отдельные фрагменты, могут слабо отличаться по яркости от области лица.

Во-вторых, для устойчивого обнаружения границы лица требуется рассматривать также и направление наибольшего изменения яркости и цвета. Для обнаружения контура лица была разработана методика обнаружения величины и направления резкого изменения цвета - “цветовых краев” изображения.

Деформируемая модель, применяемая для обнаружения контура подбородка, инициализируется внутри области лица и расширяется в сторону границ лица до тех пор, пока не встретит достаточное количество пикселей с резким изменением цвета или яркости.

Реализация разработанных алгоритмов используется в системе автоматического построения моделей головы по двум фотографиям (фронтальной и профильной). Результаты работы алгоритмов представлены на рисунке.

Третья глава описывает систему, реализующую управление передвижением курсора и срабатыванием кнопки “мыши” при помощи движений головы и мимики пользователя, регистрируемых видеокамерой. Разработка системы велась совместно с факультетом психологии МГУ им. М.В. Ломоносова. Сотрудник факультета психологии, к.ф.-м.н., д.ф.н. А.Н. Кричевец занимался разработкой общей концепции системы, необходимых требований к работе системы и характеру перемещения курсора в зависимости от действий пользователя. Перед автором стояла задача разработки и реализации алгоритмов определения движений головы и мимики пользователя в видеопотоке, а также трансляции движений головы в сигналы перемещения курсора.

Система предназначена для инвалидов, которые не могут справиться с клавиатурой и мышью - в первую очередь для детей, страдающих церебральным параличом. Этот недуг затрагивает прежде всего двигательный аппарат, однако подвижность головы в значительной степени сохраняется, что позволяет использовать движения головы для управления компьютером. Существует и другой тип управления, использующий распознавание направления взгляда для указание положения курсора на экране. Однако, как показывают исследования, проведенные в ряде лабораторий по разработке человеко-машинного интерфейса, взгляд используется человеком для обозначения области его фокуса внимания, а не для совершения действий. Движения глаз часто происходят неосознанно, и использование направления взгляда, как инструмента для управления курсором, ведет к заметному дискомфорту. Движения головой значительно лучше поддаются сознательному контролю со стороны пользователя.

Существующие коммерческие системы опираются на использование подсветки в инфракрасном диапазоне для облегчения обнаружения маркеров, располагаемых на лице или голове пациента. Цена систем, по функциональности аналогичных разработанной, колеблется от 900 до 15,000 долларов и требует инфракрасных источников света и видеокамер, чувствительных в ИК диапазоне. Разработанная система использует в качестве дополнительного оборудования бытовую видеокамеру стоимостью около двадцати долларов (дешевизна оборудования является необходимым условием для внедрения системы в отечественных медицинских центрах). Изображения, получаемые с нее, характеризуются низким разрешением (около 320x240 пикселей), высоким уровнем шума и низкой четкостью. Система должна функционировать на компьютере невысокой вычислительной мощности, оставляя достаточно вычислительных ресурсов для работы пользовательских приложений.

Для выполнения строгих требований к устойчивости распознавания в условиях низкого качества изображения, а также использования небольших вычислительных ресурсов, в системе используется реперная конструкция (шлем) с контрастными маркерами для облегчения задачи распознавания движения головы.

Положение маркеров на изображении, получаемом с видеокамеры, транслируется в сигналы перемещения курсора мыши. В системе используются три маркера - два расположены с левой и правой стороны головы, примерно на одинаковом удалении от камеры. Третий расположен примерно по центру между ними, на меньшем удалении от камеры. После обнаружения положений маркеров в текущем кадре производится вычисление координат центрального маркера в системе координат, связанной с двумя боковыми маркерами. Положение точки начала координат O вычисляется как среднее арифметическое координат боковых маркеров. Длины проекций вектора, соединяющего точку O с центральным маркером, на прямую, проходящую через центры боковых маркеров и на перпендикуляр, проходящий через точку O, дают координаты центрального маркера u и v в системе координат, связанной с боковыми маркерами. Такой выбор координатной системы делает алгоритм нечувствительным к повороту головы в плоскости изображения и позволяет отслеживать только наклон и повороты головы вне плоскости изображения.

Рис. 6. Маркеры, используемые для распознавания движений головы.

В соответствии с рекомендациями психологов, в системе предусмотрено два различных способа трансляции поворота головы в движения курсора - по скорости (аналогично манипулятору типа “джойстик”) и по положению (аналогично манипулятору типа “мышь”). Первый тип управления означает, что поворот головы на определенный угол влечет перемещение курсора в соответствующем направлении со скоростью, пропорциональной углу поворота.

Во втором типе управления положение курсора напрямую зависит от угла поворота головы. Система позволяет комбинировать два вида управления в зависимости от задания, стоящего перед пользователем, и его персональными предпочтениями и возможностями. На основе вычисленных координат u и v перемещение курсора мыши вычисляется по следующим формулам:

В формуле (0.6) (xt1, yt1 ) и (xt, yt ) есть координаты курсора мыши в предыдущий и текущий момент времени, (ut1, vt1 ) и (ut, vt ) - координаты центрального маркера относительно боковых на предыдущем и текущем кадре. Точка с координатами (u0, v0 ) соответствует “нейтральному” положению маркеров, когда перемещения курсора не происходит. Кусочно-линейные функции fd () и fm () регулируют скорость и характер перемещения курсора в зависимости от положения головы. Коэффициенты x и y регулируют интенсивность движения по каждой из осей.

Срабатывание кнопки мыши должно быть связано с изменением мимики пользователя, поскольку необходимо полностью исключить использование рук. Наиболее предпочтительным оказалось открывание рта, поскольку это действие могут успешно совершать большинство пациентов - потенциальных пользователей системы и, в отличие от моргания, это действие производится человеком осознанно. Система следит за мимикой пользователя, и, если он держит рот открытым достаточно долгое время, происходит срабатывание кнопки мыши. В системе предусмотрено несколько вариантов функционирования кнопки мыши: залипающая кнопка и срабатывание кнопки только при отсутствии перемещения курсора мыши (для части пациентов оказывается достаточно сложным одновременно следить за движением курсора и контролировать мимику).

Для выделения областей маркеров на изображении используется яркостная сегментация (маркеры представляют собой темные области на светом фоне). К полученному после сегментации изображению применяется морфологическая фильтрация для снижения уровня шума. Следующим шагом является выделение связных компонент, после чего производится поиск областей, соответствующих маркерам. Распознавание осуществляется по характеристикам областей (площадь, периметр, удлиненность, компактность и ориентация главной оси) и положению маркеров на предыдущем кадре.

Для увеличения устойчивости распознавания используются маркеры характерной формы, достаточно протяженные по площади: боковые маркеры вертикально ориентированные вытянутые прямоугольники, центральный маркер - круговая область. Это позволяет минимизировать вероятность случайного совпадения характеристик связных областей, относящихся к маркерам, и фоновых областей на изображении. Вытянутая форма прямоугольников позволяет использовать ориентацию главной оси инерции в качестве дополнительного признака областей при начальном обнаружении и отслеживании маркеров.

Для упрощения использования системы были разработаны алгоритмы автоматического обнаружения маркеров на первом кадре и последующего определения параметров яркостной сегментации, а также адаптация этих параметров по ходу сеанса. Наличие подобных алгоритмов позволяет полностью исключить необходимость ручной настройки системы и делает ее устойчивой к изменению условий освещения.

В четвертой главе описываются алгоритмы распознавания и отслеживания положения антропометрических точек лица в видеопотоке. Цель разработки подобных алгоритмов - освободить пользователя системы, описанной в третьей главе, от необходимости использовать дополнительные маркеры для работы.

В качестве характерных антропометрических точек были выбраны две точки в районе глаз, одна в нижней части лица (рот) и одна в области носа (не лежащая в плоскости глаз и рта). Такой выбор точек связывает их с характерными чертами лица (что облегчает их обнаружение), и дает возможность вычислить ориентацию головы в трехмерном пространстве по проекциям точек на изображение.

Для определения положения черт лица не требуется столь же высокой точности и подробности распознавания, как в случае построения трехмерной модели головы. Учитывая это, а также невысокое качество изображения и низкое разрешение кадров видеопотока, генерируемого недорогими видеокамерами, методы, разработанные для решения этой задачи, нацелены на устойчивое распознавание положения черт лица, без дополнительных деталей.

Выделение области лица на текущем кадре производится с помощью метода статистических моментов (см. главу 1). Результатом применения этого метода является выделенная эллиптическая область лица. Дальнейшие действия построены в предположении, что область лица уже найдена.

Обычно системы отслеживания черт лица в видеопотоке фокусируются на определении положения центров глаз на изображении. Однако, если пользователь носит очки (что является скорее правилом для пользователей ЭВМ, чем исключением), определение положения центров глаз значительно усложняется из-за бликов стекол. По результатам испытаний линия бровей была выбрана как более устойчиво обнаруживаемый признак, нежели центры глаз.

Рис. 8. Иллюстрация к методу обнаружения бровей Поиск линии бровей происходит путем обнаружения прямоугольной области, внутри которой содержится значительное количество пикселей с абсолютной величиной градиента яркости I(x, y), превышающей заданный порог. Дополнительно требуется отсутствие пикселей с большими абсолютными значениями градиента непосредственно над областью бровей - в области лба (рис. 8). Обнаружение производится с помощью модифицированного преобразования Хафа. Используется система координат с началом в центре эллипса лица и осями, направленными вдоль осей эллипса. Положение линии бровей задается двумя параметрами и (рис. 8). Границы отрезков допустимых значений параметров [min, max ] и [min, max ] задаются, исходя из возможной неточности в определении эллипса лица. Каждой ячейке фазового пространства [min, max ] [min, max ], дискретизированного с шагами и, ставится в соответствие счетчик, изначально полагаемый равным нулю. Для компенсации дискретности разбиения используется следующий алгоритм обнаружения линии бровей: для каждого пикселя (x, y), такого что I(x, y) > :

1. Перевести координаты (x, y) пикселя в систему, связанную с эллипсом 2. Для каждого [min, max ] подсчитать = x · cos + y · sin ;

3. Если [min, max ], то увеличиваются счетчики ячеек фазового пространства со следующими координатами: ( /, / ), ( / + 4. Если ( ) [min , max ], то уменьшаются счетчики ячеек фазового пространства со следующими координатами: ( ( )/, / ), После рассмотрения всех пикселей изображения лица выбирается линия бровей с параметрами (, ), соответствующими наибольшему значению счетчика. Использование варианта преобразования Хафа, компенсирующего дискретность разбиения фазового пространства, дает повышенную по сравнению с традиционным алгоритмом устойчивость распознавания. Еще одним важным отличием приведенного алгоритма от традиционного преобразование Хафа является встроенный в алгоритм механизм “штрафования” (шаг 4) нежелательных конфигураций обнаруживаемого объекта. Обнаружение линии бровей дает две из требуемых четырех точек лица.

Предлагаемый алгоритм отслеживания положения губ с использованием карты вероятности цвета губ (0.7) отличается от алгоритмов, использующих только яркостную информацию или заранее обученный цветовой классификатор, высокой надежностью распознавания и устойчивостью к различным условиям освещения.

В (0.7) RGB - цветовые координаты пикселя с координатами (x, y) в пространстве RGB, Skin(RGB) - вероятность принадлежности цвета к оттенку кожи, u, v - координаты соответствующего цвета в пространстве CIEL*u*v*. На основе получаемой карты вероятностей производится поиск областей пикселей, с высокой вероятностью имеющих форму, близкую к эллиптической. Для увеличения надежности обнаружения производится шумоподавляющая фильтрация карты вероятностей. Обнаружение координат губ происходит путем нахождения координат с наибольшим значением критерия согласия, вычисляемого по следующей формуле:

Области In(xc, yc ) и Out(xc, yc ) задаются ожидаемой формой и размером губ на изображении. Результаты отслеживания представлены на рисунке 10(б). Положение губ предоставляет информацию о положении третьей точки.

Для определения ориентации головы по положению черт лица на изображении необходимо знать координаты еще одной точки, не лежащей в плоскости рта и бровей. Идеально для этого подходит кончик носа, однако устойчивого отслеживания кончика носа в неизвестных условиях освещения достичь весьма проблематично. С другой стороны, при соответствующем положении камеры, ноздри представляют собой четко видимые, характерные особенности изображения. Обнаружение координат ноздрей производится путем поиска контрастных областей определенной формы с помощью критерия согласия, задаваемого следующей формулой:

Области In(xc, yc ) и Out(xc, yc ) задаются шаблоном (см. рисунок 10(a)).

Результаты отслеживания представлены на рисунке 10(б).

Предложенные алгоритмы функционируют в реальном времени на ЭВМ с процессором Pentium II (тактовая частота 800 МГц) со скоростью 8 кадров в секудну.

Рис. 10. (a) Шаблон для обнаружения ноздрей. (б) Пример обнаружения полного набора антропометрических точек В заключении сформулированы основные результаты работы.

Основные результаты работы состоят в следующем:

1. Предложены новые алгоритмы выделения лица человека на изображении, работающие в реальном времени и удовлетворяющие следующим ограничениям: работа с изображениями низкого разрешения (порядка 320x240 пикселей) и высокого уровня шума, характерного для бытовых видеокамер.

2. Разработан алгоритм автоматического выделения антропометрических точек лица на фронтальной фотографии среднего разрешения (порядка 640x480 пикселей) для построения фотореалистичных моделей виртуальной реальности.

3. Разработан алгоритм управления курсором “мыши” с помощью движений головы и мимики пользователя.

4. Разработан алгоритм для автоматического определения положения антропометрических точек лица в видеопотоке низкого разрешения в реальном времени.

Основное содержание диссертационной работы изложено в следующих публикациях:

[1] Вежневец В. П. Локализация человеческого лица на цветном растровом изображении // Труды конференции “Математические методы распознавания образов” (ММРО-10). 2001.

[2] Вежневец В. П. Использование контурных моделей для выделения черт лица на фронтальном изображении // Труды конференции “Математические методы распознавания образов” (ММРО-10). 2001.

[3] Automatic extraction of frontal facial features for 3-d face modeling / V. Vezhnevets, S. Soldatov, A. Degtiareva, I.-K. Park // Proc. Sixth Asian Conference on Computer Vision. 2004.

[4] Vezhnevets V. Face and facial feature tracking for natural human-computer interface // Труды конференции ГрафиКон’2002. 2002.

[5] Vezhnevets V. Method for localization of human faces in color-based face detectors and trackers // Труды конференции Digital Information Processing And Control In Extreme Situations’2003. 2003.

[6] Vezhnevets V., Degtiareva A. Robust and accurate eye contour extraction // Труды конференции ГрафиКон’2003. 2003.

[7] Vezhnevets V., Sazonov V., Andreeva A. A survey on pixel-based skin color detection techniques // Труды конференции ГрафиКон’2003. 2003.



Похожие работы:

«Федяшев Глеб Арнольдович ГЛАЗНОЙ ПСЕВДОЭКСФОЛИАТИВНЫЙ СИНДРОМ ПРИ ВОЗРАСТНОЙ КАТАРАКТЕ У ЖИТЕЛЕЙ ХАБАРОВСКОГО КРАЯ 14.01.07 – глазные болезни Автореферат диссертации на соискание ученой степени кандидата медицинских наук Красноярск 2010 Работа выполнена в Хабаровском филиале ФГУ МНТК Микрохирургия глаза им. акад. С.Н. Федорова Федерального агенства по высокотехнологичной медицинской помощи Научный руководитель : доктор медицинских наук, профессор Егоров Виктор Васильевич...»

«Хуснутдинова Ляйля Гельсовна ЭТНОСОЦИАЛЬНЫЕ АСПЕКТЫ АДАПТАЦИИ БЕЖЕНЦЕВ И ВЫНУЖДЕННЫХ ПЕРЕСЕЛЕНЦЕВ В РЕСПУБЛИКЕ БАШКОРТОСТАН (1992–2007 гг.) Специальность 07.00.07 – этнография, этнология и антропология АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата исторических наук Ижевск – 2008 2 Работа выполнена в Центре этнологических исследований Уфимского научного центра Российской Академии наук. Научный руководитель : кандидат исторических наук, Габдрафиков Ильдар...»

«Каширина Юлия Петровна Гражданско-правовой статус индивидуальных предпринимателей в Российской Федерации Специальность 12.00.03 – гражданское право; предпринимательское право; семейное право; международное частное право Автореферат диссертации на соискание ученой степени кандидата юридических наук Краснодар – 2012 2 Работа выполнена в автономной некоммерческой образовательной организации высшего профессионального образования Воронежский экономико-правовой институт. Научный...»

«Минеева Валентина Ивановна Правовая политика российского государства в области экологии: проблемы реализации 12.00.01 – теория и история права и государства; история учений о праве и государстве. 12.00.06 – природоресурсное право; аграрное право; экологическое право. АВТОРЕФЕРАТ Диссертации на соискание ученой степени кандидата юридических наук. Ставрополь 2004 Работа выполнена в Северо-Кавказском Государственном техническом университете Научный руководитель : доктор...»

«МУХАМЕТОВ УРАЛ ФАРИТОВИЧ МОРФОЛОГИЧЕСКОЕ И КЛИНИЧЕСКОЕ ОБОСНОВАНИЕ ПРИМЕНЕНИЯ НОВЫХ НАНОСТРУКТУРНЫХ МАТЕРИАЛОВ В ТРАВМАТОЛОГИИ И ОРТОПЕДИИ (Экспериментально – клиническая работа) 14.03.01 - анатомия человека 14.01.15 - травматология и ортопедия Автореферат диссертации на соискание ученой степени кандидата медицинских наук Уфа – 2010 Работа выполнена в Государственном образовательном учреждении высшего профессионального образования Башкирский государственный медицинский...»

«ПОЛЕВЩИКОВА АННА СЕРГЕЕВНА ЯЗЫКОВАЯ ИГРА В РОМАНЕ А. МУШГА „DER ROTE RITTER. EINE GESCHICHTE VON PARZIVAL“(1993) (НА МАТЕРИАЛЕ НЕМЕЦКОГО ЯЗЫКА) Специальность 10.02.04 - германские языки АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук Москва 2011 Работа выполнена на кафедре немецкого языкознания филологического факультета ФГОУ ВПО Московский государственный университет им. М. В. Ломоносова. НАУЧНЫЙ РУКОВОДИТЕЛЬ: кандидат филологических наук,...»

«ХАЙДАРОВ Тимур Фаритович СРЕДНЕВЕКОВЫЙ ДАНЦИГ В НЕМЕЦКОЙ ИСТОРИОГРАФИИ (XIX – 30-е годы XX вв.) Специальность: 07.00.09 – Историография, источниковедение и методы исторического исследования Автореферат диссертация на соискание учёной степени кандидата исторических наук Казань–2008 Работа выполнена на кафедре истории древнего мира и средних веков исторического факультета ГОУВПО Казанский государственный университет им. В.И. Ульянова-Ленина Научный руководитель : доктор...»

«Усынин Владимир Михайлович Процессуальные формы взаимодействия органов предварительного следствия и органов, осуществляющих оперативно-розыскную деятельность, по уголовным делам на досудебных стадиях уголовного процесса 12.00.09 – уголовный процесс, криминалистика и судебная экспертиза; оперативно-розыскная деятельность Автореферат диссертации на соискание ученой степени кандидата юридических наук Ижевск, 2005 1 Работа выполнена на кафедре уголовного процесса государственного...»

«Мордасов Константин Александрович МЕТОД БЫСТРОГО ДЕКОДИРОВАНИЯ ДЛИННЫХ ПСЕВДОСЛУЧАЙНЫХ КОДОВ 05.12.13 – Системы, сети и устройства телекоммуникаций АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Москва-2009 Диссертационная работа выполнена на кафедре телекоммуникационных систем Московского государственного института электронной техники (технического университета) доктор технических наук, старший Научный руководитель научный сотрудник Кузнецов...»

«Баринов Денис Олегович ПРОЦЕДУРЫ ЗАКЛЮЧЕНИЯ, ИЗМЕНЕНИЯ И ПРЕКРАЩЕНИЯ ТРУДОВОГО ДОГОВОРА Специальность 12.00.05 - трудовое право; право социального обеспечения Автореферат диссертации на соискание ученой степени кандидата юридических наук Москва - 2012 Работа выполнена в Московском государственном университете имени М.В. Ломоносова (юридический факультет). Научный руководитель : доктор юридических наук, профессор Хныкин Геннадий Валентинович Официальные оппоненты : Петров...»

«Ларин Андрей Александрович ОСОБЕННОСТИ ОПРЕДЕЛЕНИЯ И ОЦЕНКА НАКОПЛЕНИЯ УГЛЕВОДОРОДОВ В ГИДРОБИОНТАХ АЗОВСКОГО МОРЯ Специальность 03.02.08 – экология (химические наук и) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата химических наук Краснодар 2010 г. Работа выполнена в Федеральном государственном унитарном предприятии Азовский научно-исследовательский институт рыбного хозяйства (ФГУП АзНИИРХ) Научный руководитель : доктор биологических наук Корпакова Ирина...»

«Агадуллина Елена Рафиковна Факторы социальной категоризации молодежных политических групп Специальность 19.00.05 – Социальная психология (психологические наук и) Автореферат диссертации на соискание ученой степени кандидата психологических наук Москва – 2008 Работа выполнена на кафедре социальной психологии факультета психологии Московского государственного университета имени М.В. Ломоносова Научный руководитель : доктор философских наук, профессор Андреева Галина Михайловна....»

«Калекина Анна Викторовна Влияние профессиональной культуры на удовлетворенность трудом инженеров-конструкторов промышленных предприятий Специальность 19.00.03 – Психология труда, инженерная психология, эргономика (психологические наук и) Автореферат диссертации на соискание учёной степени кандидата психологических наук Москва – 2009 Работа выполнена на кафедре психологии труда и инженерной психологии факультета психологии Московского государственного университета имени М.В....»

«ХАСАНОВ РИШАТ АУХАТОВИЧ Гражданско-правовой статус обладателя исключительного права на товарный знак Специальность 12.00.03 – Гражданское право; предпринимательское право; семейное право; международное частное право АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Санкт-Петербург – 2010 2 Работа выполнена в Государственном образовательном учреждении высшего профессионального образования Казанский государственный университет им. В.И....»

«АБДУКАМИЛОВ Шавкат Шухратович НЕСУЩАЯ СПОСОБНОСТЬ ЗЕМЛЯНОГО ПОЛОТНА, ОТСЫПАННОГО БАРХАННЫМИ ПЕСКАМИ, ВОСПРИНИМАЮЩИМИ ВИБРОДИНАМИЧЕСКУЮ НАГРУЗКУ Специальность 05.22.06 – Железнодорожный путь, изыскание и проектирование железных дорог Автореферат диссертации на соискание ученой степени кандидата технических наук САНКТ-ПЕТЕРБУРГ 2011 Работа выполнена на кафедре Управление и технология строительства Федерального государственного бюджетного образовательного учреждения высшего...»

«ПРОКОПЬЕВА Алена Кирилловна СЛОЖНЫЕ ПРЕДЛОЖЕНИЯ В ТЕКСТАХ ЯКУТСКОЙ ХУДОЖЕСТВЕННОЙ ЛИТЕРАТУРЫ Специальность 10.02.02 – Языки народов Российской Федерации (якутский язык) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук Якутск 2013   Работа выполнена на кафедре якутского языка Института языков и культуры народов Северо-Востока Российской Федерации Федерального государственного автономного образовательного учреждения высшего профессионального...»

«ИВКИН Антон Евгеньевич ВИХРЕТОКОВЫЕ МЕТОДЫ ИЗМЕРЕНИЯ ТОЛЩИНЫ НЕФЕРРОМАГНИТНЫХ ЭЛЕКТРОПРОВОДЯЩИХ ПОКРЫТИЙ НА НЕФЕРРОМАГНИТНЫХ ЭЛЕКТРОПРОВОДЯЩИХ ОСНОВАНИЯХ Специальность 05.11.13 – Приборы и методы контроля природной среды, веществ, материалов и изделий Автореферат диссертации на соискание ученой степени кандидата технических наук САНКТ-ПЕТЕРБУРГ 2013 Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования...»

«Рассказова Юлия Ибрагимовна СОРБЦИОННО-ФОТОМЕТРИЧЕСКОЕ ОПРЕДЕЛЕНИЕ АНТИГИСТАМИННЫХ ПРЕПАРАТОВ С ИСПОЛЬЗОВАНИЕМ СОРБЕНТА СВ-1-М Специальность 02.00.02 – аналитическая химия Автореферат диссертации на соискание ученой степени кандидата химических наук Казань – 2007 Работа выполнена на кафедре аналитической и физической химии химического факультета государственного образовательного учреждения высшего профессионального образования Астраханский государственный университет Научный...»

«Якимов Михаил Юрьевич Анализ механизмов повышения эффективности передачи информации в высокоскоростных локальных и городских беспроводных сетях Специальность 05.12.13 – Системы, сети и устройства телекоммуникаций АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Москва – 2008 Работа выполнена в Институте проблем передачи информации им. А.А. Харкевича РАН Научный руководитель : доктор технических наук, доцент Ляхов Андрей Игоревич Официальные...»

«Яблоков Александр Сергеевич ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ РАБОТЫ ЭНЕРГЕТИЧЕСКИХ УСТАНОВОК ПЛАВУЧИХ КРАНОВ ЗА СЧЕТ ПРИМЕНЕНИЯ ГИДРОТРАНСФОРМАТОРОВ В МЕХАНИЗМЕ ПОДЪЕМА Специальность 05.08.05 – Судовые энергетические установки и их элементы (главные и вспомогательные) Автореферат диссертации на соискание ученой степени кандидата технических наук Нижний Новгород – 2011 Работа выполнена в Федеральном бюджетном образовательном учреждении высшего профессионального образования Волжская...»




























 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.