WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

На правах рукописи

Воскресенский Евгений Михайлович

Параметрическая и структурная адаптация систем распознавания

текстовых меток на видеоизображениях

Специальность 05.13.01 – Системный анализ, управление и обработка

информации (промышленность)

Автореферат диссертации на соискание ученой степени

кандидата технических наук

Рыбинск – 2010

Работа выполнена в Институте менеджмента и информационных технологий Санкт-Петербургского государственного политехнического (филиале) университета в г.Череповце

Научный руководитель кандидат технических наук Царев Владимир Александрович

Официальные оппоненты: доктор технических наук, профессор Юдин Виктор Васильевич кандидат технических наук Юдина Ольга Вадимовна

Ведущая организация Институт систем обработки изображений РАН, г. Самара

Защита состоится 7 июля 2010 г. в 12 часов на заседании диссертационного совета Д 212.210.04 в Рыбинской государственной авиационной технологической академии им. П. А. Соловьева по адресу: 152934, г. Рыбинск, Ярославская область, ул. Пушкина, 53.

С диссертацией можно ознакомиться в библиотеке Рыбинской государственной авиационной технологической академии им. П. А. Соловьева Автореферат разослан « 4 » июня 2010 г.

Ученый секретарь диссертационного совета Конюхов Б. М.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы Системы распознавания текстовых меток на видеоизображениях (СРТМ), используемые в составе различных информационно-управляющих систем, применяются для оптической идентификации (как правило, движущихся) объектов контроля, имеющих регистрационные надписи, например, промышленных изделий, упакованных продуктов, наземных транспортных средств, грузовых контейнеров, денежных купюр и т.п. Целью применения таких систем является избавление человека от рутинных операций, а также решение задач, с которыми он физически не способен справляться в режиме реального времени (конвейерная обработка изделий, поиск в базе данных и т.п.).

СРТМ являются частным случаем OCR-систем, представленных системами распознавания текста различного происхождения (печатного, рукопечатного, рукописного). Методы оптического распознавания текста описаны в работах таких российских и зарубежных ученых как Горский Н.Д., Арлазаров В.Л., Ян Д.Е., Nishida H., Impedovo S. и др. Достаточно большое количество научных публикаций посвящено описанию различных прикладных СРТМ. На основе этих публикаций можно сделать вывод, что в настоящее время сложился общепринятый подход к представлению алгоритмической части СРТМ в виде многоуровневой системы эвристических алгоритмов анализа изображений и распознавания графических образов.

Как правило, алгоритмы СРТМ, используемых в промышленности и на транспорте, обладают множеством параметров, настройка которых позволяет адаптировать систему к заданным условиям эксплуатации при первичном внедрении СРТМ. Адаптация СРТМ также необходима при существенных изменениях условий ее эксплуатации (оптической схемы, освещения, фона и пр.) и при изменении требований пользователя к показателям эффективности системы. Эффективность СРТМ принято характеризовать, с одной стороны, «качеством» распознавания (на входных видеоизображениях как содержащих образ текстовой метки, так и не содержащих такого образа). С другой стороны – длительностью рабочего цикла по обработке одного видеокадра, которая часто ограничена требованием распознавания в реальном времени. В настоящее время эффективность большинства эксплуатируемых СРТМ зачастую не соответствует современным требованиям, что обусловлено не только несовершенством используемых алгоритмов, но и нередко неудачно настроенными параметрами.

Количество параметров СРТМ, как правило, довольно велико. Например, распространенные российские системы распознавания автомобильных номеров обладают более чем тремя десятками только открытых для пользователя параметров используемых алгоритмов. Зависимость значений критериев эффективности СРТМ от значений настраиваемых параметров носит сложный алгоритмический характер, что исключает применение аналитических методов вычисления оптимальных параметров. Кроме того, однократное вычисление значений критериев эффективности СРТМ при заданных значениях параметров алгоритмов нередко требует существенных вычислительных затрат времени, что затрудняет применение известных методов оптимизации. В результате в настоящее время настройка СРТМ производится, в основном, вручную и приблизительно. Такой подход требует от настройщика системы высокой квалификации, сравнимой с квалификацией разработчика, и не гарантирует нахождение оптимальных параметров.

С учетом того факта, что количество ежегодных внедрений отдельных видов СРТМ в России уже измеряется тысячами и непрерывно растет, проблема обеспечения эффективности функционирования таких систем и автоматизации процесса их внедрения является весьма актуальной.

Цель работы Целью диссертационной работы является повышение эффективности функционирования систем распознавания текстовых меток на видеоизображениях путем совершенствования процессов разработки и адаптации таких систем с учетом условий эксплуатации.





Основные задачи Для достижения указанной цели в работе поставлены и решены следующие основные задачи:

- Разработка математической модели СРТМ, представляющей СРТМ в виде множественной композиции эвристических алгоритмов.

- Разработка на базе предложенной математической модели методов параметрической адаптации СРТМ к заданным условиям эксплуатации.

- Разработка способа повышения эффективности СРТМ за счет ее структурной адаптации, не требующей модификации используемых алгоритмов.

- Апробация предложенных модели и методов на примере оптоэлектронной системы идентификации объектов подвижного состава железнодорожного транспорта.

Предмет исследования – методы и средства параметрической и структурной адаптации алгоритмического обеспечения СРТМ.

Методы исследования Для решения поставленных задач использованы методы теории вероятностей и математической статистики, основы теории оптимизации и принятия решений, методы обработки изображений, математический аппарат теории распознавания образов.

Научная новизна В работе выделен и исследован класс иерархических эвристических алгоритмов анализа изображений и распознавания графических образов, лежащих в основе большинства современных СРТМ. Предложен набор моделей, методов и программных средств, обеспечивающих повышение эффективности функционирования СРТМ за счет совершенствования процессов разработки и внедрения таких систем. Научной новизной обладают:

1. Математическая модель СРТМ, обеспечивающая описание и исследование СРТМ в виде множественной композиции базовых специализированных эвристических алгоритмов анализа видеоизображений. Модель включает в себя вероятностные критерии эффективности всей СРТМ и критерии эффективности отдельных составляющих алгоритмов и устанавливает зависимость между такими критериями.

Метод параметрической адаптации СРТМ. Метод основан на модели из п. и заключается в декомпозиции СРТМ на алгоритмы-компоненты эвристического анализа изображений, статистической оценке значений вероятностных критериев эффективности системы и оценке затрат времени на анализ системой единицы входных данных. Он позволяет обеспечить практическую решаемость задачи вычисления квазиоптимальных (оптимальных в рамках заданных экзаменационной последовательности изображений и дискретизации значений параметров) значений параметров большинства существующих СРТМ по сравнению с известными способами их настройки.

Метод параметрической адаптации подсистемы принятия решений СРТМ.

Метод основан на модели из п. 1 и заключается в декомпозиции СРТМ на алгоритмы-компоненты, формирующих списки альтернативных решений на промежуточных этапах анализа входного видеоизображения. Метод позволяет обеспечить практическую решаемость задачи вычисления квазиоптимальных (оптимальных в рамках заданных экзаменационной последовательности изображений и дискретизации значений параметров) значений параметров подсистемы принятия решений, управляющей размерами списков альтернативных решений.

Способ структурной адаптации СРТМ, обеспечивающий без сопутствующей модификации образующих СРТМ алгоритмов уменьшение среднего времени анализа последовательности входных видеоизображений как содержащих, так и не содержащих образы текстовых меток движущихся объектов контроля.

Практическая ценность Предложена методика оценки затрат времени на подготовку экзаменационных данных и на вычисление оптимальных параметров алгоритмов СРТМ, на основе которых производится целенаправленный выбор способа декомпозиции СРТМ.

Предложена методика кластеризации экзаменационной выборки видеоизображений, позволяющая сопоставить подмножествам видеоизображений подходящие квазиоптимальные наборы параметров.

Разработаны алгоритмы и произведена параметрическая адаптация модуля распознавания системы идентификации объектов подвижного состава железнодорожного транспорта «ARSCIS», разработка которой выполнялась на базе ИМИТ СПбГПУ и научно-производственной компании «Малленом»

(г. Череповец) по заказам администрации станции Череповец Северной Железной Дороги, ОАО «Лукойл-Ухтанефтепереработка», ОАО «ЛукойлВолгограднефтепереработка».

Разработаны программные инструментальные средства параметрической адаптации алгоритмов СРТМ, используемые в научно-производственной компании «Малленом» при разработке оптоэлектронных систем контроля, среди которых: семейство систем идентификации автотранспортных средств «Автомаршал», системы контроля печатной продукции, системы распознавания текстовой маркировки на стальных слябах, трубах и др.

5. Результаты исследований используются в учебном процессе ИМИТ СПбГПУ в рамках дисциплины «Основы теории распознавания образов»

для специальности 230105 – Программное обеспечение вычислительной техники и автоматизированных систем.

Апробация работы Основные положения диссертации докладывались и обсуждались на всероссийской научно-практической конференции «Образование. Наука.

Бизнес. Особенности регионального развития и интеграции» (Череповец, 2004гг.), Межвузовском конкурсе-конференции «Технологии Microsoft в теории и практике программирования» (Санкт-Петербург, 2005 г., 2007 г., г.), IIX международной научной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Йошкар-Ола, 2007), международной научной конференции «Распознавание образов и обработка информации 2007» (Минск, 2007), всероссийской научной конференции студентов и аспирантов «Молодые исследователи – регионам» (Вологда, г.), Вторых ежегодных смотрах-сессиях аспирантов и молодых ученых Вологодской области по отраслям наук (Вологда, 2008 г.), IX международной научной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Нижний Новгород, 2008), а также на научных семинарах научно-технической лаборатории систем технического зрения и экспертных систем ИМИТ СПбГПУ, кафедры ИУС ФТК СПбГПУ и кафедры МПО ЭВС РГАТА им. П.А. Соловьева.

Публикации По материалам диссертации опубликовано 16 печатных работ (из них 4 в научных изданиях, рекомендованных ВАК, одна монография).

На защиту выносятся:

1. Математическая модель СРТМ.

2. Метод параметрической адаптации СРТМ.

3. Метод параметрической адаптации подсистемы принятия решений СРТМ.

4. Способ структурной адаптации СРТМ.

Структура и объем работы Диссертационная работа состоит из введения, четырех глав, заключения и приложения. Объем работы составляет 181 страницу. Работа содержит рисунка, 9 таблиц, список использованной литературы из 86 наименований, приложений на 18 страницах.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность работы, сформулирована цель и поставлены задачи проводимых исследований, определены научная новизна и практическая значимость результатов, приведены сведения о публикациях и апробации полученных результатов.

В первой главе дается общая характеристика СРТМ как особого подкласса OCR-систем распознавания текста, а также определяется круг проблем, связанный с разработкой и адаптацией СРТМ.

СРТМ включает в себя ЭВМ, средства ввода видеоданных, а также алгоритмическую часть, обычно реализуемую в виде единого программного модуля распознавания. В большинстве случаев он представляется в виде композиции алгоритмов, решающих отдельные логические подзадачи распознавания текстовых меток. Алгоритм локализации (АЛ) выделяет прямоугольную зону видеоизображения, потенциально содержащую образ текстовой метки. Алгоритм сегментации (АС) выделяет на зоне множество сегментов, предположительно являющихся образами символов метки.

Алгоритм распознавания (АР) сопоставляет каждому сегменту код символа либо отклоняет сегмент. Алгоритм формирования решений (АФР) составляет из распознанных сегментов с учетом их взаимного расположения коды текстовых меток. Часто, чтобы не потерять истинное решение, между промежуточными этапами передаются списки вариантов решений с некоторыми эвристическими оценками их правдоподобия, а итоговое решение по изображению выбирает алгоритм принятия решений (АПР).

В ходе своей работы СРТМ приходится, как правило, анализировать видеоизображения как содержащие образ текстовой метки (информативные), так и не содержащие (неинформативные). При этом с учетом плохой формализации задачи анализа изображений, решаемой СРТМ, разработчики таких систем вынуждены использовать эвристические алгоритмы локализации, сегментации и распознавания. В связи с этим эффективность анализа информативных изображений характеризуется вероятностью правильного распознавания текстовой метки Pright и вероятностью ошибки Perr, а неинформативных – вероятностью ложного решения Pfalse. Четвертым критерием является среднее время анализа отдельного изображения T, влияющее на эффективность функционирования модуля в режиме реального времени. Таким образом, СРТМ характеризуется критериями:

эффективность алгоритма A, осуществляющего полный цикл обработки входного видеоизображения в СРТМ с параметрами u = {u1, u 2,..., u k } в заданных условиях эксплуатации. Каждое место внедрения характеризуется аппаратным обеспечением СРТМ h и полученной по месту внедрения экзаменационной выборкой видеоизображений B. Таким образом, основным средством обеспечения заданной эффективности Q ( A, B, u, h) = ( Pright, Perr, Pfalse, T ) является настройка параметров СРТМ.

Обычно множество настраиваемых параметров довольно велико (до нескольких десятков). Зависимость Q (u ) носит сложный алгоритмический характер, что исключает применение аналитических методов вычисления оптимальной конфигурации u *. Кроме того, однократное вычисление оценки Q обычно связано с существенными вычислительными затратами. Все это приводит к тому, что на современном этапе настройка параметров модуля распознавания, как правило, выполняется вручную самими разработчиками.

Это не гарантирует нахождение оптимальной конфигурации и требует существенного объема трудозатрат при адаптации СРТМ, поэтому актуальной задачей является создание методов, позволяющих рассчитывать оптимальные в заданных условиях эксплуатации значения параметров СРТМ без привлечения разработчиков системы.

Кроме того, эффективность современных СРТМ далека от идеальной по причине несовершенства современных методов анализа изображений.

Например, для современных российских систем распознавания государственных регистрационных знаков автомобилей вероятность правильного распознавания в благоприятных условиях, как правило, составляет 0.8-0.9. Это обуславливает необходимость применения в СРТМ так называемой «мягкой схемы» принятия решения, в которой на промежуточных этапах анализа данных формируется не единственное решение, а списки альтернативных решений с оценками их правдоподобия. Такой подход дает возможность «не потерять» истинное решение на промежуточных этапах, но при этом приводит к значительному увеличению времени полного цикла анализа входного изображения. Таким образом, актуальной является также задача совершенствования подсистемы принятия решений в составе СРТМ.

Вторая глава посвящена моделированию алгоритмической части СРТМ.

Современные методы оптического распознавания текстовой информации достаточно подробно описаны в литературе, однако мало исследованной остается задача синтеза модуля распознавания с заданными характеристиками из базовых алгоритмов с учетом условий эксплуатации. В связи с этим выделен класс A C иерархических эвристических алгоритмов распознавания текстовых меток, которому соответствует большинство описанных в литературе СРТМ:

A(b) AC 2) Correct ( A(b)) {true, false}, где b – вход алгоритма A ; Inf – класс информативных входов, по которым алгоритм A должен возвращать некоторое непустое решение; Empty – класс неинформативных входов, по которым алгоритм A должен возвращать пустое решение; Correct – функция, определяющая, является ли решение алгоритма A по входу b правильным; Ai – алгоритм-компонент алгоритма A, i = 1..n ;

Correct i – функция, определяющая, является ли решение алгоритмакомпонента Ai по входу bi правильным. Важно, что значения функций Correct и Correct i могут быть определены экспертом практически на любом наборе данных. При этом в качестве эксперта при распознавании текстовых меток на видеоизображениях может выступать любой взрослый человек.

Разработана математическая модель СРТМ, отождествляемой с некоторым A AC. Модель позволяет установить функциональную зависимость значений критериев эффективности Q от значений критериев эффективности алгоритмов-компонентов. Кроме того, она задает способы композиции алгоритмов-компонентов, образующих A, из базовых (неделимых) алгоритмов-компонентов, в число которых входят АЛ, АС, АР, АФР, АПР. Два базовых алгоритма являются смежными, если выход одного из них (вышележащего) является входом другого (нижележащего). В работе предложены спецификации входных и выходных данных для базовых алгоритмов СРТМ в целях обеспечения возможности создания их композиций.

Композиция смежных базовых алгоритмов образует алгоритм-компонент Ai, алгоритмы-компоненты (далее алгоритмы) в свою очередь образуют A :

где Ak, Ak +1,..., Alb – смежные базовые алгоритмы, 1 k l m. Таким образом, существуют различные варианты декомпозиции алгоритма A. Алгоритм Ai характеризуется критериями Q i = ( P(Ci ), P ( Fi ), Ti ), где Ci =«выход алгоритма Ai правильный», Ti – затраты времени на анализ единицы входных данных.

Если алгоритм способен давать пустой ответ, то дополнительным критерием может выступать вероятность события Fi =«выход алгоритма Ai не пустой».

Статистические оценки P(C i ), P( Fi ), Ti рассчитываются по массиву прецедентов, созданному экспертом, в котором экзаменационные примеры представляют собой решения композиции вышележащих относительно Ai алгоритмов по входам экзаменационной последовательности B алгоритма A.

Каждому исходу анализа видеоизображения соответствует множество последовательностей событий Ci, Ci, Fi, Fi, определяющих связь Q и Q i :

Perr = 1 Pright Pempty, Pempty = P ( F1 | I ) + P( F2 | IF1 ) +... + P ( Fn | IF1 F2...Fn 1 ), (5) Здесь события I и N указывают на различные (информативные и неинформативные) входы. Среднее время анализа входных данных T рассчитывается с учетом вероятности пустого выхода каждого алгоритмакомпонента:

В третьей главе предложены методы параметрической и структурной адаптации СРТМ. Обычно разработчик СРТМ способен задать ограниченное множество допустимых значений каждого параметра u j {v j,1,...v j,m } используемых алгоритмов-компонентов, и все комбинации значений параметров образуют конечное множество конфигураций Conf. Поскольку критерии Q носят статистический характер, то оптимальные в рамках Conf и B параметры в общем случае являются квазиоптимальными. Задача вычисления оптимальных параметров u * при заданных A, B, h, Conf формулируется как задача максимизации Pright с учетом ограничений на значения всех критериев:

u* = arg max ( Pright (u )), Pright (u*) Pright, Perr (u*) Perr, (8) Иерархическая структура СРТМ позволяет производить раздельную настройку алгоритмов-компонентов. Способ композиции из базовых алгоритмов алгоритмов-компонентов, подлежащих раздельной настройке, предлагается выбирать с учетом затрат времени на составление массива прецедентов и на длительность процесса вычисления u *. При ограниченном количестве значений каждого параметра и заданной конфигурации вышележащих алгоритмов {u 1, u 2,..., u i 1} задачу адаптации алгоритма Ai можно свести к формированию подмножества Conf i, filter :

где пороги Citr, Ti tr задаются с учетом (8). Множество Conf i, filter может быть довольно большим. Его сокращение до множества оптимальных по Парето конфигураций сопряжено с возможностью потерять оптимальную конфигурацию u * СРТМ. Это обусловлено тем, что выходы Ai образуют экзаменационную последовательность для Ai +1, состав которой влияет на эффективность Ai +1, Ai + 2,..., An. Поэтому оптимальная по P(C i ) и Ti конфигурация Ai не обязательно является составляющей оптимальной конфигурации u * алгоритма A (глобально оптимальной). Для выявления всех потенциально глобально оптимальных конфигураций алгоритма Ai предлагается использовать прецедентный критерий – вектор V = (V1,V2,...,Vsz ), результат анализа экзаменационного входа Inp j, «~» – знак эквивалентности, sz – количество экзаменационных примеров. Необходимое условие глобальной оптимальности (НУГО) конфигурации u i, которой соответствует прецедентный критерий V i, следующее: конфигурация u i должна быть оптимальна по Парето по векторному критерию q i = (V1i,V2i,...,Vsz, Ti ) на множестве Conf i. Тогда результатом настройки алгоритма Ai является сформированное из Conf i, filter множество удовлетворяющих НУГО конфигураций Conf i,opt. Если Conf i, filter не пусто, то формируется множество оптимальных по Парето конфигураций:

где Paretou – функция, определяющая, является ли конфигурация u i, характеризующаяся векторным критерием q i (u i ), оптимальной по Парето на множестве Conf i, filter.

Метод вычисления u * заключается в последовательном, то есть от вышележащих алгоритмов к нижележащим, вычислении множеств Conf i,opt, образующих в результате множество потенциально оптимальных конфигураций Conf opt (если i 1..n Conf i,opt ). Для элементов Conf opt вычисляются критерии эффективности, исходя из которых выбирается u *.

Настройка параметров представленного в работе модуля распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта предложенным методом заняла менее 16 часов. При тех же условиях настройка методом перебора потребовала бы несколько лет.

Настройка модуля распознавания, входящего в состав оптоэлектронной системы «ARSCIS», позволила повысить значение статистической оценки вероятности правильной идентификации ж/д вагонов по месту внедрения системы на станции Череповец на 3.4% по сравнению с ручной настройкой, произведенной разработчиками системы, без ухудшения значений остальных статистических критериев.

Как было отмечено выше, в целях повышения эффективности СРТМ применяется «мягкая схема» принятия решений. В работе предложен алгоритм усечения списков (АУС) вариантов решений, принимающий решения об усечении списков до приемлемого размера либо их отклонении. Параметр АУС K i ограничивает длину СВР алгоритма Ai. Решение о принятии или отклонении СВР выполняется по результатам сравнения осредненной оценки правдоподобия элементов усеченного списка с порогом Ei.

Задачей настройки подсистемы принятия решений СРТМ является поиск оптимальных при заданных A, B, h и конечном Conf АУС значений порогов u АУС = {K, E}. Часто требуется производить настройку АУС отдельно от параметров алгоритмов-компонентов (при фиксированной конфигурации u ), для решения этой задачи разработан следующий метод. Пусть A АУС A C, при этом A АУС = { A1, A2,..., An }, где каждый Ai возвращает СВР. Для расчета оптимальных значений порогов u АУС параметры АУС устанавливаются в такие значения K imax и Eimin, при которых СВР пропускаются и не усекаются. В итоге выходом A является полный список вариантов решений, сформированных по результатам анализа видеоизображения. Далее по множеству B статистически оцениваются Pright (u АУС ), Perr (u АУС ), Pfalse (u АУС ).

Каждое решение d j из полного списка решений d = {d1, d 2,..., d k } алгоритма A образовано последовательностью промежуточных решений алгоритмов-компонентов: d 1, d 2,…, d n1, d j = d n. Каждое промежуточное решение d ij занимает определенную позицию p(d ij ) в соответствующем СВР, характеризующемся оценкой правдоподобия e(d ij ), а его корректность устанавливается с использованием массива прецедентов. Характеристики решений d j :

позволяют установить исход анализа примера B j при любой конфигурации u АУС и сформировать множество:

Из полученного множества удаляются конфигурации, не удовлетворяющие ограничению T tr :

где T (u АУС ) либо измеряется экспериментально, либо оценивается предложенным в работе способом, который основан на статистическом расчете среднего количества вызовов каждого алгоритма-компонента на одно видеоизображение при заданном u АУС. Экспериментальной базой для исследования метода послужил модуль распознавания идентификационных номеров объектов подвижного состава железнодорожного транспорта, описанный в гл. 4.

Рис. 1. Оцененные и измеренные средние затраты времени на анализ В ходе эксперимента настройка предложенным методом параметров АУС указанной системы при | Conf АУС |= 40000 заняла около 20 минут. При аналогичных условиях непосредственное «переборное» вычисление значений критериев эффективности каждой конфигурации займет 31 сутки.

В главе 3 также предложен способ структурной адаптации СРТМ, функционирующих в режиме реального времени, направленный на снижение затрат времени T. Для этого в состав СРТМ включается алгоритм, синтезированный из АС и АР, который производит классификацию локализованных зон на содержащие и не содержащие текстовую метку посредством анализа их фрагментов. Обосновано, что отсев неинформативных зон позволяет сократить средние затраты времени на анализ последовательности видеоизображений, существенная доля которых не содержит текстовых меток.

В четвертой главе дано описание разработанных алгоритмов модуля распознавания системы идентификации объектов подвижного состава железнодорожного транспорта и результатов экспериментов по их адаптации с использованием предложенных в гл. 3 методов.

Алгоритм локализации на первом этапе производит наложение фильтра на исходное изображение I mn, что дает матрицу E mn, характеризующую уровень изменения яркости в окрестности каждого пикселя I i, j. На втором этапе производится анализ E mn с целью локализации зон Z hw, характеризующихся повышенным средним значением элементов Ei, j относительно окружающих зону элементов Ei, j. Оценкой правдоподобия зоны является ее среднее значение Ei, j. Зона анализируется алгоритмом сегментации, основанном на применении гистограммы яркости. Алгоритм распознавания реализован в виде комплекса многослойных персептронов, производящих двухэтапную (класс символа, подтверждение) классификацию сегментов. Алгоритм формирования решений, основанный на поиске в глубину, формирует из распознанных сегментов с учетом их координат варианты текстовых меток. В качестве итогового выбирается решение с максимальной суммарной оценкой правдоподобия сегментов, образующих решение.

В работе приведен пример требований технического задания к разработанной СРТМ и дано подробное описание процесса параметрической адаптации системы, а также представлены результаты экспериментов по ее структурной адаптации. В состав разработанного модуля распознавания был включен алгоритм классификации зон (АКЗ), производящий сегментацию фрагментов зон, распознавание сегментов и принятие решения о классификации на основании количества распознанных сегментов (табл. 1).

Экзаменационная последовательность состояла из 550 кадров с изображениями железнодорожных цистерн и вагонов с видимым идентификационным номером на борту, а также 688 изображений цистерн и вагонов без номера в кадре.

Результаты экспериментов по сравнению эффективности типовой СРТМ и информативных кадров), сек.

Эксперименты показали, что статистические показатели эффективности СРТМ с АКЗ при подобной структурной адаптации идентичны показателям исходной СРТМ. В то же время использование АКЗ позволило сократить среднее время анализа видеоизображения примерно на 50%, с учетом того, что в заданных условиях около 23% кадров содержат образ номера. Доверительный интервал для Pright = 0.65 при надежности оценки = 0.95 равен (0.62, 0.68), оценка t = 0.60 характеризуется P(| t t | 0.02) = 0.923.

В заключении подводятся итоги работы, формулируются основные выводы.

ОБЩИЕ ВЫВОДЫ ПО РАБОТЕ

Установлено, что в настоящее время большинство описанных в литературе систем распознавания текстовых меток на видеоизображениях являются многопараметрическими системами и имеют однотипную структуру, представленную композицией алгоритмов локализации, сегментации, распознавания и принятия решений.

Такие системы могут быть описаны представленной в работе моделью СРТМ, и к ним применимы предложенные автором методы параметрической и структурной адаптации СРТМ с учетом заданных условий эксплуатации. Для большинства современных СРТМ данные методы позволяют:

- Находить за приемлемое время оптимальный (в рамках заданной экзаменационной последовательности видеоизображений и дискретизации значений параметров) набор значений параметров системы.

- Снизить трудозатраты на параметрическую адаптацию системы.

На практике это дает возможность повышать эффективность не только самих СРТМ, но и процессов их разработки и внедрения, поскольку предложенные методы позволяют производить внедрение и вторичную настройку СРТМ без привлечения алгоритмистов-разработчиков, снижая трудоемкость процесса внедрения и его длительность.

Предложенный в работе способ повышения эффективности функционирования СРТМ за счет их структурной адаптации позволяет существенно снизить среднее время анализа видеоизображений в тех условиях, когда значительная часть поступающих на вход СРТМ видеоизображений не содержит образ текстовой метки. При этом не требуется сопутствующая модификация базовых алгоритмов СРТМ.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

В изданиях, рекомендованных ВАК:

1. Воскресенский, Е. М. Метод декомпозиции и вычисления показателей эффективности систем распознавания текстовых меток на видеоизображениях [Текст] / Е. М. Воскресенский, В. А. Царев // Научнотехнические ведомости СПбГПУ. – 2008. – №3. – С. 140–145.

2. Воскресенский, Е. М. Метод оценки эффективности систем распознавания текстовых меток на сложном фоне с использованием дерева вероятностных характеристик [Текст] / Е. М. Воскресенский, В. А. Царев // Компьютерная Оптика. – 2008. – Т.32. – №3. – С. 283–290.

3. Воскресенский, Е. М. Методы управления процессом распознавания текстовых меток на изображениях [Текст] / Е. М. Воскресенский, В. А.

Царев // Компьютерная Оптика. – 2008. – Т.32. – №4. – С. 413–416.

4. Воскресенский, Е. М. Метод параметрической оптимизации процесса принятия решений в системах распознавания текстовых меток на видеоизображениях [Текст] / Е. М. Воскресенский, В. А. Царев // Компьютерная Оптика. – 2009. – Т. 33. – №2. – С. 202–209.

В иных изданиях:

5. Воскресенский, Е. М. Моделирование и адаптация систем распознавания текстовых меток на видеоизображениях [Текст] : монография / Е.М.

Воскресенский, В.А. Царев. – Череповец: ИНЖЭКОН-Череповец, 2009. – 154 с. – ISBN 978-5-902459-06-4.

6. Воскресенский, Е. М. Классификация фрагментов изображений в задаче поиска и локализации графических образов текстовых меток на сложном фоне [Текст] / Е. М. Воскресенский, В. А. Царев // Образование, наука, бизнес: особенности регионального развития и интеграции: Сборник трудов Всероссийской научно-методической конференции. – Череповец: ИМИТ СПбГПУ, 2004. – С. 262–270.

7. Воскресенский, Е. М. Программная реализация нейронной сети прямого распространения на языке C# и ее применение в задачах классификации изображений [Текст] / Е. М. Воскресенский, В. А. Царев // Технологии Microsoft в теории и практике программирования: Материалы межвузовского конкурса-конференции студентов, аспирантов и молодых ученых Северо-Запада. – СПб.: Изд-во Политехн. ун-та, 2005. – С.19–20.

8. Воскресенский, Е. М. Распознавание буквенно-цифровых символов с использованием нейронных сетей на примере изображений цифр регистрационных номеров транспортных средств [Текст] / Е. М.

Воскресенский, Е. Н. Веснин // Образование, наука, бизнес: особенности регионального развития и интеграции: Сборник трудов Всероссийской научно-практической конференции. – Череповец: ИМИТ СПбГПУ, 2005. – С. 246–250.

9. Воскресенский, Е. М. Исследование процедур сегментации цифровых изображений идентификационных номеров железнодорожных вагонов [Текст] / Е. М. Воскресенский // Образование, наука, бизнес: особенности регионального развития и интеграции: Сборник трудов Всероссийской научно-практической конференции. – Череповец: ИМИТ СПбГПУ, 2006. – С. 283–286.

10.Воскресенский, Е. М. Методы и средства автоматизации разработки систем распознавания [Текст]/ Е. М. Воскресенский, В. А. Царев // Технологии Microsoft в теории и практике программирования: Материалы межвузовского конкурса-конференции студентов, аспирантов и молодых ученых Северо-Запада. – СПб.: Изд-во Политехн. ун-та, 2007. – С. 156–157.

11.Voskresenskiy, E. M. Design automation of text labels recognition systems [Text] / E. M. Voskresenskiy // Pattern Recognition and Information Processing (PRIP-2007): Proceedings of the Ninth International Conference. – Minsk: United Institute of Informatics Problems of National Academy of Science of Belarus, 2007. – Vol. II. – P. 236–239.

12.Voskresenskiy, E. M. Text label recognition systems efficiency control using localization and segmentation algorithms output likelihood [Text] / E. M.

Voskresenskiy, V. А. Tsarev // International Conference «Pattern Recognition and Image Analysis: New Information Technologies» (PRIA-8-2007): Conference Proceedings. – Yoshkar-Ola: Mari State Technical University, 2007. – Vol. 3. – P.

57–61.

13.Воскресенский, Е. М. Метод оценки эффективности систем распознавания текстовых меток на сложном фоне с использованием дерева вероятностных характеристик [Текст] / Е. М. Воскресенский, В. А. Царев // Технологии Microsoft в теории и практике программирования: Материалы межвузовского конкурса-конференции студентов, аспирантов и молодых ученых Северо-Запада. – СПб.: Изд-во Политехн. ун-та, 2008. – С. 193–194.

14.Воскресенский, Е. М. Метод расчета эффективности систем распознавания текстовых меток на видеоизображениях [Текст] / Е. М. Воскресенский // Сборник трудов всероссийской научной конференции студентов и аспирантов «Молодые исследователи – регионам». – Вологда: ВоГТУ, 2008.

– С. 47–48.

15.Voskresenskiy, E. M. Methods of searching for quasioptimal configurations of text label recognition systems [Text] / E. M. Voskresenskiy // International Conference «Pattern Recognition and Image Analysis: New Information Technologies» (PRIA-9-2008): Conference Proceedings. – Nizhni Novgorod: N. I.

Lobachevski State University of Nizhni Novgorod, 2008. – Vol. 2. – P. 307–311.

16.Воскресенский, Е. М. Модель системы распознавания текстовых меток на видеоизображениях с использованием событийного представления процесса анализа видеокадров [Текст] / Е. М. Воскресенский // Материалы II (вторых) ежегодных смотров-сессий аспирантов и молодых ученых Вологодской области по отраслям наук. – Вологда: ВоГТУ, 2008. – Т. 1. – С. 13–20.



Похожие работы:

«РОГОВА ИРИНА АЛЕКСАНДРОВНА КОМПЛЕКСНОЕ УПРАВЛЕНИЕ ХОЗЯЙСТВЕННЫМ РИСКОМ НА ПРЕДПРИЯТИЯХ ИНДУСТРИИ ТУРИЗМА Специальность 08.00.05 – Экономика и управление народным хозяйством (экономика, организация и управление предприятиями, отраслями, комплексами - сфера услуг) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата экономических наук Москва – 2009 2 Диссертация выполнена на кафедре Таможенный менеджмент Института туризма и развития рынка Государственного...»

«КЛАДЬКО ВАСИЛИЙ ПЕТРОВИЧ УДК: Б39.26 - 548.731 ЗАВИСИМОСТЬ РАССЕЯНИЯ РЕНТГЕНОВСКОГО ТОРМОЗНОГО ИЗЛУЧЕНИЯ ОТ СТРУКТУРНОГО СОВЕРШЕНСТВА МОНОКРИСТАЛЛОВ БИНАРНЫХ И ТРОЙНЫХ СОЕДИНЕНИЙ. Специальность 01.04.07 - физика твердого тела Автореферат диссертации на соискание ученой степени кандидата фнзико-математических наук Киев - 1986 г. Работа выполнена в Институте полупроводников АН УССР...»

«ЕВСИКОВА Наталья Ивановна ВЛИЯНИЕ ВАРИАТИВНОЙ ОБРАЗОВАТЕЛЬНОЙ СРЕДЫ НА ЭМОЦИОНАЛЬНО-ЛИЧНОСТНОЕ РАЗВИТИЕ УЧАЩЕГОСЯ В ПОЛНОМ ЦИКЛЕ ШКОЛЬНОГО ОБУЧЕНИЯ Специальность 19.00.07 – Педагогическая психология (психологические наук и) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата психологических наук Москва - 2009 2 Диссертация выполнена на кафедре общей психологии факультета психологии Московского государственного университета имени М.В. Ломоносова. доктор...»

«ЛЕПЕХИНА Ирина Владимировна МОДЕЛЬ РЫНКА ТРУДА В ПЕРЕХОДНОЙ ЭКОНОМИКЕ РОССИИ Специальность 08.00.01. - Экономическая теория АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата экономических наук Красноярск - 2002 Работа выполнена на кафедре экономической теории Красноярского государственного университета Научный руководитель : кандидат экономических наук, доцент Т.М. Шибитова...»

«ДЖАБИРОВ РАШИД ПАШАЕВИЧ Этническое и культурное возрождение народа Дагестана в современных условиях Специальность: 24.00.01 – теория и история культуры Автореферат Диссертации на соискание ученой степени кандидата философских наук Москва - 2006 Диссертация выполнена на кафедре культурологии и менеджмента в культуре Государственного университета управления Научный руководитель доктор философски наук, профессор Диденко Валерий Дмитриевич Официальные оппоненты доктор философских...»

«ОРУДЖЕВ РАСИМ ГАРДАШХАН ОГЛЫ ЗАКОНОМЕРНОСТИ СТАНОВЛЕНИЯ И ЭВОЛЮЦИИ ГОСУДАРСТВЕННОЙ ВЛАСТИ В АСПЕКТЕ ПОЛИТИКО-ПРАВОВОЙ ИСТОРИИ ДЕРЖАВ СТЕПНЫХ НАРОДОВ ЕВРАЗИИ И ДРЕВНЕРУССКОЙ ГОСУДАРСТВЕННОСТИ КИЕВСКОГО КАГАНАТА (историко-правовой аспект) Специальность 12.00.01. – Теория и история права и государства; история учений о праве и государстве АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Санкт-Петербург Работа выполнена на кафедре государственного и...»

«Чжан Цзе ГИПЕРГЕННЫЕ ИЗМЕНЕНИЯ ИНЖЕНЕРНО-ГЕОЛОГИЧЕСКИХ СВОЙСТВ МОРЕННЫХ СУГЛИНКОВ МОСКОВСКОГО РЕГИОНА И ЛАТЕРИТОВ ЮЖНОГО КИТАЯ Специальность 25.00.08 – инженерная геология, мерзлотоведение и грунтоведение АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата геолого-минералогических наук Москва – 2010 Работа выполнена на кафедре инженерной геологии Российского государственного геологоразведочного университета им. С. Орджоникидзе Научный руководитель : доктор...»

«УДК 37.018 Максименко Елена Юрьевна РАЗВИТИЕ ПЕДАГОГИЧЕСКИХ КОМПЕТЕНЦИЙ У РОДИТЕЛЕЙ ШКОЛЬНИКОВ 13.00.01 - общая педагогика, история педагогики и образования АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата педагогических наук Пятигорск - 2012 Работа выполнена в ФГБОУ ВПО Пятигорский государственный лингвистический университет на кафедре педагогики Научный консультант - доктор педагогических наук, профессор, заслуженный деятель науки РФ МАКАЕВ Вячеслав...»

«УДК 519.63:533.6 КАРСКАНОВ Сергей Андреевич ПРЯМОЕ ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ ТРЕХМЕРНЫХ ТЕЧЕНИЙ ГАЗА В ПЛОСКОМ КАНАЛЕ С РЕЗКИМ РАСШИРЕНИЕМ Специальность: 01.02.05 – Механика жидкости, газа и плазмы Автореферат диссертации на соискание учёной степени кандидата физико-математических наук Ижевск - 2009 Работа выполнена в Учреждении Российской академии наук Институте прикладной механики УрО РАН Научный руководитель : академик РАН Липанов Алексей Матвеевич Официальные оппоненты :...»

«Кичаев Петр Евгеньевич РАЗРАБОТКА ЭНЕРГЕТИЧЕСКОЙ МОДЕЛИ РЕОЛОГИЧЕСКОГО ДЕФОРМИРОВАНИЯ И РАЗРУШЕНИЯ МЕТАЛЛОВ ПРИ ВИБРОПОЛЗУЧЕСТИ 01.02.04 – Механика деформируемого твердого тела Автореферат диссертации на соискание ученой степени кандидата физико-математических наук Самара – 2006 Работа выполнена в Самарском государственном техническом университете Научный руководитель : доктор физико-математических наук, профессор Радченко Владимир Павлович Официальные оппоненты : доктор...»

«БОРИСОВ АЛЕКСЕЙ ПАВЛОВИЧ РЕЖИМЫ ПРОЦЕССА РАЗРУШЕНИЯ ЗЕРНА ПОСРЕДСТВОМ МАЯТНИКОВОГО ИЗМЕЛЬЧИТЕЛЯ Специальность 05.20.01 – Технологии и средства механизации сельского хозяйства АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Барнаул – 2009 2 Работа выполнена в Алтайском государственном техническом университете им. И.И. Ползунова Научный руководитель : доктор технических наук, профессор, заслуженный изобретатель РФ В.Л. Злочевский (ГОУ ВПО...»

«ОДИНЦОВ СЕРГЕЙ СЕРГЕЕВИЧ ОРГАНИЗАЦИЯ ПРОЦЕССА ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ ЭКОНОМИЧЕСКОГО РАЗВИТИЯ ПРОМЫШЛЕННОГО ПРЕДПРИЯТИЯ Специальность 08.00.05 – Экономика и управление народным хозяйством (экономика, организация и управления предприятиями, отраслями, комплексами: промышленность) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата экономических наук Санкт-Петербург-2013 2 Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего...»

«Соловьева Татьяна Владимировна РЕАЛИЗАЦИЯ В ГРАЖДАНСКОМ СУДОПРОИЗВОДСТВЕ АКТОВ ВЫСШИХ СУДЕБНЫХ ОРГАНОВ 12.00.15 – гражданский процесс, арбитражный процесс АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора юридических наук Саратов – 2014 Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования Саратовская государственная юридическая академия доктор юридических наук, профессор Научный консультант :...»

«Абдрашитов Андрей Владимирович СТРУКТУРНЫЕ ИЗМЕНЕНИЯ ПЛАЗМЕННО-ПЫЛЕВЫХ КРИСТАЛЛОВ В ПОЛЯХ РАЗЛИЧНОЙ КОНФИГУРАЦИИ Специальности: 01.04.07 – физика конденсированного состояния 01.04.02 – теоретическая физика АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Томск – 2011 Работа выполнена в Учреждении Российской академии наук Институте физики прочности и материаловедения Сибирского отделения РАН Научные руководители: доктор...»

«ВАЛЕЕВ МАРАТ ЮНУСОВИЧ ПРОЕКТИРОВАНИЕ СИСТЕМЫ НЕПРЕРЫВНОЙ ИНФОРМАЦИОННОЙ ПОДГОТОВКИ ИНЖЕНЕРОВ ДЛЯ НАУКОЕМКИХ ПРОИЗВОДСТВ (НА ПРИМЕРЕ СПЕЦИАЛЬНОСТИ АВТОМАТИЗИРОВАННЫЕ СИСТЕМЫ ОБРАБОТКИ ИНФОРМАЦИИ И УПРАВЛЕНИЯ) 13.00.08 -теория и методика профессионального образования АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата педагогических наук Казань 2002 Работа выполнена на кафедре Автоматизации и информационных технологий Казанского государственного технологического...»

«СИЛИНЕНКО Александр Витальевич РАЗГРАНИЧЕНИЕ ДОСТУПА В IP-СЕТЯХ НА ОСНОВЕ МОДЕЛЕЙ СОСТОЯНИЯ ВИРТУАЛЬНЫХ СОЕДИНЕНИЙ Специальность 05.13.19 – Методы и системы защиты информации, информационная безопасность АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Санкт-Петербург – 2010 Работа выполнена в Государственном образовательном учреждении высшего профессионального образования Санкт-Петербургский государственный политехнический университет Научный...»

«КАЙНОВА ЮЛИЯ ВЛАДИМИРОВНА ПРАВОВОЕ РЕГУЛИРОВАНИЕ БАНКОВСКОЙ ТАЙНЫ В РОССИЙСКОЙ ФЕДЕРАЦИИ (административно – правовой аспект) Специальность 12.00.14 – Административное право; финансовое право; информационное право АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Санкт-Петербург 2008 2 Работа выполнена на кафедре государственного и административного права ГОУ ВПО Санкт-Петербургский инженерно-экономический университет. Научный руководитель : доктор...»

«АМЕЛИЧЕВА ВАРВАРА МАКСИМОВНА АНАЛИЗ СЕМАНТИКИ И ФУНКЦИОНИРОВАНИЯ ПРЕДЛОГА DE В ПРЕДЛОЖНОЙ СИСТЕМЕ ФРАНЦУЗСКОГО ЯЗЫКА Специальность 10.02.05 — романские языки АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук Москва — 2010 Работа выполнена на кафедре французского языкознания филологического факультета ФГОУ ВПО Московский государственный университет им. М.В. Ломоносова. НАУЧНЫЙ РУКОВОДИТЕЛЬ: доктор филологических наук, доцент, зав. кафедрой...»

«Сутурин Михаил Александрович ОБЯЗАТЕЛЬНЫЕ РАБОТЫ В ОТНОШЕНИИ НЕСОВЕРШЕННОЛЕТНИХ 12.00.08 – уголовное право и криминология; уголовно-исполнительное право АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Томск 2011 Работа выполнена на кафедре уголовно-исполнительного права и криминологии ФГБОУ ВПО Национальный исследовательский Томский государственный университет Научный руководитель : доктор юридических наук, профессор Прозументов Лев Михайлович...»

«ДОНЧЕНКО Сергей Сергеевич ПОЭТИЧЕСКАЯ ТРАДИЦИЯ НАРОДНЫХ ПЕВЦОВ БЕНГАЛИИ: ТВОРЧЕСТВО БАУЛОВ Специальность 10.01.03 – литература народов стран зарубежья (литературы стран Азии и Африки) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук Санкт-Петербург 2011 Работа выполнена на кафедре индийской филологии Восточного факультета Санкт-Петербургского государственного университета. Научный руководитель...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.