WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

На правах рукописи

ГЕНРИХОВ ИГОРЬ ЕВГЕНЬЕВИЧ

ПОСТРОЕНИЕ И ИССЛЕДОВАНИЕ ПОЛНЫХ

РЕШАЮЩИХ ДЕРЕВЬЕВ ДЛЯ ЗАДАЧ

КЛАССИФИКАЦИИ ПО ПРЕЦЕДЕНТАМ

05.13.17 – теоретические основы информатики

Автореферат диссертации на соискание ученой степени

кандидата физико-математических наук

Москва – 2013

Работа выполнена на кафедре теоретической информатики и дискретной математики математического факультета в Федеральном государственном бюджетном образовательном Учреждении Высшего профессионального образования Московский педагогический государственный университет

Научный руководитель: доктор физико-математических наук, профессор Дюкова Елена Всеволодовна

Официальные оппоненты: Сенько Олег Валентинович, доктор физикоматематических наук, ведущий научный сотрудник, Федеральное государственное бюджетное Учреждение науки Вычислительный центр им. А. А. Дородницына Российской академии наук Середин Олег Сергеевич, кандидат физикоматематических наук, доцент, Федеральное государственное бюджетное образовательное Учреждение Высшего профессионального образования Тульский государственный университет

Ведущая организация: Федеральное государственное бюджетное Учреждение науки Институт математики и механики им. Н. Н.

Красовского Уральского отделения Российской академии наук

Защита диссертации состоится «_» 2013 г. в _ часов на заседании диссертационного совета Д 002.017.02 при Федеральном государственном бюджетном Учреждении науки Вычислительный центр им. А. А. Дородницына Российской академии наук по адресу: 119333, Москва, ул. Вавилова, дом 40, конференц-зал.

С диссертацией можно ознакомиться в библиотеке Федерального государственного бюджетного Учреждения науки Вычислительный центр им. А. А. Дородницына Российской академии наук.

Автореферат разослан «_»_ 2013 г.

Ученый секретарь Диссертационного совета Д 002.017.02, д.ф.-м.н., профессор В. В. Рязанов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Одной из центральных задач распознавания образов является задача распознавания по прецедентам. Известным инструментом решения данной задачи являются деревья решений. Синтез классического решающего дерева (РД) представляет собой итерационный процесс. Как правило, для построения очередной внутренней вершины дерева выбирается признак, который наилучшим образом удовлетворяет некоторому критерию ветвления, т.е.

наилучшим образом разделяет текущее множество обучающих объектов. По каждой ветви, исходящей из построенной вершины, осуществляется спуск и строится либо лист дерева, либо новая внутренняя вершина. Каждому листу приписан один из классов, и, как правило, в листе содержится вся информация, позволяющая сделать вывод о принадлежности распознаваемого объекта классу, который приписан данному листу. Основные достоинства метода: решающее правило строится быстро, получается достаточно простым и хорошо интерпретируемым, появляется дополнительная возможность изучать влияние отдельных признаков. Однако, если при построении дерева несколько признаков удовлетворяют критерию ветвления в равной или почти равной мере, то выбор одного из них происходит случайным образом. Поэтому, в зависимости от выбранного признака, построенные деревья могут существенно отличаться как по составу используемых признаков, так и по своим распознающим качествам.

В работе Е. В. Дюковой и Н. В. Пескова 1 предложена конструкция РД, названная полным решающим деревом (ПРД). В отличие от классического РД, в ПРД на каждой итерации строится так называемая полная вершина, которой соответствует набор признаков X. В набор X попадают все признаки, удовлетворяющие выбранному критерию ветвления. Далее по аналогии с классическим РД проводится ветвление по каждому из признаков, входящих в X.

В ПРД, в отличие от классического РД, описание распознаваемого объекта S может принадлежать разным листьям ПРД. Поэтому выбор класса, которому Djukova E. V., Peskov N. V. А classification algorithm based on the complete decision tree // Pattern Recognition and Image Analysis. – 2007. – Vol. 17, no. 3. – Pp. 363-367.

принадлежит объект S, осуществляется на основе коллективного голосования по листьям дерева (голосования по большинству). Предложенная модель РД была успешно продемонстрирована её авторами на примере усовершенствования алгоритма построения допустимых разбиений (АДР).

В работах зарубежных ученых В. Бунтина (1992) и Р. Кохави (1997) была рассмотрена конструкция РД, близкая к конструкции ПРД. Однако использование предложенных В. Бунтиным и Р. Кохави моделей РД требовало существенных затрат времени и памяти. В связи с чем решалась оптимизационная задача определения допустимого числа признаков, образующих полную вершину, и полные вершины строились не на всех ярусах РД.

Следует отметить, что конструкция ПРД изучалась в указанной выше работе Е. В. Дюковой и Н. В. Пескова исключительно на задачах с целочисленной информацией низкой значности, в частности, бинарной. В большинстве прикладных задач признаки описаны в вещественнозначном пространстве, при этом в признаковых описаниях объектов могут встречаться пропуски (случай неполной информации). Кроме того, часто встречаются задачи, в которых обучающие объекты неравномерно распределены по классам (в этом случае можно указать пару классов таких, что число обучающих объектов в одном из них существенно больше числа обучающих объектов в другом).



Актуальной задачей является исследование обобщающей способности РД (надежности и качества принятия решения). С этой целью применяются различные подходы, в частности подходы, использующие такие понятия, как емкость семейства, из которого выбирается классификатор, радемахеровская сложность этого семейства и отступ (margin) обучающего объекта от границы класса, которому принадлежит этот объект. С изучением обобщающей способности связана проблема переобученности (overfitting, overtraining) распознающего алгоритма, возникающая из-за того, что алгоритм слишком «подогнан» под обучающую информацию, и, как следствие, качество распознавания на новых объектах оказывается плохим.

Представляют интерес задачи изучения комбинаторной сложности РД (получения оценок мощности множества вершин и мощности множества ребер) и временной сложности синтеза РД.

Перечисленные вопросы в основном исследованы для бинарного РД (БРД).

Результаты, полученные для БРД, легко обобщаются на k-арные РД. Случай ПРД является более сложным, так как появляется новый тип вершин, существенно усложняющий конструкцию дерева.

Целью диссертации является построение и исследование распознающих процедур на основе ПРД с энтропийным критерием ветвления, решающих задачу распознавания с вещественнозначной, неполной и неравномерно распределенной информацией, изучение обобщающей способности ПРД и получение оценок комбинаторной и временной сложности ПРД.

Научная новизна. Все основные результаты работы являются новыми.

Развит подход к решению задачи распознавания по прецедентам, позволяющий более полно по сравнению с другими подходами, базирующимися на РД, использовать обучающую информацию. Впервые построены и изучены распознающие процедуры на основе ПРД с энтропийным критерием для задач классификации по прецедентам. За счет применения взвешенного голосования по листьям ПРД усовершенствовано решающее правило, применявшееся в первоначальной конструкции ПРД. Для оценки качества построенных алгоритмов использован скользящий контроль, ROC-анализ и представление классификатора в виде выпуклой корректирующей процедуры.

Для задачи с бинарной информацией получены верхние оценки емкости семейства ПРД. На прикладных задачах исследована эмпирическая радемахеровская сложность ПРД. Получена оценка обобщающей способности ПРД, учитывающая отступы обучающих объектов.

Предложен и апробирован метод снижения переобученности ПРД, основанный на вычислении средней глубины дерева и среднего числа обучающих объектов, описания которых попадают в лист дерева. Снижение переобученности ПРД достигается за счет обрезания ветвей дерева.

Для задачи с m объектами и n признаками (при фиксированной глубине дерева и при условии, что из каждой вершины ПРД, не являющейся полной, выходит ровно две дуги) получены значения числовых характеристик ПРД и оценки времени синтеза ПРД. В указанном случае найдено максимальное число ребер ПРД, максимальное число полных вершин ПРД, максимальное число вершин ПРД, не являющихся полными, и максимальное число листьев ПРД. В общем случае получены оценки времени синтеза ПРД. Показано, что эти оценки могут быть улучшены в некоторых важных частных случаях.

В работе применялись методы и понятия распознавания образов, дискретной математики, комбинаторики, теории информации, теории сложности алгоритмов.

Теоретическая и практическая значимость. Результаты, полученные в диссертационной работе, могут быть использованы в теоретических исследованиях, касающихся построения эффективных реализаций для процедур распознавания на основе РД, а также при разработке спецкурсов по распознаванию образов, преподаваемых в госуниверситетах. Практическая значимость подтверждена тестированием на большом числе прикладных задач из различных областей.

Апробация работы. Результаты диссертационной работы докладывались и обсуждались на научных семинарах кафедры «Теоретической информатики и дискретной математики» в МПГУ; на научных семинарах ВЦ РАН; на мероприятии «Круглый стол молодых ученых по приоритетным направлениям развития науки», проводимом в МПГУ, 2007 г. и 2008 г.; на 14-ой Всероссийской конференции «Математические методы распознавания образов», гор. Суздаль, 2009 г.; на 8-ой Международной конференции «Интеллектуализация обработки информации», гор. Пафос (Кипр), 2010 г.; на 15-ой Всероссийской конференции «Математические методы распознавания образов», гор. Петрозаводск, 2011 г.

Публикации. По результатам диссертации опубликовано 9 печатных работ;

из них 4 статьи входят в список ВАК РФ. Описания основных результатов включались в научные отчеты по проектам РФФИ 07-01-00516-а, 10-01-00770-а и в отчеты по грантам президента РФ по поддержке ведущих научных школ НШ №5294.2008.1 и НШ №7950.2010.1.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложения. Содержание диссертации изложено на 169 страницах. Список использованной литературы содержит наименования отечественных и зарубежных источников.

СОДЕРЖАНИЕ ДИССЕРТАЦИОННОЙ РАБОТЫ

В автореферате сохранена нумерация разделов, определений и теорем, используемая в диссертационной работе.

Во введении обоснована актуальность темы, сформулированы цель и задачи диссертационной работы, перечислены основные результаты, приведено описание структуры диссертации.

В главе 1 рассмотрены методы построения РД в распознающих алгоритмах АДР и С4.5. Показана связь алгоритмов АДР и С4.5 с распознающими алгоритмами, основанными на поиске информативных фрагментов в признаковых описаниях объектов.

В разделе 1.1 введены основные понятия, используемые в работе.

Пусть исследуется некоторое множество объектов M. Объекты из M описываются системой признаков {x1,..., xn}. Известно, что множество M представимо в виде объединения непересекающихся подмножеств, называемых классами K1,..., Kl, l 2. Дано конечное множество объектов (прецедентов или обучающих объектов) {S1,..., Sm} из M, о которых известно, каким классам они принадлежат. Требуется по описанию в системе признаков {x1,..., xn} некоторого объекта S из M определить класс, которому принадлежит объект S.

В данном разделе описывается процедура построения РД для задачи распознавания по прецедентам с целочисленными признаками.

Обозначим через T и X (T ) соответственно подмножество обучающих объектов и подмножество признаков, рассматриваемые на текущем шаге построения РД. На первом шаге T {S1,..., Sm}, X (T ) {x1,..., xn}.

На текущем шаге синтеза РД строится либо внутренняя вершина, либо лист дерева. Для построения внутренней вершины выбирается некоторый признак x из X (T ), который наилучшим образом разделяет объекты из разных классов. Пусть V – множество различных значений признака x, встречающихся в описаниях объектов из T. В этом случае из вершины, соответствующей признаку x, строится | V | дуг, помеченных разными числами из V. Далее по каждой дуге осуществляется спуск и строится либо лист дерева, либо следующая внутренняя вершина. При спуске по дуге с меткой, V, из T удаляются те объекты, для которых значение признака x не равно, из X (T ) удаляется признак x. Данный процесс синтеза РД повторяется до тех пор, пока не выполнится условие останова.

Пусть ветвь РД порождена внутренними вершинами x j1,..., x jr, i – метка дуги, выходящей из вершины x ji, i 1,..., r. Тогда рассматриваемой ветви можно поставить в соответствие пару ( B, K ), где K {K1,..., Kl }, а B – элементарная конъюнкция (э.к.) вида x1...x r, в которой x 1, если x, и x 0 иначе.

{S1,..., Sm} Определение 1.11. Ветвь РД называется корректной, если наборы из N B являются описаниями объектов только одного класса. В этом {S1,..., Sm} случае интервал N B называется допустимым.

Определение 1.12. РД называется корректным, если каждая ветвь РД является корректной.

Наиболее часто применяется следующее решающее правило. Пусть построено РД с листьями ( B1, K j1 ),...,( B, K j ). Из построения РД следует, что если найдется i, i {1,..., }, такое, что S N Bi, то S относится к классу K ji. В противном случае происходит отказ от распознавания.

В разделе 1.2 описан алгоритм АДР, строящий корректное БРД. Алгоритм АДР разбивает множество описаний обучающих объектов на непересекающиеся интервалы, которые являются допустимыми интервалами. Такое разбиение называется оптимальным допустимым разбиением, если оно состоит из минимального числа допустимых интервалов. Синтез оптимального допустимого разбиения является NP-полной задачей. Для построения допустимого разбиения, близкого к оптимальному, используются эвристические критерии ветвления.

В разделах 1.3 и 1.4 описан алгоритм C4.5 для следующих двух случаев: 1) для задачи с целочисленной информацией; 2) для задачи с вещественнозначной информацией и с наличием пропусков в признаковых описаниях объектов.

В разделе 1.3 рассмотрен случай целочисленной информации.

Выбор признака для построения внутренней вершины РД в алгоритме С4. осуществляется на основе энтропийного критерия. Опишем данный критерий.

Пусть V {k1,..., k j } – множество текущих значений признака x, x X (T ).

Текущее множество обучающих объектов T разбивается на подмножества T (k1),...,T, где T (u ), u {k1,..., k j }, состоит из объектов, для которых значение признака x равно u. Обозначим через f ( Ki,T ), i {1,..., l}, – число объектов из множества T, относящихся к классу Ki. Вероятность P (T ), i {1,..., l}, того, что случайно выбранный объект из множества T будет принадлежать классу Ki, равна f ( Ki,T ) | T |.

Количество информации (энтропия), необходимое для определения класса, которому принадлежит объект из множества T, вычисляется по формуле Info(T) i 1 P (T )log P (T ).

Количество информации, необходимое для определения класса, которому принадлежит объект из множества T при разбиении T по значениям признака x, оценивается величиной Info( x) uV (| T (u ) | | T |)Info(T (u ) ).

Информационный выигрыш (information gain), получаемый при выборе признака x, вычисляется по формуле Gain( x) Info(T) Info( x).

Потенциальная информация, получаемая при разбиении множества T по значениям признака x, оценивается величиной В качестве признака для ветвления выбирается признак x из X (T ), для информационный выигрыш) принимает наибольшее значение.

В разделе 1.4 дано описание алгоритма С4.5 в случае вещественнозначной информации и наличия пропусков в признаковых описаниях объектов.

В рассматриваемом случае для ветвления из внутренней вершины РД, соответствующей признаку x, x X (T ), осуществляется бинарная перекодировка текущих значений признака x с помощью выбора «оптимального» порога d ( x).

Порог d ( x) выбирается из множества текущих порогов для признака x.

При этом под текущим порогом для признака x понимается полусумма двух соседних значений из упорядоченного множества текущих различных значений признака x. Для каждого из текущих порогов осуществляется бинарная перекодировка и определяется информативность признака x по энтропийному критерию GainRatio( x). В качестве оптимального текущего порога d ( x) берется тот порог, для которого GainRatio( x) имеет максимальное значение.

Данная процедура повторяется для каждого признака из X (T ). После этого из X (T ) выбирается наиболее информативный по критерию GainRatio( x) признак xopt с оптимальным порогом d ( xopt ). Далее строится внутренняя вершина с меткой ( xopt, d ( xopt )). Следует отметить, что при ветвлении из этой вершины признак xopt не удаляется и рассматривается на следующем шаге наравне с другими признаками.

В случае наличия пропусков по признаку x, x X (T ), предполагается, что пропущенные значения признака x вероятностно распределены пропорционально GainRatio( x) учитываются все объекты из T (при спуске из внутренней вершины, соответствующей признаку x, объекты из T, имеющие пропуски по признаку x, не удаляются).

В разделе 1.5 показано, что классификаторы, основанные на построении РД, по конструкции близки к моделям логических процедур распознавания, например к алгоритмам голосования по представительным наборам и тестовым алгоритмам распознавания.

Пусть H {x j1,..., x jr }, r n, – набор из r различных признаков, где x ji {x1,..., xn}, i 1,..., r, и пусть S M, S (a1,..., an ). Набор H выделяет в описании объекта S фрагмент (S, H ) (a j1,..., a jr ).

Определение 1.13. Фрагмент ( S, H ), S K, называется представительным набором для класса K, если для любого обучающего объекта S K имеет место В алгоритмах голосования по представительным наборам на этапе обучения для каждого класса K, K {K1,..., Kl }, строится некоторое множество представительных наборов.

Пусть листу РД соответствует пара ( B, K ), B x1...x r. Тогда, очевидно, (1,..., r ) – фрагмент, содержащийся в описаниях обучающих объектов S из класса K таких, что S N B. Нетрудно также видеть, что в случае корректной ветви набор (1,..., r ) – представительный набор для класса K.

Из сказанного следует, что алгоритм АДР строит некоторое множество представительных наборов, так как этот алгоритм строит корректное РД. В дереве, построенном алгоритмом С4.5, ветви не всегда являются корректными.

Алгоритм С4.5 нацелен на построение «почти» представительных наборов для каждого класса K, т.е. таких фрагментов, которые наиболее часто встречаются в описаниях обучающих объектов класса K и достаточно редко в описаниях обучающих объектов из других классов.

В главе 2 предложены алгоритмы синтеза ПРД для случаев целочисленной информации, вещественнозначной информации, наличия пропусков и неравномерного распределения обучающих объектов по классам.

В разделе 2.1 приведены основные понятия, используемые при построении ПРД, и для указанных выше случаев описаны основные принципы синтеза ПРД.

Опишем структуру ПРД.

На каждом шаге построения ПРД строится либо лист дерева, либо формируется набор из различных признаков X {xt,..., xt }, X X (T ), образующий полную вершину. Далее из этой полной вершины строится ровно | X | дуг с метками t1,..., tq, каждая из которых входит в обычную вершину, соответствующую признаку xti, xti X, i 1,..., q. При ветвлении из вершины, соответствующей признаку x, происходит удаление признака x из X (T ) и удаление некоторых обучающих объектов из T.

Определение 2.1. Ветвью в ПРД называется путь, начинающийся в корне дерева и заканчивающийся в вершине ПРД.

Пусть v – лист дерева, порожденная ветвью с обычными вершинами x j1,..., x jr, и i, i {1,..., r}, – метка дуги, выходящей из вершины x ji.

набором для листа v, если ji i при i 1,..., r, и j " " при j { j1,..., jr }.

( Nv,{1,..., v}), где N v – порождающий набор для вершины v, {1,..., v} – вектор оценок за классы, способ вычисления этих оценок будет указан ниже.

Определение 2.6. Глубиной ветви в ПРД называется число обычных вершин, которые содержит эта ветвь, исключая концевую вершину ветви.

Определение 2.7. Ребром в ПРД называется дуга, выходящая из обычной или из полной вершины дерева.

Определение 2.8. Глубиной ПРД называется максимальная глубина среди всех построенных ветвей дерева.

Определение 2.9. Ярусом i -ого уровня ( i -ым ярусом) в ПРД называется совокупность полных и обычных вершин, порожденных ветвями с глубиной i 1, а также совокупность листьев дерева, порожденных ветвями с глубиной i.

Как правило, используются два способа ветвления из обычной вершины, соответствующей признаку x, x X (T ). Первый способ предпочтителен в случае бинарной или целочисленной информации низкой значности, а второй в случае вещественнозначной или целочисленной информации высокой значности.

Способ 1. Пусть V, | V | 2, – множество различных значений признака x, встречающихся в описаниях объектов из T. В этом случае из обычной вершины x выходит | V | дуг, помеченных разными числами. Пусть, V, – метка одной из дуг, выходящих из вершины x. При спуске из вершины x по дуге с меткой удаляются те объекты из T, для которых значение признака x не равно.

Способ 2. Для ветвления из обычной вершины, соответствующей признаку x, осуществляется бинарная перекодировка текущих значений признака x с помощью «оптимального» порога d ( x) (разд. 2.4). Рассматриваемая вершина помечается парой ( x, d ( x)). Спуск из вершины ( x, d ( x)) происходит по двум ветвям, при этом левая ветвь помечается 0, а правая – 1. При спуске из вершины ( x, d ( x)) по левой (правой) ветви удаляются те объекты из T, для которых значение признака x больше (не больше) d ( x).

распознаваемого объекта S (b1,..., bn ) с помощью ПРД в способах 1 и 2.

Способ 1. Под описанием объекта S в вершине v понимается вектор S (v) (1,..., n ), в котором ji b ji при i 1,..., r, иначе j " ".

Способ 2. Под описанием объекта S в вершине v понимается вектор и j " " при j { j1,..., jr }.

Определение 2.10. Лист v называется голосующим за S, если S (v) Nv.

Пусть Q( S ) – множество всех голосующих листьев ПРД за объект S. Для каждого i {1,..., l} вычисляется оценка принадлежности объекта S классу Ki, имеющая вид Г ( S, Ki ) Объект S зачисляется в класс Ki, если:

Если классов с максимальной оценкой несколько и среди них имеется класс K, который имеет наибольшее число объектов в обучающей выборке, то S приписывается классу K. Если классов с максимальной оценкой несколько и среди них нет класса с наибольшим числом объектов в обучающей выборке, то происходит отказ от классификации объекта S.

Рассмотрим теперь случай, когда информация вещественнозначная и в признаковых описаниях объектов имеются пропуски.

Пусть значение признака x для некоторого обучающего объекта не определено, т.е. равно " ". Методика построения ПРД в случае наличия пропусков направлена на сохранение исходной информации в полном объеме.

рассматриваемый обучающий объект удаляется.

Стоит отметить, что при синтезе ПРД происходит лавинообразный рост вершин и ветвей. В связи, с чем увеличивается время классификации объекта S.

Для сокращения времени классификации предложено строить только голосующие за S листья дерева. Например, при ветвлении из обычной вершины, соответствующей признаку x ji, строится только ветвь с меткой i, где i ji.

В случае, когда описание объекта S содержит пропуски, то при классификации этого объекта признаки с пропущенными значениями исключаются из {x1,..., xn}.

Данная методика позволяет сократить время классификации на скользящем контроле («leave-one-out», LOO) более чем в 2 раза. Если же имеется контрольная выборка и синтез ПРД для каждого объекта из контрольной выборки требует значительного времени, то целесообразнее один раз полностью построить ПРД.

В разделе 2.2 описан алгоритм Полный С4.5, являющийся модификацией алгоритма С4.5. Разработанный алгоритм строит корректное ПРД и предназначен для обработки целочисленной информации. Для построения полной вершины предложена специальная процедура выделения набора признаков. Данная процедура заключается в выборе признаков, информативность которых равна максимальному значению величины GainRatio( x), x X (T ), на текущем шаге максимальной информативности. Близость признаков по информативности информационного выигрыша.

Вектор оценок для висячей вершины v с порождающим набором N v в алгоритме Полный С4.5 определяется следующим образом. Пусть mv – число обучающих объектов класса Ki, i {1,..., l}, описания которых равны N v. Оценка В разделе 2.3 описаны алгоритмы AGI.Voice, AGI.La.max, AGI.La.sum и AGI.Bias, использующие схемы синтеза ПРД из разд. 2.1 для задач классификации с вещественнозначной информацией и с наличием пропусков в признаковых описаниях объектов. В этих алгоритмах процедура выделения набора признаков аналогична процедуре, используемой в алгоритме Полный C4.5. Для вычисления информативности признака x, x X (T ), используется модифицированный энтропийный критерий, описание которого приведено в разд. 2.4.

Вектор оценок {1,..., v } для висячей вершины v с порождающим набором N v в указанных алгоритмах определяется следующим образом. Пусть mv, i {1,..., l}, – число обучающих объектов класса Ki, описания которых равны N v, mi – число всех обучающих объектов класса Ki, mv max mv и пусть mv i 1mv. Тогда 1) в алгоритме AGI.Voice оценка v 1, если mv mv, иначе v 0 ;

2) в алгоритме AGI.La.max оценка v (mv 1) (mv l ), если mv mv, иначе v 0 ;

3) в алгоритме AGI.La.sum оценка v (mv 1) (mv l ) ;

4) в алгоритме AGI.Bias оценка v (mv 1) (mi l ).

В разделе 2.4 описан критерий выбора оптимального порога d ( x) для бинарной перекодировки текущих значений признака x, используемый в алгоритмах AGI.Voice, AGI.La.max, AGI.La.sum и AGI.Bias. Выбор d ( x) позволяет оценить информативность признака x и из наиболее информативных признаков построить полную вершину ПРД.

Предложенный критерий отличается от соответствующего критерия в алгоритме С4.5. Опишем эти отличия. Строятся только такие пороги, которые информативности признака x, x X (T ), учитываются только те объекты из T, в описании которых значение признака x определено.

В главе 3 проведено тестирование разработанных алгоритмов Полный С4.5, AGI.Voice, AGI.La.max, AGI.La.sum и AGI.Bias на прикладных задачах. Качество этих алгоритмов сравнивалось с распознающими алгоритмами из системы интеллектуального анализа данных, распознавания и прогнозирования «Распознавание 2.0» (разработано в ВЦ РАН), с распознающими алгоритмами из широко распространенной системы «WEKA», основанных на построении РД, а также с алгоритмом C5.0. Качество алгоритмов оценивалось методом LOO функционалами m m, l 1qi l и Q= min qi, где qi – процент правильно распознанных объектов класса Ki, m – общее число правильно распознанных объектов.

переобученности ПРД. Предложена методика снижения эффекта переобучения ПРД с использованием числовых характеристик дерева. Проведен анализ ПРД как выпуклой корректирующей процедуры.

В разделе 3.1 проведено сравнение алгоритма Полный С4.5 с алгоритмами Полный АДР (усовершенствованный с помощью ПРД алгоритм АДР) и С4.5.

Тестирование проводилось на прикладных задачах из различных областей.

Вычислялась величина. Алгоритм Полный C4.5 показал лучшие результаты.

В разделах 3.2 и 3.3 проведено сравнение алгоритмов AGI.La.max, AGI.Voice, AGI.La.sum и AGI.Bias с алгоритмом С5.0 и с алгоритмами из системы «Распознавание 2.0», а именно с нейронной сетью (НС), алгоритмом вычисления оценок (АВО), стохастическим алгоритмом голосования по тупиковым тестам (ГТТ), линейным дискриминантом Фишера (ЛДФ), алгоритмом построения РД с применением генетического метода (ГМ), методом синтеза БРД (МБРД) и с методом k ближайших соседей (МБС). Алгоритмы AGI.La.sum и AGI.Bias также сравнивались с алгоритмами из системы «WEKA», а именно с алгоритмом J (аналог алгоритма С4.5), SimpleCART (аналог алгоритма CART), RandomForest («бэггинг» над РД) и LADTree («бустинг» над РД). Тестирование алгоритмов проводилось на 25 реальных задачах, собранных в отделе Математических проблем распознавания и методов комбинаторного анализа ВЦ РАН.

Вычислялись величины и Q.

Следует отметить, что функционал не рассматривался, так как при неравномерном распределении обучающих объектов по классам как правило Наилучшие результаты среди разработанных алгоритмов показал алгоритм AGI.Bias, который нацелен на случай неравномерного распределения объектов по классам. Качество алгоритма AGI.Bias по показателю Q превосходит все указанные в тестировании алгоритмы на большинстве задач. По показателю алгоритм AGI.Bias лучше алгоритмов С5.0, МБРД, ГМ, J48, АВО, SimpleCART, LADTree, и немного уступает алгоритму НС на большинстве задач. При сравнении с другими алгоритмами по показателю алгоритм AGI.Bias на одних типах задач (с целочисленной информацией, с пропусками) немного превосходит эти алгоритмы, а на других задачах (с вещественнозначной информацией, без пропусков) немного уступает.

На шести задачах проведен ROC-анализ алгоритмов НС, ГМ, ГТТ и AGI.La.sum. Методика ROC-анализа позволяет выявить соотношение ошибок первого и второго рода. Ошибка первого рода – отнесение объекта из первого класса во второй класс. Ошибка второго рода – отнесение объекта из второго класса в первый класс. Лучшим алгоритмом стал алгоритм ГТТ, второй результат показал алгоритм AGI.La.sum, третий результат – алгоритм НС, четвертый результат – ГМ. По результатам ROC-анализа алгоритмов AGI.La.sum и AGI.Bias показано преимущество алгоритма AGI.Bias.

В разделе 3.4 предложена процедура снижения эффекта переобучения ПРД.

Первый этап процедуры – синтез начального ПРД с использованием методики, описанной в разд. 2.1, и вычисление характеристик дерева, а именно: средней глубины дерева, обозначаемой D, и среднего числа обучающих объектов J, описания которых попадают в лист дерева. Второй этап процедуры – синтез итогового ПРД. Итоговое ПРД отличается от начального ПРД тем, что текущая ветвь обрывается и строится лист дерева, если глубина текущей ветви превышает значение D или число объектов в текущем множестве обучающих объектов меньше значения J. Также рассматривались варианты построения итогового ПРД с использованием одной из указанных характеристик и с небольшими отступами от точных значений.

Указанная методика исследована на примере алгоритма AGI.Bias. Счет на прикладных задачах показал эффективность предложенной методики, в среднем снижение переобученности ПРД с комбинацией « D и J » составило 5%.

В разделе 3.5 на прикладных задачах проведено исследование ПРД как выпуклой корректирующей процедуры, так как решающее правило на основе ПРД представимо в виде выпуклой комбинации базовых классификаторов.

Показано, что ошибка выпуклой корректирующей процедуры для ПРД меньше по сравнению с классическим РД.

В главе 4 получены значения числовых характеристик ПРД (точные оценки мощности множества вершин и мощности множества ребер) при фиксированной глубине дерева, когда из каждой обычной вершины в ПРД выходят ровно две дуги. Для бинарной информации получены верхние оценки емкости семейства ПРД. Найдены оценки времени синтеза ПРД. На основе понятий из теории отступов получена оценка обобщающей способности ПРД. На реальных задачах проведено исследование радемахеровской сложности ПРД.

В разделе 4.1 получены значения числовых характеристик ПРД в зависимости от глубины дерева k. Найдено максимальное число полных вершин FV (k ), максимальное число обычных вершин SV (k ), максимальное число листьев L(k ) и максимальное число ребер R(k ). Показано, что k min{n, m 1}.

Обозначим через An – число размещений из n по k.

Теорема 4.1.1. Имеет место Найденные оценки также являются оценками аналогичных характеристик для бинарного ПРД (БПРД).

Известно, что для классического БРД справедливо Полученные результаты свидетельствуют о значительной комбинаторной сложности ПРД по сравнению с классическим РД.

В разделе 4.2 с помощью метода pVCD, предложенного В. И. Донским, получены верхние оценки емкости семейства БПРД. Метод pVCD основан на понятии Колмогоровской сложности конечных объектов и заключается в получении сжатого двоичного описания элемента рассматриваемого семейства.

Пусть FD,l,n,k – семейство БПРД с не более листьями и глубиной не более k, в котором БПРД строится для задачи распознавания с n признаками и l классами. Обозначим через VCD( FD,l,n,k ) – емкость семейства FD,l,n,k.

Для сравнения оценка емкости семейства БРД с не более листьями, в котором БРД строится для задачи с n признаками и двумя классами, не превышает величины ( 1) log n log( 3).

Таким образом, полученная оценка емкости семейства БПРД превосходит оценку емкости семейства БРД примерно в k 2 раза. Также показано, что основными величинами, влияющими на оценку емкости семейства ПРД, являются число висячих вершин и глубина дерева. Тем самым за счет уменьшения числа висячих вершин и глубины дерева происходит уменьшение сложности семейства ПРД, и, следовательно, снижается переобученность ПРД. Этот вывод согласуется с результатами разд. 3.4.

В разделе 4.3 на примере алгоритма AGI.Bias получены оценки времени T (n, m, l ) синтеза ПРД.

Пусть k – глубина ПРД.

Теорема 4.3.1. Имеет место следующая оценка времени построения ПРД:

Теорема 4.3.2. Если на каждом шаге построения ПРД в полную вершину попадает не более n 2 признаков, где n | X (T ) |, то Теорема 4.3.3. Если на каждом шаге построения ПРД в полную вершину попадает не больше трех признаков из X (T ), то Полученные оценки времени синтеза ПРД существенно превосходят оценки времени синтеза классического РД.

В разделе 4.4 с использованием понятий из теории отступов получена оценка обобщающей способности ПРД. На реальных задачах проанализированы распределения отступов обучающих объектов.

margin(S ) k ( S ) max j k { j ( S )}, где k – номер правильного класса для S, j ( S ) – оценка классификатора за принадлежность S классу K j, Далее рассматривается стандартная задача распознавания с двумя классами, при этом метки классов принадлежат множеству Y {1,1}. Пусть D – распределение на M Y, T {S1,..., Sm} – множество обучающих объектов выбранных независимо и случайно из D.

Решающая функция FDT (S ) на основе ПРД с листьями для объекта S может быть представлена в следующем виде:

i -ого листа принадлежит N Bi, то Bi ( S ) 1, иначе Bi (S ) 0, i 1,...,.

Пусть R j – множество предикатов для признака x j, э.к. Bi – конъюнкция Теорема 4.4.1. Пусть VCD(U ) – емкость семейства U, и пусть 0. Тогда с вероятностью не меньше 1 над множеством T, для каждой решающей функции FDT ( S ) и для любого 0 справедливо где P (margin ) – вероятность того, что отступ для случайно выбранного объекта из T не превысит величины, PD[error] – вероятность ошибки ПРД на объекте S M, v i 1i diVCD(U ), d maxi di, где di – глубина i -ого листа.

Таким образом, получено, что выпуклая комбинация (ПРД) сглаживает прогнозы базовых классификаторов (РД).

В данном разделе на прикладных задачах показано, что при построении ПРД отступы обучающих объектов увеличиваются, при этом увеличивается доля объектов с положительным отступом, тем самым повышается вероятность правильно распознать произвольный объект.

В разделе 4.5 проведено исследование эмпирической радемахеровской сложности ПРД.

Определение 4.7. Эмпирической радемахеровской сложностью (ЭРС) радемахеровских переменных, независимых от обучающей выборки.

Важность данного понятия отражена в следующем неравенстве. Пусть P(h) – вероятность ошибки функции h на произвольном объекте, v(h) – частота ошибок функции h на обучении. Тогда для любого 0 и для любой функции h H с вероятностью не меньшей 1 справедливо На прикладных задачах показано, что ЭРС полного дерева существенно ниже ЭРС классического РД за счет использования взвешенного голосования и удаления просмотренного признака при спуске из обычной вершины. При этом применение полных вершин практически не изменяет ЭРС дерева, этот факт также подтверждается тем, что выпуклая комбинация (ПРД) не увеличивает сложность (разд. 4.4). Таким образом, вероятность ошибки классификации с помощью ПРД будет ниже, чем при применении классического РД.

В заключении приведены основные результаты, полученные в работе.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ

1. Разработаны и исследованы распознающие процедуры на основе ПРД с энтропийным критерием, использующие различные варианты взвешенного коллективного голосования по листьям ПРД (для задач с целочисленной и вещественнозначной информацией, с наличием пропусков в признаковых описаниях объектов и с неравномерным распределением обучающих объектов по классам).

2. Исследованы вопросы обобщающей способности ПРД. С помощью метода pVCD получена верхняя оценка емкости семейства БПРД. Для задачи с двумя классами на основе теории отступов получена оценка обобщающей способности семейства ПРД. Экспериментально изучена эмпирическая радемахеровская сложность ПРД. Разработана и исследована методика снижения переобученности ПРД.

3. При фиксированной глубине дерева и при условии, что из каждой обычной вершины ПРД выходят ровно две дуги, получены точные оценки мощности множества вершин и мощности множества ребер ПРД, а также оценки времени синтеза ПРД.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Генрихов И. Е., Дюкова Е. В. Полные решающие деревья в задачах классификации по прецедентам // Всеросс. конф. Математические методы распознавания образов-15. – М.: МАКС Пресс, 2011. – С. 84-87.

2. Генрихов И. Е., Дюкова Е. В. Исследование комбинаторных свойств и сложности построения полных решающих деревьев // Всеросс. конф.

Математические методы распознавания образов-15. – М.: МАКС Пресс, 2011.

– С. 88-91.

3. Генрихов И. Е. Построение полного решающего дерева на базе алгоритма С4. // Сообщение по прикладной математике. – М.: ВЦ РАН, 2009. – 24 с.

4. Генрихов И. Е., Дюкова Е. В. Усовершенствование алгоритма С4.5 на основе использования полных решающих деревьев // Всеросс. конф. Математические методы распознавания образов-14. – М.: МАКС Пресс, 2009. – С. 104-107.

5. Генрихов И. Е., Дюкова Е. В. Построение и исследование распознающих процедур на основе полных решающих деревьях // Междунар. конф.

Интеллектуализация обработки информации-8. – М.: МАКС Пресс, 2010. – С.

117-120.

6. Генрихов И. Е., Дюкова Е. В. Классификация на основе полных решающих деревьев // Ж. вычисл. матем. и матем. физ. – 2012. – Т. 52, № 4. – С. 750-761.

7. Генрихов И. Е. Исследование переобученности распознающих процедур на основе полных решающих деревьев // Программные продукты и системы. – 2011 – № 4 (96). – С. 141-147.

8. Генрихов И. Е. О сложности построения полных решающих деревьев // Естественные и технические науки. – 2012. – № 1 (57). – С. 327-336.

9. Genrikhov I. E. Synthesis and analysis of recognizing procedures on the basis of full decision trees // Pattern Recognition and Image Analysis. – 2011. – Vol.

21, no. 1. – Pp. 45-51.





Похожие работы:

«Шишкина Кристина Владимировна ПРАВОВОЕ РЕГУЛИРОВАНИЕ ДОПОЛНИТЕЛЬНОЙ ТРУДОВОЙ ДЕЯТЕЛЬНОСТИ Специальность 12.00.05 – трудовое право; право социального обеспечения Автореферат диссертации на соискание ученой степени кандидата юридических наук Ижевск 2012 Работа выполнена на кафедре трудового права и основ правоведения федерального государственного бюджетного образовательного учреждения высшего профессионального образования Удмуртский государственный университет Научный...»

«ФОКИН Сергей Михайлович КУЛЬТУРНО-ИСТОРИЧЕСКИЕ ПРОЦЕССЫ В РАННЕМ И РАЗВИТОМ СРЕДНЕВЕКОВЬЕ КРАСНОЯРСКОЙ ЛЕСОСТЕПИ Специальность 07.00.06 - археология АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата исторических наук Кемерово 2007 2 Работа выполнена на кафедре археологии и исторического краеведения Томского государственного университета. Научный руководитель : доктор исторических наук, профессор Людмила Александровна Чиндина Официальные оппоненты : доктор...»

«Буякова Наталья Васильевна УПРАВЛЕНИЕ ЭЛЕКТРОМАГНИТНОЙ ОБСТАНОВКОЙ В ТЯГОВЫХ СЕТЯХ НА ОСНОВЕ МЕТОДОВ СИСТЕМНОГО АНАЛИЗА И ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ Специальность 05.13.01 – системный анализ, управление и обработка информации (промышленность) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Иркутск – 2012 Работа выполнена в ФГБОУ ВПО НИ Иркутский государственный технический университет и ФГБОУ ВПО Иркутский государственный университет путей...»

«Верхоглазова Елена Викторовна ДИАГНОСТИКА ГЛИАЛЬНЫХ ОПУХОЛЕЙ МЕТОДАМИ ЯДЕРНОГО МАГНИТНОГО РЕЗОНАНСА Автореферат диссертации на соискание ученой степени кандидата физико-математических наук Специальность: 03.01.01 - радиобиология Москва - 2012 2 Работа выполнена на кафедре физики ускорителей и радиационной медицины физического факультет МГУ имени М.В. Ломоносова. Научный руководитель : доктор физико-математических наук, профессор Пирогов Юрий Андреевич Официальные оппоненты :...»

«Аунг Вин Разработка алгоритмов вычисления и методика обработки результатов в аналого-цифровом структурном базисе с разделением операндов для систем управления Специальность: 05.13.01 Системный анализ, управление и обработка информации (в приборостроении) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук МОСКВА 2008 Работа выполнена на кафедре Вычислительная Техника в Московском Государственном Институте Электронной Техники (Техническом...»

«Стригулина Александрина Валерьевна МЕЖДУНАРОДНО - ПРАВОВЫЕ ОСНОВЫ СОТРУДНИЧЕСТВА В ОБЛАСТИ МЕЖДУНАРОДНОГО ТУРИЗМА С УЧАСТИЕМ РОССИЙСКОЙ ФЕДЕРАЦИИ Специальность 12.00.10 Международное право. Европейское право АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Казань – 2008 1 Диссертация выполнена на кафедре международного и европейского права ГОУ ВПО Казанский государственный университет им. В.И. Ульянова-Ленина. Научный руководитель кандидат...»

«Малахов Василий Алексеевич МЕТОДЫ РЕШЕНИЯ ДИСПЕРСИОННЫХ ЗАДАЧ ДЛЯ СВЧ, КВЧ СТРУКТУР, ОПИСЫВАЕМЫХ НЕСАМОСОПРЯЖЕННЫМИ ОПЕРАТОРАМИ СПЕЦИАЛЬНОСТЬ 05.12.07 - АНТЕННЫ, СВЧ УСТРОЙСТВА И ИХ ТЕХНОЛОГИИ Автореферат диссертации на соискание учёной степени доктора технических наук Нижний Новгород - 2013 Работа выполнена на кафедре Физика и техника оптической связи федерального государственного бюджетного образовательного учреждения высшего профессионального образования Нижегородский...»

«СЫТЫХ НАДЕЖДА АЛЕКСАНДРОВНА СОЦИАЛЬНОЕ ВОСПИТАНИЕ И СОЦИАЛИЗАЦИЯ ЧЕЛОВЕКА В НЕОПТИМАЛЬНЫХ ОБЩЕСТВЕННЫХ УСЛОВИЯХ Специальность 09.00.11 – социальная философия АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата философских наук Барнаул – 2009 Работа выполнена на кафедре философии и методологии науки (ФПФ) ГОУ ВПО Алтайский государственный университет Научный руководитель : доктор философских наук, профессор Ушакова Елена Владимировна Официальные оппоненты : доктор...»

«Лаптев Алексей Иванович КОМПЛЕКСНЫЙ КОНТРОЛЬ И КОРРЕКЦИЯ АЭРОБНЫХ И СКОРОСТНО-СИЛОВЫХ ВОЗМОЖНОСТЕЙ БОРЦОВ – СУРДЛИМПИЙЦЕВ В УПРАВЛЕНИИ ИХ ФИЗИЧЕСКОЙ ПОДГОТОВКОЙ 13.00.04 – Теория и методика физического воспитания, спортивной тренировки, оздоровительной и адаптивной физической культуры Автореферат диссертации на соискание ученой степени кандидата педагогических наук Москва - 2014 2 Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего...»

«МАРКЕЛОВ СЕРГЕЙ ИВАНОВИЧ ВОЗНИКНОВЕНИЕ И СТАНОВЛЕНИЕ ГОСУДАРСТВЕННОСТИ И ПРОБЛЕМЫ РАЗВИТИЯ ФОРМ ГОСУДАРСТВЕННОГО УСТРОЙСТВА ДРЕВНЕЙ РУСИ В VII - X ВЕКАХ (ИСТОРИКО-ПРАВОВОЙ АСПЕКТ) Специальность 12.00.01. – Теория и история права и государства; история учений о праве и государстве АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Санкт-Петербург 2010 Работа выполнена на кафедре государственного и административного права ГОУ ВПО Санкт-Петербургский...»

«ЛУЗЯНИНА ЕКАТЕРИНА СЕРГЕЕВНА РАЗРАБОТКА СИСТЕМЫ УПРАВЛЕНИЯ НЕМОНЕТАРНОЙ МОТИВАЦИЕЙ РАБОТНИКОВ АПТЕЧНЫХ ОРГАНИЗАЦИЙ (НА ПРИМЕРЕ ОМСКОЙ ОБЛАСТИ) Специальность 14.04.03 – организация фармацевтического дела Автореферат диссертации на соискание ученой степени кандидата фармацевтических наук Москва 2011 -2 Работа выполнена на кафедре фармации Государственного образовательного учреждения высшего профессионального образования Омская государственная медицинская академия Министерства...»

«Перекрестов Вадим Николаевич Уголовно-процессуальное значение признания обвиняемым своей вины в уголовном судопроизводстве РФ. Специальность 12.00.09 – уголовный процесс; криминалистика; оперативно-розыскная деятельность Автореферат на соискание ученой степени кандидата юридических наук Волгоград – 2010 Работа выполнена на кафедре уголовного процесса и криминалистики Волгоградского государственного университета Научный руководитель : кандидат юридических наук, доцент...»

«Тараненко Людмила Андреевна ИММУНОКОРРЕКЦИЯ ПРЕПАРАТОМ ПРОФЕТАЛЬ В КОМПЛЕКСНОЙ ТЕРАПИИ СОПРОВОЖДЕНИЯ НЕКОТОРЫХ ОПУХОЛЕВЫХ ЗАБОЛЕВАНИЙ 14.00.36. – аллергология и иммунология 14.00.14. – онкология Автореферат диссертации на соискание ученой степени кандидата медицинских наук Челябинск – 2007 Работа выполнена на кафедрах профессиональных болезней, промышленной экологии и терапии с курсом профпатологии ФПК и ППС; онкологии, лучевой диагностики и лучевой терапии Государственного...»

«Поздняков Михаил Николаевич СОВЕРШЕНСТВОВАНИЕ ОРГАНИЗАЦИИ ДОРОЖНОГО ДВИЖЕНИЯ НА КОЛЬЦЕВЫХ ПЕРЕСЕЧЕНИЯХ Специальность 05.22.10 - Эксплуатация автомобильного транспорта Автореферат диссертации на соискание учёной степени кандидата технических наук Волгоград, 2005 2 Работа выполнена в Ростовском государственном строительном университете. Научный руководитель : доктор технических наук, профессор Зырянов Владимир Васильевич. Официальные оппоненты : доктор технических наук,...»

«Логинова Наталья Владимировна КУЛЬТУРОЛОГИЧЕСКОЕ ОБЕСПЕЧЕНИЕ САМООПРЕДЕЛЕНИЯ ЛИЧНОСТИ ПРИ ИЗУЧЕНИИ ПРЕДМЕТОВ ДУХОВНО-НРАВСТВЕННОЙ НАПРАВЛЕННОСТИ Специальность 24.00.01. - Теория и история культуры АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата культурологии Москва 2012 1 Работа выполнена на кафедре теории и истории культуры факультета культурологии Федерального государственного бюджетного образовательного учреждения высшего профессионального образования...»

«СТЕПАШКИН Михаил Викторович МОДЕЛИ И МЕТОДИКА АНАЛИЗА ЗАЩИЩЕННОСТИ КОМПЬЮТЕРНЫХ СЕТЕЙ НА ОСНОВЕ ПОСТРОЕНИЯ ДЕРЕВЬЕВ АТАК Специальность: 05.13.11 — Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей 05.13.19 — Методы и системы защиты информации, информационная безопасность АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Санкт-Петербург Работа выполнена в Санкт-Петербургском институте...»

«Ходак Нина Анатольевна Гендерные особенности психофизиологических функций студентов технических и гуманитарных специальностей 19.00.02 – Психофизиология АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук Челябинск, 2010 Диссертация выполнена на кафедре общей психологии ГОУ ВПО ЮжноУральский государственный университет. Научный руководитель : доктор медицинских наук, профессор     Рычкова Лидия Сергеевна  Официальные оппоненты : доктор...»

«НГУЕН ЧАН ХУНГ МОДИФИЦИРОВАНИЕ УГЛЕРОДНЫХ НАНОТРУБОК И НАНОВОЛОКОН ДЛЯ ПОЛУЧЕНИЯ КЕРАМИЧЕСКИХ НАНОКОМПОЗИТОВ 05.17.02 – технология редких, рассеянных и радиоактивных элементов АВТОРЕФЕРАТ Диссертации на соискание ученой степени кандидата технических наук Москва – 2009 Работа выполнена на кафедре технологии редких металлов и наноматериалов на их основе Российского химико-технологического университета им.Д.И.Менделеева Научный руководитель : Доктор химических наук, профессор...»

«УДК 65 + 64.032 ББК У9(2)–823.2 Ч48 ЧЕРМОШЕНЦЕВ Дмитрий Николаевич РЕТРОСПЕКТИВНОЕ РАЗВИТИЕ УПРАВЛЕНИЯ КАЧЕСТВОМ ПРОДУКЦИИ ПРОМЫШЛЕННОГО ПРЕДПРИЯТИЯ Специальность 08.00.05 – Экономика и управление народным хозяйством: экономика и управление качеством АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата экономических наук Тамбов Работа выполнена на кафедре экономического анализа института Экономика и право Тамбовского государственного технического университета Научный...»

«КОТЛЯРОВ ДЕНИС ВЛАДИМИРОВИЧ СОВЕРШЕНСТВОВАНИЕ СПОСОБОВ ЗАЩИТЫ ЗЕРНОВЫХ КОЛОСОВЫХ КУЛЬТУР ОТ БАКТЕРИОЗОВ 06.01.07 – защита растений АВТОРЕФЕРАТ диссертации на соискание учной степени кандидата биологических наук Краснодар – 2010 Работа выполнена в Федеральном государственном образовательном учреждении Высшего профессионального образования Кубанский государственный аграрный университет (ФГОУ ВПО КГАУ) Научный руководитель : - профессор, доктор биологических наук, Федулов Юрий...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.