На правах рукописи
Линев Константин Андреевич
РАЗРАБОТКА МАТЕМАТИЧЕСКОГО И
ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ СИСТЕМ
УПРАВЛЕНИЯ МАСТЕР-ДАННЫМИ
Специальность 05.13.11 Математическое и программное
обеспечение вычислительных машин, комплексов и
компьютерных сетей
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Москва 2011
Работа выполнена в Московском государственном институте электроники и математики (техническом университете).
Научный руководитель Белов Александр Владимирович, кандидат технических наук, доцент
Официальные оппоненты Кульба Владимир Васильевич доктор технических наук, профессор Бабешко Владимир Николаевич кандидат технических наук
Ведущая организация: Федеральное государственное учреждение «Государственный научно-исследовательский институт информационных технологий и телекоммуникаций»
Защита состоится 28 июня 2011 года в 14:00 на заседании диссертационного совета Д 212.133.01 Московского государственного института электроники и математики (технического университета) по адресу: 109028, Москва, Б. Трехсвятительский пер., д.3.
С диссертацией можно ознакомиться в библиотеке Московского государственного института электроники и математики (технического университета).
Автореферат разослан 27мая 2011 года.
Ученый секретарь диссертационного совета кандидат технических наук доцент С.Е. Бузников
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. В последние годы развитие информационных технологий вышло далеко за рамки чисто научного исследования. Практически каждая организация на самых ранних этапах своего развития приходит к необходимости применения в своей работе тех или иных программных продуктов. Возникло понятие информационной среды предприятия, представляющей собой совокупность всех программных продуктов, которые управляют теми или иными аспектами его работы.
Стремление увеличить прозрачность и управляемость предприятий приводит к тому, что возникает необходимость во все большей консолидации информационной среды. Каждый программный компонент информационной среды должен обладать способностью отвечать на запросы, уведомлять о своем состоянии другие части среды и эффективно взаимодействовать с любым другим ее компонентом.
С другой стороны, активное внедрение программных решений долгое время проводилось без учета возможности последующей интеграции. Это привело к тому, что задача создания внутри организации единого информационного пространства наталкивается на целый ряд проблем, связанных с тем, что существующие разрозненные подсистемы хранят одни и те же данные общего назначения в самых различных, зачастую, мало совместимых формах.
Первым шагом в решении задачи интеграции информационной среды является предоставление разным ее компонентам возможности успешно обмениваться данными и правильно их интерпретировать. Как правило, в организации существует определенный набор относительно постоянной информации, которая проникает практически во все аспекты ее деятельности. Списки подразделений, сотрудников, стандартов, спецификаций, все это создает терминологический контекст существования предприятия. Эта информация неизбежно попадает и в программные компоненты среды. И, как правило, в каждом из них выглядит по-своему.
Соответственно, чтобы осуществлять взаимодействие компонентов друг с другом сначала надо добиться того, чтобы они одинаково обрабатывали одни и те же базовые понятия. И решение этой задачи в настоящее время выделилось в отдельное направление разработки программного обеспечения, которое принято называть управлением нормативно-справочной информацией (НСИ), или иначе мастер-данными.
Определение 1. Под мастер-данными будем понимать условнопостоянную часть всей корпоративной (учрежденческой) информации, не претерпевающую существенных изменений в процессе повседневной деятельности организации, на основании которой формируются текущие документы.
Важность и актуальность проблемы интеграции разрозненных компонентов информационной среды и, в частности, консолидации справочной информации отмечались в работах Когаловского М.Р., Калиниченко Л.А., Чернобровцева А., Гулько Д., Михайлова С, Помазкова Я. Уолтера Р.. Существует ряд коммерческих решений, обеспечивающих управление справочной информации, таких, как SAP MDM, Oracle Data Hub, Microsoft MDS, Talend Open Studio, СУ НСИ Интертех.
Ограничения современных систем управления НСИ (СУ НСИ) и их коммерческий, закрытый характер обуславливают потребность в разработке метода проектирования СУ НСИ, независимого от продуктов какой-то конкретной компании и позволяющего априори оценить надежность работы спроектированной системы. Таким образом, проведенный обзор литературы, а также анализ существующих программных продуктов показал актуальность тематики настоящей работы.
Цель данной работы заключается в том, чтобы разработать эффективный метод проектирования систем управления мастер-данными.
Для достижения поставленной цели в работе решаются следующие задачи:
1. Анализ существующих технологий управления нормативносправочной информацией;
2. Разработка модели данных, предназначенной для описания НСИ, гарантирующей возможность представления справочной информации в разных формах для разных компонентов информационной среды;
3. Обеспечение явной поддержки данной моделью элементов математического моделирования, необходимых при описании справочников, но отсутствующих в распространенных моделях данных, таких как иерархии, множества и наследование одними сущностями свойств других сущностей;
4. Обеспечение реализуемости модели на базе наиболее распространенных в настоящее время технологий программирования;
5. Разработка на основе данной модели программного обеспечения системы управления НСИ;
6. Разработка метода верификации качества работы распределенной СУ НСИ с учетом взаимодействия мастер-данных с текущими данными;
7. Применение разработанного метода для оценки качества работы системы управления мастер-данными, используемой при проведении Всероссийской переписи населения (ВПН-2010).
Методы исследования. Исследования базируются на использовании методов и средств теории реляционных баз данных, формул Хорна первого порядка, объектно-ориентированного проектирования, теории графов и статистического анализа.
Научная новизна 1. Разработана оригинальная модель данных, специально предназначенная для проектирования СУ НСИ.
2. Разработана математическая модель распределенной СУ НСИ, позволяющая моделировать взаимодействие текущих данных и НСИ.
3. Предложен подход и разработан метод решения задачи обнаружения потенциальных сбоев в работе СУ НСИ на этапе проектирования системы, основанный на разработанной модели.
Основные результаты, выносимые на защиту 1. Модель данных, позволяющая описывать НСИ с учетом ее сложной структуры и многообразия представлений в информационной среде;
2. Математическая модель, описывающая взаимодействие мастер-данных с текущими данными в распределенной СУ НСИ;
3. Метод обнаружения потенциальных сбоев в работе распределенной СУ НСИ, связанных с взаимодействием текущих данных и мастер-данных, на этапе проектирования системы;
4. Программный комплекс, обеспечивающий имитационное моделирование распределенной СУ НСИ на основании предложенной модели и позволяющий обнаруживать возникающие в ходе моделирования сбои.
Практическая ценность 1. Разработанная в диссертационной работе модель данных позволяет существенно сократить время, затрачиваемое на проектирование и реализацию СУ НСИ.
2. Разработанная модель распределенной СУ НСИ, а также метод априорного обнаружения потенциальных сбоев в работе распределенной СУ НСИ позволяет снизить риски, связанные с ошибками проектирования и повысить эффективность планирования процессов разработки и внедрения СУ НСИ.
Внедрение результатов работы Разработанная модель данных и метод обнаружения потенциальных сбоев в работе СУ НСИ использовались при проектировании и разработке подсистемы ведения справочников территориальных единиц (ВСТЕ), входящей с состав автоматизированной системы ВПН-2010, обеспечивающей сбор, обработку и получение итогов Всероссийской переписи населения 2010 года.
Полученные в диссертации результаты использованы в учебном процессе на кафедре «Кибернетика» МИЭМ (Москва) в рамках дисциплины «Компьютерные технологии в экономике и финансовая деятельность банковских предприятий».
Полученные в диссертации результаты использованы в учебном процессе в институте ИБС НИТУ «МИСиС» (Москва) на кафедре «Информационные бизнес системы» в рамках дисциплины «Архитектура предприятия и проектирование КИС».
Апробация работы Основные положения и результаты работы докладывались на следующих научно-технических конференциях и семинарах:
1. Информационные бизнес системы. Первая Всероссийская ежегодная научно-практическая конференция. 2009 г.
2. Научно техническая конференция студентов, аспирантов и молодых специалистов МИЭМ. 2009 г.
3. Научно техническая конференция студентов, аспирантов и молодых специалистов МИЭМ. 2010 г.
4. Научно техническая конференция студентов, аспирантов и молодых специалистов МИЭМ. 2011 г.
5. Научный семинар кафедры «Кибернетика» МИЭМ под руководством д.т.н., проф. В.Н. Афанасьева.
Публикации результатов По материалам диссертации опубликовано 8 научных работ, в том числе 4 в журналах, входящих в список рекомендованных изданий ВАК РФ.
Структура и объем диссертации Диссертация состоит из введения, 5 глав, заключения, списка литературы в 61 наименование и трех приложений, всего 147 страниц, включая 4 рисунка и 2 таблицы.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность направления исследования диссертационной работы, формулируется цель и задачи диссертации, определяется научная новизна и дается общая характеристика работы, перечисляются положения, выносимые на защиту.
В первой главе работы приведен обзор текущего состояния проблемы управления нормативно-справочной информацией. Проанализированы современные решения в области моделирования данных и верификации сетей передачи данных, и сделан вывод о необходимости построения модели данных, учитывающей специфику НСИ. Также проведен обзор современных решений в области управления НСИ и выделены особенности НСИ, как типа данных. В ходе анализа были выделены следующие недостатки современных СУ НСИ:
1. Не существует научно обоснованной методики проектирования СУ 2. Как правило, СУ НСИ носят коммерческий характер и требуют приобретения других программных продуктов производителя;
3. Предназначены в основном для крупных предприятий;
4. Поддержка сложных структур данных ограничена;
5. Не предоставляют средств априорной оценки эффективности работы.
В заключении первой главы сформулирована содержательная постановка задачи разработки математической модели СУ НСИ.
Во второй главе работы приведена структура модели данных, явным образом обеспечивающей описание не только НСИ, но и знаний о ее структуре, семантическом смысле и многообразии ее представлений. Модель построена таким образом, чтобы допускать сравнительно простую реализацию с помощью СУБД на базе реляционной модели в качестве хранилища данных.
Далее приведены основные понятия этой модели данных:
Определение 2. Справочник, это базовое понятие модели. Представляет собой четверку (D, F, L, E), где D – коллекция атрибутов справочника, F – коллекция граней справочника, L – коллекция связей справочника, E – коллекция записей справочника.
Понятие справочника можно считать аналогом понятия отношения в реляционной модели данных. Атрибуты справочника определены по аналогии с атрибутами отношения в реляционной модели, записи справочника определены по аналогии с понятием кортежа в реляционной модели.
Определение 3. Связью справочника называется четверка (С, n, t, l), где C – справочник, входящий в хранилище справочников, n – признак обнуляемости связи: «истина» или «ложь», t – тип связи, а l – это связь или специальный элемент «пусто», то есть признак отсутствия связи, в зависимости от типа связи. Будем называть l присоединенной связью. Если l – это элемент «пусто», будем говорить, что присоединенная связь отсутствует.
Связь может обладать рядом декларируемых свойств, которые служат для поддержания целостности справочника. В частности связь может гарантировать отношение "один к одному". В этом случае обратная связь становится присоединенной связью, упомянутой в определении. Такие связи один к одному могут также использоваться для того, чтобы определить отношение наследования одним справочником свойств другого. Связь может рассматриваться, как частный случай атрибута, наделенного дополнительными свойствами, и таким образом может храниться в реляционной таблице в качестве атрибута отношения.
Определение 4. Ассоциацией называется четверка (T, V, P, E), где T – декартово произведение множеств идентификаторов записей одного или более справочников, V – его конечное подмножество, P – набор свойств ассоциации, а E – степень обусловленности ассоциации. Будем говорить, что ассоциация A верна для записей x и y из справочников X и Y, если для A T=Х*Y и V содержит элемент ([x],[y]). Ассоциация A соответствует предикату A(x, y), принимающему значение «истина» тогда и только тогда, когда ассоциация верна.
Ассоциации используются для того, чтобы реализовать отношение "многие ко многим", а так же описать правила, по которым оно образуется. С помощью свойств ассоциации, отношение может приобретать такие свойства, как транзитивность и коммутативность, а так же приобретать зависимость от справочников и других ассоциаций, выраженную в предикатах Хорна, для которых в качестве модели используются понятия описываемой модели. Ассоциации позволяют явно описать такие структуры данных, как иерархии и множества.
Ассоциацию можно считать частным случаем справочника, который содержит только связи и таким образом она также может храниться в реляционной таблице.
Определение 4. Гранью справочника X называется четверка (A, D, R, P). Где A – это подмножество множества атрибутов и связей справочника, к которому принадлежит грань. D – отображение множества записей справочника X в другой справочник X1, не входящий в хранилище справочников. R – отображение из множества записей справочника X1 в множество записей, набор атрибутов и связей которых соответствует таковым в справочнике X. P – набор свойств грани.
С помощью граней моделируется переход справочника из одной формы в другую в разных частях информационной среды. Понятие грани позволяет не только учесть возможность преобразования справочника в ходе работы системы, но и определить, для каких преобразований возможно непротиворечивое обновление. Для граней справочников был разработан алгоритм, позволяющий, при соблюдении ограничений на преобразования данных, обеспечить непротиворечивое обновление данных в справочнике X путем изменения записей справочника X1.
Аналогичные результаты получены для групп связанных справочников.
Также было проведено сопоставление предложенной модели и реляционной модели данных и введена алгебра запросов к построенной модели, являющаяся расширением реляционной алгебры. Для данной алгебры сформулировано и доказано следующее утверждение:
Утв. 1. Построенная алгебра является реляционно полным языком запросов, замкнутым относительно понятия справочника.
Понятие справочника было расширено таким образом, чтобы позволить хранить в одном справочнике множество версий одной и той же записи, тем самым обеспечивая хранение истории изменения справочников.
В третьей главе поставлена и решена аналитически для наиболее простых случаев задача определения вероятности функционирования распределенной СУ НСИ с заданной топологией в течение некоторого заранее известного срока эксплуатации без возникновения сбоев определенных типов, связанных с взаимодействием между мастер-данными и основанными на них текущими данными.
Для решения задачи была построена обобщенная математическая модель распределенной СУ НСИ, основанная на понятиях, введенных в главе 2, благодаря которой возможно выявить, какие элементы системы управления НСИ вызывают наибольший риск возникновения проблемной ситуации. Таким образом, модель позволяет устранять недостатки системы там, где они оказывают наибольшее негативное влияние на работу СУ НСИ в целом.
Основными объектами построенной модели СУ НСИ являются:
1. Ориентированный связанный граф Г (N, G, B) произвольной топологии без петель.
2. Множество узлов N (I, V, C), каждый из которых характеризуются множеством I справочников, которые используются в данном узле, множеством V номеров версий этих справочников в узле и C – потоками событий изменения номеров версий каждого справочника.
3. Множество «зеленых» дуг G (i, L, S, ) которые соответствуют путям передачи изменений НСИ, где i – справочник, изменения которого передаются, L – латентность канала (то есть время, необходимое для передачи блока изменений за вычетом собственно времени, необходимого для передачи каждого отдельного изменения), S время передачи одного изменения, – случайная величина, определяющая время, которое проходит с момента появления первого после предыдущей отправки изменений нового номера версии справочника i до того, момента, как все появившиеся с этого момента новые версии начинают передаваться по зеленой дуге. То есть эта случайная величина определяет время, в течение которого накапливаются новые версии, входящие в один блок изменений.
4. Множество «синих» дуг B (I, S, ), которые соответствуют каналам передачи текущей информации, где I – множество справочников, участвующих в передаче данных, S – время передачи данных, – поток случайных событий возникновения нового передаваемого пакета данных.
Подчиняясь потокам случайных событий и задержкам передачи, присвоенным зеленым дугам, новые номера версий справочников возникают в узлах модели и с течением времени копируются во все узлы, связанные с узлом исходного появления новой версии. При этом на синих дугах возникают пересылки текущих данных, в моменты времени, определяемые потоками случайных событий. Все фигурирующие в модели потоки случайных событий и случайные величины считаются независимыми друг от друга.
На основании данной модели была сформулирована задача обнаружения ситуаций, когда отправленный по синему каналу пакет текущих данных прибывает в принимающий узел раньше, чем в принимающий узел по зеленым дугам будут доставлены все версии справочника, которые находились в отправляющем узле в момент отправки. В результате сообщение не будет корректно обработано принимающей стороной. Данная ситуация была названа ситуацией запаздывающего обновления.
Далее приводится аналитическое решение задачи о вычислении вероятности возникновения ситуации запаздывающего обновления, в случае, если изменения НСИ передаются немедленно после того, как произошли, потоки возникновения изменений и отправления документов являются потоками Пуассона, а все узлы, которые соединены синими дугами соединены также и сонаправленными с синими зелеными дугами, через которые осуществляется обновление всех справочников, которые участвуют в формировании передаваемых по синим дугам текущих данных, а граф Г не содержит циклов из зеленых дуг, осуществляющих обновление одного и того же справочника.
При данных условиях вероятность бесперебойной работы СУ НСИ в течение срока эксплуатации T0 вычисляется по формуле (1) где С – справочник, i – индекс узла графа, – суммарная плотность потока событий обновлений справочника С в узле i с учетом обновлений, поступающих из других узлов, j – индексы синих дуг, исходящих из узла i узлов, так называемый интервал уязвимости после обновления справочника С в узле i в течение которого по узлу j могут быть отправлены данные, которые вызовут возникновение ситуации запаздывающего обновления, наконец, M Ci – это число, заведомо большее, чем число обновлений справочника C, которое может произойти в узле i, показатель который зачастую бывает известен проектировщику СУ НСИ еще на этапе проектирования системы.
Далее проводится аналитическое решение задачи для случая, когда задержка между возникновением нового изменения и отправлением блока изменений по зеленой дуге определяется случайной величиной с показательным распределением при сохранении всех прочих условий. Полученное решение существенно усложняется по сравнению с приведенным выше, и его применение на практике потребует аппроксимации точного решения с помощью численных методов. Отсюда делается вывод о том, что метод имитационного моделирования может оказаться более продуктивен при решении задачи вычисления вероятности бесперебойной работы распределенной СУ НСИ в общем случае, нежели поиск общего аналитического решения.
В четвертой главе работы описана программная реализация программного комплекса, имитирующего распространение обновлений справочной информации по распределенной СУ НСИ, основанного на предложенной в третьей главе модели. В главе формулируются следующие основные требования к разрабатываемому комплексу:
1. Должен обеспечивать реализацию всех понятий и механизмов предложенной в третьей главе модели СУ НСИ;
2. Не должен накладывать каких-либо дополнительных ограничений на топологию исследуемой сети распространения мастер-данных;
3. Должен быть реализован таким образом, чтобы облегчить дальнейшую поддержку и расширение функциональности, в частности, получение дополнительных показателей для анализа;
С учетом приведенных выше требований проведен обзор и анализ современных технологий разработки ПО. По результатам анализа в качестве базовой технологии для построения комплекса была выбрана технология.Net компании Microsoft. В качестве языка описания моделируемой системы был выбран язык XML, так как технология.Net предоставляет встроенный механизм преобразования объектов в памяти компьютера в XML-документы и обратно, так называемый механизм сериализации.
Моделирование абстракции модели распределенной СУ НСИ в терминах объектно-ориентированного программирования было произведено путем создания отдельного класса для каждого отдельного понятия. Узлы, синие и зеленые дуги были смоделированы в качестве отдельных классов, причем два типа дуг наследовались от общего класса «дуга». Для управления событиями изменения справочников и передачи документов были реализованы класс «событие» и класс «последовательность событий», последний содержит коллекцию событий, а так же экземпляр генератора случайных событий, который описывает правило возникновения новых событий в данной последовательности. Каждый узел содержит по одной последовательности событий для каждого справочника. Также, каждая синяя дуга содержит последовательность событий передачи текущих данных. Каждая зеленая дуга содержит генератор случайных событий, который описывает способ срабатывания передачи изменений после того, как в исходном узле появилось новое событие изменения справочника. События изменения справочников могут порождать вторичные события изменения справочников в других узлах по мере того, как изменения распространяются по зеленым дугам графа. Такие зависимые события содержат ссылку на своего «предка».
Комплекс сначала полностью строит все последовательности событий за все время эксперимента, а потом путем сопоставления последовательностей событий в узлах и синих дугах определяет, содержатся ли среди всех построенных событий ситуация запаздывающего обновления. Для уведомления одних объектов об изменении других применяется механизм подписки на события, входящий в состав технологии.Net.
В дальнейшем в главе описаны способы решения основных технических проблем, возникших в ходе разработки комплекса:
1. Отсутствие в.Net средств встроенной поддержки сериализации сложносвязанных множеств объектов (в частности, содержащих кольцевые ссылки) в формат XML. Проблема была преодолена с помощью использования плоской коллекции объектов, как промежуточного представления модели, адаптированного к сериализации.
Взаимозависимость событий в системе и отсутствие у программиста априорного знания о том, в каком порядке возникают события в системе. Из-за этого в ходе работы комплекса может возникнуть необходимость изменить время возникновения уже обработанного и внесенного в последовательность события, а значит и всех зависимых от него событий. Проблема была преодолена с помощью явной реализации таких цепочек изменения положения событий в последовательностях посредством механизма делегатов и подписки на события платформы.Net.
Было проведено сопоставление результатов аналитического решения и компьютерного моделирования на примере двух задач о распространении НСИ.
Рис. 1: Схема распределенной СУ НСИ, рассматриваемой в примере Пример 1. В этом примере рассматривается задача об обмене изменениями двух справочников между двумя отделами одной и той же компании.
Схематическое изображение исследуемой СУ НСИ приведено на рисунке 1.
Зеленые дуги обозначены пунктирными линиями, синие – сплошными. Изменения возникают с равными интервалами I, изменения каждого справочника возникают в своем отделе и немедленно передаются по зеленой дуге.
Латентность зеленых дуг обозначена как L, время передачи данных по дугам, как S, плотность потока Пуассона событий передачи текущих данных по синим дугам обозначена за. За единицу времени принят один день.
Рис. 2: Схема распределенной СУ НСИ, рассматриваемой в примере Пример 2. Во втором примере рассматривается задача о круговом обмене данными справочника текущих заданий между тремя отделами компании. Схематическое изображение исследуемой СУ НСИ приведено на рисунке 2. Зеленые дуги также обозначены пунктирными линиями, а синие – сплошными. Изменения справочника возникают случайно, передаются немедленно и описываются потоками Пуассона с плотностью. За единицу времени принят один час. Латентность всех зеленых ребер составляет L = 0.5, время передачи S = 0.016666. Плотность потоков возникновения событий передачи текущих документов по синим дугам = 0.5, время передачи документа по синей дуге S = 1.016666.
Результаты сопоставления аналитического решения с результатами моделирования задачи с помощью разработанного комплекса приведены в таблице 1.
В пятой главе описано применение предложенной модели для решения прикладной задачи управления иерархическими справочниками. Реализованный программный продукт носит название «Ведение справочников территориальных единиц» (ВСТЕ) и входит в состав АС ВПН-2010. ВСТЕ основано на реляционной СУБД Microsoft SQL Server 2005 с применением дополнительных библиотек, реализованных на языке программирования С#. ВСТЕ осуществляет управление иерархическим справочником административнотерриториальных единиц и муниципальных образований ТЕРСОН, представляющим собой две взаимосвязанные иерархии, элементы которых также обладают признаками, правила проверки целостности которых зависят от положения элемента в иерархии. В ходе ведения справочника должно обеспечиваться ведение также и полной истории его изменений.
Аналитическое решение 106 сбоев в течение двух 26.3% месяцев без Результат имитационного 105.481 сбоев в течение 25.2% месяцев без Таблица 1: Результаты имитационного моделирования В главе приводится описание справочника ТЕРСОН в терминах разработанной модели данных. Использование этой модели в качестве инструмента проектирования позволило сократить длительность общего цикла разработки на 15%, что подтверждено соответствующим актом о внедрении.
Также, в главе рассматривается задача об обновлении справочника ТЕРСОН и связанного с ним справочника адресов в процессе изменения административно-территориальной структуры Российской Федерации. С помощью описанного в главе 4 программного комплекса было проведено моделирование обмена данными между компонентами АС ВПН-2010, расположенными на трех разных уровнях структурных подразделений Федеральной службы государственной статистики: в центральном аппарате, территориальных органах и районных центрах. Была спрогнозирована возможность бесперебойной работы системы с вероятностью более 98.5% при условии, что рабочие таблицы будут строиться с учетом изменений справочников, произошедших ранее, чем за 5.5 дней до формирования запроса на построение таблицы. Данная информация использовалась в ходе проектирования АС ВПНи, в частности, подсистемы ВСТЕ.
В заключении подводятся итоги проделанной работы. Приводятся основные выводы и результаты работы.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. Разработана оригинальная модель данных на базе реляционной модели данных, учитывающая характерные особенности задачи управления НСИ. Для модели построена алгебра запросов по аналогии с реляционной алгеброй, доказана реляционная полнота этой алгебры и ее большая выразительность по сравнению с реляционной. Доказана возможность обновления справочников через их особые альтернативные версии, получившие название граней;2. Разработанная модель допускает хранение всех своих объектов в реляционной СУБД, при условии реализация логики обработки не выразимых в реляционной модели ее абстракций путем введения промежуточного слоя доступа к данным над СУБД;
3. Модель успешно использована при проектировании подсистемы ВСТЕ, входящей в автоматизированную систему ВПН-2010, предназначенную для обработки результатов Всероссийской переписи населения 2010;
4. Разработана оригинальная модель, описывающая функционирование распределенной СУ НСИ на основе двуцветных графов. Получено аналитическое решение для задачи вычисления вероятности возникновения сбоев, связанных с взаимодействием текущих данных и мастерданных;
5. Реализован программно-аппаратный комплекс, позволяющий имитировать процесс работы распределенной СУ НСИ, описанной с помощью предложенной модели. Программа апробирована как путем испытания на примерах, для которых получено аналитическое решение, так и при решении промышленной задачи в рамках проектирования компонентов АС ВПН-2010.
Публикации по теме диссертационной работы Публикации в изданиях, включенных в перечень ВАК РФ Линев К.А., Разработка систем управления нормативно справочной информацией для систем обработки статистической информации – M., Бизнес-информатика №4(10) за 2009 г, стр. 29- Линев К. А., Каркасное решение для построения СУ НСИ для систем сбора, контроля качества и обработки статистической информации – M., Качество. Инновации Образование, №4 за 2010 год, страницы 52-56.
Линев К.А., Моделирование мастер-знаний – M., Информатизация образования и науки № 4(8)/2010, стр. 156- Линев К.А., Организация распределенных систем управления нормативно-справочной информацией – M., Информатизация образования и науки № 1(9)/2011, стр. 128- Публикации в других изданиях Линев К.А., Разработка системы управления НСИ для систем обработки статистической информацией, Информационные бизнес системы. Первая Всероссийская ежегодная научно-практическая конференция. Материалы конференции. – M., Академия ИБС: МФТИ, 2009, стр. 32-36.
Линев К.А., Исследование задач построения СУ НСИ для систем обработки статистической информации, Научно техническая конференция студентов, аспирантов и молодых специалистов МИЭМ. Тезисы докладов. – М., МИЭМ, 2009, стр. 155-156.
Линев К.А., Моделирование мастер-знаний, Научно техническая конференция студентов, аспирантов и молодых специалистов МИЭМ. Тезисы докладов. – М., МИЭМ, 2010, стр. 147-148.
Линев К.А., Разработка математического и программного обеспечения для систем управления мастер-данными, Научно техническая конференция студентов, аспирантов и молодых специалистов МИЭМ. Тезисы докладов. – М., МИЭМ, 2011, стр. 136-137.