WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

Pages:     || 2 | 3 | 4 | 5 |   ...   | 6 |

«1 2 УДК 681.3.06 ББК 32.973.2 Г38 Гайдамакин Н. А. Г38 Автоматизированные информационные системы, базы и банки данных. Вводный курс: Учебное пособие. — М.: Гелиос АРВ, 2002. — 368 с., ил. ISBN 5-85438-035-8 Учебное ...»

-- [ Страница 1 ] --

1

2

УДК 681.3.06

ББК 32.973.2

Г38

Гайдамакин Н. А.

Г38 Автоматизированные информационные системы, базы и банки данных. Вводный курс: Учебное

пособие. — М.: Гелиос АРВ, 2002. — 368 с., ил.

ISBN 5-85438-035-8

Учебное пособие содержит сведения по автоматизированным информационным системам и лежащим в

основе их создания и функционирования системам управления базами данных.

Рассматриваются структура и классификация автоматизированных информационных систем и СУБД, модели организации данных в фактографических СУБД, основы концептуального проектирования банков данных фактографических систем и схемно-структурного проектирования реляционных баз данных. Представлен материал по основам и технологиям построения распределенных и многопользовательских информационных систем.

Для студентов вузов и слушателей институтов повышения квалификации, изучающих курсы по теории информационных систем, баз и банков данных, информационного поиска, а также для специалистов, занимающихся информационным обеспечением деятельности предприятий и организаций.

УДК 681.3. ББК 32.973. © Гайдамакин Н. А., ISBN 5-85438-035- © Оформление. Шачек Е. С.,

ПРЕДИСЛОВИЕ

Характерной чертой нашего времени являются интенсивно развивающиеся процессы информатизации практически во всех сферах человеческой деятельности. Они привели к формированию новой информационной инфраструктуры, которая связана с новым типом общественных отношений (информационные отношения), с новой реальностью (виртуальной реальностью), с новыми информационными технологиями различных видов деятельности. Сердцевиной современных информационных технологий являются автоматизированные информационные системы (АИС), создание, функционирование и использование которых привело к возникновению специфических понятий, категорий, приемов и навыков.

В настоящее время изучение дисциплин, связанных с автоматизированными информационными системами (АИС), является обязательным элементом подготовки специалистов в самых разнообразных областях деятельности.

Вместе с тем анализ отечественной и переводной учебной литературы по тематике АИС, баз и банков данных показывает ее расслоение по нескольким, независимо развивающимся, направлениям.

Первое направление, которое условно можно назвать «программистским», связано с системами управления базами данных (СУБД) фактографических АИС и представлено рядом классических учебных изданий, по которым на протяжении последних двадцати лет осуществляется подготовка специалистов по программированию, разработке и эксплуатации средств вычислительной техники. К числу подобных работ относится энциклопедическое издание одного из основоположников теории баз данных, известного американского специалиста, К. Дейта «Введение в системы баз данных», выдержавшее с момента своего первого выхода более шести изданий. В этом же ряду находится книга еще одного известного американского специалиста А. Саймона «Стратегические технологии баз данных».

В отечественной литературе данное направление представлено рядом фундаментальных изданий, среди которых можно упомянуть работы: Л. А. Овчарова, С. Н. Селеткова «Автоматизированные банки данных», В. В. Бойко, В. М. Савинкова «Проектирование баз данных информационных систем», а также более современные учебные курсы по системам управления базами данных известных отечественных специалистов С. Д. Кузнецова «Введение в СУБД» и Г. М. Ладыженского «Системы управления базами данных — коротко о главном».

Особенностью перечисленных выше изданий является их математико-программистская направленность, что формирует определенные требования к исходной подготовке обучаемых.

Второе направление — просветительское — обусловлено процессами так называемого реинжиниринга (переустройство бизнеспроцессов на предприятиях и в организациях на основе новых информационных технологий), активно развившегося в 90-е годы и ориентированного на различные категории управленческих работников (менеджеров). Особенностью работ данного направления является «популяризаторское» изложение материала в отношении основ, устройства и функционирования баз данных и СУБД. Наиболее интересной в этом плане можно назвать книгу Д.

Васкевича «Стратегии Клиент/Сервер. Руководство по выживанию для специалистов по реорганизации бизнеса».

Третье направление — библиотечное — относится к области документальных информационных систем, являющихся современным инструментом документального информационного поиска, традиционно рассматриваемого в контексте библиотечно-информационной сферы. Здесь можно упомянуть ряд известных изданий, в частности работы: Дж. Солтона «Динамические библиотечно-информационные системы», Ф. У. Ланкастера «Информационно-поисковые системы», А. И. Черного «Введение в теорию информационного поиска», А. В. Соколова «Информационно-поисковые системы».

Вероятно, ввиду гораздо более ранней, чем у компьютерных систем, предыстории библиотечноинформационной сферы, это направление развивалось практически до 90-х годов отдельно от фактографических АИС. В результате, документальные АИС, несмотря на общую с фактографическими системами природу практически никогда не рассматривались с ними в одной работе.

Последние тенденции в развитии АИС, баз данных и СУБД проявляют признаки конвергенции фактографического и документального направления, что предопределяет изучение предметной сферы АИС в рамках единой идеологии и единых подходов.



Еще одним мотивом для создания данного учебного пособия послужили наблюдения по контингенту специалистов, участвующих в создании и эксплуатации АИС.

Массовая компьютеризация и персонализация компьютерной техники во второй половине 80-х годов, внедрение АИС в деятельность не только крупных, средних, но и мелких предприятий потребовало большого количества специалистов, способных такие системы разрабатывать. В результате, в сферу создания и эксплуатации (администрирования) АИС пришел большой отряд специалистов из смежных областей, прежде всего разработчиков программного обеспечения так называемых прикладных программистов. Обладая навыками программирования и знанием языков программирования высокого уровня, во многих случаях специалисты данной категории слабо или вовсе не представляют системологических основ АИС, а также многих других аспектов предназначения и функций баз данных. Поэтому создание АИС зачастую рассматривается в узком смысле создания базы данных и разработки примитивного интерфейса для работы с ней. Подобный технократический подход не может обеспечить должный уровень, качество и эффективность разрабатываемых АИС.

Целью создания представляемого учебного пособия является системное изложение всех аспектов тематики АИС, которое соединяет, хотя бы в рамках вводного и краткого курса, основы учебного материала первого, второго и третьего направлений учебных изданий, касающихся АИС.

Пособие состоит из семи глав.

Первая глава посвящена основам информационного обеспечения различных процессов и систем, понятиям, функциям, структуре и классификации информационных систем, системам представления данных в фактографических АИС.

Во второй главе рассматриваются функции и внутреннее устройство систем управления базами данных фактографических АИС, классические модели организации данных (иерархическая, сетевая и реляционная). Изложение реляционной модели в части манипуляционной составляющей сопровождается примерами операций над данными. Большая часть второй главы посвящена внутренней схеме баз данных, структурам физической организации данных с рассмотрением также и таких основополагающих аспектов организации и функционирования баз данных, как индексирование и хеширование записей.

Третья глава посвящена основам создания АИС. Приводятся материалы нормативных документов (ГОСТов), регламентирующих организацию и содержание работ по созданию АИС, рассматриваются понятие и сущность технического задания. Излагаются также основы проектирования центрального компонента АИС — банка данных, с описанием этапов концептуального и схемно-структурного проектирования. Описывается сущность процессов нормализации таблиц из классической теории реляционной модели данных. Как и во всем пособии, все операции над данными иллюстрируются примерами. В силу вводного характера пособия важная часть теории и практики проектирования баз данных, связанная с CASE-технологиями, затрагивается только в постановочном плане.

Четвертая глава, занимающая центральное место в работе, рассматривает комплекс вопросов, связанных с вводом, обработкой и выводом данных в фактографических АИС. Структура и направленность изложения материала обусловлены логикой и характером информационных задач, решаемых или обеспечиваемых процессами и процедурами обработки данных в отличие от программистского подхода в учебных работах первого направления. Подробно рассмотрены как простейшие вопросы, связанные с просмотром, поиском и фильтрацией табличных данных, так и вопросы классификации, содержания, в том числе программное выражение на языке SQL и оптимизация запросов по обработке данных в реляционных СУБД. Вводятся также другие смежные понятия и процедуры, связанные с событийной техникой обработки данных, формами и отчетами по результатам обработки и вывода данных. Приведены редко рассматриваемые в учебной литературе особенности обработки, и в частности навигации, по связанным записям в АИС с сетевой моделью организации данных.

Пятая глава посвящена теоретическим основам и технологиям построения распределенных АИС.

Представлены технологии и модели «Клиент-серверных» систем, в том числе с рассмотрением основ реализации мониторов транзакций. Глава содержит также излагаемые практически только в руководствах по СУБД сведения по технологиям объектного связывания и репликации данных.

Одной из особенностей пособия является изложение в шестой главе в идеологии единого представления с фактографическими системами основ построения и функционирования документальных информационных систем (ИПС). Рассматриваются теоретические основы документального информационного поиска, классификация и особенности разновидностей информационно-поисковых документальных систем. Представлен материал по широко применяемым в настоящее время информационно-поисковым каталогам и тезаурусам, полнотекстовым и гипертекстовым ИПС, моделям организации и особенностям обработки данных, лежащим в основе полнотекстовых и гипертекстовых ИПС.

Заключительная седьмая глава охватывает вопросы администрирования и защиты данных в АИС.

Рассматриваются основные функции и задачи, решаемые администраторами баз данных, политики и модели безопасности (разграничения доступа) в СУБД, технологические аспекты реализации моделей безопасности, в том числе технологии «представлений» и другие конструкции языка SQL, обеспечивающие построение и управление системой разграничения доступа в АИС. Приведены также необходимые в минимальном объеме сведения по классификации уровней защищенности информации в автоматизированных системах по Руководящим документам Гостехкомиссии России.

Автор выражает благодарность тем людям, без помощи и поддержки которых создание пособия со столь разноплановым материалом было бы вряд ли возможным. Прежде всего хотелось бы выразить признательность за советы и критические замечания известному специалисту в области документального информационного поиска Д. Я. Шараеву, а также коллегам по работе О. Н.

Соболеву, С. А. Необутову, С. Н. Смирнову, А. П. Коваленко и отдельно О. В. Безусовой, принявшей на себя тяготы редактирования первоначального варианта рукописи. Автор также признателен заведующему кафедрой вычислительной техники УГТУ-УПИ С. Л. Гольдштейну и его сотрудникам, в частности Т. Я. Ткаченко, а также заведующему сектором информационных систем ИММ УрО РАН И. А. Хохлову за рецензирование первоначального варианта пособия.

1. ОСНОВЫ ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ ПРОЦЕССОВ И СИСТЕМ

1.1. Понятие и содержание информационного обеспечения Информационное обеспечение является составной частью более широкого понятия информационных процессов. В нормативно-правовой трактовке информационные процессы определяются как «процессы создания, сбора, обработки, накопления, хранения, поиска, распространения и потребления информации* и охватывают тем самым все сферы человеческой деятельности.

* Закон РФ «Об участии в международном информационном обмене» от 04. 07. 1996 г.. № 85-03.

Информационное обеспечение чаще всего соотносится с организационно-управленческой и производственно-технологической сферой. Поэтому под информационным обеспечением будем понимать совокупность процессов сбора, обработки, хранения, анализа и выдачи информации, необходимой для обеспечения управленческой деятельности и технологических процессов.

Основополагающим в определении информационного обеспечения является понятие информации.

Термин информация происходит от латинского informatio —разъяснение, изложение. До середины нашего столетия информация трактовалась как сведения, передаваемые людьми устным, письменным или другим (знаками, техническими средствами) способом. После 50-х годов на фоне бурного развития средств связи и телекоммуникаций, возникновения и внедрения в различные сферы жизни электронно-вычислительной техники появились новые, расширенные трактовки понятия информация. Информацию в вероятностно-статистическом (или энтропийном) подходе стали трактовать как уменьшение степени неопределенности знания о каком-либо объекте, системе, процессе или явлении, или изменение неопределенности состояния самого объекта, системы, явления, процесса. Такую трактовку по имени ее автора, американского математика К. Э. Шеннона еще называют информацией но Шеннону.

Известна также и широко используется философская, или точнее говоря, общенаучная трактовка понятия информации как изменение объема и структуры знания воспринимающей системы. При этом под воспринимающей системой понимается не только собственно сам человек или его производные (коллектив, общество), но и, вообще говоря, любая система, например биологическая клетка, воспринимающая при рождении генетическую информацию.

Существует еще и нормативно-правовая трактовка понятия информации, которая используется в законодательных актах, регламентирующих информационные процессы и технологии. Так, в частности, в законе РФ «Об информации, информатизации и защите информации» (от 20.02.95 № 24ФЗ) дается следующее определение термина «информация» — сведения о лицах, предметах, фактах, событиях и процессах независимо от способа их представления. Добавим в связи с этим еще один важный нормативно-правовой аспект. Статья 128 Гражданского кодекса РФ информацию, наряду с вещами (включая деньги, ценные бумаги и иное имущество, в том числе имущественные права), работами и услугами, результатами интеллектуальной деятельности, нематериальными благами, определяет видом объектов гражданских прав, распространяя на нес тем самым весь институт гражданского права, включая права собственности и авторское право.

Как представляется, в контексте рассмотрения содержания информационно-аналитической сферы наиболее подходящим является объединение общенаучной и нормативно-правовой трактовки понятия информации. Поэтому в дальнейшем информацию будем понимать как изменение объема и структуры знания о некоторой предметной области (лица, предметы, факты, события, явления, процессы) воспринимающей системой (человек, организационная структура, автоматизированная информационная система) независимо от формы и способа представления знания.

При рассмотрении понятия информационного обеспечения в контексте обработки информации важное значение имеет понятие данных. От информации данные отличаются конкретной формой представления и являются некоторым ее подмножеством, определяемым целями и задачами сбора и обработки информации. К примеру, данные по сотрудникам какой-либо организации в виде формализованных учетных карточек кадрового подразделения содержат лишь некоторый перечень необходимых сведений (ФИО, год рождения, образование, семейное положение, должность и т. д.) в отличие от огромного количества сведений, характеризующих каждого конкретного человека.

Поэтому определим данные как информацию, отражающую определенное состояние некоторой предметной области в конкретной форме представления и содержащую лишь наиболее существенные с точки зрения целей и задач сбора и обработки информации элементы образа отражаемого фрагмента действительности.

Таким образом, информация на стадии данных характеризуется определенной формой представления и дополнительной характеристикой, выражаемой термином структура.

Структура данных связана с понятием представления информации и определяется (функциональной, логической, технологической и т. п. структурой той предметной области, информацию о которой содержат данные. Вместе с тем данные могут быть представлены и в неструктурированной (форме, что предопределяет технологические особенности их накопления и обработки. Таким образом, можно выделить неструктурированную и структурированную форму представления данных.

В качестве примера неструктурированной формы можно привести:

• связный текст (т. е. документ на естественном языке — на литературном, официально-деловом и т. д.);

• графические данные в виде фотографий, картинок и прочих неструктурированных изображений.

Примерами структурированной формы данных являются:

• анкеты;

• таблицы;

• графические данные в виде чертежей, схем, диаграмм.

Способы сбора, анализа и обработки структурированных и неструктурированных данных существенно различаются. Наиболее развитыми в настоящее время, с точки зрения задач обработки и анализа информации, являются программные средства обработки структурированных данных, т. к.

структуризацию можно считать первичной и наиболее трудно формализуемой и алгоритмизируемой обработкой.

В плане оперирования с информацией в процессах ее создания (порождения), сбора, выдачи и потребления важное значение имеет понятие документированной информации или просто документа. Можно сказать, что в большом количестве случаев информация предстает и фигурирует в образе документа, исключая ту часть информационных процессов, которые оперируют исключительно с данными, как, например, в автоматизированных системах управления технологическими процессами — АСУТП, где информация порождается в виде показаний датчиков (входные данные), обрабатывается, выдается и потребляется в виде управляющих сигналов (выходные данные) на технологическое оборудование.

Как и в случае с понятием самой информации, существует несколько трактовок термина документ — историческая, организационно-управленческая и нормативно-правовая трактовка.

Исторически документ понимался (и в определенных случаях понимается сейчас) как объект, средство, способ для удостоверения личности, прав собственности и т. д.

В организационно-управленческом смысле документ понимается как служебный или организационнораспорядительный документ, т. е. как форма и способ выражения организационно-управленческих решений и воздействий.

В нормативно-правовом аспекте документ определяется как зафиксированная на материальном носителе информация с реквизитами, позволяющими ее идентифицировать.* * Закон РФ «Об информации, информатизации и защите информации» от 20.02.1995г., №24-ФЗ.

Для традиционного «бумажного» документа совокупность реквизитов, идентифицирующих конкретный документ, определяется соответствующими ГОСТами* и руководящими документами по делопроизводству или отраслям технологической документации.** Не вдаваясь в детали, отметим, что важнейшим реквизитом, идентифицирующим традиционные документы, является подпись должностного лица. Подобный подход для компьютерной информации в настоящее время развит в виде техники «электронных цифровых подписей», основанных на криптографических методах, также закреплен соответствующими ГОСТами*** и применяется в телекоммуникационных системах передачи данных. Вместе с тем такие особенности компьютерной формы информации, как возможность ее эталонного копирования (т. с. практически мгновенного и в любых количествах порождения полностью идентичных копий, экземпляров), делают процесс идентификации документов в компьютерной форме и в более широком смысле аспект юридического статуса документов в вычислительной среде сложной и до конца еще нерешенной проблемой.

* ГОСТ Р 6.30-97. Унифицированная система организационно-распорядительной документации. Требования к оформлению документов—М.: Госстандарт России, 1997.

** Например, ЕСКД— Единая система конструкторской документации.

*** ГОСТ Р 34.10-94. Информационная технология. Криптографическая защита информации. Процедуры выработки и проверки электронной цифровой подписи на базе асимметричного криптографического алгоритма—М.: Госстандарт России, 1994.

Под документированием информации в широком смысле слова можно понимать выделение единичной смысловой части информации (данных) по некоторой предметной области в общей ее массе, обособление этой части с приданием ему самостоятельной роли (имя, статус, реквизиты и т. п.).

Процесс документирования превращает информацию в информационные ресурсы. Нормативноправовая трактовка информационных ресурсов определяет их как «отдельные документы и отдельные массивы документов, документы и массивы документов в информационных системах (библиотеках, архивах, фондах, банках данных, других видах информационных систем)».* * Закон РФ «Об участии в международном информационном обмене» от 04.07.1996 г., №85-ФЗ.

Таким образом, документирование информации подводит к одному из самых (фундаментальных понятий в сфере информационного обеспечения — информационным системам. Так же как и для понятий информации и документа, понятие информационной системы многогранно и имеет несколько определений и подходов. В нормативно-правовом смысле информационная система определяется как «организационно упорядоченная совокупность документов (массивов документов) и информационных технологий, в том числе и с использованием средств вычислительной техники и связи, реализующих информационные процессы».* * Закон РФ «Об информации, информатизации и защите информации» от 20.02.1995 г., №24-ФЗ.

В технологическом плане аспект использования средств вычислительной техники (СВТ) в информационных системах и обеспечение на этой основе автоматизации решения каких-либо задач проявляется в близком термине автоматизированная система — «система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций».* *' ГОСТ 34.003-90. Информационная технология. Комплекс стандартов на автоматизированные системы. Термины и определения —М.: Изд-во стандартов, 1991.

Опыт, практика создания и использования автоматизированных информационных систем в различных сферах деятельности позволяет дать более широкое и универсальное определение, которое полнее отражает все аспекты их сущности.

Под информационной системой в дальнейшем понимается организованная совокупность программнотехнических и других вспомогательных средств, технологических процессов и функциональноопределенных групп работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определенной предметной области, поиск и выдачу сведений, необходимых для удовлетворения информационных потребностей установленного контингента пользователей — абонентов системы.

Исторически первыми видами информационных систем являются архивы и библиотеки. Им присущи все атрибуты информационной системы. Они обеспечивают в какой-либо предметной области сбор данных, их представление и хранение в определенной форме (книго-, архивохранилища, каталоги и т. д.), в них определяется порядок использования информационных (фондов (т. е. определены абоненты, режимы и способы выдачи информации—абонементы, читальные залы и т. п.).

Информационные системы, в которых представление, хранение и обработка информации осуществляются с помощью вычислительной техники, называются автоматизированными, или сокращенно АИС. Автоматизированные информационные системы в настоящее время являются неотъемлемой частью современного инструментария информационного обеспечения различных видов деятельности и наиболее бурно развивающейся отраслью индустрии информационных технологий.

Таким образом, информационные системы являются основным средством, инструментарием решения задач информационного обеспечения, а соотношение понятий, связанных с информационным обеспечением, можно отобразить в виде схемы, приведенной на рис. 1.1.

Технологическое и организационно-штатное воплощение информационного обеспечения в большинстве случаев осуществляется в трех формах:

• служба документационного обеспечения управления (СлДОУ);

• информационная служба;

• экспертно-аналитическая служба.

Традиционной организационно-штатной и технологической структурой является СлДОУ, которая в обобщенном виде реализует следующие функции:

• организация и обеспечение делопроизводства и документооборота;

• документационное обеспечение подготовки и осуществления управленческих решений через организацию и контроль разработки и согласования организационно-распорядительных и информационно-справочных документов;

• внутренний мониторинг (контроль реализации управленческих решений, оценка их результатов через контроль и отслеживание прохождения документов).

Информационная служба (отдел автоматизации, вычислительный центр и т. д.) в общем виде обеспечивает решение следующих задач:

• сбор недокументированной и документированной информации из внешних источников, необходимой для поддержки управленческих и технологических процессов;

• внешний мониторинг (выявление и анализ управленческих проблем, возникающих по внешним причинам);

• информационное оповещение и удовлетворение информационных потребностей управленческих и технологических структур;

• внутренний мониторинг (статистика, отчетность, оценка результатов деятельности).

Экспортно-аналитическая группа (группы советников, консультантов, так называемых аналитиков) привлекается для:

• анализа различных управленческих, производственных ситуаций;

• выработки альтернатив управленческих решений;

• прогнозирования последствий управленческих решений.

Структура информационного обеспечения определяется структурой (циклом) функционирования информационных систем. В общем плане можно выделить следующие элементы цикла функционирования информационных систем.

• сбор информации;

• комплектование информацией;

• поиск и выдача сведений для абонентов системы;

• поддержание целостности, актуальности и сохранности информации.

Сбор информации представляет собой специальным образом организованный порядок и процесс получения и отбора информации, имеющей отношение к предметной области сведений информационной системы, и включает:

• получение информации;

• оценку относимости информации;

• организационные схемы, порядок отбора и фиксации информации.

Получение информации осуществляется через организацию и использование системы источников и каналов получения информации.

Оценка относимости информации к предметной области сведений информационной системы в некоторых случаях осуществляется автоматически (информация с датчиков в автоматизированных системах управления технологическими процессами — АСУ ТП), а в других случаях (системы обеспечения аналитических исследований, мониторинга социально-экономических или экологических процессов и т. п.) представляет сложную, многокритериальную классификационную задачу, слабо поддающуюся автоматизации и выполняемую специальной категорией работников.

Организационные схемы, порядок отбора и фиксации информации определяют организационную основу подсистемы сбора информации и обусловливаются характером и другими параметрами источников и каналов получения информации.

Комплектование информационной базы в различных ее формах в общем плане включает предварительную обработку (рубрикацию, структуризацию) и занесение информации.

Характер предварительной обработки информации определяется формой представления входных данных (структурированная, неструктурированная), особенностями представления данных в информационной системе и может включать классификацию сведений по определенным рубрикам (делам), разделам и т. п. предметной области с целью накопления материалов определенного характера, или объединенных каким-либо признаком, фактором. Структуризация информации представляет процесс преобразования документированной информации (т. е. информации на естественном неформализованном языке — обычно это текст документа) в семантику АИС, т. е. в информационный язык представления данных, используемый в конкретной информационной системе.

Занесение данных в информационную систему заключается в добавлении новых сведений и, при необходимости, их отождествлении, слиянии и установлении взаимосвязи новых данных с ранее накопленными. Принципиальное значение при этом имеет вопрос идентификации новых данных с возможно уже имеющимися в системе.

Важным моментом при занесении новой информации является также установление ее логической взаимосвязи с ранее введенными данными. В некоторых видах АИС (информационно-поисковые) такая задача является одной из основных, так как позволяет искать и устанавливать не всегда очевидные связи между информационными объектами и категориями сведений информационной системы. Комплектование информацией в таких случаях неотделимо от обработки и выдачи информации.

В информационных службах, обеспечивающих создание и эксплуатацию информационных систем, сбор и комплектование информации осуществляют работники группы отбора («отборщики», «индексаторы»), квалификация которых помимо информационной должна включать также знание конкретной предметной области информационных систем.

Поиск и выдача данных включают установление специального организационно-технологического порядка удовлетворения информационных потребностей абонентов информационной системы в управленческой деятельности и технологических процессах.

Удовлетворение информационных потребностей осуществляется через периодический плановый поиск и выдачу сведений, оповещение и обработку запросов, выполняемую организационными структурами (СлДОУ, информационная служба), организующими и эксплуатирующими информационную систему.

Периодический плановый поиск и выдача сведений осуществляются в целях обеспечения процессов организации, планирования и осуществления конкретного вида деятельности, т. е. в основном для информационного обеспечения организационно-управленческой деятельности. Данного рода задачи включаются в функции и обязанности информационных, информационно-аналитических и других информационно-обеспечивающих служб и заключаются, как правило, в формировании и выдаче статистических и сводных данных по периодически повторяющимся ситуациям в управленческой и производственной сфере.

Оповещение и обработка запросов представляют собой формы информационного обслуживания управленческих и производственно-технологических структур. Оповещение может осуществляться в форме инициативно-сигнального оповещения, объектового и планово-периодического оповещения.

Объектовое оповещение обычно осуществляется через выдачу абонентам информационной системы любых новых данных по определенному объекту, тематике, событию и т. п., появляющихся в АИС из любых источников.

Планово-периодическое оповещение производится через выдачу абонентам всех новых данных, поступивших к определенному плановому сроку из всех источников в информационную систему по определенному объекту, тематике, событию, проблеме.

Обработка запросов и выдача по ним сведений является одной из основных функций информационных служб. Данная деятельность регламентируется по вопросам инициирования, санкционирования и формы подачи запросов, форм и способов выдачи информации по запросам, учета запросов и т. д.

Поддержание целостности и сохранности информации, пересмотр, ревизия и отсеивание утратившей актуальность информации являются неотъемлемой функцией информационных подразделений, создающих и поддерживающих информационные системы. Данные задачи решаются категорией работников, называемых администраторами АИС. Администраторы обеспечивают создание и поддержание банков данных АИС, организацию разграничения доступа к ним, защиту информации от несанкционированного доступа (НСД), ее резервирование и восстановление при разрушении или утрате ее целостности вследствие преднамеренных и непреднамеренных воздействий или ситуаций. Подобного рода задачи требуют высокой квалификации персонала и выполняются наиболее подготовленными информационными работниками.

Периодическая ревизия информации в банках данных АИС призвана проверить целостность (не нарушены ли внутренние взаимосвязи информационных объектов) и сохранность данных, а также удалить из АИС информацию, потерявшую свою актуальность. Удаление информации из АИС, как и ее занесение в АИС, регламентируется специальными нормативно-инструктивными документами.

1.2. Структура и классификация информационных систем В составе информационной системы можно выделить три подсистемы, представленные на рис. 1.2.

Рис. 1.2. Состав и функциональные группы информационной системы Организационно-технологическая подсистема сбора информации обеспечивает отбор и накопление данных в информационную систему и включает совокупность источников информации, организационно-технологические цепочки отбора информации для накопления в системе. Без правильно организованной, оперативно и эффективно действующей организационнотехнологической подсистемы сбора информации невозможна эффективная организация функционирования всей информационной системы в целом.

Подсистема представления и обработки информации составляет ядро информационной системы и является отражением представления разработчиками и абонентами системы структуры и картины предметной области, сведения о которой должна отражать информационная система. Подсистема представления и обработки информации является одним из наиболее сложных компонентов при разработке информационной системы.

Нормативно-функциональная подсистема выдачи информации определяет пользователей, или иначе абонентов, системы, реализует целевой аспект назначения и выполнения задач информационной системы.

Информационным ядром (информационным фондом) подсистемы представления и обработки информации АИС, или, говоря иначе, внутренним носителем знаний о предметной области является база данных (БД). Понятие базы данных является центральным в сфере технологий автоматизированных информационных систем. В справочной литературе по информатике приводится следующее определение базы данных — «совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ».* Нормативно-правовая трактовка понятия базы данных представлена в законе «О правовой охране программ для ЭВМ и баз данных», согласно которому «база данных — это объективная форма представления и организации совокупности данных (например, статей, расчетов), систематизированных таким образом, чтобы эти данные могли быть найдены и обработаны с помощью ЭВМ».

* Толковый словарь по информатике.—М.: Финансы и статистика, 1991.

Другим фундаментальным понятием, непосредственно связанным с АИС, является система управления базами данных (СУБД), которая по ГОСТу определяется как «совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами». В настоящее время развитие СУБД как специального вида программного обеспечения для создания и эксплуатации АИС приводит к более широким санкциям СУБД. Ввиду этого в расширенном толковании СУБД можно определить как комплекс программных средств, реализующих создание баз данных, их поддержание в актуальном состоянии, а также обеспечивающих различным категориям пользователей возможность получать из БД необходимую информацию.

Совокупность конкретной базы данных, СУБД, прикладных компонентов АИС (набор входных и выходных форм, типовых запросов для решения информационно-технологических задач в конкретной предметной области), а также комплекса технических средств, на которых они реализованы, образуют банк данных (БнД), или иначе автоматизированный банк данных (АБД).

Таким образом, соотношение понятий БнД, СУБД и БД можно проиллюстрировать схемой, приведенной на рис. 1.3.

По характеру представления и логической организации хранимой информации АИС разделяются на фактографические, документальные и геоинформационные.

Фактографические АИС накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов (информационных объектов). Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения по какомулибо факту, событию и т. д., отделенному (вычлененному) от всех прочих сведений и фактов.* Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области. К примеру, фактографическая АИС, накапливающая сведения по лицам, каждому конкретному лицу в базе данных ставит в соответствие запись, состоящую из определенного набора таких реквизитов, как фамилия, имя, отчество, год рождения, место работы, образование и т. д.

Комплектование информационной базы в фактографических АИС включает, как правило, обязательный процесс структуризации входной информации из документального источника.

Структуризация при этом осуществляется через определение (выделение, вычленение) экземпляров информационных объектов определенного типа, информация о которых имеется в документе, и заполнение их реквизитов.

* Отсюда и название—«фактографические системы».

В документальных АИС единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе (входной документ), как правило, не структурируется, или структурируется в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции — дата изготовления, исполнитель, тематика и т. д. Некоторые виды документальных АИС обеспечивают установление логической взаимосвязи вводимых документов — соподчиненность по смысловому содержанию, взаимные отсылки по каким-либо критериям и т. п. Определение и установление такой взаимосвязи представляет собой сложную многокритериальную и многоаспектную аналитическую задачу, которая не может в полной мере быть формализована.

В геоинформационных АИС данные организованы в виде отдельных информационных объектов (с определенным набором реквизитов), привязанных к общей электронной топографической основе (электронной карте). Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеет пространственно-географический компонент, например маршруты транспорта, коммунальное хозяйство и т. п.

Разработка и проектирование информационной системы начинаются с построения концептуальной модели ее использования. Концептуальная модель использования информационной системы определяет, прежде всего, круг конкретных задет и функций, обеспечиваемых созданием и эксплуатацией информационной системы, а также систему сбора, накопления и выдачи информации.

Поэтому другим критерием классификации АИС являются функции и решаемые задачи, основными из которых могут являться:

• справочные;

• поисковые;

• расчетные;

• технологические.

Справочные функции являются наиболее распространенным типом функций информационных систем и заключаются в предоставлении абонентам системы возможностей получения установочных данных на определенные классы объектов (Лица, Организации, Телефоны, Адреса и т. п.) с жестко или произвольно заданным набором сведений. Видами информационных систем, реализующих чисто справочные функции, являются всевозможные электронные справочники, картотеки, программные или аппаратные «электронные записные книжки» и их более развитые аналоги в виде т.н.

персональных информационных систем.

Системы, реализующие поисковые функции, являются наиболее широко распространенным классом информационных систем, которые чаще всего называют информационно-поисковыми системами (ИПС). ИПС в общем виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно-логического описания предметной области — «информационные объекты», «информационные связи». Пользователям ИПС предоставляется возможность поиска и получения сведений по различным поисковым образам в таком информационном пространстве.

Расчетные функции информационных систем заключаются в обработке информации, находящейся в системе, по определенным расчетным алгоритмам для различных целей. К числу подобных задач относится вычисление определенных статистических характеристик и показателей по экземплярам различных типов объектов и отношений, данные по которым накапливаются в системе. Широко применяющейся разновидностью расчетных информационных систем являются различные системы автоматического проектирования, всевозможные бухгалтерские и финансово-экономические системы.

Технологические функции информационных систем заключаются в автоматизации всего технологического цикла или отдельных его компонент, какой-либо производственной или организационной структуры. К системам, обеспечивающим подобные задачи, относится широкий класс автоматизированных систем управления (АСУ, АСУ ТП). Другой разновидностью технологических информационных систем являются системы автоматизации документооборота.

Рассмотренная классификация автоматизированных информационных систем, как и всякая классификация, условна и на практике конкретная АИС может характеризоваться комплексным характером представления информации (например, являться фактографически-документальной системой) и решать комплекс справочных, поисковых, расчетных и технологических задач.

1.3. Система представления и обработки данных фактографических АИС В архитектуре подсистемы представления и обработки информации фактографических АИС можно выделить различные уровни представления информации, отображенные на рис. 1.4.

Начальный уровень определяется локальными представлениями о предметной области пользователейабонентов информационной системы и их представлениями о своих информационных потребностях.

На основе анализа этих представлений определяется информационно-логическая или сокращенно инфологическая схема предметной области, подлежащей отображению информационной системой, и концептуальная модель использования информационной системы. Инфологическая схема представляет собой формализованное представление (описание) объектов и отношений фрагмента действительности.

Наиболее часто формализация представлений о предметной области осуществляется в рамках модели «объекты-связи» (так называемая ER-людель — от англ. Entity Relationship). При этом под информационным объектом в общем плане понимается некоторая сущность фрагмента действительности, например организация, документ, сотрудник, место, событие и т. д. В предметной области выделяются различные типы объектов, представляемые в информационной системе в каждый момент времени конечным набором экземпляров данного типа. Каждый тип объекта включает (идентифицируется) присущий ему набор атрибутов (свойств, характерных признаков, параметров). Атрибут представляет логически неделимый элемент структуры информации, характеризующийся множеством атомарных значений. Для примера можно привести атрибут «Имя»

объекта типа «Лицо», который характеризуется множеством всех возможных имен, и атрибут «Текст» объекта типа «Документ», который характеризуется множеством средств смыслового выражения в определенном национальном языке.

Экземпляр объекта образуется совокупностью конкретных значений атрибутов данного типа объекта.

Один или некоторая группа атрибутов объекта данного типа могут исполнять роль ключевого атрибута, по которому идентифицируются (различаются) конкретные экземпляры объектов. К примеру, для объектов типа «Лицо» ключом может являться совокупность атрибутов «Фамилия», «Имя», «Отчество» или один атрибут, выражающий номер паспорта (удостоверения личности).

Различные типы объектов и различные экземпляры одного типа объекта могут быть охвачены определенными отношениями, которые в рамках ER-модели выражаются т. н. связями. Так, например, объекты «Сотрудник» и «Организация» могут быть охвачены отношением «Работа», т. е.

связаны этим отношением. При этом связи могут быть двух типов — иерархические, или, иначе говоря, структурные (владелец-подчиненный) и одноуровневые, например, родственная связь «Братсестра» между двумя экземплярами объекта типа «Лицо» (в отличие от иерархической родственной связи—«Отец-сын»). Объекты-владельцы иерархических связей-отношений иногда называют структурными объектами, в противовес простым объектам, которые таковыми не являются (не являются владельцами).

Структурные и одноуровневые связи (отношения), в свою очередь, по признаку множественности могут быть трех типов — «один-к-одному» (например, отношение «Лицо-Паспорт», имея в виду под «Паспортом» не атрибут объекта Лицо, а самостоятельный объект, состоящий из атрибутов «Номер», «Вид паспорта», «Владелец», «Место выдачи», «Дата выдачи» и т. д.), «один-ко-многим» (например, отношение «Подразделение-Сотрудник», имея в виду, что в одном подразделении может работать много сотрудников, но каждый сотрудник работает только в одном подразделении) и «многие-комногим» (например, отношение «Лицо-Документ», имея в виду, что один человек может быть автором, или иметь какое-либо другое отношение ко многим документам, и, в свою очередь, один документ может иметь много авторов.

Помимо этого информационные потребности абонентов информационной системы могут включать также и оперирование опосредованными (т. е. косвенными, непрямыми, ассоциативными) связями.

Примерами таких непрямых связей является совместная работа нескольких человек на одном предприятии (подразделении). Прямая непосредственная связь в данном случае, как правило, устанавливается только между объектами «Лицо» и «Организация», но не между различными экземплярами объекта «Лицо».

Одним из способов представления формализованного описания предметной области информационной системы в рамках модели «объекты-связи» является использование техники специальных диаграмм, которая была предложена известным американским специалистом в области баз данных Ч.

Бахманом. В диаграммах Бахмана объекты (сущности) представляются вершинами некоторого математического графа, а связи —дугами графа. Виды и свойства связей-отношений объектов отображаются направленностью, специальным оформлением дуг и расположением вершин графа.

В качестве примера можно привести инфологическую схему предметной области сведений информационной системы, предназначенной для накопления данных о научной работе в каком-либо учебном или исследовательском учреждении (см. рис. 1.5).

Рис. 1.5. Мифологическая схема предметной области информационной системы со сведениями о научной работе На приведенном рисунке однонаправленность дуг означает структурность связи «владелецподчиненный», двунаправленность дуг означает одноуровневые связи, двойные стрелки означают множественность отношения «один-ко-многим», двунаправленность двойных стрелок означает одноуровневые отношения «многие-ко-многим».

Одним из недостатков использования ER-диаграмм Бахмана для описания формализованных схем (моделей) предметных областей информационных систем является их статичность, не позволяющая наглядно и непосредственно отображать процессы, в которые вовлечены сущности и которым подвержены отношения (связи). Отчасти подобные проблемы преодолеваются введением дополнительных сущностей, выражающих собственно процессы и ситуации — событие, действие, момент времени. Аналогичным образом в некоторых случаях вводятся пространственные сущности для адекватного представления сущностей и отношений предметной области—маршрут, место, населенный пункт, здание, элемент здания, зона и т. д.

Вторым уровном представления информации в информационной системе (см. рис. 1.4) является схема базы дачных, (называемая еще логической структурой данных), представляющая описание средствами конкретной СУБД инфологической схемы предметной области (информационные объекты, реквизиты, связи).

Совокупность средств и способов реализации схемы базы данных в конкретной СУБД составляет модель организации данных.

Схема базы данных содержит также ограничения целостности данных. Ограничения целостности представляют собой набор установок и правил по типам, диапазонам, соотношениям (и т. д.) значений атрибутов объектов, характеристик и особенностей связей между объектами. К примеру, диапазон значения атрибута «Дата рождения» объекта лицо не может выходить за рамки текущей даты, значение атрибута «Дата приобретения» объекта «Имущество» не может быть позднее значения атрибута «Дата продажи», значение атрибута «Количество» объекта «Материал» не должно быть меньше минимально необходимого на складе и т. п. Ограничения целостности данных лежат в основе контроля корректности информации при ее вводе в систему и периодического контроля наличия смысловых и других ошибок в базе данных после проведения операций добавления, удаления и изменения данных.

Третий и самый «низкий» уровень представления информации в фактографических информационных системах выражается внутренней схемой базы данных, определяющей структуру организации и особенности хранения информационных массивов, в которых и находятся собственно сами данные (см. рис. 1.4).

Более конкретные особенности представления и организации данных определяются конкретным типом и особенностями СУБД, используемой для создания фактографической информационной системы.

1. Разъясните соотношение и взаимосвязь понятий «информация», «знания», «сведения» и «данные».

2. Охарактеризуйте в терминах информационного обеспечения листок по учету кадров и автобиографию, заполняемые и составляемые сотрудником при приеме на работу.

3. Бланк заказа заполняется клиентом, подписывается работником организации, регистрируется, исполняется и подшивается в соответствующее дело. Охарактеризуйте в терминах информационного обеспечения указанные операции и процессы.

4. Является ли обязательным использование СВТ в информационных системах? Каковы главные признаки информационной системы и чем она отличается от простой совокупности информационных ресурсов?

5. Одной из задач работника информационно-аналитической службы является поиск, сбор и систематизация всех публикаций по определенной проблеме. Как можно охарактеризовать эти функции с точки зрения структуры и этапов информационного обеспечения?

6. К какому этапу цикла функционирования информационных систем относится извещение абонента читального зала об исполнении заказа на интересующую его книгу, журнал?

7. Чем отличается база данных от информационного массива?

8. Каково соотношение понятий банка данных и базы данных?

9. К какому типу информационных систем можно отнести картотеку личных дел сотрудников организации?

10. Какого типа информационную систему наиболее целесообразно создавать для информационного обеспечения снабжения товарами сети магазинов торговой компании?

11. Чем отличается инфологическая схема предметной области информационной системы от схемы ее базы данных?

12. Какие атрибуты или совокупности атрибутов объектов «Образование» (наименование учебного заведения, год поступления, год окончания, квалификация, специальность, № диплома), «Имущество» (инв. №, наименование, тип, дата приобретения) могут исполнять роль ключей?

13. Каковы типы отношений-связей между объектами (сущностями) «Счет»—«Банк», «Товары»— «Поставщики», «Студенты»—«Преподаватели» и «Автомобиль»—«Паспорт транспортного средства (ПТС)»?

2. СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ ФАКТОГРАФИЧЕСКИХ

ИНФОРМАЦИОННЫХ СИСТЕМ

История СУБД как особого вида программного обеспечения неразрывно связана с историей начала использования электронно-вычислительных машин для организации хранения и обработки информации. Именно в то время (конец 60-х, начало 70-х годов) были разработаны основы программного обеспечения для создания и эксплуатации фактографических информационных систем. В конце 70-х, начале 80-х годов направление программного обеспечения под общим названием «СУБД» превратилось в одну из наиболее бурно развивающихся отраслей программной индустрии.

При этом основные программно-математические и технологические решения по СУБД были разработаны в 70-х годах в ряде крупных исследовательских проектов. Наиболее известными из них являются проект «Рабочей группы по базам данных» КОДАСИЛ (DBTG CODASYL) с участием уже упоминавшегося Ч. Бахмана, пионерские работы основателя теории реляционных баз данных Е.

Кодда, проект разработки системы управления реляционными базами данных «System R» фирмы IBM (1975-1979 гг.) и проект разработки СУБД «Ingres» (Interactive Graphics and Retrieval System) в университете Беркли (1975-1980 гг.) под руководством известного специалиста в области баз данных М. Стоунбрейкера.

С начала своего возникновения в конце 60-х годов автоматизированные информационные системы ориентировались на хранение и обработку больших объемов данных, которые не могли быть одновременно и полностью размещены в оперативной памяти ЭВМ.

В структуре программного обеспечения ЭВМ, как в то время, так и сейчас, за организацию, размещение и оперирование данными во внешней (долговременной) памяти отвечает операционная система ЭВМ, соответствующий компонент которой чаще всего называется «файловой системой». Данные во внешней памяти компьютера представлены именованными совокупностями, называемыми файлами.

В большинстве случаев операционная (файловая) система не «знает» внутренней смысловой логики организации данных в файлах и оперирует с ними как с однородной совокупностью байтов или строк символов.

С точки зрения смысла и назначения АИС файлы данных имеют структуру, отражающую информационно-логическую схему предметной области АИС. Эта структура данных в файлах должна обязательно учитываться в операциях обработки (собственно, в этом и заключается одна из основных функций АИС). Вместе с тем, в силу невозможности в большинстве случаев размещения файлов баз данных сразу целиком в оперативной памяти компьютера, структуру данных в файлах баз данных приходится учитывать при организации операций обращения к файлам во внешней памяти.

Отсюда вытекает основная особенность СУБД как вида программного обеспечения. Будучи по природе прикладным программным обеспечением, т. е. предназначенным для решения конкретных прикладных задач, СУБД изначально выполняли и системные функции — расширяли возможности файловых систем системного программного обеспечения.

В общем плане можно выделить следующие функции, реализуемые СУБД:

• организация и поддержание логической структуры данных (схемы базы данных);

• организация и поддержание физической структуры данных во внешней памяти;

• организация доступа к данным и их обработка в оперативной и внешней памяти.

Организация и поддержание логической структуры данных (схемы базы данных) обеспечивается средствами модели организации данных.* Модель данных определяется способом организации данных, ограничениями целостности и множеством операций, допустимых над объектами организации данных. Соответственно модель данных разделяют на три составляющие — структурную, целостную и манипуляционную.

* В обиходе просто «модель данных».

Известны три основные модели организации данных:

• иерархическая;

• сетевая;

• реляционная.

Модель данных, реализуемая СУБД, является одной из основных компонент, определяющих функциональные возможности СУБД по отражению в базах данных информационно-логических схем предметных областей АИС. Модель организации данных, по сути, определяет внутренний информационный язык автоматизированного банка данных, реализующего автоматизированную информационную систему.

Модели данных, поддерживаемые СУБД, довольно часто используются в качестве критерия для классификации СУБД. Исходя из этого, различают иерархические СУБД, сетевые СУБД и реляционные СУБД.

Другой важной функцией СУБД является организация и поддержание физической структуры данных во внешней памяти. Эта функция включает организацию и поддержание внутренней структуры файлов базы данных, иногда называемой форматом файлов базы дачных, а также создание и поддержание специальных структур (индексы, страницы) для эффективного и упорядоченного доступа к данным. В этом плане эта функция тесно связана с третьей функцией СУБД — организацией доступа к данным.

Организация и поддержание физической структуры данных во внешней памяти может производиться как на основе штатных средств файловых систем, так и на уровне непосредственного управления СУБД устройствами внешней памяти.

Организация доступа к данным и их обработка в оперативной и внешней памяти осуществляется через реализацию процессов, получивших название транзакций. Транзакцией называют последовательную совокупность операций, имеющую отдельное смысловое значение по отношению к текущему состоянию базы данных. Так, например, транзакция по удалению отдельной записи в базе данных последовательно включает определение страницы файла данных, содержащей указанную запись, считывание и пересылку соответствующей страницы в буфер оперативной памяти, собственно удаление записи в буфере ОЗУ, проверку ограничений целостности по связям и другим параметрам после удаления и, наконец, «выталкивание» и фиксацию в файле базы данных нового состояния соответствующей страницы данных.

Транзакции принято разделять на две разновидности — изменяющие состояние базы данных после завершения транзакции и изменяющие состояние БД лишь временно, с восстановлением исходного состояния данных после завершения транзакции. Совокупность функций СУБД по организации и управлению транзакциями называют монитором транзакций.

Транзакции в теории и практике СУБД по отношению к базе данных выступают внешними процессами, отождествляемыми с действиями пользователей банка данных. При этом источником, инициатором транзакций может быть как один пользователь, так и несколько пользователей сразу. По этому критерию СУБД классифицируются на однопользовательские (или так называемые «настольные») и многопользовательские («тяжелые», «промышленные») СУБД. Соответственно в многопользовательских СУБД главной функцией монитора транзакций является обеспечение эффективного совместного выполнения транзакций над общими данными сразу от нескольких пользователей.

Непосредственная обработка и доступ к данным в большинстве СУБД осуществляется через организацию в оперативной памяти штатными средствами операционной системы или собственными средствами системы буферов оперативной памяти, куда на время обработки и доступа помещаются отдельные компоненты файла базы данных (страницы). Поэтому другой составной частью функций СУБД по организации доступа и обработки данных является управление буферами оперативной памяти.

Еще одной важной функцией СУБД с точки зрения организации доступа и обработки данных является так называемая журнализация всех текущих изменений базы данных. Журнализация представляет собой основное средство обеспечения сохранности данных при всевозможных сбоях и разрушениях данных. Во многих СУБД для нейтрализации подобных угроз создается журнал изменений базы данных с особым режимом хранения и размещения. Вместе с установкой режима периодического сохранения резервной копии БД журнал изменений* при сбоях и разрушениях данных позволяет восстанавливать данные по произведенным изменениям с момента последнего резервирования до момента сбоя. Во многих предметных областях АИС (например, БД с финансово-хозяйственными данными) такие ситуации сбоя и порчи данных являются критическими и возможности восстановления данных обязательны для используемой СУБД.

* Резервная копия БД и журнал изменений, как правило, размещаются на отдельных от основного файла БД носителях.

Исходя из рассмотренных функций, в структуре СУБД в современном представлении можно выделить следующие функциональные блоки:

• процессор описания и поддержания структуры базы данных;

• процессор запросов к базе данных;

• монитор транзакций;* • интерфейс ввода данных;

• интерфейс запросов;

• интерфейс выдачи сведений;

• генератор отчетов.

* Как правило, в однопользовательских СУБД монитортранзакций в виде отдельного функционального элемента СУБД не реализуется и не выделяется.

Схематично взаимодействие компонент СУБД представлено на рис. 2.1.

Ядром СУБД является процессор описания и поддержания структуры базы данных. Он реализует модель организации данных, средствами которой проектировщик строит логическую структуру (схему) базы данных, соответствующую инфологической схеме предметной области АИС, и обеспечивает построение и поддержание внутренней схемы базы данных.

Процессором описания и поддержания структуры данных в терминах используемой модели данных (иерархическая, сетевая, реляционная) обеспечиваются установки заданной логической структуры базы данных, а также трансляция (перевод) структуры базы данных во внутреннюю схему базы данных (в физические структуры данных). В АИС на базе реляционных СУБД процессор описания и поддержания структуры базы данных реализуется на основе языка базы данных, являющегося составной частью языка структурированных запросов (SQL).

Интерфейс ввода данных СУБД реализует входной информационный язык банка данных, обеспечивая абонентам-поставщикам информации средства описания и ввода данных в информационную систему. Одной из современных тенденций развития СУБД является стремление приблизить входные информационные языки и интерфейс ввода к естественному языку общения с пользователем в целях упрощения эксплуатации информационных систем так называемых «неподготовленными»

пользователями. Данная проблема решается через применение диалоговых методов организации интерфейса и использование входных форм. Входные формы, по сути, представляют собой электронные аналоги различного рода анкет, стандартизованных бланков и таблиц, широко используемых в делопроизводстве и интуитивно понятных большинству людей (неподготовленных пользователей). Интерфейс ввода при этом обеспечивает средства создания, хранения входных форм и их интерпретацию в терминах описания логической структуры базы данных для передачи вводимых через формы сведений процессору описания и поддержания структуры базы данных.

Интерфейс запросов совместно с процессором запросов обеспечивает концептуальную модель использования информационной системы в части стандартных типовых запросов, отражающих информационные потребности пользователей-абонентов системы. Интерфейс запросов предоставляет пользователю средства выражения своих информационных потребностей.

Современной тенденцией развития СУБД является использование диалогово-наглядных средств в виде специальных «конструкторов» или пошаговых «мастеров» формирования запросов.

Процессор запросов интерпретирует сформированные запросы в терминах языка манипулирования данными и совместно с процессором описания и поддержания структуры базы данных собственно и исполняет запросы. В реляционных СУБД основу процессора запросов составляет язык манипулирования данными, являющийся основной частью языка SQL. Тем самым на базе процессора запросов и процессора описания и поддержания структуры базы данных образуется низший уровень оперирования данными в СУБД, который иногда называют машиной данных. Стандартные функции и возможности машины данных используют компоненты СУБД более высокого порядка (см. рис.

2.1), что позволяет разделить и стандартизировать компоненты СУБД и банка данных на три уровня —логический уровень, машина данных и собственно сами данные.

Функции монитора транзакции, как уже отмечалось, заключаются в организации совместного выполнения транзакций от нескольких пользователей над общими данными. При этом дополнительной функцией, неразрывно связанной, в том числе и с основной функцией, является обеспечение целостности данных и ограничений над данными, определяемыми правилами предметной области АИС.

Интерфейс выдачи СУБД получает от процессора запросов результаты исполнения запросов (обращений к базе данных) и переводит эти результаты в форму, удобную для восприятия и выдачи пользователю-абоненту информационной системы. Для отображения результатов исполнения запросов в современных СУБД используются различные приемы, позволяющие «визуализировать»

данные в привычной и интуитивно понятной неподготовленному пользователю форме. Обычно для этого применяются табличные способы представления структурированных данных, а также специальные формы выдачи данных, представляющие также, как и формы ввода, электронные аналоги различных стандартизованных бланков и отчетов в делопроизводстве.

Формы выдачи лежат также и в основе формирования так называемых «отчетов», выдающих результаты поиска и отбора информации из БД в письменной форме для с формализованного создания соответствующих текстовых документов, т. е. для документирования выводимых данных.

Для подобных целей в состав современных СУБД включаются генераторы отчетов.

В заключение по структуре и составу СУБД следует также добавить, что современные программные средства, реализующие те или иные СУБД, представляют собой совокупность инструментальной среды создания и использования баз данных в рамках определенной модели данных (реляционной, сетевой, иерархической или смешанной) и языка СУБД (язык описания данных, язык манипулирования данными, язык и средства создания интерфейса). На основе программных средств СУБД проектировщики строят в целях реализации конкретной информационной системы (инфологическая схема предметной области, задачи и модель использования, категории пользователей и т. д.) автоматизированный банк данных, функционирование которого в дальнейшем поддерживают администраторы системы и услугами которого пользуются абоненты системы.

2.2.1. Иерархическая и сетевая модели организации данных В иерархической модели объекты-сущности и отношения предметной области представляются наборами данных, которые имеют строго древовидную структуру, т. е. допускают только иерархические (структурные) связи-отношения. Иерархическая модель данных была исторически первой, на основе которой в конце 60-х-начале 70-х годов были разработаны первые профессиональные СУБД-СУБД IMS (Information Management System) фирмы IBM, СУБД Total для компьютеров НР3000. К иерархическим СУБД также относятся отечественные промышленные СУБД 70-80-х годов «ОКА» и «ИНЭС».

База данных с иерархической моделью данных состоит из упорядоченного набора экземпляров структуры типа «дерево», что иллюстрируется примером на рис. 2.2.

В приведенном примере информационный объект «Отделы» является предком информационного объекта «Подразделения», который, в свою очередь, является предком информационного объекта «Сотрудники». Объект «Подразделения» является потомком объекта «Отделы», а объект «Сотрудники» потомком объекта «Подразделения». Экземпляры потомка с общим предком называются близнецами.

В иерархической модели устанавливается строгий порядок обхода дерева (сверху-вниз, слева-направо) и следующие операции над данными:

• найти указанное дерево (например, отдел № 3);

• перейти от одного дерева к другому;

• перейти от одной записи к другой (например, от отдела к первому подразделению);

• перейти от одной записи к другой в порядке обхода иерархии;

• удалить текущую запись.

Основное внимание в ограничениях целостности в иерархической модели уделяется целостности ссылок между предками и потомками с учетом основного правила: никакой потомок не может существовать без родителя.

Сетевая модель является расширением иерархической и широко применялась в 70-е годы в первых СУБД, использовавшихся крупными корпорациями для создания информационных систем (СУБД IDMS — Integrated Database Management System компании Cullinet Software Inc., СУБД IDS, отечественные СУБД «СЕТЬ», «БАНК», «СЕТОР»). Одним из идеологов концепции сетевой модели являлся Ч. Бахман. Эталонный вариант сетевой модели данных, разработанный с участием Бахмана, был описан в проекте «Рабочей группы по базам данных» КОДАСИЛ (DBTG CODASYL).

В отличие от иерархической, в сетевой модели объект-потомок может иметь не одного, а вообще говоря, любое количество объектов-предков. Тем самым допускаются любые связи-отношения, в том числе и одноуровневые. В результате сущности и отношения предметной области АИС представляются графом любого (не только древовидного) типа. Пример такой организации данных приведен на рис. 2.3.

Сетевая СУБД состоит из одного или нескольких типов записей (типов информационных объектов) и набора типов связей между ними. Каждый тип записей представлен в БД набором экземпляров записей данного типа. Аналогично каждый тип связи представлен набором экземпляров связей данного типа между конкретными экземплярами типов записей. В приведенном на рис. 2.3 примере типами записей являются «Организация», «Сотрудник», «Банк», «Счет», а типами связей — «Совместительство», «Основная работа», «Вклады», «Накопления». При этом тип записи «Счет» имеет двух предков — «Сотрудник» и «Банк», экземпляр типа записи «Сотрудник» может иметь два предка (по связям «Основная работа» и «Совместительство»), являющихся различными экземплярами типа записи «Организация».

Для данного типа связи L между типом записи предка Р и типом записи потомка С выполняются следующие условия:

• каждый экземпляр типа Р является предком только в одном экземпляре L, • каждый экземпляр С является потомком не более чем в одном экземпляре L.

В рамках сетевой модели возможны следующие ситуации:

• тип записи потомка в одном типе связи L1 может быть типом записи предка в другом типе связи L (как в иерархической модели);

• данный тип записи Р может быть типом записи потомка в любом числе типов связи;

• может существовать любое число типов связи с одним и тем же типом записи предка и одним и тем же типом записи потомка;

• если L1 и L2 —два типа связи с одним и тем же типом записи предка Р и одним и тем же типом записи потомка С, то правила, по которым образуется родство, в разных связях могут различаться;

• типы записей Х и Y могут быть предком и потомком одной связи и потомком и предком в другой;

предок и потомок могут быть одного типа записи (связь типа «петля»).

В сетевой модели устанавливаются следующие операции над данными:

• найти конкретную запись (экземпляр) в наборе однотипных записей;

• перейти от предка к первому потомку по некоторой связи;

• перейти к следующему потомку по некоторой связи;

• создать новую запись;

• уничтожить запись;

• модифицировать запись;

• включить в связь;

• исключить из связи;

• переставить в другую связь.

Реализация связей и сведений по ним в виде отдельных записей в БД обеспечивает одну важную отличительную особенность сетевых СУБД - навигацию по связанным данным. Сетевые СУБД обеспечивают возможность непосредственной «навигации» (перехода) от просмотра реквизитов экземпляра одного типа записи (например, «Организация») к просмотру реквизитов экземпляра связанного типа записей (например, «Сотрудник»). Тем самым пользователю предоставляется возможность многокритериального анализа базы данных без непосредственной формализации своих информационных потребностей через формирование запросов на специальном языке, встроенном в СУБД. Поэтому СУБД с сетевой организацией данных иногда еще называют СУБД с навигацией.

Другой сильной стороной сетевой модели в немногих примерах современной реализации сетевых СУБД является также использование множественных типов данных для описания атрибутов информационных объектов (записей), что позволяет создавать информационные структуры, которые хорошо отражают традиционную табличную форму представления структурированных данных. К примеру, при описании типа записи «Сотрудник» в сетевой модели можно ввести реквизит «Имена детей», характер значений которого является множественным.

Сетевая модель позволяет наиболее адекватно отражать инфологические схемы сложных предметных областей. Вместе с тем, несмотря на появление в конце 70-х годов стандарта по сетевой модели данных КОДАСИЛ, не получила широкого распространения ни одна из попыток создания языковых программных средств, которые позволили бы в разных прикладных информационных системах одинаковым образом описывать данные с сетевой организацией. В результате в сетевых СУБД данные оставались жестко связанными как с самой СУБД, так и с прикладными компонентами АИС, что затрудняло специализацию в развитии программных компонент СУБД сетевого типа и объективно затормаживало процесс их развития.

В реляционной модели объекты-сущности инфологической схемы предметной области АИС представляются плоскими таблицами данных. Столбцы таблицы, называемые полями базы данных, соответствуют атрибутам объектов-сущностей инфологической схемы предметной области.

Множество атомарных значений атрибута называется доменом. Так доменом для поля «Имя»

является множество всех возможных имен. Различные атрибуты могут быть определены на одном и том же домене — например, атрибуты «Год поступления» (в вуз) и «Год окончания» определены на одном и том же домене, являющемся перечнем дат определенного диапазона.

Строки таблицы, представляющие собой различные сочетания значений полей из доменов, называются кортежами (в обиходе просто записями) базы данных и соответствуют экземплярам объектовсущностей инфологической схемы предметной области.

Считается, что сильной стороной реляционных баз данных является развитая математическая теория, лежащая в их основе—реляционная алгебра. Само слово «реляционная» происходит от англ. relation — отношение. Но в случае реляционных баз слово «отношение» выражает не взаимосвязь между таблицами-сущностями, а определение самой таблицы как математического отношения доменов.* * Для любителей математики—отношением называется подмножество декартова произведения множеств, роль которых в данном случае играют домены, таким образом таблицы — это отношение доменов, а строки таблицы (кортежи) — элементы отношения доменов.

Ключевому атрибуту объекта-сущности, который идентифицирует (определяет, отличает от других) конкретный экземпляр объекта, в таблице соответствует ключевое поле (так называемый ключ таблицы). Примером ключа в таблице «Отделы» может быть поле «Номер отдела» или поле «Наименование отдела». В тех случаях, когда конкретную запись таблицы идентифицирует значение не одного поля, а совокупность значений нескольких полей, тогда все эти поля считаются ключевыми, а ключ таблицы является составным. Примером такой ситуации может служить таблица «Сотрудники», роль составного ключа в которой может играть совокупность полей «Фамилия», «Имя», «Отчество».* * В той ситуации, когда исключается полное совпадение фамилии, имени и отчества у разных сотрудников.

Ключевое поле для созданной записи (заполненной строки таблицы) впоследствии обновиться (изменить значение) уже не может.

В некоторых таблицах роль ключа могут играть сразу несколько полей или групп полей. Например, в той же таблице «Сотрудники» может быть определен второй ключ «Номер паспорта», который также может идентифицировать конкретную запись (экземпляр) объекта «Сотрудник». В этих случаях один из ключей объявляется первичным. Значения непервичных ключей, которые называются возможными, в отличие от первичных ключей могут обновляться.

Совокупность определенных для таблицы-отношения полей, их свойства (ключи и пр.) составляют схему таблицы-отношения. Две отдельные таблицы-отношения с одинаковой схемой называются односхемными.

Как уже отмечалось, таблица в реляционной модели отражает определенный объект-сущность из мифологической схемы предметной области АИС. Отношения-связи объектов-сущностей в реляционной модели устанавливаются через введение в таблицах дополнительных полей, которые дублируют ключевые поля связанной таблицы. К примеру, связь между таблицей «Сотрудники» и таблицей «Отделы» устанавливается через введение копии ключевого поля «Номер отдела» из таблицы «Отделы» в таблицу «Сотрудники» — см. рис. 2.4. Такие поля, дублирующие ключи связанной таблицы, называются внешними ключами.

На приведенном рисунке ключевые поля таблиц обведены жирными рамками, а поле с внешним ключом — двойной рамкой.

Так как значения первичного ключа уникальны, т. е. не могут повторяться (в таблице «Отделы» может быть только один кортеж по, к примеру, 710-му отделу), а значения других полей и, в частности, внешнего ключа могут повторяться (в таблице «Сотрудники» может быть несколько строк-кортежей сотрудников по 710-му отделу), то такой механизм автоматически обеспечивает связь типа «Одинко-многим». Отсюда также можно заключить, что связи между таблицами типа «Один-к-одному» в реляционной модели автоматически обеспечиваются при одинаковых первичных ключах, например между таблицей «Сотрудник» с ключом «Таб_№» и таблицей «Паспорт» с таким же ключом.

Другой вывод, который следует из анализа данного механизма реализации связей, заключается в том, что реляционная модель не может непосредственно отражать связи типа «Многие-ко-многим», что объективно снижает возможности реляционной модели данных при отражении сложных предметных областей.

Таким образом, структурная составляющая реляционной модели определяется небольшим набором базовых понятий — таблица-отношение, схема таблицы-отношения, домен, поле-атрибут, кортежзапись (строка), ключ, первичный ключ, вторичный ключ, внешний ключ (отсылка). Данный набор понятий позволяет описывать естественным образом, близким к понятийному аппарату диаграмм Бахмана, большинство инфологических схем не слишком сложных предметных областей. Это обстоятельство как раз и способствовало интенсивному развитию реляционных СУБД в 80-х-90-х годах.

Ограничения целостности (целостная составляющая) реляционной модели можно разделить на две группы — требование целостности сущностей и требование целостности ссылок.

Требование целостности сущностей в общем плане заключается в требовании уникальности экземпляров объектов инфологической схемы, отображаемых средствами реляционной модели.

Экземплярам объектов инфологической схемы в реляционной модели соответствуют кортежи-записи таблиц-отношений. Поэтому требование целостности сущностей заключается в требовании уникальности каждого кортежа.

Отсюда вытекают следующие ограничения:

• отсутствие кортежей дубликатов (данное требование реализуется не через требование отсутствия совпадения значений одновременно по всем полям, а лишь по полям первичных ключей, что обеспечивает определенную гибкость в описании конкретных ситуаций в предметных областях АИС);

• отсутствие полей с множественным характером значений атрибута (данное ограничение по отношению к весьма типичным ситуациям при описании реальных предметных областей в реляционной модели обеспечивается так называемой нормализацией таблиц-отношений, т.е.

разбиением исходной таблицы на две или более связанные таблицы с единичным характером значений полей-атрибутов).

Требование целостности ссылок заключается в том, что для любого кортежа-записи с конкретным значением внешнего ключа (отсылки) должен обязательно существовать кортеж связанной таблицыотношения с соответствующим значением первичного ключа. Простым примером этого очевидного требования является таблица-отношение «Сотрудники» с внешним ключом «№ отдела» и отсылаемая (связанная) таблица «Отделы» с первичным ключом «№ отдела» (см. рис. 2.4). Если существует кортеж-запись «Иванов», работающий в отделе № 710, то в таблице «Отделы»

обязательно должен быть кортеж-запись с соответствующим номером отдела (каждый сотрудник должен обязательно в каком-либо отделе хотя бы числиться).

Теоретико-множественный характер реляционных таблиц-отношений требует также отсутствия упорядоченности кортежей и отсутствия упорядоченности полей-атрибутов. Отсутствие упорядоченности записей-кортежей в таблицах-отношениях усложняет поиск нужных кортежей при обработке таблиц. На практике с целью создания условий для быстрого нахождения нужной записи таблицы без постоянного упорядочения (переупорядочения) записей при любых изменениях данных вводят индексирование полей (обычно ключевых). Индексирование полей, или лучше сказать создание индексных массивов, является типовой распространенной операцией практически во всех СУБД, поддерживающих и другие, не реляционные модели данных, и заключается в построении дополнительной упорядоченной информационной структуры для быстрого доступа к записямкортежам.

Все операции над данными в реляционной модели (манипуляционная составляющая) можно разделить на две труппы — операции обновления таблиц-отношений и операции обработки таблицотношений.

К операциям обновления относятся:

• операция ВКЛЮЧИТЬ —добавляет новый кортеж (строку-запись) в таблицу-отношение. Требует задания имени таблицы и обязательного значения ключей. Выполняется при условии уникальности значения ключа. Добавить новую строку-запись со значением ключа, которое уже есть в таблице, невозможно;

• операция УДАЛИТЬ — удаляет одну или группу кортежей (строк-записей). Требует задания имени таблицы, имени поля (группы полей) и параметров значений полей, кортежи с которыми должны быть удалены;

• операция ОБНОВИТЬ — изменяет значение не ключевых полей у одного или группы кортежей.

Требует задания имени таблицы-отношения, имен полей и их значений для выбора кортежей и имен изменяемых полей.

Особенностью операций обработки в реляционной модели по сравнению с иерархической и сетевой моделью является то, что в качестве единичного элемента обработки выступает не запись (экземпляр объекта), а таблица в целом, т. е. множество кортежей (строк-записей). Поэтому все операции обновления являются операциями над множествами и их результатом является также множество, т.

е. новая таблица-отношение. К операциям обновления относятся следующие операции:

• операция ОБЪЕДИНЕНИЕ — выполняется над двумя односхемными таблицами-отношениями.

Результатом объединения является построенная по той же схеме таблица-отношение, содержащая все кортежи первой таблицы-отношения и все кортежи второй таблицы-отношения. При этом кортежи-дубликаты в итоговой таблице устраняются;

• операция ПЕРЕСЕЧЕНИЕ — выполняется также над двумя односхемными таблицами-отношениями.

Результатом является таблица-отношение, построенная по той же схеме и содержащая только те кортежи первой таблицы-отношения, которые входят также в состав кортежей второй таблицы-отношения. Для примера рассмотрим таблицу «Сотрудники» со схемой (полями) «ФИО», «Год рождения», «Национальность» и таблицу «Вкладчики банка «НАДЕЖНЫЙ» с той же схемой.

Результатом их пересечения будет новая таблица с той же схемой, содержащая кортежи только тех сотрудников, которые имеют вклады в банке «НАДЕЖНЫЙ», что иллюстрируется примером, приведенным на рис. 2.5;

• операция ВЫЧИТАНИЕ — выполняется также над двумя односхемными таблицами-отношениями.

Результатом является таблица-отношение, построенная по той же схеме и содержащая только те кортежи первой таблицы-отношения, которых нет в составе кортежей второй таблицы-отношения.

Результатом операции вычитания над таблицами в предыдущем примере будет новая таблица стой же схемой, содержащая кортежи только тех сотрудников, которые не имеют вкладов в банке «НАДЕЖНЫЙ»;

• операция ПРОИЗВЕДЕНИЕ (ДЕКАРТОВО) — выполняется над таблицами-отношениями с разными схемами. Результатом является таблица-отношение, схема которой включает все поля первой и все поля второй таблицы. Кортежи (строки-записи) результирующей таблицы образуются путем последовательного сцепления каждого кортежа первой таблицы-отношения к каждому кортежу второй таблицы-отношения. Количество кортежей результирующей таблицы соответственно равно произведению количества кортежей первой таблицы на количество кортежей второй таблицы. На рис. 2.6 иллюстрируется пример операции произведения;

• операция ВЫБОРКА (горизонтальное подмножество) — выполняется над одной таблицейотношением. Результатом является таблица-отношение той же схемы, содержащая подмножество кортежей исходной таблицы-отношения, удовлетворяющих условию выборки;

• операция ПРОЕКЦИЯ (ВЕРТИКАЛЬНОЕ ПОДМНОЖЕСТВО) —также выполняется над одной таблицей-отношением. Результатом является новая таблица-отношение, схема которой содержит только некоторое подмножество полей исходной таблицы-отношения. Каждому кортежу исходной таблицы соответствует кортеж итоговой таблицы, образованный соответствующими значениями по полям, вошедшим в итоговую таблицу-отношение. При этом в итоговой таблице кортежи-дубликаты устраняются и поэтому мощность итоговой таблицы (количество кортежей) может быть равна или меньше исходной. На рис. 2.7 приведен пример операции проекции;

• операция СОЕДИНЕНИЕ — выполняется над таблицами-отношениями с разными схемами. В каждой таблице-отношении выделяется поле, по которому будет осуществляться соединение. При этом оба поля должны быть определены на одном и том же домене. Схема итоговой таблицы-отношения включает все поля первой таблицы и все поля второй таблицы (как в произведении). Кортежи итоговой таблицы-отношения образуются путем сцепления каждого кортежа из первой таблицы с теми кортежами второй таблицы, значения которых по полю сцепления одинаковы. На рис. 2. приведен пример операции соединения;

• операция ДЕЛЕНИЕ — выполняется над двумя таблицами-отношениями, первая из которых называется делимым, а вторая делителем. При этом схема таблицы-делителя должна состоять из подмножества полей таблицы делимого. Схема итоговой таблицы-отношения содержит только те поля таблицы-делимого, которых нет во второй таблице-делителе. Кортежи итоговой таблицыотношения образуются на основе кортежей первой таблицы (делимого) по значениям полей, вошедших в итоговую таблицу при условии того, что если взять произведение (декартово) итоговой таблицы-отношения и второй таблицы-отношения (делителя), то образуются соответствующие кортежи первой таблицы (делимого). На рис. 2.9 приведен пример операции деления.

В своем исходном виде манипуляционная составляющая реляционной модели не предусматривает операции над полями-атрибутами и схемами таблиц-отношений. Однако на практике применение рассмотренных выше операций манипулирования данными может приводить к временным нарушениям требований ограничения целостностей, которые преодолеваются специальными операциями переименования, удаления, добавления полей-атрибутов.

Реляционная модель организации данных сыграла трудно переоценимую роль в развитии программного обеспечения АИС. Именно реляционные СУБД были тем программным инструментарием, на основе которого происходила массовая информатизация малых и средних предприятий и организаций в 80-х годах. В начале 90-х годов реляционные СУБД стали фактическим стандартом для построения самых разнообразных информационных систем. Вместе с тем проявились и определенные ограничения реляционной модели, которые не позволяют адекватно описывать такие сложные предметные области, как конструирование, производственные технологические процессы и др. Поэтому в 90-х годах были предприняты попытки создания новых усовершенствованных моделей организации данных в виде постреляционных СУБД и объектно-ориентированных СУБД. К сожалению, до сей поры ни одна из попыток создания и описания новых моделей описания данных не стандартизована, и количество коммерческих СУБД, основанных на новых моделях данных, исчисляется единицами.

2.3. Внутренняя схема баз данных фактографических АИС Изначально и по сей день программное обеспечение АИС (СУБД) в качестве места физического размещения данных ориентировано на внешнюю (дисковую) память. Как уже отмечалось, размещение данных во внешней памяти, точнее эффективность доступа к ним во внешней памяти, существенно влияет на эффективность обработки данных. В результате важным аспектом АИС является внутренняя схема базы данных, которую организует и поддерживает СУБД.

В общем плане внутренняя схема базы данных включает три основных компонента, представленные на рис. 2.10.

Центральным компонентом внутренней схемы являются информационные массивы, включающие собственно данные (информационных объектов логической схемы БД, т.е. в реляционных СУБД таблиц), и массивы индексов, являющихся специальными дополнительными конструкциями для ускорения доступа к данным основных информационных объектов. Информационные массивы в большинстве СУБД состоят из одной или нескольких так называемых страниц, каждая из которых содержит совокупность некоторых единичных элементов, называемых физическими записями. В результате, единичным элементом внутренней схемы баз данных АИС является физическая запись, в большинстве случаев совпадающая по смыслу с логической записью, т. е. в реляционных СУБД с табличной строкой.

Способы организации записей в страницах (расположение, добавления, корректировка, удаление) составляют физические структуры данных, которые образуют третий (низший) уровень представления информации в информационной системе (см. рис. 1.4).

Важным компонентом внутренней структуры является каталог БД, в котором размещается системная информация по логической структуре БД, включающая описание основных информационных объектов (имена, структура, параметры, связи) и ограничения целостности данных. Организация системной информации БД определяется особенностями конкретной СУБД, а сам каталог может входить непосредственно в файлы данных (область описателей данных) или составлять отдельный информационный массив.

Как уже отмечалось, в состав автоматизированного банка данных АИС помимо самой базы данных входит и прикладной компонент, образуемый совокупностью интерфейсных элементов представления, ввода и обработки данных, типовых запросов и процедур обработки данных, а также «событий» и «правил», отражающих правила и специфику предметной области АИС (так называемые «правила бизнеса»). Соответственно во внутренней схеме БД выделяется специальная область, в которой размещается информация по прикладному компоненту АИС.

Все три части внутренней структуры и их составные элементы (например, информационные массивы отдельных информационных объектов БД) могут размещаться в одном едином файле базы данных или в разных файлах. Во втором случае внутренняя схема БД определяется совокупностью и порядком расположения данных файлов.

Страничная организация информационных массивов БД определяется общей спецификой доступа к данным больших объемов. Доступ к физическим записям во внешней памяти в большинстве СУБД осуществляется через считывание в оперативную память страниц файла данных, содержащих соответствующие записи. Непосредственная обработка записей производится в оперативной памяти, для чего СУБД образует и поддерживает, как уже отмечалось, специальные буферы, в которых временно размещаются страницы, содержащие обрабатываемые записи. После завершения обработки страница с соответствующими записями «выталкивается» из буфера и фиксируется в дисковом файле.

Аналогичным образом осуществляется размещение и доступ к индексным массивам. В итоге общий принцип организации доступа к данным во внешней памяти можно проиллюстрировать схемой, приведенной на рис. 2.11.

Физические структуры организации файлов данных подразделяются на линейные и нелинейные.

В линейных структурах в одну страницу файла базы данных объединяются записи-кортежи одной таблицы (информационного объекта), которые располагаются в последовательном (линейном) порядке друг за другом. Каких-либо ссылок, указателей на связи между записями не предусматривается.

Если не применяется специального порядка размещения записей в страницах (так называемая «расстановка» записей), то при добавлении записей в большинстве случаев в линейных структурах каждая новая запись помещается непосредственно за последней записью. Если страница файла данных заполняется, то для соответствующей таблицы выделяется дополнительная страница.



Pages:     || 2 | 3 | 4 | 5 |   ...   | 6 |


Похожие работы:

«Левушкина Ольга Николаевна [email protected] Звание: кандидат педагогических наук, доцент, Должность: доцент кафедры филологического образования МИОО Деятельность: преподавание курсов Методика преподавания русского языка в школе, Современный урок русского языка, Лингвокультурологический анализ текста в школе; курирование сетевого инновационного проекта опытноэкспериментальной работы КФО в школах Москвы, подготовка семинаров, круглых столов, научно-практических конференций КФО регионального...»

«Что такое библиотечная выставка? Библиотечная выставка - это публичная демонстрация специально подобранных и систематизированных произведений печати и других носителей информации, рекомендуемых пользователям библиотеки для обозрения и ознакомления. (Справочник библиотекаря. - 2000. - С. 160.) Что такое выставочная работа? Из каких этапов она состоит? Выставочная работа - это деятельность по организации выставок, включающая в себя планирование, разработку, оформление, проведение и подведение...»

«Аннотации к методическим и учебным пособиям Факультет ветеринарной медицины Кафедра анатомии, физиологии домашних животных, биологии и гистологии Методические разработки Составители: Чопорова Н.В., Шубина Т.П. Сравнительно-анатомические особенности костей осевого скелета и их соединений: методические разработки. - пос. Персиановский: Донской ГАУ, 2014. – 19 с. Аннотация: Методические разработки предназначены для студентов 1 курса по специальности 111100.62 Зоотехния при изучении дисциплины...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ ГОУ ВПО Уральский государственный лесотехнический университет Факультет гуманитарный Кафедра истории и социально- политических дисциплин Дисциплина _Отечественная история Специальность Все специальности Наличие Кол- Место хранения Наименование элемента УМК (есть, нет) во есть УМК Учебно-организационная документация 1 1.ГОС ВПО (фрагмент, относящийся к есть Деканат ГФ 1 дисциплине) 2.Компетентностная модель выпускника есть кафедра (фрагмент, относящийся к...»

«В серии: Библиотека ALT Linux Георгий Курячий Кирилл Маслинский Операционная система Linux Курс лекций. Учебное пособие Москва, 2010 УДК ББК Операционная система Linux: Курс лекций. Учебное пособие / Г. В.Курячий, К. А. Маслинский М. : ALT Linux; Издательство ДМК Пресс, 2010. 348 с. : ил. ; 2-е изд., исправленное. (Библиотека ALT Linux). ISBN В курсе даются основные понятия операционной системы Linux и важнейшие навыки работы в ней. Изложение сопровождается большим количеством практических...»

«Министерство образования Республики Беларусь УО ПОЛОЦКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МЕТОДИЧЕСКИЕ УКАЗАНИЯ к выполнению курсовой работы по дисциплине Анализ хозяйственной деятельности для студентов специальности 1-25 01 08 очной (заочной) формы обучения г. Новополоцк, ПГУ, 2010 УДК 657(075.8) ББК 65.052 (4 БЕИ) я 73 Одобрено и рекомендовано к изданию Методической комиссией финансово-экономического факультета в качестве методических указаний (протокол № от 20_г.) кафедра бухгалтерского учета и...»

«В.К. КЛЮЕВ МЕНЕДЖМЕНТ РЕСУРСНОГО ПОТЕНЦИАЛА БИБЛИОТЕКИ Учебное пособие Рекомендовано Учебно-методическим объединением по образованию в области народной художественной культуры, социально-культурной деятельности и информационных ресурсов в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению подготовки 071900 – Библиотечно-информационная деятельность Москва 2011 СОДЕРЖАНИЕ Предисловие 3 I. Организационно-экономические основы управления ресурсным комплексом...»

«Раздел Пояснительная записка Рабочая программа по окружающему миру составлена на основе следующих нормативных документов: Федеральный государственный стандарт НОО ( Приложение к приказу Минобрнауки России от 06.10.2009г. №373) ООП общеобразовательного учреждения ( утверждена приказом № от ) Примерная программа начального образования по окружающему миру. Авторская программа по окружающему миру: И Потапова, Г.Ивченковой, Е. Саплиной. Астрель, 2011. Письмо Департамента образования Ярославской...»

«Министерство образования и науки Украины Севастопольский национальный технический университет СИСТЕМЫ ОДНОВРЕМЕННЫХ УРАВНЕНИЙ: ИДЕНТИФИКАЦИЯ КОЭФФИЦИЕНТОВ МЕТОДИЧЕСКИЕ УКАЗАНИЯ к лабораторной работе по дисциплине Эконометрия для студентов специальностей: 7.050201 – Менеджмент организаций, 7.050104 – Финансы 7.050106 – Учет и аудит 7.050107 – Экономика предприятия всех форм обучения Севастополь Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com) УДК...»

«ГБОУ ВПО Ивановская государственная медицинская академия Министерства здравоохранения России Кафедра госпитальной терапии ДИФФЕРЕНЦИАЛЬНАЯ ДИАГНОСТИКА ПРИ НЕФРОТИЧЕСКОМ СИНДРОМЕ Методическая разработка для студентов 6 курса лечебного факультета Иваново – 2013 Составители: Миронова Н.А., Алеутская О.Н., Корнилов Л.Я. Зав. кафедрой поликлинической терапии и эндокринологии ГБОУ ВПО ИвГМА МЗ России д.м.н., профессор Полятыкина Тамара Семеновна Методическая разработка составлена в соответствии с...»

«Н.А. МАЛКОВ, А.П. ПУДОВКИН ЭЛЕКТРОМАГНИТНАЯ СОВМЕСТИМОСТЬ РАДИОЭЛЕКТРОННЫХ СРЕДСТВ ИЗДАТЕЛЬСТВО ТГТУ Министерство образования и науки Российской Федерации ГОУ ВПО Тамбовский государственный технический университет Н.А. Малков, А.П. Пудовкин ЭЛЕКТРОМАГНИТНАЯ СОВМЕСТИМОСТЬ РАДИОЭЛЕКТРОННЫХ СРЕДСТВ Утверждено Ученым советом университета в качестве учебного пособия для студентов 4 и 5 курсов специальностей 210303 и 210201 Тамбов Издательство ТГТУ УДК 621.396.6(075) ББК 844- М Рецензенты: Доктор...»

«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Факультет социологии Кафедра прикладной и отраслевой социологии МЕТОДЫ ПРИКЛАДНОЙ СОЦИОЛОГИИ (цикл лекций) Под ред. В.Г. Овсянникова Выпуск первый Учебное пособие Санкт-Петербург 2002 Рецензенты: д-р социологических наук Глотов М.Б., д-р экономических наук Тихомиров Б.И. Настоящий цикл лекций подготовлен на основе материалов проблемнометодологического семинара кафедры прикладной и отраслевой социологии и реализации программы курса Прикладная...»

«Р.В. Бабун ОРГАНИЗАЦИЯ МЕСТНОГО САМОУПРАВЛЕНИЯ Допущено Советом Учебно-методического объединения вузов России по образованию в области менеджмента в качестве учебного пособия для использования в учебном процессе по специальности Государственное и муниципальное управление Второе издание, переработанное и дополненное УДК 351/354(075.8) ББК 66.3.124я73 Б12 Рецензенты: О.М. Рой, заведующий кафедрой региональной экономики и управления терри ториями Омского государственного университета им. Ф.М....»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Алтайская государственная педагогическая академия (ФГБОУ ВПО АлтГПА) ОСНОВНАЯ ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА (ООП) ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ Направление подготовки 030300 ПСИХОЛОГИЯ Профиль подготовки Психология Квалификация выпускника бакалавр ООП обсуждена на заседании совета Института психологии и педагогики 25 мая 2013 г.,...»

«Государственное бюджетное образовательное учреждение Центр Образования №1419 Согласовано Утверждено Протокол заседания Приказ руководителя методического объединения образовательного учреждения учителей начальных классов № №_ от 2013 г. от __2013 г. Рабочая программа по математике на 2013-2014год 4 класс Количество часов в неделю – 4 ч; на год – 136 ч(классы КРО - 132 ч) Программа составлена на основе учебно-методического комплекта Школа России, а именно государственной программы М.И. Моро,...»

«ПРАВИТЕЛЬСТВО МОСКВЫ ДЕПАРТАМЕНТ ЗДРАВООХРАНЕНИЯ СОГЛАСОВАНО УТВЕРЖДАЮ Заместитель председателя Первый заместитель Ученого медицинского совета руководителя Департамента Департамента здравоохранения здравоохранения Л.Г. Костомарова Н.Ф. Плавунов ДЕТСКИЙ ЦЕРЕБРАЛЬНЫЙ ПАРАЛИЧ И ЭПИЛЕПСИЯ – СОВРЕМЕННЫЕ ПОДХОДЫ К ЛЕЧЕНИЮ И РЕАБИЛИТАЦИИ СОЧЕТАННОЙ ПАТОЛОГИИ. Методические рекомендации № Главный детский невролог Департамента здравоохранения Т.Т. Батышева Москва Учреждение разработчик: Научно-...»

«Учебно-методическое обеспечение образовательной программы 1-х классов Лицея им. Г.Ф.Атякшева-ФГОС ПРЕДМЕТ ПРОГРАММА ИСПОЛЬЗУЕМЫЙ МЕТОДИЧЕСКАЯ ЛИТЕРАТУРА УЧЕБНИК Л.Г. Петерсон Математика. 1 кл. В Петерсон Л.Г. Математика. Математика Максимова, Т.Н. Поурочные разработки по математике.1 класс: к учебному комплекту 3-х ч.-М.:Ювента,2011.-96с. Программа. Предметная линия Петерсон Л.Г. / Т. Н. Максимова. - М. : ВАКО, 2009. - 352 с. - (В помощь учебников Перспектива 1- школьному учителю). кл. М.;...»

«КУБАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Факультет управления и психологии кафедра общего, стратегического, информационного менеджмента и бизнес-процессов Ермоленко В.В., Ермоленко Д.В., Закарян М.Р., Приходько А.И., Матвиенко Н.В. ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА Методические указания Краснодар - 2009 УДК 332.14(075.8) ББК 65.9(2)я73 В77 Рецензенты: кафедра экономики ЮИМ (г. Краснодар) (зав. кафедрой, д-р эконом. наук, проф. Ермоленко А.А. заведующий кафедрой экономики и организации производства...»

«СОДЕРЖАНИЕ Стр. 1. ОБЩИЕ ПОЛОЖЕНИЯ 4 1.1. Нормативные документы для разработки ООП по направлению 4 подготовки 1.2. Общая характеристика ООП 6 1.3. Миссия, цели и задачи ООП ВПО 7 1.4. Требования к абитуриенту 7 ХАРАКТЕРИСТИКА ПРОФЕССИОНАЛЬНОЙ 2. 8 ДЕЯТЕЛЬНОСТИ ВЫПУСКНИКА ПО НАПРАВЛЕНИЮ ПОДГОТОВКИ Область профессиональной деятельности выпускника 2.1. Объекты профессиональной деятельности выпускника 2.2. Виды профессиональной деятельности выпускника 2.3. Задачи профессиональной деятельности...»

«КОМИТЕТ ПО ЗДРАВООХРАНЕНИЮ ПРАВИТЕЛЬСТВА САНКТ-ПЕТЕРБУРГА ЦЕНТР ГОССАНЭПИДНАДЗОРА САНКТ-ПЕТЕРБУРГА ТКАНЕВЫЕ ГЕЛЬМИНТОЗЫ У ВЗРОСЛЫХ И ДЕТЕЙ (эпидемиология, клиника, диагностика, лечение профилактика) Методические рекомендации Санкт-Петербург 2004 г. КОМИТЕТ ПО ЗДРАВООХРАНЕНИЮ ПРАВИТЕЛЬСТВА САНКТ-ПЕТЕРБУРГА ЦЕНТР ГОССАНЭПИДНАДЗОРА САНКТ-ПЕТЕРБУРГА УТВЕРЖДЕНО УТВЕРЖДЕНО Первый заместитель главного врача Первый заместитель председателя Комитета ФГУ Центра Госсанэпиднадзора по здравоохранению...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.