«ИНФОРМАТИКА Энциклопедический систематизированный словарь-справочник Введение в современные информационные и телекоммуникационные технологии в терминах и фактах Электронное издание №5 © Воройский Ф.С. © ГПНТБ России ...»
1) основного имени файла [basic file name (filename)], отражающего в краткой форме содержание и/или назначение находящихся в нем данных, 2) расширения имени файла [file name broadening], которое характеризует вид записанных данных и их организацию (см. также «Формат файла»). Расширение отделяется от основного имени файла точкой и записывается в форме кода, принятого для каждого вида формата файлов. Код расширения, как правило, содержит от двух до четырех буквенных или буквенно-цифровых символов, например:
«*.aiff», «*.au», «*.ехе», «*.doc», «*.txt», «*.tif», «*.jpg», «*.wav», « *.3ds» и т.п.
На физическом уровне содержимое файла может быть не структурировано и представлять собой единственную физическую запись, или структурировано, например полями данных. В последнем случае оно будет включать соответствующее множество физических записей.
Некоторые типы файлов • Файл данных [data file] — файл, содержащий данные в отличие от "программных" файлов, содержащих записи программ или их частей.
О других типах файлов см. Толковый словарь по информатике В.И. Першикова и В.М. Савинкова [265].
• Файл регистрации [log file] — файл, в котором хранятся записи о других файлах, например, если какие-либо файлы были архивирована (см. «Архивация»), список имен этих файлов может храниться в файле регистрации.
• Файл с произвольным доступом [random-access file] — файл, в котором любая запись может быть считана, записана или изменена без необходимости считывания других записей. Произвольный доступ должен быть обеспечен операционной системой и реализован специальной машинной программой.
• Основной файл [master file] — файл, являющийся основным источником данных для решения определенного класса задач, для какой-либо цели или назначения.
Поддержка этого файла в актуальном состоянии, при котором содержащиеся в нем данные отвечают требованиям новизны и точности, производится с использованием операций обновления файла.
• Упорядоченный файл [sequential file] — файл, в котором записи упорядочены по ключевому полю для ускорения доступа к определенной записи.
• Последовательный файл [serial file] — файл, в котором записи не упорядочены; поэтому чтобы прочитать нужную запись, требуется прочитать все предыдущие.
• Программный файл [program file] — файл, содержащий программу или ее часть, написанную на каком-либо из языков программирования.
• Исполняемый файл [executable file] — программный файл (см. ранее), предназначенный для запуска операционной системой. К исполняемым файлам относятся:
командный файл, имеющий расширение «*.bat», и машинный файл, имеющий расширение имени (см. ранее) «*.com» или «*.ехе».
• Скрытый файл [hidden file] — файл, который не отображается на экране монитора при просмотре каталога файлов (директории). Скрытым можно сделать любой файл с целью затруднения его нахождения, чтения и/или порчи другими лицами, которые могут иметь доступ к ЭВМ и др. В то же время скрытые файлы могут создаваться разработчиками различных средств ПО для организации несанкционированного доступа к информационным ресурсам их пользователей [27, 265, 369, 722, 1665].
МАССИВ [array] 1. Упорядоченная структура множества документов или данных одного типа.
2. Поименованная совокупность однотипных (логически однородных), упорядоченных по индексам записей ИЭ.
3. Упорядоченное множество элементов одного типа. Каждый элемент массива должен иметь имя (идентификатор, индекс), обеспечивающее возможность его нахождения.
Элементы массива могут быть одномерными и многомерными.
Применительно ко многим задачам автоматизированной обработки данных термины массив и файл могут использоваться как синонимы. Однако соответствующие понятия имеют и отличия: так, понятие массив не обязательно связано с записями информационных элементов (включая полнотекстовые документы) на машиночитаемых носителях.
Понятие же файл в русскоязычной практике, как правило, предполагает указанное условие. О видах массивов см. [722].
Информационно-поисковый массив, поисковый массив [information collection, file] — массив документов или данных (соответствующие англ. эквиваленты — document collection, data collection), в котором производится информационный поиск [27, 265, 369].
АРХИВ [archives] Организованная совокупность массивов данных или программ, длительно хранимых на внешних машиночитаемых носителях (например на гибких магнитных дисках, магнитных лентах и/или CD-ROM и т.д.) с целью обеспечения возможности их дальнейшего использования.
Целями создания архивов являются:
1. Создание страховочных копий информационных и программных продуктов на случай их утраты или порчи в ходе эксплуатации вычислительных средств;
2. Освобождение внешней памяти ЭВМ (например накопителя на жестком магнитном диске) от программ и данных, потребность в оперативном использовании которых частично, полностью или временно отпала.
КЛЮЧ [key] 1. Информационный элемент, однозначно идентифицирующий запись или указывающий ее местоположение. Ключ может также служить средством для идентификации некоторого множества (в том числе массива) записей и располагаться в одном или нескольких из его полей.
В качестве ключа может служить элемент данных (в том числе индекс, адрес, код и др.) или группа элементов данных. Так, в индексно-последовательном файле ключ является обязательным элементом записи в каждом поле данных. Набор значений некоторой совокупности атрибутов в реляционной модели данных служит ключом, который однозначно идентифицирует кортеж или группу кортежей конкретного отношения.
2. Параметр шифрования, представляющий один из возможных вариантов шифра.
Для дешифрирования помимо ключа необходимо знать последовательность операций или правило его использования (см. также «Алгоритм»).
3. Значение, используемое для подтверждения полномочий на доступ к некоторой информации (в том числе к базам данных, отдельным файлам и т.п.), программным и/или техническим средствам. См. также значение «Электронный ключ» в разделе 1.6.3.
Единицы измерения количественных показателей записей данных в ЭВМ • Бит [bit — от англ., binary digit] — простое двоичное число (цифра или символ), принимающее значения 1 или 0 и служащее для записи и хранения данных в ЭВМ.
Бит является минимальной двоичной единицей измерения энтропии и количества информации в ЭВМ, соответствующей одному двоичному разряду. Энтропия сообщения, выраженная в битах, определяется средним числом символов, необходимых для записи этого сообщения. Определенное количество бит составляет размер других единиц — двоичных слов, в том числе — байта, килобайта, мегабайта (см. далее) и т.д.
• Байт [byte] — двоичное слово, способное записывать и хранить в памяти ЭВМ один буквенно-цифровой или другой символ данных. Каждый символ записывается в виде набора двоичных цифр (битов) при помощи определенного кода, например ASCII. Количество бит в байте определяет его разрядность, которая может составлять 8, 16, 32 и т.д. Соответственно байт называют 8-разрядным, 16-разрядным и т.д. Один 8-разрядный байт может определять 256 разных значений, например десятичных чисел от 0 до 256. Увеличение разрядности ведет к соответствующему увеличению числа возможных вариантов комбинаций, кодируемых одним байтом.
Например, 16-разрядным — до 65536 или 216, 32-разрядным — до 232 и т.д.
• Килобайт, Кбайт [kilobyte, KB] — единица измерения емкости памяти или длины записи, равная 1024 байтам. Часто под килобайтом понимается также величина, равная 103 байт.
• Мегабайт, Мбайт [megabyte, MB] — единица измерения емкости памяти или длины записи, равная 1024 Кбайт. Часто под мегабайтом понимается также величина, равная 103 килобайт или 106 байт.
• Гигабайт, Гбайт [gigabyte, GB] — единица измерения емкости памяти или длины записи, равная 1024 Мбайт. Часто под гигабайтом понимается также величина, равная 103 мегабайт, 106 килобайт или 109 байт.
• Терабайт, Тбайт [terabyte, TB] — единица измерения емкости памяти или длины записи, равная 1024 Гбайт. Часто под терабайтом понимается также величина, равная 103 гигабайт, 106 мегабайт, 109 килобайт или 1012 байт.
• Петабайт, Пбайт, Пб [petabyte, PB] — единица измерения емкости памяти или длины записи, равная 1024 Тбайт. Под петабайтом может пониматься также величина, равная 103 терабайт, 106 гигабайт, 109мегабайт, 1012 килобайт или 1015 байт 11.
• Экcабайт (Экзабайт), Эбайт [exabyte, EB] — единица измерения емкости памяти или длины записи, равная 1024 Пбайт. Под экзабайтом может пониматься также величина, равная 103 петабайт или ~ 1,1 млрд гигабайт, 1012 мегабайт, 1015 килобайт или 1018 байт.
• Зеттабайт, Збайт [zbyte, ZB] — единица измерения емкости памяти или длины записи, равная 1024 Эбайт. Под зеттабайтом может пониматься также величина, равная 103 эксабайт или ~ 1,1 млрд эксабайт, 1012 гигабайт, 1015 мегабайт, 1018 килобайт или 1021 байт.
• Йоттабайт, Йбайт [ybyte, YB] — единица измерения емкости памяти или длины записи, равная 1024 Пбайт. Под экзабайтом может пониматься также величина, равная 103 петабайт или ~ 1,1 млрд зеттабайт, 1015 гигабайт, 1018 мегабайт, 1021 килобайт или 1024 байт.
• Кубит [quantum bit, qubit] — «Квантовый бит»: мера и измерения объема памяти в теоретически возможном виде компьютера, использующем квантовые носители, например — спины 12 электронов. Кубит может принимать не два различных значения («0» и «1»), а несколько, соответствующих нормированным комбинациям двух основных состояний спина, что дает большое число возможных сочетаний. Так, кубита могут образовать около 4 млрд состояний [1027, 1317].
ЗНАК [charter] Один символ, который может быть представлен и воспринят ЭВМ. К знакам относятся буквы, цифры, пробелы, знаки препинания, специальные символы (например математические, кодовые и т.п.).
1.4.3. СТРУКТУРЫ, МОДЕЛИ ДАННЫХ И СВЯЗАННЫЕ С НИМИ ТЕРМИНЫ
СТРУКТУРА [structure] Фиксированное упорядоченное множество объектов и связей между ними.С понятием «структура» связаны следующие термины:
• структура данных [data structure] — множество элементов данных, объединенных и упорядоченных определенным образом;
• структура информационной базы [information support structure] — упорядоченная по определенным правилами совокупность подмножеств записей информационных элементов, образующих информационную базу, и необходимых для реализации функций автоматизированной системы;
• структура базы данных [DB structure] — принцип или порядок организации записей в базе данных и связей между ними. Структуру БД принято рассматривать на разных уровнях абстракции (представления) и, в частности 1) концептуальном (с позиции администратора предприятия), 2) реализации или внешнем (с позиций конечного пользователя и прикладного программиста), 3) физическом или внутреннем (с позиций системного аналитика и системного программиста). Соответственно этим уровням различают концептуальную, внешнюю и физическую модели и/или схемы организации данных, • абстракция [abstraction] — использование для описания или представления общих свойств объекта без конкретной его реализации (например, типов объектов — "читатель", "фирма", "автомобиль", но не конкретно названных читателей, фирм, маВ Википедии по поводу Пбайта дается следующее пояснение: «Петабайт (Пбайт, Пб) м., скл. — единица измерения количества информации, равная 250 стандартным (8-битным) байтам или 1024 терабайтам. Применяется для указания объёма памяти в различных электронных устройствах. Название «петабайт» общепринято, но формально неверно, так как приставка пета-, означает умножение на 1015, а не 250. Правильной для 250 является двоичная приставка пеби-».
Спин (от англ. spin — вращаться, вертеться) — собственный момент количества движения элементарных частиц (например электрона, протона, нейтрона, нейтрино и т.д.), имеющий квантовую природу и не связанный с перемещением частицы как целого.
рок автомобилей и т.п.);
• абстрактная структура данных [
Abstract
logic design] — структура данных, определенная функционально посредством выполняемых на ней операций. Такая структура не связана с поименованными типами объектов, СПИСОК [list] 1. Структура данных, представляющая собой логически связанную последовательность записей — элементов списка;
2. Перечень различных объектов.
Связанные со "структурой" и "списком" понятия:
• цепной список, связанный список [chained (linked) list] — список данных, в котором порядок элементов списка задан посредством указателей, включенных в их запись;
• подсписок [sublist] — ветвь списковой структуры, представляющая собой отдельный цепной список, на который имеется указатель от одного из элементов цепного списка вышестоящего уровня иерархии в данной структуре;
• цепная структура [chain structure] — структура цепного списка;
• ассоциативная (ассоциативно-адресная) структура [associative structure] — совокупность цепного списка и всех, связанных с ним подсписков. Различают объектные и признаковые списковые структуры;
• однородная структура — структура, состоящая из однотипных элементов;
• комбинированная структура [combined structure] — структура данных, полученная путем объединения (композиции) нескольких исходных структур.
МОДЕЛЬ [model] 1. Результат корректного воспроизведения каким-либо способом или средствами различных объектов (в том числе процессов и явлений реального мира или мыслительной деятельности человека). Модели являются, с одной стороны, продуктом изучения свойств соответствующих объектов, процессов и явлений предметной области, с другой — служат инструментом для углубления знаний о них, а также решения разнородных прикладных задач (см. далее также «Моделирование»). В зависимости от характера средств, используемых для построения (создания) "моделей" последние подразделяются на описательные, математические, физические и комбинированные (например, физико-математические модели). Различают также статические и динамические модели (в том числе кибернетические модели) и др.
2. Тип, марка, образец конструкции (например, модель автомобиля — «ВАЗ 21099»).
3. Образец для подражания, образцовый экземпляр какого-либо изделия.
4. Оригинал, который служит для снятия копии, изображения или создания другого произведения, имеющего признаки сходства с ним (примерами могут служить неодушевленные предметы и люди, в том числе — «фотомодели», «натурщики» в живописи и т.п.).
МОДЕЛЬ ДАННЫХ [data model] 1. Представление данных и их взаимосвязей (отношений), описывающих понятия проблемной среды. Модели данных используются для представлений структур данных на концептуальном и внешнем уровнях, но не физическом (см. монографию Т.Тиори. Дж. Фрая [28]). Понятие модель данных связано с их логической структурой.
2. Совокупность правил порождения структур данных в БД и выполнения операций 3. Формализованное описание структур данных и операций над ними.
Модель защиты (информации) [protection model, information protection model] — абстрактное (формализованное или неформализованное) описание комплекса программно-технических средств и (или) организационных мер защиты информации от несанкционированного доступа [1746].
МОДЕЛИРОВАНИЕ [modeling] Методология выполнения экспериментальных работ путем исследования свойств различных объектов на их моделях (см. ранее). Виды моделирования различаются в зависимости от целей его выполнения, характера исследуемых объектов и выбранных для исследования средств (о некоторых видах моделирования см. в Словаре по Кибернетике [4]). В связи с развитием вычислительной техники наиболее широкое применение в различных областях человеческой деятельности получило математическое моделирование.
Математическое моделирование [mathematical modeling] — процесс построения и исследования в динамике поведения математических моделей различных процессов, явлений и физических объектов с использованием средств вычислительной техники. В основе математического моделирования лежит использование фундаментальных законов естествознания и конкретных наук, связанных с целями и предметами моделирования. На основании этих законов разрабатывается математический аппарат, описывающий исследуемые явления и объекты, который преобразуется в соответствующий алгоритм и программу для реализации его на ЭВМ. В зависимости от общих целей математического моделирования полученные в ходе "испытания" математической модели данные могут использоваться для принятия определенных решений, в частности, для выбора альтернативных вариантов поведения специалистов или для уточнения исходной математической модели (например, в виде поправок, вводимых в математический аппарат, и таким образом использоваться в качестве средства ее совершенствования).
Методы математического моделирования нашли широчайшее применение при построении так называемых интеллектуальных (экспертных) систем, систем автоматизированного проектирования и др. Об использовании математического моделирования в области трехмерной компьютерной графики и анимации, а также реализующих его средствах программного обеспечения см. [503, 504].
Некоторые общие термины, связанные с моделированием и моделями данных:
• логическая структура [logical structure] — представление логической организации данных в виде множества типов записей данных и связей между ними;
• структурная модель данных [structured data model] — модель данных, представленная в виде структуры — множества типов данных и связей между ними. Различают три основных вида структурной модели (логической структуры) организации данных: иерархической, сетевой и реляционной;
• связь (между данными) [binding, link, relationship] — установленный характер взаимозависимости данных в различных информационных моделях и структурах данных.
Связи между данными идентифицируются видом связи и направлением. Характер вида и направления связи могут отражаться ее именем — указателем связи (поименованная связь, характеристика отношения). Различают иерархическую или вертикальную, горизонтальную, ассоциативную, логическую, двунаправленную связи и др.;
• иерархическая (вертикальная) связь [hierarchical binding, vertical binding] — вид связи, устанавливаемый между данными, находящимися на разных уровнях иерархической структуры (например, связи: "род - вид", "вид - подвид", "отец - сын" и т.п.);
• горизонтальная связь [horizontal binding] — вид связи, устанавливаемый между данными, находящимися на одном уровне иерархической структуры;
• логическая связь [logical relationship] — вид связи, устанавливаемый между типами данных в иерархической и сетевой моделях данных (см. далее), в отличие от связи между конкретными экземплярами данных в базах данных;
• ассоциативная связь [associative link] — вид связи, устанавливаемый исходя из заданного сочетания признаков данных или информационных элементов, которые образуют таким путем упорядоченные последовательные цепочки. Указатели на связанные данные (адреса связи) могут размещаться в самих данных или программных средствах управления базой данных (см. также «СУБД» и «Гипертекст»);
• двунаправленная связь [bidirectional binding] — совокупность связей в прямом и обратном направлении.
ИЕРАРХИЧЕСКАЯ МОДЕЛЬ (СТРУКТУРА) ДАННЫХ [hierarchical data model] Модель организации данных, представляющая собой древовидный граф, состоящий из ряда типов записей (типов данных) и связей между ними (отношений или характеристик отношений), причем один из типов записей определяется как корневой или входной, а остальные связаны с ним или друг с другом отношениями «один-комногим» или (реже) "один-к-одному". При этом запись, идентифицируемая элементом "один", рассматривается как исходная, а соответствующая элементу "много", как порожденная. Каждая запись может быть порожденной только в одной связи, следовательно ей соответствует только одна исходная запись. Однако каждая запись может быть исходной во многих связях. Корневая запись может быть только исходной. Пример иерархической модели приведен на рис. 1.
Граф [graph от греч. grapho — пишу, изображаю] — графическое представление математической модели системы связей между объектами любой природы. Объекты задаются в графе точками — вершинами, связи — линиями, соединяющими вершины, которые называются ребрами или дугами графа. Каждое ребро может быть ориентированным (т.е. иметь определенное направление от одной вершины к другой) либо неориентированным (двунаправленным). Ребро, соединяющее вершину с нею самой, называется петлей. Вершины, которым не соответствует ни одно ребро, являются изолированными. Число ребер, соединяющих две фиксированные вершины, может быть произвольным, поскольку оно определяется количеством и характером связей между соответствующими этим вершинам объектами. В то же время каждому ребру соответствует не более двух вершин. Раздел математики, изучающий свойства различных геометрических схем, образованных множеством точек и соединяющих их линий (графов), называется Теорией графов. Подробнее см. [4, с.142-145].
Принцип построения иерархической модели организации БД.
СЕТЕВАЯ МОДЕЛЬ (СТРУКТУРА) ДАННЫХ [network data model] Модель организации данных, подобная иерархической, но отличающаяся от нее тем, что каждая запись может вступать в любое количество поименованных связей с другими записями как исходная или порожденная, или как то и другое (см. «Двунаправленная связь»). Примеры (1 и 2) сетевой модели приведены на рис. 2.
Принцип построения сетевой модели организации БД.
РЕЛЯЦИОННАЯ МОДЕЛЬ (СТРУКТУРА) ДАННЫХ [relation data model] Реляционная модель данных была предложена в 1969 г. сотрудником фирмы IBM Е.Ф. Коддом. Она представляет собой набор плоских файлов — таблиц, называемых отношениями, к которым применимы операции реляционной алгебры для реализации автоматизированного ответа на запросы пользователей системы 13.
Потенциально в реляционной модели может быть организовано очень большое количество связей между данными, значительная часть которых является избыточными (т.е. не используемыми). Поэтому разработаны формы (варианты) нормализации отношений: первая (1НФ), вторая (2НФ), третья (ЗНФ) и четвертая (4НФ).
Примеры реализации реляционной модели приведены на рис. 3 и 4. В настоящее время существует достаточно большое число различных вариантов построения реляционных моделей. Одной из них является постреляционная модель. Подробнее см. [28, 29, 552].
Принцип построения реляционной модели (а) и связей внутри единственного отношения: б) Первая нормальная форма (1НФ), в) Вторая нормальная форма (2НФ), г) Третья нормальная форма (ЗНФ).
Весьма распространенной ошибкой является употребление термина реляционная БД по отношению к любым массивам данных, имеющих табличную форму организации, однако не обеспечивающим выполнение указанного условия.
Принцип организации связей между разными отношениями в реляционной модели с использованием двух доменов: первый определяет область возможных значений атрибутов "Наименование фирмы" в отношении 1 и "Фирма изготовитель" в отношениях 2 и 3; второй определяет область возможных значений атрибутов "Наименование продукции и/или услуг" в отношении 1, "Марка оборудования" в отношении 2 и "Марка комплектующих" в отношении 3.
Термины, связанные с реляционной моделью данных:
• Отношение [relation] 1. Форма связи между объектами (в рассматриваемом случае — разными типами данных или атрибутами), отражающая то общее, что их объединяет.
2. Два математических выражения, связанных знаком операции сравнения ("=", ">",