WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

Pages:     || 2 | 3 |

«Лапо Петр Михайлович Соколов Андрей Владимирович 2005 Выражение благодарности / Acknowledgement Поддержка для настоящей публикации была оказана программой SCOUT, финансируемой Бюро по делам Образования и Культуры ...»

-- [ Страница 1 ] --

ВВЕДЕНИЕ

В

ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ

Лапо Петр Михайлович

Соколов Андрей Владимирович

2005

Выражение благодарности / Acknowledgement

Поддержка для настоящей публикации была оказана программой SCOUT, финансируемой

Бюро по делам Образования и Культуры Госдепартамента США (ЕСА), в соответствии

с Актом Фулбрайт-Хейс от 1961 года с поправками, программа администрируется

Институтом Открытого Общества (OSI), который также поддерживает программу SCOUT. Мнения авторов могут не совпадать с мнениями ECA или OSI.

Идея о создании данной публикация возникла во время моего обучения на факультете библиотечно-информационных систем в St. John's University, в Нью-Йорке в 2002-2004гг.

в рамках программы Маски (Muskie), администрируемой отделом образовательных и культурных программ госдепартамента США. Особую благодарность выражаю профессору Гари Васдину, своему преподавателю курса "Введение в электронные библиотеки" и наставнику Измаэлю Ривере Сьерра, директору Библиотеки им. Дэвис.

Андрей Соколов Support for this publication was provided by the SCOUT (Support for Community Outreach and University Teaching) Program, funded by the Bureau of Educational and Cultural Affairs of the United States Department of State (ECA), under authority of the Fulbright-Hays Act of 1961 as amended, and administered by the Open Society Institute (OSI), which also provided funding for the SCOUT. The opinions expressed herein are the author's own and do not necessarily express the views of either ECA or OSI.

Research for this publication was supported in part by the Edmund S. Muskie/FREEDOM Support Act Graduate Fellowship Program, a program sponsored and managed by the Bureau of Educational and Cultural Affairs (ECA), U.S. Department of State under authority of the Fullbright-Hays Act of 1961 as amended, and administered by American Councils for International Education: ACTR/ACCELS. The opinions expressed herein are the author’s own and do not necessarily express the views of either ECA or American Councils..

The idea to create this publication was born in 2004 when I was a graduate student in my last semester at St. John’s University, New York taking a course "Introduction in Digital Libraries" taught by a remarkable professor Garry Wasdin, access services librarian of the New York Public Library. I also want to thank Ismael Rivera, my supervisor at the Davis Library, NY, NY.

Andrei Sakalou О книге Настоящее издание было подготовлено при поддержке Департамента США, Бюро по вопросам образования и культуры и предназначено для бесплатного распространения и использования в целях самообразования и повышения квалификации по данной тематике. Ссылка на источник и авторов обязательна.

В настоящей публикации использованы материалы с веб-сайтов Британской Библиотеки, Библиотеки Конгресса США, РГБ, РНБ, Новозеландской электронной библиотеки и др. Полный перечень электронных библиотек, материалы которых использовались, приведен отдельно в приложении 1.

Как пользоваться книгой?

Для качественного отображения рекомендовано использовать Windows 95/98/XP, Internet Explorer 5.5 и выше, Acrobat Reader, устройства воспроизведения аудио и видео. При установке CD-ROM в дисковод происходит автозапуск. При просмотре в Internet Explorer рекомендовано установить размер шрифта в меню на.

Материалы настоящего издания дополняются гиперссылками на интернет-ресурсы, поэтому для полноценного охвата материалов рекомендуется иметь подключение к сети интернет.

Введение Широкое внедрение современных компьютерных и телекоммуникационных технологий, и особенно технологий и информационных ресурсов сети Интернет привело к качественным изменениям в организации информационных ресурсов, их хранении и обеспечении доступа к ним. Одним из направлений по организации электронных информационных ресурсов является создание электронных библиотек (ЭБ).

В настоящее время в области создания и использования ЭБ активно работают как специалисты-практики многих профессий (физики, программисты, медики, библиотекари и др.), так и преподаватели гуманитарных и естественнонаучных дисциплин. ЭБ интегрируют в себе проблемы из разных областей, объединяют специалистов с различным опытом и различными подходами.

При подготовке предлагаемой работы ее авторы ставили перед собою цель дать представление об электронных библиотеках на уровне введения в проблему, систематизировав информацию об основных аспектах их создания и проектах, выполненных в этой области. Большинство примеров взято из практики США и Великобритании, поскольку специалисты, работающие в этих странах, занимают передовые позиции в исследовании проблематики электронных библиотек и практике их использования, хотя, конечно, развитие ЭБ происходит в различных странах мира, в различных формах и по различным направлениям.

Предлагаемое издание предназначено для изучения студентами основ современных электронных библиотек (терминология, технологии, стандарты и их практическая реализация). В качестве примеров рассматриваются электронные библиотеки, реализованные в рамках международных, национальных и локальных проектов.

Предлагаемое издание предназначено прежде всего для студентов, изучающих библиотечные и информационные технологии, а также для лиц, использующих электронные библиотеки для достижения своих профессиональных, образовательных или научных целей.

';

Содержание издания включает рассмотрение понятий «электронная библиотека», характеристику разных видов электронных библиотек, анализ текущего состояния развития технологий, используемых при создании электронных библиотек.

Авторы с благодарностью примут все замечания и предложения по совершенствованию данного издания.

История создания и терминология электронных библиотек. Тенденции развития электронных библиотек В настоящее время термины "электронная библиотека", "цифровая библиотека", "виртуальная библиотека" широко употребляются в бытовом и профессиональном общении, в докладах научных конференций и публикациях.

Существование целого спектра мнений о том, что такое электронная библиотека (ЭБ), является следствием участия в развитии технологий ЭБ специалистов ряда профессий (физиков, программистов, медиков, библиотекарей и др.), которые, как правило, владеют недостаточной информацией о деятельности друг друга в этой сфере.

Компьютерные специалисты часто не имеют представления о богатом многолетнем опыте и достижениях библиотекарей в области обработки, анализа и поиска информации, в то время как библиотекари и издатели могут не знать о достижениях и направлениях исследований, проводимых разработчиками информационных технологий в этой же области. И те, и другие понимают, что область их профессиональных интересов подвержена влиянию экономических и юридических факторов, но пока, как представляется, глубина такого понимания недостаточна.

Электронные библиотеки появились как естественный результат эволюции методов обработки, анализа, хранения, поиска информации и широкого внедрения в практику деятельности человека компьютерных и сетевых технологий. Вильям Армс в своей книге «Электронные библиотеки» отмечает двух авторов, «первооткрывателей цифровых библиотек», чьи работы оказали существенное влияние на следующие поколения исследователей. Это американские ученые Буш (Vannevar Bush) и Ликлидер (J.C.R.Licklider).

В июле 1945 г. В. Буш, директор Американского агентства научных исследований и разработок (U.S. Office of Scientific Research and Development), опубликовал статью в журнале Atlantic Monthly под названием «Как мы можем думать» (“As we may think”), в которой высказал предположения о потенциальных возможностях, которые перспективные технологии того времени могут предоставить ученым для сбора, хранения, поиска и обработки информации. Так, например, он предложил использовать фотографии для хранения информации, и многие годы спустя микрофильмы и микрофиши по своим технологическим характеристикам оказались наиболее подходящим и относительно недорогим способом хранения информации.

Хотя Буш зачастую упоминается как первый человек, озвучивший видение библиотек будущего, следует отметить, что его статья основывается на более ранних работах, большинство из которых было выполнено в Германии еще до начала Второй мировой войны. Но непреходящее значение его статьи в том, что он четко продемонстрировал связь между информацией и научными исследованиями, а также отметил скрытый потенциал новых технологий.

В 1960-х гг. другой американский ученый Ликлидер, будучи сотрудником Массачусетского технологического института, изучал вопрос влияния компьютеризации вычислений на будущее библиотек. В опубликованной в 1965 г.

книге "Библиотеки будущего" Ликлидер предсказал многие достижения современных нам компьютерных технологий и перечислил исследования и разработки, которые необходимо выполнить для создания действительно комфортной для пользователя ЭБ.

Хотя многие, очень смелые для того времени предсказания о том, как будет выглядеть компьютер в 1994 г., осуществились, следует отметить, что автор все же недооценил возможности, которые приобрели современные мощные компьютеры, использующие сверхбыстрые процессоры и огромные объемы памяти, и переоценил возможный прогресс в таких областях, как искусственный интеллект и машинная обработка текстов на естественных языках.

Первая серьезная попытка сохранить достаточно большие объемы информации в компьютере была предпринята в конце 1960-х гг., однако возникли серьезные технические проблемы, такие как высокая стоимость компьютеров (1 байт памяти стоил примерно 1 доллар США), неудобный пользовательский интерфейс и отсутствие компьютерных сетей. Поскольку стоимость хранения была высокой, первые разработки были выполнены в расчете на быструю окупаемость даже при малых объемах хранимых данных. Одним из первых успешных примеров сохранения информации в электронной форме была разработка специалистами Библиотеки Конгресса США формата MARC (Machine Readable Cataloging) для создания и ведения машиночитаемых каталогов библиотек. Его использование в Онлайновом компьютерном библиотечном центре Online Computer Library Center, (OCLC) позволило предоставлять доступ к каталожным записям для многих библиотек одновременно и сократить расходы на каталогизацию библиотечных фондов.

Первые электронные информационные службы, такие как создание библиографических записей в едином центре, электронные информационные системы по законодательству, онлайновая служба Medline Национальной медицинской библиотеки США использовали технологии того времени. Сравнительно небольшие объемы информации размещались в большом центральном компьютере, соединение пользователя с которым осуществлялось с удаленного терминала по медленной линии связи.



Эти системы требовали от пользователей специальных, не связанных с их профессиональной деятельностью знаний, а сами пользователи ради доступа к удаленным источникам информации были вынуждены мириться с головоломным недружественным интерфейсом. Эти системы не предполагали получения печатного документа. Все, что могло быть изображено на экранах терминалов, ограничивалось неформатированным текстом (обычно с использованием шрифта широкого начертания) с графикой очень низкого качества.

Если к этим недостаткам добавить присущие тогдашним дисплеям проблемы -низкий контраст и разрешение, то уже не удивляет тот факт, что большинство людей не верило в то, что пользователи будут охотно читать текстовую информацию с экрана компьютера. Сегодня же стремительное развитие компьютерных технологий привело к тому, что все большую популярность и распространение получают так называемые "электронные книги", предоставляющие возможность сохранять информацию в памяти устройства, листать и читать страницы текста на экране подобно книге.

В середине 1980-х гг. в библиотеках появились системы с возможностью полнотекстового поиска в больших коллекциях. Обычно в них загружали каталоги библиотеки в формате MARC, а также обычные реферативные сборники.

Полнотекстовый поиск означает, что пользователь может искать по любому слову в любом месте записи; при этом ему не нужно знать структуру записи или те правила, по которым она была создана.

Исследованиям в этой области уже более 30 лет, но базовый подход практически не изменился. Пользователь составляет поисковое выражение, называемое запросом (query). Это может быть как одно слово "кактус" или фраза "цифровые библиотеки", так и длинный запрос (напр. "В каком году Ч. Дарвин путешествовал на "Бигле"?). Задача обработки информации сводится к нахождению соответствующего запросу объекта в коллекции. Поскольку компьютер не имеет возможности каждый раз анализировать все записи в коллекции по каждому элементу запроса, в компьютере должны быть определенные индексы, которые и позволяют находить нужную информацию.

По мере того, как компьютеры становились все мощнее, а стоимость хранения снижалась, методы обработки информации менялись от жестко ограниченного поиска коротких записей (вроде каталожных записей или записей в индексах или рефератах) к поиску любого слова в полных текстах всей коллекции. Раньше высокая стоимость хранения и трудоемкость поиска стимулировали разработку компактных методов хранения и эффективных алгоритмов поиска.

В последнее время поисковые программы в веб-пространстве позволяют искать в больших объемах информации, размещенной на разных компьютерах.

Библиотечный каталог является первичным источником информации о монографиях, но он менее полезен для периодики. Каталог дает единственную краткую запись об издаваемом журнале. Поскольку это мало что дает читателю, который хочет найти конкретную статью, появились службы реферирования и индексирования. Типичными примерами являются Medline (биомедицинская тематика), Chemical (химия), Inspec (физические науки, включая компьютеры). Эти службы различаются многими деталями, но базовая структура весьма схожа.

Профессионалы в конкретных областях читают все статьи из большого списка журналов и либо присваивают индексы, либо составляют рефераты. Некоторые службы такого рода используют тщательно разработанные системы индексов, такие как тезаурус MeSH в Medline, разработанный Национальной Медицинской библиотекой. Некоторые генерируют все рефераты сами, другие, как Inspec, используют рефераты издателей.

Большая часть этих служб начиналась с издания печатных томов для продажи библиотекам, но сегодня практически все виды поиска выполняются компьютером (компьютерный поиск по индексам восходит к технологиям пакетной обработки и магнитным лентам). Некоторые индексные системы поддерживают компьютерные службы, бесплатные для пользователей, другие лицензируют свои услуги третьим сторонам, которые предоставляют различные онлайновые сервисы. Многие крупные библиотеки покупают данные и помещают их на своих серверах.

После создания онлайновых каталогов библиотеки начали размещать другие данные, такие как рефераты, индексы и аналитические обзоры. Эти источники информации могут храниться в центральном компьютере, а найденные записи могут отображаться на удаленных терминалах или персональных компьютерах.

Реферативные сборники, состоящие из коротких записей, особенно подходят для подобной формы распространения информации, поскольку пользователи быстро переходят от одной записи к другой, а их вполне удовлетворяют простые дисплеи без особых графических возможностей.

Гибкий и быстрый поиск в данном случае более важен, чем эстетические достоинства монитора. В качестве типичного примера приведем список информационных источников, доступных в интерактивном режиме в университете Карнеги-Мэллона в 1998 г.:

Библиотечный каталог Список журналов Библиографические записи архитектурных чертежей и рисунков Словарь американского наследия (American) Рефераты периодики ABI/Inform (бизнес-периодика) Inspec (физика, электроника, компьютеры) Исследовательская директория (исследования и исследователи в университете).

Часть этих онлайновых коллекций предоставляет локальную информацию, например, "Кто есть кто" (университетский справочник по факультетам, студентам и сотрудникам).

Многие библиотеки предлагают, в частности, множество видов информации от налоговых деклараций до расписания автобусов. Возможности веб-браузеров и полнотекстового индексирования позволяют объединить в единую систему с единым пользовательским интерфейсом как традиционные, так и нетрадиционные библиотечные материалы. Такой подход стал столь обычным, что сейчас уже трудно понять, почему такие примеры объединения информации из разных источников ранее встречались столь редко.

Размещение и поддержание больших объемов информации в сети стоит весьма дорого. Несмотря на то, что стоимость компьютерной техники быстро снижается, она все еще существенна. Большие расходы связаны с лицензированием источников информации и оплатой работы персонала, который обеспечивает как управление, так и обработку больших файлов данных. Снижая расходы, библиотеки формируют консорциумы, чтобы одна онлайновая коллекция обслуживала большое число библиотек-пользователей.

Определение термина "электронная библиотека" В настоящее время существует довольно большое число определений термина "электронная библиотека". Авторы проведенного в 1994 г. специального аналитического исследования на эту тему суммировали общее в определениях ЭБ, предложенных в посвященных электронным библиотекам изданиях:

электронная библиотека не является единым целым;

электронной библиотеке присуща технология для связи ресурсов многих ЭБ и информационных служб;

электронная библиотека, состоящая из многих ЭБ и информационных служб, "прозрачна" для конечного пользователя;

цель создания электронной библиотеки -- обеспечение универсального доступа к информации и информационным службам;

фонды электронной библиотеки не исчерпываются только идентификаторами документов-объектов, они содержат электронные объекты, которые не могут быть представлены или распространяться в печатной форме.

Как синонимы термина "электронная библиотека" употребляются выражения "цифровая библиотека" и "виртуальная библиотека".

С точки зрения формы представления информации термин "цифровая библиотека" более точен, чем "электронная библиотека", поскольку все материалы, хранящиеся в такой библиотеке, предварительно тем или иным образом оцифровываются, т.е. имеют цифровой, дискретный характер. Характером представления информации в цифровой (электронной) библиотеке обуславливаются ее потенциальные возможности, недостатки и формы работы с нею.

Термин "виртуальная библиотека" подчеркивает то обстоятельство, что в силу цифрового представления информации и в условиях существования глобальных компьютерных сетей электронные документы могут быть, во-первых, доступны как в стенах традиционной библиотеки, так и за ее пределами, во-вторых, поиск необходимого документа может вестись практически из любого места, где есть возможность подключения к глобальной компьютерной сети, в-третьих, такая библиотека имеет распределенный характер, т.е. ее части могут быть расположены в различных частях не только земного шара, но и Солнечной системы, галактики и т.д.

Для широкого круга пользователей участие библиотекаря в создании и функционировании электронной библиотеки еще менее заметно, чем в библиотеке традиционной. Но как показывает накопленный в области создания ЭБ опыт, ряд электронных библиотек уже прекратили свое существование из-за отсутствия тех форм работы с документами и ответственного отношения к их хранению, которые присущи библиотекам традиционным. Эти библиотеки явились результатом различных проектов, предполагавших, что электронные библиотеки могут быть созданы какой угодно организацией или даже физическим лицом -- достаточно оцифровать какие-либо документы и предоставить к ним доступ посредством подключения к сети Интернет.

Можно с уверенностью сказать, что процессы создания электронной библиотеки, а еще в большей мере процессы ее сопровождения потребуют постоянного присутствия и участия специалистов библиотечной или родственной ей профессии.

"Реальность ЭБ — это взаимодействие людей, техники, организаций и технологий" В научной дисциплине "библиотековедение" при определении термина "библиотека" руководствуются, прежде всего, исторически сложившимся пониманием библиотечной практики, которая сводится к "обеспечению библиотекарем массового по масштабам явления и индивидуального по форме реализации взаимодействия читателей (абонентов, пользователей, потребителей информации) с информацией в виде публикаций". С позиции библиотековедения, "библиотека -- взаимодействие трех составляющих: пользователь – библиотекарь – документ (информация)".

Неслучайно со временем сложилось следующее "информационное определение ЭБ: управляемая коллекция информации в совокупности с соответствующими сервисами, причем информация хранится в цифровых форматах и доступна по сети".

Ключевой частью этого определения является слово "управляемая". Поток данных, передаваемый со спутника на Землю, -- это еще не библиотека. Те же самые данные, организованные в определенную систему, становятся коллекцией ЭБ. Большинство людей не согласятся рассматривать базу данных финансовых записей отдельной компании в качестве ЭБ, однако совокупность такой информации по множеству компаний уже является частью библиотеки.

ЭБ содержат различные коллекции информации для использования большим числом пользователей, и их объемы могут быть самыми различными.

В сравнении с традиционными библиотеками электронные обладают рядом потенциальных преимуществ:

доставляют информацию пользователю на место заказа информации -достаточно иметь компьютер, подключенный к компьютерной сети;

предоставляют больше возможностей по поиску информации и ее обработке, поскольку практически любое слово в тексте может быть поисковым предоставляют возможность совместного использования какой-либо информации, что значительно упрощает дорогостоящую задачу физического дублирования малоиспользуемых материалов, а также обеспечивает доступ к уникальному документу, для работы с которым раньше требовалось приехать в хранилище, где он находится; дают библиотекам и архивам возможность обеспечить широкий доступ пользователей к своим фондам посредством выставления их в компьютерную сеть;

дают возможность библиотекам постоянно поддерживать свои информационные ресурсы в актуальном состоянии, поскольку обновление электронной версии документа проще, чем печатной;

информация доступна круглосуточно и повсеместно;

информационные материалы могут быть представлены в различных форматах (текст, база данных, диаграмма);

информационная среда может быть интегрирована с новыми формами общения посредством таких технологий, как электронная почта и телеконференции, которые исторически не вызывали особого энтузиазма у библиотекарей.

Еще одно важное потенциальное преимущество электронных библиотек -- это экономия финансовых средств. Перевод фондов традиционной библиотеки на электронные носители сокращает площади занимаемых ими помещений и количество высокообразованных, но низкооплачиваемых сотрудников, работающих с ними.

Процесс подготовки электронных изданий дешевле, чем печатных, что также дает возможность приобретать их по более низким ценам.

Цена на компоненты ЭБ быстро снижается по мере того, как развиваются компьютерные технологии. В особенности быстро падает цена хранения и распространения информации.

В последнее время все более популярным становится термин "гибридная библиотека" (hybrid library), обозначающий библиотеку, частями которой являются как традиционные библиотечные службы, так и ее электронная библиотека - часть фонда библиотеки, представленная в электронной форме и сопровождаемая как техническими средствами, так и соответствующим образом подготовленным персоналом. Гибридные библиотеки призваны объединить преимущества новых информационных технологий, реализованные в электронных библиотеках, и преимущества библиотек традиционных, которые, в отличие от других систем и структур информационного обслуживания общества, хранят в своих фондах практически все типы информации (научную, техническую, экономическую, научнопознавательную, развлекательную и т.д., за исключением информации специального назначения) и обслуживают практически все социальные слои, пользователей всех возрастов и профессиональных категорий. Также общепризнано, что печатные документы являются важной частью цивилизации, и их роль в хранении и передаче информации будет сокращаться постепенно. Обладая самой развитой инфраструктурой и являясь самой демократичной формой информационного обслуживания, традиционные библиотеки доступны всем гражданам страны практически в любом ее уголке и как социальный институт общества помимо информационной выполняют еще ряд функций, способствующих формированию мировоззрения, духовному развитию и воспитанию граждан.

Миссия традиционных библиотек созвучна главной идее библиотек электронных -- предоставлять свободный доступ к информации.

Основные термины и положения Коллекции Электронные библиотеки могут содержать любую информацию, которая может быть представлена последовательностью битов. Иногда это цифровые версии обычных носителей, таких как текст, графика, музыка, звукозаписи, чертеж и спецификации и многое другое. По мере расширения ЭБ их содержание все чаще и чаще уже не просто цифровая копия, но объект, который не имеет "твердого" эквивалента, к примеру, данные, поступающие с научного прибора, компьютерная программа, видеоигра, базы данных.

Поиск Поиск информации -- это центральная задача библиотек. Пользователь -ученый, врач или адвокат -- заинтересован в информации по некоторой теме и хочет найти нужный объект в тематической коллекции.

Ретроконверсия Одна из фундаментальных задач библиотеки - сохранить нынешние материалы как долговременную память на завтра. Большие библиотеки имеют замечательные коллекции, которые представляют собой "ткань истории" и цивилизации. Создание цифровой копии сохраняет содержание материала и делает его доступным во всем мире.

Во многих проектах ЭБ предусматривается конверсия существующих бумажных документов в растровые изображения. Печатные документы сканируются постранично. В ранних экспериментах страница записывалась как последовательность черных и белых точек (обычно 300 на дюйм). Затем обычными стали цветные сканеры с высоким разрешением. Хорошие растровые изображения достаточно отчетливы для того, чтобы быть представленными на дисплее высокого разрешения или на бумаге.

Поскольку такие сканеры создают огромное количество точек на страницу, используются различные алгоритмы сжатия, чтобы хранить и передавать по сети файлы меньшего размера. Но и в этом случае страничка даже с простой графикой занимает десятки килобайт.

Данные и метаданные Информация, хранящаяся в ЭБ, может быть разделена на данные и метаданные.

Данные -- это общий термин, обозначающий информацию, закодированную в цифровой форме.

Метаданные - это данные о данных. Распространенные категории метаданных включают "описательные метаданные" (например, библиографическая информация), "структурные метаданные" (информация о форматах и структурах), и "административные метаданные" (которые включают права, разрешения и другую информацию, используемую для управления доступом). Еще одна разновидность метаданных - идентификатор, который однозначно представляет объект для внешнего мира. Различие между данными и метаданными часто зависит от контекста. Запись в каталоге и реферат обычно рассматривают как метаданные (т.к. они описывают другие данные), однако будучи в онлайновом каталоге или реферативной базе это — данные.

Объекты в электронной библиотеке Пока не предложено приемлемого термина для обозначения элемента (item) в ЭБ. Наиболее общее понятие данного термина обозначает все, что может храниться в библиотеке. Слово "элемент" практически является синонимом. Оба этих термина ничего не сообщают о содержании, структуре или точке зрения пользователя на данную информацию.

Слово "материал" может быть использовано для описания физических объектов или информации в цифровой форме. Термин "цифровой материал" используется, когда качество "цифровой" необходимо выделить. Более точный термин "цифровой объект" используется для описания объектов, хранящихся в ЭБ. Обычно цифровой объект состоит из данных, метаданных и идентификатора.

Термин "библиотечный объект" полезен тем, что выражает взгляд пользователя на то, что хранится в ЭБ. Например, статья в онлайновом периодическом издании обычно хранится в компьютере в виде нескольких различных объектов (страницы текста, графика и, возможно, компьютерные программы или связанные материалы на других сайтах). С точки же зрения пользователя, это один библиотечный объект, состоящий из нескольких цифровых объектов.

Формы хранения, представления и распространения объектов ЭБ Форма, в которой информация сохраняется в ЭБ, может быть различной в зависимости от характера ее использования. Тренажер для обучения летчиков может храниться в виде нескольких компьютерных программ, структурных данных, цифровых образов и других данных. Это "форма хранения" объекта, а пользователь воспринимает последовательность образов, управляющих сигналов, сопровождаемых звуком. Некоторые используют термин "представление" для обозначения того, что видит пользователь, и в большинстве случаев это вполне допустимо. Более общий термин — это "распространение", который подчеркивает то обстоятельство, что трансформация из формы хранения в то, что видит пользователь, требует исполнения ряда компьютерных программ.

Когда цифровая информация поступает на пользовательский компьютер, она должна быть преобразована в форму, доступную для пользователя -- обычно на дисплее, иногда в звуковом сопровождении или с другими эффектами. Такое превращение называется "рендеринг" (rendering).

Произведение и содержание Особенно трудно найти адекватные термины для описания содержания.

Английский язык очень гибок, и слова имеют различное значение в зависимости от контекста. Рассмотрим пример "the". В зависимости от контекста, фраза может относиться к песне как произведению (work) со словами и музыкой, к музыкальной записи песни, к исполнению этой песни конкретным исполнителем, к звукозаписи исполняемой песни, к изданию музыкального компакт-диска, к конкретному компактдиску, к акту воспроизведения музыкальной записи, к воспроизведению цифровой записи этой песни из ЭБ и к многим другим аспектам песни. Эти различия значимы для музыкальной индустрии, поскольку именно они определяют, кто получает деньги, которые выплачиваются за запись или воспроизведение музыкального произведения.

Некоторые исследователи ЭБ пытались ввести некую общую иерархию терминов, которая могла бы быть применима ко всем произведениям и библиотечным объектам. Сама по себе эта цель весьма важна и полезна, однако связана с большими трудностями. Материалы библиотек столь разнообразны, что любая классификация будет хорошо соответствовать одним коллекциям, но окажется абсолютно непригодной для других.

Тем не менее, термины "работа" и "содержание" полезны. Большинство людей свободно пользуются словом "содержание" и мы в этой книге последуем их примеру.

Этот термин полезен во многих контекстах, когда необходимо подчеркнуть то обстоятельство, что библиотечные материалы есть не только биты и байты, обрабатываемые компьютером, но информация, представляющая интерес для пользователя. Мы не можем точно определить "содержание", но оно для нас очевидно.

В то время как термин "содержание" определен свободно, общий термин "работа" используется более конкретно. Согласно закону США об авторских правах, понятие "литературная работа" сформулировано как абстрактное содержание (например, последовательность слов или нот) независимо от конкретного типа хранения, представления или презентации. В этой книге мы используем это слово именно с таким значением, хотя, возможно, не всегда юридически точно.

Ряд терминов используются для обозначения людей, связанных с ЭБ. Создатели информации для библиотеки включают авторов, композиторов, фотографов, картографов, дизайнеров и всех, кто создает интеллектуальные продукты. Некоторые из них любители, некоторые профессионалы, одни работы созданы группой авторов, другие -- отдельными людьми. У них было много различных причин для создания информации.

Другая группа состоит из пользователей ЭБ. В зависимости от контекста, пользователи могут обозначаться различными терминами. В библиотеках их часто называют читателями; в другой ситуации их могут назвать публикой или потребителями. В традиционных библиотеках создатель и пользователь -- иногда одно и тоже лицо. Академические, исследовательские и школьные учреждения используют библиотеки для своей работы и публикуют свои результаты в изданиях, которые становятся частью библиотечной коллекции.

Последняя группа весьма обширна и включает всех, кто играет какую-либо роль в оказании услуг создателям и пользователям: специалисты по компьютерам, библиотекари, издатели, редакторы и многие другие. Их можно назвать информационными посредниками. С развитием веб появилась новая профессия -- вебмастер. Понятно, что один и тот же человек может быть создателем, пользователем и информационным менеджером.

Компьютеры и сети ЭБ состоит из ряда компьютеров, объединенных в сеть. Основная, базовая сеть -- это Интернет, который в процессе развития превратился в гибкий, недорогой, общедоступный инструмент, являющийся главным фактором в развитии ЭБ.

Компьютеры в сети выполняют три главные функции: помощь пользователям во взаимодействии с библиотекой, хранение коллекций, предоставление сервисов.

В компьютерной терминологии любой, кто взаимодействует с компьютером, является пользователем. Этот широкий термин охватывает создателей (авторов), пользователей библиотеки, профессионалов в сфере информатики, и всех остальных, кто имеет доступ к компьютеру. Компьютер, который используется для доступа к ЭБ, называется "клиентом". Клиент может взаимодействовать с ЭБ и без участия человека, к примеру, роботы, автоматически индексирующие библиотечные коллекции, или сенсоры, собирающие данные о погоде и передающие их в ЭБ.

"Репозитории" (repositories) - это компьютеры, которые хранят информационные коллекции и предоставляют к ним доступ. "Архивы" - это хранилища, которые специально организованы для долговременного хранения материалов.

Две типичные услуги (services), предоставляемые ЭБ — это поиск (search) и определение местонахождения (locate). Поиск включает каталоги, индексы и другие инструменты, призванные помочь пользователю найти информацию. Второй сервис позволяет определить место хранения информации и идентифицировать ее.

В некоторых ситуациях в "цепочке" между клиентом и компьютером, в котором хранится информация, могут участвовать и другие компьютеры. Зеркала (mirrors) и кэш-хранилища дублируют информацию для повышения надежности и ускорения доступа. Зеркала дублируют большие массивы информации; в кэше хранится только недавно запрошенная. Прокси-сервера и шлюзы являются мостиками между различными типами компьютерных систем и особенно полезны в системах, которые имеют несовместимые технические спецификации.

Универсальный термин "сервер" используется для обозначения любого компьютера кроме клиента. Данный сервер может выполнять сразу несколько из вышеперечисленных функций, к примеру, хранилища и поиска. И наоборот - одна функция может быть распределена между многими серверами. К примеру, служба доменных имен, определяющая IP-адреса компьютеров в Интернете, является единым интегрированным сервисом, который выполняется на тысячах отдельных серверов.

"Распределенная система" - это группа компьютеров, которые работают сообща, предоставляя сервис пользователю. ЭБ является одной из самых сложных распределенных систем, созданных когда-либо. Персональные компьютеры пользователей, которые должны обмениваться сообщениями с сервером (локальные сети), -- это общеизвестный пример такой работающей на самом различном программном обеспечении системы, которая существует в тысячах различных организаций.

Термин "интероперабельность" относится к задаче построения работоспособного сервиса для пользователей в условиях, когда индивидуальные компоненты технически различны и управляются различными организациями.

Некоторые люди вообще утверждают, что все технические проблемы в ЭБ — это лишь аспекты проблемы интероперабельности. Возможно, это преувеличение, но определенно можно утверждать, что достижение интероперабельности является фундаментальной проблемой в построении и функционировании ЭБ.

Определение и характеристики электронной библиотеки Внедрение компьютеров в различные сферы деятельности человека сопровождалось созданием информационных ресурсов в электронной форме в виде баз и банков данных, используемых для проведения вычислений, исследований, производственной и коммерческой деятельности, принятия управленческих решений.

В 1960-е и 1980-е гг. эти информационные ресурсы еще не рассматривались в качестве электронных библиотек, по-видимому, потому, что в традиционном общеупотребительном смысле и по определению "библиотека [гр. bibliothk < biblion книга + thk хранилище] - 1) собрание печатных, а также рукописных материалов; 2) помещение для хранения книг; 3) учреждение, осуществляющее общественное пользование всеми видами печатных изданий и рукописными материалами" предполагает общественное пользование (или по крайней мере, возможность общественного пользования) хранящихся в ней документов, что не могло соответствовать характеру деловой, служебной, нормативной, производственной, корпоративной информации, сохранявшейся в то время на электронных носителях.

Выражение "электронная библиотека" вошло в употребление и становилось все более популярным по мере распространения таких электронных носителей как компакт диски (CD-ROM) и по мере развития компьютерных, главным образом, глобальных сетей. Более-менее внушительная коллекция CD-ROM-ов, а также коллекция текстов, выставленных в компьютерную сеть, с легкой руки разработчиков в области компьютерных технологий, имевших о деятельности традиционных библиотек весьма поверхностные представления, что характерно для большинства пользователей, получили название "электронная библиотека".

До сих пор довольно широко распространено мнение, что электронные библиотеки могут быть созданы какой угодно организацией или даже физическим лицом: достаточно оцифровать какие-либо документы и предоставить к ним доступ посредством подключения информационного сервера к глобальной сети.

Просматривая web-страницы университетов, научных учреждений, можно увидеть на одном уровне и ссылку на информацию о библиотеке данного учреждения, и ссылку на электронную библиотеку, например, по химии, физике и т.п., созданную какимлибо подразделением или сотрудником данной организации.

Исторический путь трансформации традиционных библиотек в электронные неразрывно связан с процессами библиотечной автоматизации. Говоря о развитии библиотек, можно обозначить его следующие три важных периода: (1) традиционная библиотека -- со времен Аристотеля до начала библиотечной автоматизации; (2) автоматизированная библиотека, в которой компьютеризированы такие основные службы, как, например, каталогизация и хранение фондов, и наконец, (3) электронная библиотека, службы которой делают информацию доступной повсеместно и в интерактивном режиме. Цели автоматизации библиотек также претерпевали изменения и сводились на первом этапе к обеспечению эффективности внутренних операций библиотеки, на втором -- к обеспечению доступа пользователей к локальным библиотечным ресурсам, на третьем -- к обеспечению доступа к ресурсам за пределами библиотеки. Сначала библиотечная автоматизация была сфокусирована на автоматизации отдельных функций -- инвентарный учет, простейшие функции обслуживания и создание электронного каталога. Последнее стало началом создания механизмов поиска информации в автоматизированном и распределенном режиме.

Затем стали создаваться электронные информационные ресурсы рефератов статей периодических изданий, что было определенным прогрессом по сравнению с электронными каталогами. Но желаемой целью, конечно, оставался доступ к полным текстам изданий, что удалось реализовать только в электронной библиотеке.

В настоящее время можно выделить следующие основные направления деятельности традиционных библиотек в сети Интернет:

предоставление электронных каталогов и других библиотечных информационных ресурсов в Интернете;

использование интернет-технологий для решения следующих информационно-библиографическое обслуживание пользователей;

организация открытого доступа пользователей к ресурсам создание библиографических и полнотекстовых баз данных.

Основные тенденции развития электронных библиотек История ЭБ — это история непрерывных изменений. Учет следующих четырех факторов важен при определении тенденций развития электронных библиотек:

Хранение в электронном виде становится дешевле, чем в бумажном Большие библиотеки болезненно дороги даже для богатых организаций.

Расходы на содержание зданий составляют около четверти всех расходов. Многие выдающиеся библиотеки располагаются в огромных старых зданиях с плохим контролем параметров среды. Даже когда есть финансовые ресурсы, бывает трудно найти новое пространство для расширения в центре города или университетского кампуса.

В то время как стоимость создания новых и поддержания старых зданий для хранения печатных изданий будет только возрастать, цена электронного хранения снижается приблизительно на 30% ежегодно. В 1987 г с началом работы над электронной библиотекой Mercury в университете Карнеги-Меллона были заказаны несколько компьютеров, каждый с 10 Гб дискового пространства. Цена каждого компьютера составляла примерно 120 000 долларов США. В 1997 г. значительно более мощный компьютер с той же емкостью диска стоил уже 4 000 долларов. Таким образом, за десять лет цена упала на 97%. Это серьезный повод ожидать, что к 2007 г.

цена упадет еще на 97%.

В 1987 г. стоимость хранения документов на компакт-дисках была уже ниже стоимости хранения книг в библиотеках. Сегодня хранение большинства видов информации в компьютерной форме существенно дешевле хранения физических объектов в хранилище. В 1987 г. стоимость оборудования являлась главным барьером при создании ЭБ. Сегодня цены существенно ниже, хотя хранение больших объектов (таких, как цифровые видеозаписи, обширные коллекции графических образов, высококачественные аудиозаписи) стоит все еще дорого. Через десять лет оборудование, которое слишком дорогостояще сегодня, станет настолько доступным, что цена вряд ли будет фактором, влияющим на принятие решения.

Дисплеи компьютеров становятся более комфортабельными Стоимость хранения -- не единственный фактор. (Если бы это было так, библиотеки стандартизовали микрофильмы уже давно.) До недавнего времени только очень немногие находили удобным читать с экрана компьютера. Качество представления документа на экране было слишком низким. Обычной была процедура распечатки бумажной копии. Однако уже достигнут существенный прогресс в улучшении компьютерных дисплеев, качества экранных шрифтов, программного обеспечения для обработки информации. Все больше и больше людей читают прямо на экране -- особенно те материалы, которые были созданы для непосредственно представления на дисплее (как веб-страницы). Лучшие дисплеи все еще достаточно дороги, но с каждым годом они становятся все дешевле и все лучше. Еще не скоро читать обычные книги на компьютере станет привычным, но опытные образцы экранов с высоким разрешением уже сейчас обеспечивают удивительное качество изображения.

Увеличивается количество высокоскоростных сетей Рост Интернета в 90-е гг. XX века был просто феноменальным.

Телекоммуникационные компании предоставляют как локальный, так и удаленный интернет-сервис; международные связи достигли практически всех стран мира;

каждая сколько-нибудь заметная компания имеет свою локальную сеть; университеты создали свои сети; частные лица могут приобрести недорогой доступ по телефонной линии непосредственно из дома. Однако даже в США все еще есть много мест, где Интернет недоступен, некоторые страны вообще не имеют доступа. Но уже во многих странах информацию легче получить через Интернет, чем разыскивать обычные книги и журналы традиционными методами.

Компьютеры становятся портативными.

Несмотря на то, что ЭБ используют сети, их полезность существенно выросла с появлением ноутбуков. Подключаясь непосредственно с ноутбука к сети, пользователь соединяет ресурсы ЭБ со своей непосредственной работой, хранящейся на этом компьютере. При отключении от сети копии выбранных библиотечных материалов могут быть сохранены для дальнейшего использования.

Мощность и качество дисплеев портативных компьютеров существенно выросли за последние годы, а цена непрерывно снижается.

Преимущества доступа к электронным библиотекам ЭБ доставляют информацию тем людям, для которых недоступны обычные библиотеки, причем доступ к информации, расположенной в ЭБ, возможен в течение 24 часов в сутки 7 дней в неделю. Вместе с тем, необходимо учитывать, что Интернет все еще не является общедоступным сервисом повсюду и везде. Уровень технологий, используемых пользователями, весьма различен. Некоторые счастливчики имеют на своем рабочем столе последние модели персональных компьютеров с самым современным программным обеспечением, подключенные к Интернету по скоростной линии; у них есть возможность получить помощь от высококвалифицированной службы технической поддержки для настройки оборудования, разрешения проблем, установки новых версий программного обеспечения. Большинство людей, к сожалению, вынуждено довольствоваться меньшим. Их оборудование может быть устаревшим, программное обеспечение уже несовременным, связь неустойчивой и медленной, а их системные администраторы недостаточно профессиональны и слишком перегружены. Именно поэтому одна из важных задач в развитии ЭБ состоит в том, чтобы создавать такие системы, которые позволяли бы пользоваться преимуществами современной технологии в разных ситуациях.

Развитие электронных библиотек во многом будет определяться способностью отдельных людей и организаций находить пути адекватного использования технологий ЭБ, усваивать и принимать неизбежные перемены и создавать требуемые социальные условия. Информацией занимаются многие, и каждый привносит свой опыт, знания и ресурсы. Для фундаментального изменения системы требуются согласованные изменения в экономических, социальных, юридических взаимоотношениях всех участников.

ЭБ зависят от людей и не могут быть созданы быстрее, чем могут адаптироваться люди и организации. Это относится и к создателям, и к пользователям, и к персоналу ЭБ.

Взаимоотношения между этими группами изменяются. Пользуясь ЭБ, читатель часто напрямую находит нужную информацию, не обращаясь в библиотеку лично и не вступая в контакт с библиотечными сотрудниками. Авторы могут выполнить большую часть работы над рукописью. Профессионалам требуются новые навыки и приемы выполнения этих новых обязанностей. Некоторые из этих навыков являются следствием длительного опыта, другим можно научить. Библиотечные учебные заведения могут изменить свои программы, но пройдут годы, прежде чем изменения затронут всю систему, ведь традиция уходит в глубину веков.

Наиболее правильный подход заключается в том, чтобы -- за исключением некоторых узко специализированных областей -- традиционные и цифровые библиотеки продолжали сосуществовать. При этом первые будут по-прежнему поддерживать огромные коллекции и параллельно предоставлять электронные услуги, а у издателей останется их традиционный рынок сбыта. Однако непрерывное и значительное снижение стоимости компьютерных технологий вкупе с существенным увеличением возможностей приведет к полной замене традиционных библиотек.

Текстовые процессоры вытеснили печатные машинки в течение практически 10 лет.

Каталоги из библиотечных карточек близки к этому. В 1980 г. только половина библиотек могла позволить себе онлайновый каталог. Двадцать лет спустя уже традиционный каталог становится курьезом в американских библиотеках. В некоторых специальных областях ЭБ могут полностью заменить обычные библиотечные материалы.

Во многих вновь созданных организациях были выполнены интересные разработки в области ЭБ. Они могут начать "с чистого листа", в то время как "старые" организации вынуждены поддерживать традиционные сервисы и одновременно внедрять новые. Один из наиболее вероятных эффектов появления ЭБ - массовый "переток" денег от традиционных поставщиков информации к новым агентствам и в компьютерную индустрию. Естественно, существующие организации будут серьезно противиться любым изменениям, которые уменьшают их значение, но экономические взаимоотношения между участниками уже меняются. Некоторые крупные "игроки" на этом рынке, без сомнения, вынуждены будут сократить свой бизнес или даже уйти из него. Предсказать такие изменения особенно трудно в связи с неопределенностью в таких вопросах, как стоимость ЭБ и электронных издательств, и с необходимостью адаптировать законодательство. Очевидно, что давление рынка приведет к формированию нового порядка. В определенном смысле, для внесения юридических изменений необходимо, чтобы рынок устоялся. До этого времени экономические и юридические неопределенности будут мешать — но они не смогут стать непреодолимым барьером для прогресса.

В долгосрочной же перспективе никаких барьеров для ЭБ и электронных издательств нет. Технические, экономические, социальные и законодательные трудности есть, но они постепенно решаются. Мы не можем быть уверенными в окончательной форме, которую примут ЭБ, но очевидно, что они есть и будут.

Сегодня есть определенные нарекания на представленную в WWW информацию. Две наиболее распространенные жалобы заключаются в том, что информация плохого качества и что найти ее невозможно. Для этого есть определенные основания, но они весьма далеки от того, чтобы быть истинными. В WWW есть огромное количество материалов. Большинство из них действительно малоценны, но многие из web-серверов поддерживаются регулярно и содержат информацию высокого качества. Поиск информации в WWW может быть сложным, но существуют инструменты и сервисы, которые позволяющие пользователю получить большую часть имеющейся информации, проявив минимальную изобретательность.

Сегодня WWW скорее в самом начале, чем в конце пути. Несмотря на то, что веб сегодня предоставляет базу для построения ЭБ с лучшими коллекциями, лучшими сервисами и лучшими базовыми технологиями, большинство из современных исследований в области ЭБ могут рассматриваться как простое расширение базовых строительных блоков WWW. Можно ожидать, что через 25 лет ЭБ будут весьма различными, а начальная стадия развития WWW будет вспоминаться с трудом.

Возможно, слова "Интернет" и "WWW" уйдут в историю или будут обозначать системы, в которых невозможно будет узнать потомков своих прародителей. ЭБ будут вбирать в себя материалы и технологии из разных мест. В течение нескольких лет можно, однако, ожидать, что Интернет и WWW останутся той базой, на которой будут строиться библиотеки будущего. Как ранние программные продукты на заре эры персональных компьютеров превратились в современные операционные системы, WWW может стать основанием для многих поколений ЭБ.

Сегодня в центре внимания находится разработка семантического WWW, что структурирует содержание web-страниц, создаст среду, где программные агенты, скитаясь от страницы к странице смогут выполнить сложные задания для пользователей.

Форматы данных в электронной библиотеке Электронные библиотеки могут содержать оцифрованные версии документов различных типов: текст, графику, картографические материалы, аудио- и видеозаписи.

Изначально в электронной среде могут быть созданы такие составляющие электронных библиотек, как мультимедийные объекты, энциклопедии, электронные книги (e-books), электронные журналы (e-journals) и др.

Сегодня основным содержанием ЭБ (около 80%) являются текстовые документы, которые заносятся в ЭБ в результате сканирования печатных и рукописных материалов, создания таких документов в среде текстовых редакторов и процессоров, получения их из внешних источников, например, путем скачивания с Web-сайтов. В электронной библиотеке могут храниться все виды печатных изданий, например, монографии, учебники, учебно-методические пособия и комплексы, практикумы, хрестоматии, журналы, статьи, сборники, бюллетени, отчеты НИР, словари, библиографические издания, авторефераты диссертаций, материалы конференций, тезисы конференций, инструкции, стандарты, учебные программы, справочные издания, официальные издания, литературно–художественные издания, препринты и т.п.

Наиболее трудоемким, но в настоящее время и наиболее актуальным для библиотек направлением создания и пополнения электронных библиотек является оцифровка (сканирование) печатных документов, что объясняется важностью таких приоритетов в библиотечном деле, как обеспечение сохранности фонда и в то же время широкого доступа к нему. Процесс сканирования выполняется, как правило, в виде проектов по оцифровке той или иной коллекции документов, той или иной части библиотечного фонда и содержит ряд важных этапов. Такой подход продиктован дороговизной и трудоемкостью данного процесса, прежде чем начать который необходимо определить его приоритеты, стоимость, временные и трудовые затраты для его успешной реализации. Затем необходимо произвести отбор и фильтрацию предназначенных для сканирования документов, подготовить их к сканированию, предусмотреть меры по обеспечению требуемого качества сканирования, в случае необходимости провести оптическое распознавание текста для сохранения отсканированного документа в формате электронного текстового документа, сжатие документа, а также его каталогизацию и систематизацию, обеспечить доступ к нему посредством компьютерных технологий. Должна быть также предусмотрена система мер по сопровождению отсканированных документов (копирование, архивация, миграция и т.п.).

В настоящее время для хранения цифровых (текстовых и графических) документов используются различные форматы, на выбор которых влияют различные факторы, например:

наибольшая степень соответствия документу-оригиналу;

возможность хранения метаданных в образе документа (важно для архивации документа и его долгосрочного хранения);

особенности доставки документа (устройство, на которое документ доставляется, экран или устройство печати; способ доставки, размер файла, пропускная способность сетевого канала и т.п.).

Форматы текстовых файлов Чаще всего различают два типа форматов для текстовых файлов: ASCII и двоичный (binary). ASCII файлы могут быть созданы и прочитаны в текстовых редакторах и процессорах и обычно имеют расширение. doc или. txt. Двоичные файлы содержат нетекстовые (не в ASCII-кодировке) символы, которые на экране представлены в виде непонятных значков. Форматы двоичных файлов могут быть использованы для хранения и передачи текстовых файлов, сжатых файлов, программ, игр, картинок, иностранных языков, аудио- и видео файлов.

Существует также такой формат файла, как файл постскрипта (postscript).

Постскрипт – это язык описания текстового документа, разработанный фирмой Adobe Systems в 1985 г. Postscript (PS) язык используется для описания формы представления документа в печатной форме, и файлы в postscript формате не могут быть корректно просмотрены на экране без использования специальной программы.

Общие форматы PDF (Portable Documents Format) -- широко используемый формат для создания и хранения цифровых документов. Он позволяет сохранить все качества печатного документа: цвет, графику, шрифты, формат. Для просмотра файлов в формате PDF необходима программа Adobe Acrobat.

HTML ( HyperText Mark-up Language ) – также часто используемый в электронных библиотеках и в сети Интернет формат. HTML файлы могут содержать как текст, так и графику, изображения, мультимедийные документы. HTML файлы могут быть прочитаны любым web -браузером и текстовым процессором MS Word.

Форматы графических файлов Известен целый ряд форматов для графических файлов, каждый из которых имеет собственные характеристики. Выбор формата определяется, как правило, такими факторами, как размер файла, число цветов, разрешение и т.д.

Разрешение экрана определяется единицей измерения "количество пикселей на один дюйм" (pixels per inch - ppi). Наиболее часто встречаемое разрешение – 72 ppi, хотя существуют экраны с высоким разрешением – 84 - 200 ppi.

Цвет изображений управляется посредством так называемых каналов (channels). Один канал требуется для серого цвета, монохромных изображений, для усеченной цветовой палитры, обычно используемой в сети web. Полноцветная картинка на экране поддерживается 3 каналами для красного, зеленого и голубого цветов (RGB), в то время как полноцветное воспроизведение на принтере требует 4 канала для синего, сиреневого, желтого и черного цветов (CMYK). В то время как архивные файлы сохраняются в RGB-формате, их копии при печати на принтере преобразуются в CMYK-формат.

Разработана формула для определения размера графического файла в зависимости от разрешения и количества цветов: размер изображения в пикселях умножить на число каналов (или размеры изображения в дюймах умножить на разрешение и на количество цветов).

Например, 4 300 х 5 300 pixels x 4 канала = 91 160 000 байт = 92 Мб 10 дюймов х 12 дюймов х 300 ppi х 3 канала = 108 000 байт = 106 Кб Для создания графических объектов используются алгоритмы векторной (vector) и растровой (raster) графики.

Векторные изображения состоят из ряда графических элементов – линий, эллипсов, многоугольников и т.п., - и каждый такой графический объект имеет ряд характеристик, таких как расположение, толщина линии, цвет линии, вид линии. Технические и архитектурные чертежи, карты и диаграммы – примеры векторной графики. Преимуществом такого формата является то, что - объекты могут редактироваться независимо друг от друга;

- размеры графического файла небольшие;

- изображения могут масштабироваться без потери качества разрешения;

- графическое разрешение не зависит от характеристик устройства вывода.

Растровые (или bit-mapped) изображения представляют собой матрицу пикселей (элементов картинки). Каждый пиксель содержит информацию о цвете соответствующей позиции в картинке-оригинале. 24-битное (16 миллионов цветов) изображение использует байта (8 бит для зеленого цвета, 8 бит для голубого, 8 бит для красного) для описания цвета каждого пикселя. Поскольку информация о каждом пикселе сохраняется, то графические файлы, создаваемые на основе растровой графики, имеют большие размеры. Основные преимущества растровой графики в следующем:

- каждый пиксель может быть отредактирован отдельно от других;

- обеспечивается высокая степень соответствия картинке-оригиналу.

BMP (bitmap) формат доступен почти во всех графических программах операционной системы Windows. Применяется для небольших графических изображений, поддерживает очень простые алгоритмы сжатия, отчего размеры файла могут быть большими, неподходящими для хранения и передачи.

DJVU (произносится Дежавю) - графический формат, разработанный фирмой AT&T, в первую очередь, для размещения в Интернет отсканированных изображений. Это могут быть книги, рукописи, географические карты и т.п. В основе формата лежат такие технологии, как:

алгоритм отделения текста от фона на отсканированном изображении;

вейвлетный алгоритм сжатия фона IW44;

мощный алгоритм сжатия черно-белых изображений JB2;

эффективный универсальный алгоритм сжатия ZP;

алгоритм распаковки "по запросу";

алгоритм "маскировки" изображений.

Первые четыре алгоритма обеспечивают чрезвычайно высокую степень сжатия.

Типичным является преобразование tiff файла размером 25МБ (формат А4 отсканированный на цветном сканере 300DPI) в DJVU файл размером 80КБ, без видимой на глаз потери качества. Для черно-белого изображения, размер DJVU файла может получиться еще меньше - примерно 30КБ. Возможно дальнейшее повышение коэффициента сжатия, вплоть до отношения 1000:1, правда потеря качества становится довольно заметной. Таким образом, на стандартную дискету 1.4МБ можно разместить 15-20 изображений высокого качества.

Искажения, вносимые вейвлетным сжатием, существенно менее заметны по сравнению с искажениями в JPEG файлах.

Алгоритмы распаковки позволяют показать часть изображения, не разворачивая всю картинку в оперативной памяти, а также легко масштабировать изображение. Еще одной интересной особенностью алгоритмов распаковки является инкрементальное восстановление изображения. При просмотре через Интернет вначале выводится только текст, затем фон в низком разрешении и только потом фон в высоком разрешении. Это позволяет быстро оценить документ, не скачивая его полностью. Отделение текста от фона чрезвычайно повышает его разборчивость, особенно, если текст напечатан на цветной бумаге или расположен поверх рисунка. Возможен и отдельный просмотр фона, причем алгоритм "маскировки" восстанавливает те части фона, которые были закрыты текстом. Изображения не содержащие текста могут быть преобразованы в формат IW4, который соответствует части формата DJVU, ответственной за хранение фона. Предусмотрено объединение нескольких изображений в один файл с возможностью "перелистывания" страниц, а также нанесение на изображение так называемых "горячих точек", участков изображения, служащих гиперссылками.

GIF (Graphic Interchange Format) позволяет хранить 256 цветов (8 бит/пиксель) и применяется для хранения изображений с небольшим количеством цветов, линейной графики и простых рисунков.

JPEG (Joint Photographic Experts Group) формат предназначен для полноцветных изображений: 16 миллионов цветов (24 бит/пиксель). Применяется для хранения сканированных изображений фотографий, полноцветных рисунков и т.п. Размеры JPEGфайлов меньше размеров GIF-файлов и приемлемы для пересылки по сети Интернет.

PCX-формат – растровый формат, первоначально применявшийся на компьютерах PC.

Поддерживается графическими программами PageMaker, Photoshop, QuarkXPress (Mac) и используется преимущественно для создания компьютерных картинок.

PNG (Portable Network Graphics) – формат создан для того, чтобы обойти некоторые проблемы авторского права, связанные с использованием GIF формата, и в настоящее время постепенно вытесняет GIF-формат. PNG-файлы могут иметь миллиарды цветов в одном изображении, будучи при этом по размеру меньше, чем GIF-файлы. Обеспечивается сжатие без потерь и хранение в файле информации, полезной для поиска сведений об истории файла и авторстве. Высота и ширина изображения могут масштабироваться автоматически для соответствия размеру окна просмотра.

TGA (или TARGA) формат применяется для видеоизображений с высокой степенью разрешения. Имеет много разновидностей и поддерживает несколько алгоритмов сжатия.

Применяется также для хранения картографических материалов.

TIFF (Tagged Image File Format) – многоцелевой растровый формат, используемый для импортирования отсканированных изображений в различные графические программы. Он поддерживает большие фотоматериалы, файлы с изображениями, используется целый ряд алгоритмов сжатия.

Если при сканировании материалов использовать компактный промышленный формат TIFF IV, графические образы тектовых документов займут в среднем до 100 КБ на страницу формата А4.

VRML (Virtual Reality Modeling Language) – формат используется для хранения трехмерных моделей. Для просмотра файлов в формате VRML необходима специальная программа.

Форматы звуковых и музыкальных файлов Различные типы форматов используются для хранения аудио-файлов. Приведем наиболее популярные форматы.

WAV (Wave Form Audio File Format) – формат поддерживает множество бит-разрешений, скоростей и каналов звука, широко используется в программах, предназначенных для работы с музыкальными произведениями. Но WAV-файлы имеют большие размеры и занимают много места на диске.

MIDI (Music Instrument Digital Interface) – это стандартный формат для передачи музыкальных файлов между электронными инструментами и компьютерами. Качество записанной в MIDI-файлах музыки хорошее, и сами они занимают мало места на диске.

MP 3 (Moving Picture Expert Group, Audio Layer 3) – формат, обеспечивающий высокую степень сжатия музыкальных файлов при обеспечении высокого качества их воспроизведения.

Форматы видеофайлов MPEG (Moving Pictures Expert Group) – группа специалистов, объединившихся под эгидой Международной организации по стандартизации (International Standards Organization (ISO) для разработки стандартов для сжатия цифрового видео и аудио. Члены группы представляли различные компании и страны и существенно улучшили действовавший в то время стандарт, положив начало новым стандартам, таким как MPEG -1, MPEG -2, MPEG -3, MPEG -4 и т.д.

QuickTime – это также стандарт ИСО для цифровых медиа. Он поддерживает аудио-, видеофайлы, анимацию, интерактивные возможности.

AVI – видеоформат для операционной системы MS Windows. Количество.avi-файлов в сети Интернет постоянно увеличивается. Для их использования применяется программа Media Player;.avi-файлы могут быть преобразованы в файлы формата QuickTime (с расширением.mov).

Каталогизация и метаданные в электронных библиотеках Для организации информационных ресурсов с целью обеспечения к ним доступа и эффективного поиска в них необходимых пользователю документов библиотеки издавна применяют различные методы и подходы, реализованные в виде схем классификации, правил каталогизации, машиночитаемых (точнее, компьютерочитаемых) библиографических форматов, тезаурусов и т.п.

Библиографические классификационные схемы, такие как Универсальная десятичная система (УДК), Десятичная система Дьюи (DDC), Классификация библиотеки Конгресса США (LCC) и другие используются для того, чтобы определить каждому документу определенную классификационную рубрику системы в зависимости от содержания или назначения документа и расположить документы с одинаковой рубрикой рядом на полке для облегчения читателю тематического поиска. Читатели обычно ищут литературу по определенной тематике, просматривая вначале алфавитный каталог библиотеки.

В то время как библиографическая классификация позволяет библиотекарям группировать документы по темам и тематически (и физически) располагать их на полках библиотеки, каталогизация применяется в библиотеках для описания документа как уникального объекта хранения, раскрывает его индивидуальные особенности и характеристики, сохраняемые в полях создаваемой для каждого документа библиографической записи.

Практически каждая библиотека ведет каталог с записями о документах, хранимых в ее фонде. В библиотечном деле каталог означает коллекцию библиографических записей, созданную по строго определенным правилам. Чаще, чем повседневное слово "книга", библиотекари используют слово "монография". Многие годы информация, которая включалась в монографическую каталожную запись, кодифицировалась согласно определенным правилам ведения каталогов.

Англоязычные страны пользуются Англо-американскими правилами каталогизирования (AACR), текущая версия которых известна как AACR2.

Каталог помогает читателям найти материал в библиотеке и является важным инструментом для управления фондом.

MARC-формат Задача внесения в каталог каждой монографии требует значительного времени и опыта. Снижая расходы, библиотеки обмениваются каталожными записями. В разных странах существуют главные библиографические центры (такие как Библиотека Конгресса США, национальные и главные университетские библиотеки в других странах), которые каталогизируют большое количество издаваемых в стране монографий, предоставляют свои каталожные записи другим библиотекам бесплатно. Вместо того, чтобы создавать дубликаты записей, большинство библиотек ищет существующие каталожные записи и создает свои собственные только тогда, когда они не смогли найти подходящую для копирования.

С конца 1960-х гг. обмен каталожными записями был компьютеризирован. С этой целью группой сотрудников Библиотеки Конгресса США во главе с Генриеттой Аврам (Henriette Avram) был разработан формат обмена библиографической информацией MARC (Machine-Readable Cataloging) для распространения каталожных записей на магнитной ленте. Каталогизирование с использованием формата MARC распространилось не только на монографии, но и на другие виды документов, включая продолжающиеся издания, архивы, неопубликованные рукописи и т.п.

Приведем взятый из книги В. Армс «Электронные библиотеки» пример записи, описывающей в формате MARC монографию: Campus strategies for libraries and electronic information / Caroline Arms, editor.[Bedford, Mass.] : Digital Press, c1990. xi, 404 p. : ill. ; 24 cm.

Поиск в каталоге Библиотеки Конгресса США с удаленного терминала дает о данной монографии следующую информацию в формате MARC:

LC Control Number: 245 00 |a Campus strategies for libraries and electronic information / |c 440 _0 |a EDUCOM strategies series on information technology 504 |a Includes bibliographical references (p. [373]-381).

650 _0 |a Academic libraries |z United States |x Automation.

650 _0 |a Libraries and electronic publishing |z United States.

650 _0 |a Library information networks |z United States.

650 _0 |a Information technology |z United States.

991 |b c-GenColl |h Z675.U5 |i C16 1990 |p 00009939374 |t Copy 1 |w Информация разнесена по полям, каждое из которых имеет трехзначный код.

Например, код 440 - это поле названия серии монографий, поля 650 - предметные рубрики (subject headings) Библиотеки Конгресса США.

Специальные правила говорят библиотечному работнику, какое поле необходимо использовать и как должна интерпретироваться взаимосвязь между элементами.

Процесс создания библиографической записи – очень сложных и трудоемкий процесс. Полный формат MARC состоит из определенного набора полей, каждое из которых идентифицируется определенной меткой (tag). В полях допускаются подполя.

Поля обозначаются трехзначной цифровой меткой, подполя - одной буквой. Чтобы получить представление о том, как информация кодируется в формате MARC, рассмотрим поле с меткой 260 ("выходные данные"), которое начинается как &260. В реальной записи это означает следующее (причем последовательность abc указывает на наличие трех подполей):

&260 #a[Bedford, Mass.] : |b Digital Press, |c c1990.

Первое подполе, обозначенное меткой а, указывает на место публикации;

следующее, обозначенное как b, - издателя; третье, с - дата публикации.

MARC был передовым форматом в то время, когда большинство компьютерных систем представляли текстовые поля только фиксированной длины и только с заглавными буквами. Он остается актуальным для библиотек, но его солидный возраст очевиден. Его замена на более современный,отвечающий сегодняшним потребностям формат осложнена тем огромным объемом средств, которые были инвестированы библиотеками в его внедрение, и теми огромными информационными ресурсам, в которых он используется. Но что бы ни произошло в будущем, MARC был пионерским достижением как в истории компьютерных технологий, так и в истории библиотек. Это ключевой формат, который безусловно должен поддерживаться в ЭБ.

Метаданные Традиционная библиотечная практика систематизации и каталогизации применяется для обеспечения поиска информации и в ряде электронных библиотек.

Но основная проблема ее использования заключается в том, что такой подход требует участия достаточно квалифицированного каталогизатора и систематизатора, большой и трудоемкой ручной работы, которую невозможно обеспечить в более-менее удовлетворительном объеме, когда речь идет о стремительно растущих и поражающих воображение своими объемами информационных ресурсах глобальной сети Интернет.

Кроме того, появились совершенно новые виды электронных информационных ресурсов (web-страницы, web-сайты, порталы, базы электронных журналов и т.п.), которые имеют ряд характеристик, не предусмотренных существующими форматами, предназначенными для хранения и обмена библиографической информацией.

Ряд создателей онлайновых библиографических, реферативных и полнотекстовых баз данных не обеспечивают полную каталогизацию и классификацию всех входящих в базу записей и документов, а применяют для обеспечения поиска в БД специальные алгоритмы их индексирования. В ряде случаев такие системы создают один или несколько индексов на основе информации, извлеченной из различных полей БД, например, автор, название и т.п. Индекс также содержит ключевые слова и/или дескрипторы, создаваемые или человекоминдексатором или автоматически на основе названий, рефератов, полных текстов документов. Такие системы позволяют пользователям искать информацию, с помощью терминов и фраз, сформированных на основании содержимого одного или нескольких полей БД.

В последние годы были предприняты попытки создания новых систем каталогизации информационных ресурсов сети Интернет на основе использования так называемых метаданных. Историю использования термина «метаданные» некоторые исследователи прослеживают начиная с 1960-х гг., отмечая при этом, что более часто он стал использоваться в литературе по разработке систем управления базами данных в 1980 гг. В литературе по информационно-библиотечным наукам термин «метаданные» стал популярен с середины 1990-х гг. и сегодня он упоминается в сотнях ежегодно выходящих изданий.

Сегодня система метаданных является центральным логическим компонентом любой электронной библиотеки (ЭБ). Подобно тому, как библиотечный каталог организует все множество единиц хранения в систему библиотечных фондов, вокруг которой строятся все библиотечные технологии, система метаданных организует совокупность электронных информационных ресурсов (или цифровых объектов) ЭБ.

Вокруг системы метаданных и на ее основе строятся основные технологические процессы ЭБ, а именно:

навигация в информационном пространстве ЭБ;

поиск отдельных цифровых объектов (информационных ресурсов) или их ввод, обработка и организация хранения цифровых объектов, а также их исключение (изъятие);

управление правами доступа к цифровым объектам, включая защиту авторских прав, организация платы за доступ и пр.

Общим свойством метаданных является их относительный характер. Сведения, которые в одной информационной системе являются метаданными, в другой могут быть собственно данными. Наиболее характерный пример — библиографические или реферативные базы данных, которые в информационных системах прежних поколений являлись метаданными по отношению к традиционным (бумажным) ресурсам (иногда называвшимся вторым контуром информационных систем). В то же время для процессов, выполняемых в самой АБИС, эти БД содержали именно данные.

Относительный характер метаданных выражается также в том, что многие метаданные являются одновременно данными, поскольку присутствуют как в метаописании цифрового объекта, так и в самом объекте. Таково, например, заглавие, автор, аннотация и др. характерные метаданные обычных текстовых документов. Для других видов цифровых объектов, например, изображений, представленных в виде графических файлов, никакие метаданные в состав объекта не входят.

Некоторые исследователи различают следующие 3 группы метаданных:

1. Метаданные, создаваемые web-службами индексирования и поиска (это данные, собираемые программами-роботами на основе использования протокола http и скриптов CGI для автоматического создания записей об онлайновых информационных ресурсах).

2. Метаданные, используемые для описания информационного ресурса (например, форматы Dublin Core и IAFA/WHOIS++ (проект ROADS); записи могут создаваться вручную или автоматически).

3. Метаданные, используемые для задания месторасположения, анализа, оценки, документирования и т.п. информационного ресурса (такие метаданные довольно сложные и очень детализированы, что требует привлечения специалистов для их разработки и сопровождения).

Большинство исследователей выделяет следующие типы метаданных:

• описательные, например, библиографическая информация или другие сведения о содержании (семантике) цифровых объектов;

• структурные, включая сведения о форматах, структуре, объеме и других формальных свойствах цифровых объектов;

• административные — права, разрешения на доступ, на коррекцию данных, данные о пользователе, данные для систем оплаты, технологические данные.

Особым типом метаданных является идентификатор, задача которого — однозначное представление цифрового объекта для внешнего мира и различных приложений.

Часто «метаданные» трактуются как «данные о данных», но такое определение мало что дает для понимания сути метаданных. Поэтому их чаще характеризуют следующим образом:

• данные, которые описывают атрибуты (характеристики) документа • данные о документе (информационном ресурсе), которые дают его потенциальному пользователю возможность получить полную предварительную информацию о существовании документа и его • данные (информация) о документе, «понимаемая» компьютером "Понимание компьютером" есть ключевой момент в определении метаданных.

Человек смотрит на документ и видит его заголовок, в котором указано название документа. Подзаголовок может содержать тему документа, а также его краткую аннотацию. Обычно где-то в самом начале документа или в самом его конце указан автор (или авторы)... Таким образом, бегло взглянув на документ (и потратив обычно несколько секунд), человек получает дополнительную информацию о документе и после этого делает вывод: тот это документ, который ему нужен, или нет; читать ли сам текст, содержимое (content) документа или нет. Если бы компьютер мог также легко понять, какая тема документа, кто его автор и когда он создал этот документ и т.д., тогда реально можно охарактеризовать и автоматически искать документ по большому числу его признаков. Если компьютер не понимает документ, то поиск он может осуществлять только по словам, содержащимся в документах.

Модель документа (схема метаданных) Научить компьютер понимать содержимое документа, т.е. анализировать его структуру также, как это делает человек - дело будущего, да и при этом узнать, например, кто автор документа, можно только в том случае, если в тексте документа это явно указано каким-либо способом. Если ресурс (объект описания) достаточно сложный, имеет разнообразные характеристики (атрибуты, свойства), состоит из нескольких частей, (которые в свою очередь, тоже можно считать объектами), определённым образом связанных между собой, то интуитивно понятно, что для достаточно подробного описания такого документа метаданные также будут иметь сложную структуру. Поэтому одна из задач создания метаданных -- разработка модели описания метаданных, т.е. выработка общего формального подхода, логики описания объектов, их свойств и связей между объектами.

Не углубляясь в историю, скажем, что на сегодняшний день наиболее перспективной и общеупотребительной моделью описания метаданных является система RDF (Resource Description Framework), созданная международной организацией W3C (World Wide Web Consortium) при участии представителей различных заинтересованных организаций (см. Resource Description Framework (RDF) Model and Syntax Specification).

Набор элементов Однако модель - это только скелет описания. Для того, чтобы практически описать хотя бы самые простые атрибуты документа (Название, Автор, Ключевые слова и т.д.), нужно дать этим атрибутам названия, которые потом будут использоваться во всём мире. В противном случае один автор напишет "Название:

Метаданные для чайников", другой: "Заголовок: Метаданные для чайников", а третий:

"Title: Метаданные для чайников" - и очевидно, что мы не получим единого подхода к организации эффективного поиска информации.

Выбор системы метаданных и, соответственно, класс задач, решаемых на основе этой системы, определяется функциональностью ЭБ, для которой эта система метаданных создается. В настоящее время наиболее распространённой схемой метаданных для описания онлайнового документа является набор, создаваемый уже в течение нескольких лет международной группой "The Dublin Core initiative". Этот набор называется, соответственно, "Dublin Core Metadata Elements" (или "Дублинское ядро" по названию города Дублин в штате Огайо (США), где расположена штабквартира OCLC и где состоялась первая встреча группы) и состоит из 15 элементов (см. RFC2413, Dublin Core Metadata for Resource Discovery). Областью применения этой системы метаданных, по замыслу, должен стать весь Интернет. Очевидно, что при такой сверхуниверсальной области применения система метаданных должна обладать максимальной простотой. При опросе специалистов различных стран, присутствовавших в декабре 2000 г. в Лондоне на очередной выставке Online Information, в качестве наиболее перспективного стандарта метаданных для описания электронных ресурсов представители США, Англии, Франции, Германии, Японии, не сговариваясь, называли именно Дублинское ядро. Известно, что уже ряд национальных систем объявили о принятии Дублинского ядра в качестве национального стандарта (Австралия, Швеция).

Базовыми элементами набора метаданных Дублинского ядра являются (все элементы необязательны и могут повторяться):

Title (Заголовок) — название, присвоенное ресурсу создателем или издателем.

Creator (Автор) — человек или организация, изначально ответственная за интеллектуальное содержание ресурса (в случае рукописного документа это авторы, исполнители, фотографы или иллюстраторы в случае визуальных ресурсов).

Subject (Предмет) — тема ресурса. Обычно предмет выражается в ключевых словах или фразе, описывающей предмет или содержание ресурса. Приветствуется использование контролируемых словарей и формальных схем классификации.

Description (Описание) — текстовое описание содержания ресурса, включая реферат в случае документов или описание содержания в случае визуального ресурса.

Publisher (Издатель) — организация, ответственная за создание ресурса в его нынешней форме, например, издательский дом, университетский департамент или корпорация.

Contributor (Участник создания материала) — человек или организация, которые не являются авторами (не обозначены в элементе “автор”), но внесли значительный интеллектуальный вклад в ресурс, однако чей вклад вторичен по отношению к любому человеку или организации, указанной в числе авторов, например, редактор, переводчик, иллюстратор.

Date (Дата) — дата, указывающая на время создания или появления (в доступном виде) ресурса.

Type (Тип) — категория ресурса, например, домашняя страничка, роман, поэма, статья, препринт, технический отчет, эссе, словарь.

Format (Формат) — формат представления данных ресурса (обычно указывается тип программного обеспечения и, возможно, тип компьютера, которые могут быть необходимы для отображения и работы с ресурсом).

Identifier (Идентификатор) — набор букв или цифр, используемый для уникальной идентификации ресурса. В случае сетевых ресурсов примерами являются URL и URN.

Source (Источник) — информация о вторичном источнике, из которого был получен настоящий ресурс.

Language (Язык) — язык, на котором изложено интеллектуальное содержание ресурса.

Relation (Связь) — идентификатор вторичного ресурса и его связь с настоящим ресурсом. Этот элемент позволяет связывать между собой близкие ресурсы, а также описания ресурса, которые необходимо показать. Примеры — издание книги и глава книги.

Coverage (Охват) — характеристики местонахождения и временной продолжительности ресурса.

Rights (Права) — утверждение об авторских правах и управление ими;

идентификатор, связанный с таким утверждением; идентификатор, связанный с сервисом, представляющим информацию об управлении правами на данный ресурс.

Как указывается в RFC2413, все 15 базовых элементов можно условно разбить на следующие три группы:

1. Content - элементы, в основном относящиеся к содержанию ресурса.

2. Intellectual Property - элементы, в основном рассматриваемые с позиции интеллектуальной собственности.

3. Instantiation - элементы, в основном относящиеся к данному экземпляру Элементы формата «Dublin Core» сгруппированы следующим образом:

Source Relation Coverage Основное преимущество Дублинского ядра заключается в том, что если традиционные методы каталогизации требуют профессиональной подготовки для эффективного использования, Дублинское ядро использовать весьма просто. Однако простота конфликтует с точностью. Команда разработчиков много работала над этим парадоксом. Первоначальная цель заключалась в создании простого набора элементов метаданных для неподготовленных людей, которые публикуют электронные материалы с описанием своих результатов. Некоторые продолжают придерживаться этого минималистского подхода, они хотели бы видеть простой набор правил, которыми мог бы воспользоваться любой. Другие предпочитают ориентироваться на преимущества более тщательно разработанных правил каталогизации и согласны на увеличение трудоемкости и стоимости. Они указывают на то, что дополнительные структурные элементы позволяют добиться большей точности в метаданных.

Например, если поле “предмет” заполнялось с использованием классификатора Дьюи, было бы полезно отразить этот факт в метаданных. Для дальнейшего повышения эффективности метаданных при обработке информации предлагается присваивать некоторым элементам некоторые “значения”. Это может быть определенный набор, список типов, которым могут руководствоваться составители описаний.

Пятнадцати элементов явно недостаточно для информационных систем типа электронных библиотек. Поэтому, чтобы сохранить совместимость с простейшим описанием из 15 элементов и в то же время увеличить детализацию и сложность описаний различные организации, в том числе и рабочие группы самой The Dublin Core Initiative, разрабатывают расширения, дополнительные квалификаторы для базовых элементов. Два наиболее часто цитируемых предложения:

1. "Dublin Core Qualifiers/Substructure", автор "Rebecca Guenther" и 2. "Dublin Core qualifiers", созданный в рамках проекта ROADS.

И наконец, недавно появилось предложение группы The Dublin Core Initiative:

"Guidance on expressing the Dublin Core within the Resource Description Framework (RDF)".

Разработчики Дублинского ядра утверждают, что внедрение единой системы метаданных на этой основе поощрило бы авторов и издателей сопровождать свои данные ими же разработанными метаданными. Это позволило бы разработчикам средств для сетевых публикаций включать непосредственно в программное обеспечение шаблоны для этой информации, облегчая поставщикам информации их разработку. Метаданные, созданные информационными провайдерами, должны служить базой для более детальной каталогизации или описаний в конкретных предметных областях. Вдобавок это обеспечило бы общий для всех приложений базовый набор элементов, даже если определенным профессиональным группам потребовалась бы более специфическая информация. В то время как имеющиеся поисковые машины не в состоянии обеспечить релевантные результаты поиска при просмотре огромного количества ресурсов Интернета, поиск с использованием метаданных мог бы дать гораздо более точные результаты.

Словари Для того, чтобы классификация ресурсов приносила пользу, мало выбрать модель и набор элементов-характеристик. ОЧЕНЬ желательно еще, оказывается, не просто писать в любой форме конкретные значения этих характеристик, а выбирать из общих словарей (словников, тезаурусов) и записывать в понятной для всех форме.

Например, формат даты и времени должен быть универсальным. Это просто:

предлагается использовать Date and Time Formats.

Если информационная система дает возможность выбирать ресурсы по географическим характеристикам, то нужен общепринятый словарь (тезаурус) географических названий. Им может быть, например, The Getty Thesaurus of Geographic Names (TGN), однако для целей использования его, например, в России желательна более удобная его организация с использованием большего числа уровней территориального деления.

Subject (Тема) Очень актуален выбор тезауруса для характеристики предметной области (рубрикатора тем). Выбор конкретного, ограниченного по объему списка тем облегчает поиск информации и улучшает качество поиска. Как хорошо сказано в AGLS User Manual, для поиска можно выделить два тезауруса: предметный тезаурус (subject thesaurus) и функциональный тезаурус (function thesaurus):

1. Предметный тезаурус содержит понятия предметной области и отражает содержание документа, он отвечает на вопрос: "о чём этот документ?".

2. Функциональный тезаурус отражает роль документа в человеческой деятельности, бизнесе и отвечает на вопрос: "для чего этот документ?".

Type (Тип) Тип ресурса отражает жанр, категорию его содержания. Минимальный список, представленный в Resource Types for Simple Dublin Core, включает следующие элементы:

изображение (image) набор данных (dataset) программа (software) интерфейс (interactive) событие (event) физический объект (physical object).

Этот список может быть расширен (каждый элемент делится над подэлементы), например, event (событие, в более узком смысле - мероприятие) может быть конкретизирован следующим образом:

Coverage (Охват) В качестве значений этого элемента могут быть использованы два контролируемых словаря (controllable vocabulary) для классификации:

1. Region (Регион) - характеризует место, о котором рассказывается в документе;

место, в котором проводится мероприятие, и т.д.;

2. Target (Целевая аудитория) - конкретизирует, для кого этот документ или для работы с кем он может быть использован (intended audience).

Format (Формат) Формат отражает среду, формат данных ресурса; материал, из которого состоит ресурс (если это физический объект), и, возможно, его физические размеры.

Если описываемый ресурс представлен в электронном виде, то его формат определяет способ работы с ним, программное обеспечение.

Формат электронного документа рекомендуется выбирать из списка Internet Media Types (MIME), где это возможно. Примеры электронных форматов: text/xml текст в формате XML; text/plain - текст без форматирования; image/gif - рисунок в формате GIF.

Для других ресурсов формат нужно выбирать из списка физических объектов, например из Art and Architecture Thesaurus (AAT). (См. Format Element for Simple Dublin Core ).

Размещение метаданных Как отмечается в [RDF], метаданные могут быть встроены (embedded) в сам ресурс, например в HTML страницу (это самый простой подход для описания страниц), а могут храниться и обновляться независимо от ресурсов. Второй подход более универсален, потому что в этом случае метаданные могут быть созданы для любого ресурса (например, для человека или организации).

В случае размещения метаданных отдельно от ресурса сами метаданные предпочтительно хранить (и передавать) в формате XML. При этом максимально используются возможности модели RDF и обеспечивается свободный обмен информацией (interoperability).

Обмен метаданными сводится к пересылке RDF/XML-файлов (т.е. текстовых файлов формата XML или просто ссылок на эти файлы), т.е. может быть полностью автоматизирован. Например, можно заранее подготовить описания на группу ресурсов, а потом послать их в информационную систему одним письмом (в виде attachments).

Кроме этих систем метаданных, включающих развитую семантику, применяются формальные метаданные, использование которых предусмотрено языками разметки и протоколами, принятыми в Интернет. Это HTML или HTTP метаданные — теги, определяемые соответственно спецификациями RFC и 2616. Но ввиду неудобства использования этих тегов (они не могут использоваться с другими типами файлов и быстро становятся громоздкими) и с учетом массовой миграции интернет-приложений на язык XML, все более широко используется шаблон RDF как метод обмена метаданными на основе языка XML, разработанный Консорциумом W3 в связке с системой метаданных Дублинского ядра.

Кто создает метаданные До последнего времени библиотеки и библиотекари являлись основными производителями метаданных для карточных и электронных каталогов и индексаторами библиографических баз данных. Однако, в настоящее время, теоретически, каждый может создать метаданные для любого цифрового объекта в соответствии со своими потребностями и разместить их в сетевой среде, установив ссылку на сам объект. В идеале, создатель или разработчик цифрового объекта обладает самым глубоким знанием о нем (содержание, назначение, отношение к другим документам и т. д.). Так, на различных сайтах имеются специальные шаблоны для описания метаданных, которые запрашиваются у автора (иногда в обязательном порядке). Эти метаданные могут автоматически размещаться в HTML-заголовках документа, или загружаться в базы данных.

(http://www.ub.lu.se/metadata/DC_creator.html), форма для предоставления метаданных в рамках проекта “Немецкие диссертации он-лайн” (German Dissertations Online Project) и форма для регистрации документов (электронных или неэлектронных) в хранилище метаданных по образовательным материалам и учебным курсам (http://dbs.schule.de/db/listen.html) на сервере образовательных ресурсов Германии (http://dbs.schule.de).



Pages:     || 2 | 3 |
Похожие работы:

«ГОСТ 2.106-96 УДК 62(084.11):006.354 Группа Т52 МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ Единая система конструкторской документации ТЕКСТОВЫЕ ДОКУМЕНТЫ Unified system for design documentation Textual documents МКС 01.100.10 ОКСТУ 0002 Дата введения 1997-07-01 Предисловие 1 РАЗРАБОТАН Всероссийским научно-исследовательским институтом стандартизации и сертификации в машиностроении (ВНИИНМАШ) Госстандарта России ВНЕСЕН Госстандартом Российской Федерации 2 ПРИНЯТ Межгосударственным Советом по стандартизации,...»

«РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ НЕФТИ и ГАЗА имени И.М. Губкина Утверждена проректором по научной работе проф. А.В. Мурадовым 31 марта 2014 года ПРОГРАММА вступительного испытания по направлению 15.06.01 - Машиностроение для поступающих в аспирантуру РГУ нефти и газа имени И.М. Губкина в 2014/2015 уч. году Москва 2014 Программа вступительного испытания по направлению 15.06.01 Машиностроение разработана на основании требований, установленных паспортами научных специальностей (05.02.04,...»

«© Современные исследования социальных проблем (электронный научный журнал), №3(11), 2012 www.sisp.nkras.ru УДК 330.101 ТУРИСТСКО-РЕКРЕАЦИОННЫЕ КЛАСТЕРЫ – МЕХАНИЗМ ИННОВАЦИОННОГО СОВЕРШЕНСТВОВАНИЯ СИСТЕМЫ СТРАТЕГИЧЕСКОГО УПРАВЛЕНИЯ РАЗВИТИЕМ РЕГИОНОВ Шепелев И.Г., Маркова Ю.А. В стратегическом управлении развитием отраслей, регионов, территорий и т.д. целесообразно учитывать инновационные методы и решениях. При разработке программ развития туризма в конкретной местности возможно основываться на...»

«СПЕЦИАЛЬНЫЙ ВЫПУСК. МАЛАЯ ЭНЕРГЕТИКА июль - октябрь 2013 г. июль - октябрь 2013 СОДЕРЖАНИЕ 1. ОтРАСлЕвОЕ РЕгулИРОвАНИЕ 1.1 Зеленую энергетику берут на поруки. Банки не смогли дать гарантий за ветер и солнце 1.2 Результаты российского отбора проектов вИЭ на 2014-2017 годы 1.3 Результаты отбора проектов вИЭ. Одни впечатлены, другие разочарованы 1.4 Кто оплатит зеленый тариф 1.5 Россия выделит на энергоэффективность $870 млрд  1.6 Правительство РФ утвердило план действий по развитию биоэнергетики...»

«Услуга ТВ на компьютере Руководство по установке Инструкция пользователя 2 Содержание: 1 Установка программы 2 Обновление программы 3 Удаление программы 4 Инструкция пользователя 4.1 Активация сервиса 4.2 Телеканалы 4.3 Программа ТВ 4.4 Фильмы 4.5 Избранное 4.5.1 Доступные 4.5.2 Запланированные 4.5.3 Фильмы 4.6 Мои настройки 4.6.1 Счет 4.6.2 Подписка 4.6.3 Пользователи 5 Поиск и устранение неисправностей 1 Установка программы Для установки плеера компьютер должен отвечать следующим техническим...»

«Федеральное агентство по образованию Федеральное государственное образовательное учреждение высшего профессионального образования Сибирский федеральный университет УТВЕРЖДАЮ Декан факультета информатики и процессов управления /С.В.Ченцов/ _ _200 г. УЧЕБНАЯ ПРОГРАММА ДИСЦИПЛИНЫ Дисциплина Имитационное моделирование (наименование дисциплины в соответствии с ФГОС ВПО и учебным планом) Укрупнённая группа 230000 — вычислительная техника и информационномер и наименование укрупнённой группы) ные...»

«Министерство образования и науки РФ Беловский институт (филиал) Федерального государственного бюджетного образовательного Учреждения Высшего профессионального образования Кемеровский государственный университет Кафедра Общественных наук. РАБОЧАЯ ПРОГРАММА по дисциплине Психология малой группы для специальности Психология (030301) Составитель: к.пс.н.,доцент Авилов Г.М. БЕЛОВО Print to PDF without this message by purchasing novaPDF (http://www.novapdf.com/) Программа составлена в соответствии с...»

«ФАКУЛЬТЕТ ПОЛИТИЧЕСКИХ НАУК И СОЦИОЛОГИИ Факультет политических наук и социологии предлагает программу обучения в соответствии с современными международными требованиями и стандартами. Кроме штатных преподавателей, получивших докторские степени в ведущих университетах мира или имеющих большой международный научный опыт, факультет привлекает зарубежных специалистов. Слушателям также обеспечивается возможность стажироваться за рубежом. Одновременно деятельность факультета направлена на расширение...»

«Утверждаю Заслушано на заседании МО Директор ГБОУ СОШ №1738 Председатель МО имени авиаконструктора М.Л.Миля _( Афонина АА ) (Николаевская ВС ) 25 августа 2014 г. 25 августа 2014 г. Рабочая учебная программа базового курса 2-4 классов для 2АБВ, 3АБВ, 4ВГ классов по английскому языку ГБОУ СОШ №1738 имени авиаконструктора М.Л.Миля Статус класса общеобразовательный Количество часов 68 (2ч в нед.) Уровень базовый Контрольных работ: 2АБВ– 3АБВ – 4ВГ – Составлена на основе программы ( авторы)...»

«www.lsmuni.lt 3 На 7 факультетах и в 6 исследовательских институтах LSMU, в больнице LSMU и клинике для животных проводятся занятия и научные исследования. В настоящее время Университет предлагает 24 программы обучения, по которым занимаются более 7 600 студентов. В 2011 г. появились две новые программы – медицинская и ветеринарная генетика, а также медицинская и ветеринарная биохимия. Применения метод проблемного обучения (МПО) студентам передаются высококачественные теоретические знания....»

«Введение В соответствии с Приказом Министерства образования и науки Российской Федерации № 1365 от 16 марта 2011 Об утверждении Федеральных государственных требований к структуре основной профессиональной образовательной программы послевузовского профессионального образования (аспирантура), введены Федеральные государственные требованиям к структуре основной профессиональной образовательной программы послевузовского профессионального образования (аспирантура). Обучение аспирантов осуществляется...»

«МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Саратовский государственный аграрный университет имени Н.И. Вавилова Утверждаю Директор филиала Кучеренко И.А. 30 августа 2013 г. РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ Дисциплина БИОЛОГИЯ Специальность 190631 Техническое обслуживание и ремонт автомобильного транспорта Квалификация Техник выпускника Нормативный срок 3 года 10 месяцев обучения...»

«Министерство общего и профессионального образования Ростовской области Государственное бюджетное образовательное учреждение среднего профессионального образования Ростовской области Ростовский-на-Дону колледж связи и информатики УТВЕРЖДАЮ Директор ГБОУ СПО РО РКСИ _ М.Б. Стрюков ПРОГРАММА ускоренной подготовки рабочих по профессии: 10060 Антеннщик-мачтовик Цель: Профессиональная подготовка рабочих для предприятий связи РФ (по ускоренной программе) Форма обучения: очная Срок обучения: на базе...»

«ПРОГРАММА МЕЖДУНАРОДНОЙ ОН-ЛАЙН КОНФЕРЕНЦИИ Технологии обучения и социального сопровождения детей и взрослых с аутизмом, посвященной 2 апреля – Международному дню распространения информации об аутизме. 2 – 30 апреля 2014 г. Цель конференции: распространение передового опыта обучения и социального сопровождения детей и взрослых с аутизмом. Задачи конференции Улучшение условий для повышения организационно-методической компетентности педагогов в вопросах обучения и воспитания детей с аутизмом...»

«ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГЛАВНОЕ УПРАВЛЕНИЕ ОБРАЗОВАНИЯ ВОРОНЕЖСКОЙ ОБЛАСТИ Государственное образовательное учреждение высшего профессионального образования Воронежский государственный университет ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ЗДРАВООХРАНЕНИЮ И СОЦИАЛЬНОМУ РАЗВИТИЮ ГЛАВНОЕ УПРАВЛЕНИЕ ЗДРАВООХРАНЕНИЯ ВОРОНЕЖСКОЙ ОБЛАСТИ Государственное образовательное учреждение высшего профессионального образования Воронежская государственная медицинская академия им. Н.Н.Бурденко ПРОБЛЕМЫ...»

«АННОТАЦИИ рабочих программ учебных дисциплин по подготовке бакалавра по направлению 080500 Бизнес-информатика Аннотация рабочей программы учебной дисциплины Автоматизация учета на предприятии по подготовке бакалавров по направлению 080500 Бизнес-информатика Дисциплина Автоматизация учета на предприятии входит в вариативную часть профессионального цикла (блок Б.3) дисциплин подготовки студентов по направлению 080500 Бизнес-информатика. Дисциплина реализуется на факультете экономики и управления...»

«Торговля людьми и равенство полов в Молдове дополнительные нормативные акты 2011 Торговля людьми и равенство полов в Молдове ru до по лн ит Конвенции ел ьн ые Законы но рм Постановления ат ив ны е ак ты Кишинев CZU 343.545(478)(094)=135.1=161. T Descrierea CIP a Camerei Naionale a Crii Traficul de fiine umane i egalitatea genurilor in Moldova: acte normative actualizate = Торговля людьми и равенство полов в Молдове: дополнительные нормативные акты / resp. ed.: Otilia Bologan-Vieru, Veaceslav...»

«Направление подготовки: 08.03.01 Строительство Степень (квалификация): бакалавр Основы обучения: бюджетная, внебюджетная Срок обучения: очное обучение – 4 года Перечень вступительных испытаний: математика (профильный экзамен), русский язык, физика. Обучение по направлению подготовки 08.03.01 Строительство осуществляется в нашем университете на Факультете кадастра и строительства. Актуальность профессии строителя Есть профессии, которые никогда не теряют своей актуальности, и с каждым годом...»

«Государственное бюджетное образовательное учреждение города Москвы общеобразовательная школа-интернат среднего (полного) общего образования № 58 Обеспечение образовательного процесса учебной литературой на 2013-2014 учебный год Основное общее образование Среднее (полное) общее образование Предмет - русский язык. Федеральные программы, авторы Классы Учебники, авторы, год издания Русский язык Ладыженская Т.А., М.Т. Баранов, Л.А. 5а 5б Тростенцова и др. М., Просвещение, 2008 Русский язык Львова...»

«Учреждение образования Белорусский государственный технологический университет УТВЕРЖДАЮ Проректор по учебной работе БГТУ С.А. Касперович 2013 г. Регистрационный № УД-/р. ЛЕСНАЯ ТАКСАЦИЯ И ОСНОВЫ ЛЕСНОГО ХОЗЯЙСТВА Учебная программа учреждения высшего образования по учебной дисциплине для специальности: 1-46 01 01 Лесоинженерное дело Факультет Технологии и техники лесной промышленности Кафедра Лесоустройства Курс I – II Семестр 2–3 Лекции Экзамен – 3 семестр 70часов Практические занятия 34 часа...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.