Интеграция информационнных ресурсов Сибирского отделения РАН
Ю.И.Шокин
Институт вычислительных технологий СО РАН
А.М.Федотов
Институт вычислительных технологий СО РАН,
1. Введение
Целевая научная программа “Информационно-телекоммуникационные ресурсы Сибирского
отделения РАН”, объединяет под единым управлением основные работы проводимые в СО РАН
по следующим направлениям:
Поддержка и развитие телекоммуникационной инфраструктуры Отделения.
Поддержка и развитие информационных ресурсов Отделения.
Работы по программе включают в себя текущую эксплуатацию и поддержку телекоммуникационной инфраструктуры Отделения, развитие информационно-телекоммуникационной среды Отделения в целом и модернизацию внутренней инфраструктуры сети научных центров СО РАН, в том числе.
1. Поддержку существующей телекоммуникационной (сетевой) инфраструктуры Отделения (в Новосибирском научном центре (ННЦ) и других научных центрах СО РАН), включая поддержку аренды внешних и внутренних каналов связи.
2. Развитие информационно-телекоммуникационной среды Отделения.
3. Информационно-телекоммуникационного обслуживание и поддержка работ по созданию, развитию и накоплению собственных информационных ресурсов Отделения.
Основная информация о целевой программе размещена на информационном сервере СО РАН [1] по адресу http://www.sbras.ru/win/telecom/.
2. Информационно-телекоммуникационные ресурсы На современном этапе развития мирового сообщества информация является стратегическим ресурсом, таким же, как традиционные материальные и энергетические ресурсы. Информационные ресурсы, переведённые в электронную форму, приобретают новое качество, обеспечивая более эффективное развитие всех сфер деятельности человека, включая науку и образование. Современные информационные технологии позволили приступить к переводу в электронную форму информации, накопленной человечеством в предыдущие годы, а так же значительно повысить уровень методик её восприятия и использования.
Наибольший экономический и социальный успех сегодня сопутствует странам, активно развивающим и использующим современные компьютерные телекоммуникации и сети, информационные технологии и системы управления информационными ресурсами. Становление информационного общества немыслимо без использования информационных ресурсов в электронном виде.
c 2003 Институт вычислительных технологий СО РАН. Новосибирск, Россия.
Переведенные в электронную форму и собранные в общую систему информационные ресурсы приобретают новый статус, в котором реализуется качественно иной уровень производства, хранения, организации и распространения разнородной информации [2]. Применение мультимедийных технологий, сочетающих в себе как разноплановый информационный аспект (одновременное представление информации в виде текста, звука, видео и т.п.), так и применение механизмов интеллектуального сенсорного отклика, способствует более быстрому и эффективному восприятию и усвоению студентами уже существующих, базовых курсов.
Потребности современного общества вызвали к жизни принципиально новые виды информационных ресурсов — информационные системы, электронные публикации и коллекции, облаченные в форму электронных библиотек. Обеспечение использования информационных ресурсов мирового научного сообщества и распространение собственных достижений в виде электронных коллекций, атласов и информационных систем и электронных публикаций, создание и организация доступа к ним являются одними из важнейших задач информационной поддержки науки, культуры и образования. Применение в научно-образовательном процессе интегрированных информационных систем позволяет параллельно использовать разноплановые информационные ресурсы, разнородные банки данных, в том числе, полученных в результате научно-исследовательской деятельности, проводить научный информационный обмен. Сегодня очевидно, что наиболее эффективно это достигается путем создания электронных библиотек, которые реализуют качественно иной подход к оперированию разнообразной информацией в электронном виде и предоставлению ее массовому пользователю. Под электронной библиотекой далее понимается распределенная информационная система, позволяющая надежно сохранять и эффективно использовать разнообразные коллекции электронных документов, доступные в удобном для конечного пользователя виде через глобальные сети передачи данных.
Не менее важной задачей является создание средств такого доступа и технологий распределенного использования высокопроизводительных вычислительных и информационных ресурсов.
Для крупного территориально распределенного научного сообщества, каким является Сибирское отделение, — это один из наиболее действенных способов интеграции научных коллективов и применения результатов их исследований в образовании.
СО РАН является региональным объединением научно-исследовательских, опытно-конструкторских, производственных организаций, а также подразделений, обеспечивающих функционирование инфраструктуры научных центров, расположенных на территории Сибири в 7 областях, 2 краях и 4 республиках (общая площадь территории около 10 млн. кв. км, см. рис. 1). Научные центры СО РАН находятся в Новосибирске, Томске, Красноярске, Иркутске, Якутске, УланУдэ, Кемерово, Тюмени, Омске, отдельные институты работают в Барнауле, Чите, Кызыле. В составе СО РАН 74 научно-исследовательских и 13 конструкторско-технологических учреждений, работающих в области физико-математических, технических, химических и биологических наук, наук о Земле, гуманитарных и экономических наук. Примерно половина потенциала Отделения сосредоточена в Новосибирском научном центре (ННЦ).
На базе интеграции научных центров Отделения с университетами и другими вузами Сибири созданы и действуют региональные научно-образовательные комплексы (РНОК) в Барнауле, Красноярске, Омске, Тюмени. В тесной связи с научными центрами Отделения работают университеты и вузы в Новосибирске, Томске, Иркутске, Кемерово, Чите, Улан-Удэ, Якутске.
Развитие научных исследований и подготовка кадров высшей квалификации на текущем этапе немыслимы без использования информационно-телекоммуникационных ресурсов. Функционирование Сети Интернет СО РАН на современном этапе обеспечивает интеграцию институтов СО РАН в мировое научное сообщество, предоставление доступа к мировым информационным ресурсам, оперативную координацию действий организаций Отделения и проведение фундаментальных исследований на современном уровне. В результате использования Сети Интернет СО РАН, сотрудники Отделения имеют доступ к информационным ресурсам мирового научного сообщества и возможность представлять свои собственные результаты в мировом информаРис. 1. Зона деятельности СО РАН ционном пространстве. Так, публикация лишь части основных достижений Отделения в сети Интернет привела к возникновению более сотни новых научных связей не только с зарубежными партнерами, но и в России.
Информационно-телекоммуникационные ресурсы Отделения эксплуатируются и развиваются в рамках целевых программ Отделения при поддержке Российского фонда фундаментальных исследований (РФФИ), Министерства промышленности, науки и технологий РФ (МинПромНауки) и ряда других фондов. Телекоммуникационная сеть объединяет более 150 научнообразовательных организаций, как на территории Новосибирской области, так и за её пределами в границах действия Отделения.
В состав Сети помимо институтов Отделения входят институты Сибирских отделений Российских академий медицинских и сельскохозяйственных наук, ГНЦ вирусологии и биотехнологии “Вектор”, а также ряд других организаций науки, образования, культуры, здравоохранения и социальной сферы. Сеть обслуживает более 40000 пользователей в Новосибирске и насчитывает более 12000 подключенных компьютеров. Кроме того, в региональных научных центрах Отделения находится еще около 30000 пользователей. Фактически (по числу пользователей и компьютеров) за годы своего существования Сеть Интернет СО РАН превратилась в крупнейшую научно-образовательную (академическую) сеть в России.
К концу 2000 года Сеть Интернет СО РАН практически исчерпала ресурсы пропускной способности и для дальнейшего развития был необходим переход к новым технологиям, базирующимся на оптоволоконных каналах. Инфраструктура федеральной сети передачи данных RBNet, используемая региональными центрами Отделения для связи с организациями ННЦ, ввиду ее перегруженности московским трафиком, практически не обеспечивала необходимого качества взаимодействия, для проведения совместных работ. Таким образом, для обеспечения современных мультидисциплинарных исследований и развития систем информационной поддержки научноисследовательский работ назрела необходимость создания собственной телекоммуникационной инфраструктуры Отделения, основанной на скоростных каналах связи ННЦ с региональными научными центрами Отделения, а также организация высокоскоростного доступа в Москву и в глобальный Интернет.
Целевая программа “Информационно-телекоммуникационные ресурсы СО РАН” на начальном этапе в первую очередь была направлена на принципиальную модернизацию телекоммуникационной инфраструктуры Отделения. Отметим, что эффективное использование современных информационных-телекоммуникационных сред предполагает наличие трех факторов:
1. Высокопроизводительных информационно-вычислительныхых ресурсов, электронных библиотек, электронных коллекций, центров коллективного пользования, центров доступа к высокопроизводительным ресурсам.
2. Скоростных магистральных каналов объединяющих рабочие станции пользователей и сервера, научные и образовательные организации на уровне региона и магистральная инфраструктура объединяющая регионы.
3. Наличия в организациях подготовленных пользователей и современных рабочих мест и рабочих станций.
В второй половине 2001 года было подписано соглашение с компанией “ТрансТелеком” (ТТК) о предоставлении для Сибирского отделения РАН канала Москва — Новосибирск емкостью в Mbps при участии МинПромНауки РФ, РАН, СО РАН и Уральского отделения РАН. Благодаря достигнутым соглашениям в марте-апреле 2002 года заработал магистральный канал передачи данных Новосибирск-Москва с пропускной способностью 45 Mbps. При участии РАН и МинПромНауки (РосНИИРОС) к концу 2002 года была организована сеть передачи данных федерального уровня.
В настоящий момент канал передачи данных ТТК, построенный на основе технологии SDH (DS-3), связывает ННЦ СО РАН с Москвой с дальнейшим выходом в сеть передачи данных RBNet. По этому каналу через точку присутствия RBNet в Москве обеспечивается передача российского и зарубежного трафика.
В конце 2002 года в виду недостаточного финансирования со стороны МинПромНауки федеральная сеть RBNet в Сибирском федеральном округе практически прекратила свое существование и к телекоммуникационной инфраструктуре СО РАН мы были вынуждены подключить практически все научно-образовательные сети Сибирского региона (в том числе и сети вузов).
В следствие чего на базе сети Сибирского отделения РАН был создан новосибирский региональный узел обмена трафиком (NSK-IX) для всего научно-образовательного сообщества Сибири (см. рис. 2).
Для оптимизации потоков данных как внутри региона, так и внешних в целом (включая Интернет “общего назначения”), на первое место вышла задача организации новосибирского Рис. 2. Планируемая схема подключения региональных научных центров регионального обмена трафиком. Приходящие в Новосибирск потоки из регионов в настоящий момент сосредотачиваются в трех основных точках: Академгородок (Объединенный институт информатики СО РАН) — Центр управления Сети СО РАН (Сети ННЦ СО РАН, НГУ и каналы, арендуемые у Транстелеком’а региональными научными центрами СО РАН), ТЦМС8 — Узел связи на площадке Ростелеком (Сеть ВУЗов Новосибирска, Новосибирский городской узел обмена трафиком и каналы, арендуемые у Ростелеком’а региональными научными центрами СО РАН) и ШЧ9 — Узел связи на площадке ТТК (каналы, арендуемые у ТТК региональными научно-образовательными сетями, в том числе и сетями ВУЗов).
Распределенный коммутационный узел управляется центральным маршрутизатором, расположенном в центре управления сети СО РАН в Объединенном институте информатики СО РАН (ЦУС ОИИ). ЦУС состоит из центрального маршрутизатора (cisco 7206) и коммутатора 3-го уровня (маршрутизирующего коммутатора) состоящего из нескольких catalyst 3550-12, объединенных в кластер. Этот кластер предназначен для подключения абонентов (институтов и организаций СО РАН) к сети ННЦ (на скоростях 100 Мbps или 1000 Мbps) и обеспечения им доступа в сеть Интернет (емкость внешнего канала составляет 45 Мbps), локальных маршрутизаторов абонентов, а также каналов на RBNet и на ТЦМС8.
Был предложен следующий принцип подключения региональных сетей. Каждая региональная научно-образовательная (академическая) сеть приходит в Новосибирск единым потоком без разделения на научную и образовательную часть и включается в Новосибирский узел обмена трафиком. Дальнейшая маршрутизация потоков для всех участников сети производится на уровне коммутации потоков.
Развитие телекоммуникационной инфраструктуры Отделения в первую очередь было основано на корпоративном подходе к развитию всех составляющих сектора телекоммуникационных услуг (включая передачу данных и телефонию). В известной мере, корпоративный подход и его актуальность связаны и с внешними факторами, отражающими действия монопольных участников рынка телекоммуникационных услуг. Это схемы ценовой и временной тарификации, которую начинают вводить на рынке соответствующих услуг. Благодаря корпоративному подходу в сфере передачи данных, институты Отделения не стали заложниками монопольного рынка услуг связи.
Более того, если до определенного времени, эти сектора развивались как достаточно независимые, то в последнее время можно наблюдать их тесную интеграцию, как в области технических реализаций, так и в области программного обеспечения. Это же касается и области стандартизации и области межсетевого взаимодействия, управления, биллинга.
Складывающиеся тенденции в стране, однозначно подводят и обосновывают необходимость проведения работ в области телекоммуникаций в секторе телефонии, а именно, к созданию корпоративной телефонной сети. Под Корпоративной Телефонной Сетью (КТС), далее будет пониматься сектор телекоммуникаций, обеспечивающий современный телефонный сервис для подразделений Отделения, включающий, наряду с институтами расположенными в Академгородке, институты и отделения расположенные в других регионах и городах России, включая и Москву (Президиум РАН). Реализация КТС, позволит максимально интегрировать трафик между организациями СО РАН в рамках внутренней канальной инфраструктуры, с одной стороны, и с другой, обеспечить использование различных провайдеров в целях оптимизации стоимости получаемых услуг на внешнем рынке. Основанием для этого является не только наличие внутренней инфраструктуры в Академгородке, но и наличие выделенных каналов между городами, в которых расположены подразделения Отделения, и центром управления сетью Интернет СО РАН.
В основу развития сети Интернет СО РАН был заложен принципиальный, подход направленный на развитие технологической базы Отделения. Подход, используемый в развитии телефонной инфраструктуры, содержит ещё в большой степени фактор оптимизации расходной части технологических затрат. Можно сказать, что создание телефонной части корпоративной сети является обязательным завершающим шагом для создания гибкой динамичной телекоммуникационной инфраструктуры внутри СО РАН. Инфраструктуру, которая позволит быстро организовывать, и динамично поддерживать временные коллективы, рабочие проектные группы. Инфраструктуру, которая позволит эффективно, на современном уровне позволит организовывать как внутреннюю связь, так и внешнее взаимодействие.
При развитии телефонной части корпоративной сети предлагается строить развитие от центра, от создания центрального ядра телефонной корпоративной сети: места подключения к телефонным сервисам. Это ядро при дальнейшем развитии сети должно служить местом, обеспечивающим подключение к следующим сервисам:
1. внутри корпоративный телефонный сервис – внутренняя оптимизированная по затратам единая по нумерации телефонная связь организаций СО РАН;
2. междугородняя телефонная связь с использованием корпоративных каналов;
3. оптимизированный, высокоэффективный выход в ТФОП с расширенными сервисами (в частности, “серийный номер”);
4. доступ к альтернативным операторам международной, междугородней телефонной связи, позволяющий снизить затраты на оплату телефонных переговоров;
5. корпоративное подключение к сотовым операторам.
Предполагаемая схема, ни в коем случае не является прототипом еще одной большой, хотя и внутренней АТС, призванной централизованно обеспечить телефонию для конечных пользователей в рамках Отделения, а прежде всего является децентрализованной схемой, интегрирующей интеллектуальные телефонные платформы и обеспечивающей тесную интеграцию с сетью передачи данных СО РАН с использованием единых точек подключения к телефонным сетям общего пользования различных провайдеров.
Сегодня довольно популярны решения связанные с использованием технологии VoIP, или просто IP-телефонии и, естественно, оно может и должно найти отражение и в КТС СО РАН, однако не как самоцель, а, прежде всего, как средство обеспечения телефонного сервиса для сотрудников Отделения.
Важнейшей частью программы является поддержка информационной среды Отделения, а также создание и развитие собственных информационных ресурсов, управление этими ресурсами. Проблемы создания информационных ресурсов являются приоритетными направлениями многих стран, в том числе и в России, где эти проблемы отнесены к критическим направлениям развития общества. “Информация является важнейшим стратегическим ресурсом и наибольший экономический и социальный успех сегодня сопутствует тем странам, которые активно используют современные средства компьютерных коммуникаций и сетей, информационных технологий и систем управления информационными ресурсами” (Жискар д’Эстен).
В Сибирском отделении РАН накоплена и постоянно пополняется уникальная научная информация. Но, к сожалению, пока отсутствует единая технология ее сбора, разобщены как места хранения, так и формы представления и, что самое главное, практически отсутствует информация об информации. Громадный оригинальный материал хранится в виде бумажных архивов и в большинстве случаев не представляет организованную информационную среду, которая является основой для современных научных исследований, что, в свою очередь, является существенным препятствием на пути развития интеграционных проектов и других форм научного взаимодействия.
В настоящий момент перед нами стоит задача сохранения важнейшего информационного материала, накопленного в Отделении за многие годы. Для решения проблем информационного обеспечения принято решение о создании собственной “Интегрированной Распределенной Информационной Системы СО РАН” (ИРИС) [3], в которой должна аккумулироваться большая часть необходимой для сотрудников информации, включая создание полнофункциональной системы об интеллектуальном потенциале Отделения и “Электронной библиотеки Сибирского отделения РАН” [4].
Интегрированная Распределенная Информационная Система (ИРИС) призвана обеспечить:
1. Единую информационную среду научно-образовательного сообщества, основанную на современных сетевых средствах и перспективных информационных технологиях.
2. Информационную поддержку образовательного процесса и проведения исследований по фундаментальным и прикладным направлениям.
3. Поддержку профессионально-ориентированных систем подготовки и обмена научных документов с элементами удаленной совместной работы.
4. Поддержку профессионально-ориентированных систем доступа и интерфейсов с банками данных и автоматизированными библиотеками.
5. Поддержку перспективных систем телекооперации исследователей на базе современных телекоммуникационных и информационных технологий.
6. Коллективное использование приобретаемой электронной литературы, реферативных журналов и т.п. Ведение электронных каталогов и оглавлений научных периодических изданий, выходящих в мире.
7. Поддержку электронных версий научных журналов. Издание собственных электронных журналов, книг, препринтов и дайджестов по различным направлениям научных исследований.
8. Поддержку принятия и реализации организационных и управленческих решений, а также систем документооборота.
Организационно-технологическое обеспечение процесса создания полнофункциональной информационной системы включает в себя большой спектр работ, и что самое главное: “воспитание нового пользователя, способного жить и работать в современном информационном мире”.
Важной проблемой становится организация разнородной информации в удобном для конечного пользователя виде, что требует новых фундаментальных и прикладных исследований, разработок интерфейсов для корректного отражения предметной области. Другой задачей обслуживания электронных коллекций является стандартизация данных, разработка технологических решений и юридических аспектов использования информации, включая вопросы интеллектуальной собственности. Отличительной чертой электронной библиотеки является возможность параллельного использования различных поисковых механизмов и средств доступа к банкам электронных данных. Так, в качестве ответа на запрос к электронной библиотеке пользователю может быть представлен не единственный электронный документ (или его фрагмент) и совсем не обязательно в текстовой форме. Необходимы такие информационные системы, которые бы обеспечивали эффективный комплексный поиск и анализ информации в коллекциях разнородных объектов.
В целом создание ИРИС направлено на создание:
1. Единой распределенной информационной среды, объединяющей в интегрированное информационное пространство распределенных и локальных электронных ресурсов (информационных, программных, алгоритмических) организаций Отделения, 2. Комплекса программно-технических средств, обеспечивающего использование этих ресурсов и полнофункциональное управление ими.
Здесь на одно из первых мест выступает разработка нормативно-правовых документов, регулирующих взаимоотношения всех категорий лиц и организаций, участвующих в информационном обмене - в работе в качестве создателей, держателей и потребителей информации. Необходимо решение проблем организации и управления информационными, вычислительными и телекоммуникационными ресурсами, правовые и экономические аспекты их создания и использования, вопросы безопасности, а также стандарты представления информации в электронном виде. Разработка корпоративных стандартов хранения, поиска, представления и обработки информации на основе существующих международных и отечественных стандартов является одной из ключевых задач формирования системы распределенной обработки информации (куда, например, входят вопросы создания унифицированных словарей для поиска и представления информации).
В процессе проектирования и разработки ИРИС необходимо:
Определить весь спектр уже имеющихся на данный момент информационных ресурсов, учебных программ и методик обучения с привлечением новых информационных технологий как среди Институтов и ВУЗов, так и с изучением конъюнктуры софтовых компаний.
Выявить круг учебных программ и методических разработок, в которых есть реальная потребность со стороны Институтов и ВУЗов. Важно делать акцент на программах и информационных ресурсах, имеющих высокую степень унифицированности (универсальности) и интероперабельности.
В основе реализации ИРИС лежит метамодель, исходящая из того, что документ (информационный ресурс: документ, алгоритм, программа, файл или вычислительный ресурс) характеризуется набором присущих ему атрибутов и методов, характеризующих связи с другими документами. Информация о документах системы, их атрибутах и методах поддерживается сервером метаданных, содержащий метаописания системы и метаописания отдельных коллекций документов. Сервер метаданных является отдельной частью системы, содержащей описание информационной модели предметной области, параметров настройки стандартных функций системы. По информации сервера метаданных осуществляется динамическая генерация схем базы данных системы и ведение программного служебных баз данных, в которых хранятся данные, обеспечивающие поддержку стандартных функций системы, динамически определяемые отношения между документами и динамическое распределение ресурсов системы.
Сейчас в ИРИС выделятся следующие типы ресурсов - ДОКУМЕНТОВ:
каталоги информационных ресурсов, информация об информационных ресурсах и метаинформация;
электронные коллекции;
классификационные ресурсы;
вычислительные ресурсы и ресурсы обработки данных;
хранилища программного обеспечения;
административные информационные ресурсы, включающие полную информацию об актуальном состоянии системы и ее отдельных компонент.
В основу создания ИРИС положен принцип информационных хранилищ, с учетом поддержки уже функционирующих технологий, технологических решений используют принципы обработки метаописаний данных на основе серверов метаданных и протокола Z39.50. Разработана технология, которая обеспечивает виртуальную интеграцию разнородных информационных и вычислительных ресурсов, расположенных на серверах различных организаций, в единую систему с унифицированным доступом на основе открытых международных стандартов. Это позволило объединить в единое информационное пространство уже существующие многочисленные сервера организаций, входящих в научно-образовательную сеть, основанные на стандартных протоколах, организовать информационное обеспечение проведения исследований по фундаментальным и прикладным направлениям, проводимым в вузах, академических и институтах, ГНЦ "Вектор". Обеспечить доступ к фактографическим базам данных и уникальным коллекциям, накопленным в научных подразделениях СО РАН, с помощью современных средств доступа к данным. Таким образом, данные доступные в обычном режиме узкому кругу сотрудников той или иной организации станут доступными в пределах всего научно-образовательного сообщества Новосибирска.
Пользователю система предоставляет:
Каталоги организаций и сотрудников;
Интегрированный каталог основных разработок, проектов, публикаций и изданий, включая электронные;
Каталоги документов и ресурсов, касающиеся всего научно-образовательного пространства;
Каталоги предоставляемых программных, алгоритмических и вычислительных ресурсов;
Доступ к электронной библиотеке - хранилищу ресурсов.
1. Информационный сервер Сибирского отделения РАН.
[http://www.sbras.ru/win/].
2. Шокин Ю.И., Федотов А.М. Информационная система Сибирского Отделения РАН // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Второя Всероссийская научная конференция, Протвино, 26-28 сентября 2000 г.: Сб. докл., Протвино, ГНЦ ИФВЗ, 2000, С. 6-15, ISBN 5-88738-029-2.
3. Шокин Ю.И., Федотов А.М., Жижимов О.Л., Мазов Н.А. Интегрированная распределенная информационная система (ИРИС) Сибирского отделения РАН // В сб.: Выездное заседание научно-координационного совета по целевой программе "Информационнотелекоммуникационные ресурсы СО РАН", Иркутск, 29-30 августа 2002, ИДСТУ СО РАН, 4. Федотов А.М., Шокин Ю.И. Электронная библиотека Сибирского отделения РАН // Информационное общество, N 2, 2000.