Информационное обеспечение науки: новые технологии
Зарубежные астрономические базы
данных. Обзор и сравнительный анализ
Кувшинова И.Б., Кувшинова Е.Е., Никольская И.Ю.
(ВИНИТИ РАН)
На сегодняшний день в мировом информационном
пространстве существует огромное количество самых
разнообразных баз данных (БД), отличающихся по содержанию, направленности, доступности, полноте отражения и т.д. Рассмотрим некоторые из крупнейших БД,
которые дают возможность найти информацию по таким областям знания, как астрономия, астрофизика, космические исследования и смежные с ними науки.
Все БД условно можно поделить на специализированные БД наблюдений, политематические и специализированные библиографические БД. Если говорить об астрономии и связанных с ней науках, то БД наблюдений можно подразделить на БД, содержащие только данные наблюдений, описание программ, проектов и аппаратуры, и БД, включающие в себя также публикации.
БД наблюдений Solar System Exploration (США) [URL: http://solarsystem.nasa.gov/index.cfm] БД NASA Solar System Exploration (США) — БД по исследованиям Солнечной системы. Начала свою работу в октябре 1998 г. Содержит информацию по планетам, кометам и астероидам (описание, обзоры, характеристики, изображения и др.), подробные сведения о космических программах по их исследованиям: текущим, прошлым (с 1950 г.) и будущим, а также о новостях и основных событиях в данной области.
Имеется возможность поиска: по ключевым словам (названиям объектов); по космическим программам, включая цель исследования (название объекта), название программы (по алфавиту), годы проведения, страныучастники, тип программы (орбитальный, посадочный, Информационное обеспечение науки: новые технологии для исследования атмосфер и др.), состояние (успешная, неудачная и др.).
Дополнительно имеются данные по космическим программам изучения пространства за границами Солнечной системы. Всего приводятся сведения о почти 400 программах.
MPC (США) [URL: http://www.minorplanetcenter.net/iau/mpc.html] MPC Database — БД Центра малых планет, работающего при Смитсоновской астрофизической обсерватории (SAO) под руководством Международного астрономического союза (IAU). Содержит сведения по малым телам Солнечной системы: кометам, астероидам и их спутникам. В БД можно найти информацию по обзорам, наблюдениям и вычислениям (орбитам, элементам орбит, эфемеридам, кривым блеска и др.). Приводятся данные наблюдений для более чем 647 тыс. комет и 99,3 млн.
астероидов, а также 616 тыс. орбит малых тел. Отдельно рассматриваются семейства астероидов и особенное внимание уделяется объектам, сближающимся с Землей (ОСЗ).
Имеется возможность поиска: по названиям, по номерам, по дате и месту наблюдений, по типу орбиты объектов, по характеристикам и элементам орбит и др.
Особенностью БД является приведение изображений внутренней Солнечной системы с нанесением данных о расположении известных на сегодняшний день астероидов, а также возможность в реальном времени следить за положениями отобранных комет и ОСЗ (список приведен на сайте).
Meteoritical Bulletin Database (США) [URL: http://www.lpi.usra.edu/meteor/metbull.php] БД Meteoritical Bulletin Database — БД метеоритов, созданная на основе каталога метеоритов Музея естественной истории (Лондон, Великобритания) [1], БД MetBase и др., поддерживается Комитетом по номенклатуре метеоритного общества. БД с начала XXI века (~2005 г.) содержит более 45 тыс. наименований метеоритов с информацией о месте и времени падения и/или находки, весе, количестве найденных экземпляров, класИнформационное обеспечение науки: новые технологии сификации, фотографиях и сведениях о первом печатном сообщении, с отдельным указанием о публикации в Метеоритном бюллетене.
Имеется возможность поиска: по названиям метеоритов, по их местам обнаружения (странам), по классам и др.
Особенностью БД является возможность отображения места падения или нахождения искомого объекта на карте мира (например, ресурс Google Earth).
MetBase (Германия) [URL: http://www.metbase.de/home.html] БД MetBase ведется с 1994 г., содержит данные о более чем 31 тыс. метеоритов: наименования, даты, места и время падения и/или обнаружения, общий вес, количество экземпляров и др.
В БД включены более 500 тыс. данных анализа метеоритов по химическому, элементному и изотопному составам, а также по физическим свойствам. Собраны инвентарные списки и описания более 700 публичных и частных коллекций метеоритов. В БД доступно свыше 2000 изображений около 1750 различных метеоритов с указанием на источник. Также БД содержит более тыс. библиографических описаний различных типов (книги, статьи из журналов, тезисы конференций, монографии, электронные средства массовой информации и др.) по следующим тематикам: метеориты, метеоры, межпланетная пыль и микрометеориты, тектиты и импактиты, ударное кратерообразование, кратеры и астроблемы, лунная геология и геофизика, исследования образцов КА Apollo, астероиды, Марс и марсианская геология, Меркурий и Венера, экзобиология, космохимия, происхождение и эволюция Солнечной системы. В библиотеку БД включены издания, опубликованные за период с 1492 г. по настоящее время. Записи содержат информацию по типу публикации, категории, языку, авторам, заглавию, году публикации, выходным данным источника (включая издательство и ISSN) и др. Дополнительно приводятся сведения о реферате и ключевых словах с указанием объектов (метеоритов), упоминающихся в библиографии.
Информационное обеспечение науки: новые технологии NASA Exoplanet Archive (США) [URL: http://exoplanetarchive.ipac.caltech.edu/] БД NASA Exoplanet Archive — одна из самых крупных БД по экстрасолнечным планетам, в которой содержится информация по 844 известным планетам, вращающимся вокруг 658 звезд, а также о более чем 3,5 тыс. кандидатов. Собранные данные включают в себя характеристики звезд (координаты, звездные величины, температуры, массы, радиусы и др.), параметры экстрасолнечных планет (массы, размеры, плотности, элементы орбит и др.), сведения об открытиях, методах обнаружения, кривых блеска, изображениях, спектрах и др.
В БД есть прямой доступ к интерактивным таблицам с возможностью сортировки и фильтрации данных. Она обеспечивает доступ к более чем 700 тыс. кривых блеска, полученных в результате космических и наземных обзоров по прохождениям экстрасолнечных планет по дискам звезд, включая Kepler Public Survey, CoRoT Exoplanet Survey, CoRoT Asteroseismology, HATNet Survey, XO Survey, TrES Survey, KELT Survey.
Имеется возможность поиска: по координатам, по названиям, по характеристикам и др. В БД существует возможность дополнительного поиска по данным фотометрии и кривым блеска звезд ИСЗ Kepler.
Exoplanet Orbit Database (США) [URL: http://exoplanets.org/index.html] БД Exoplanet Orbit Database — БД орбит экстрасолнечных планет с информацией о 717 подтвержденных планетах и о ~3 тыс. кандидатах. БД находится на ресурсе exoplanets.org и доступ к ней возможен благодаря Exoplanet Data Explorer, который представляет собой: (1) набор интерактивных таблиц с данными по экстрасолнечным планетам, их звездам и ссылкам на источники;
(2) программу графического вывода обработки данных online.
Для каждой из планет в БД содержится информация об обнаружении (дата, метод), параметрах орбиты, параметрах прохождения планеты по диску звезды, сведениях по затмениям, характеристиках звезды, вокруг коИнформационное обеспечение науки: новые технологии торой она вращается, а также о координатах и ссылках на источники данных.
В интерактивных таблицах имеется поиск по имени или его части с возможностью выделения в списке планет по типу (с явлением прохождения по диску звезды, горячий юпитер и др.). А также существует возможность выгрузки данных в отдельный файл с использованием фильтров: по названиям, по координатам, параметрам орбит, по характеристикам звезд и др.
VizieR (Франция) [URL: http://vizier.u-strasbg.fr/viz-bin/VizieR] Страсбургская БД VizieR, созданная в 1996 г., содержит на сегодняшний день свыше 11,1 тыс. каталогов как уже опубликованных, так и существующих только в электронном виде, а также отдельные сведения об 11, тыс. различных космических объектов.
Имеется возможность поиска: по названиям каталогов; по авторам; по ключевым словам, встречающимся в названиях и описаниях к каталогам; по диапазонам излучения; по космическим программам; по областям, охватывающим важные направления исследований (например, активные ядра галактик, туманности, скопления галактик, данные по спектроскопии, красным смещениям и др.); по названиям объектов, содержащихся в каталогах БД; по координатам астрономических объектов (поиск производится вокруг указанных координат в радиусе, заданном в запросе).
Особенностью БД является приведение статистики запросов для каждого отдельного каталога с момента помещения его в эту БД.
SIMBAD (Франция) [URL: http://simbad.u-strasbg.fr/simbad/] Страсбургская астрономическая БД SIMBAD, полностью вошедшая в работу в 2001 г., содержит информацию о более чем 7,07 млн. астрономических объектов с возможностью перекрестной идентификации (17,6 млн.
наименований), а также более 280 тыс. библиографических ссылок и ~9,5 млн. цитат на астрономические объекты в публикациях.
Информационное обеспечение науки: новые технологии Имеется возможность поиска: по названиям астрономических объектов; по их координатам; по критериям, специально введенным в БД для возможности более полного поиска; по библиографическим описаниям (по названиям журналов, по годам публикаций, по авторам, по словам в названиях публикаций, по выходным данным статьи и др.) и др.
Ее особенностью является содержание словаря номенклатуры небесных объектов, включающего в себя более 21 тыс. различных сокращений.
NED (США) [URL: http://ned.ipac.caltech.edu/] БД NASA/IPAC Extragalactic Database — экстрагалактическая БД (сокращенно NED). 8-я версия этой БД с включенной опцией текстового поиска появилась в 1999 г. В БД содержится информация по 176,9 млн. различных объектов внегалактической астрономии, более 83,5 тыс. ссылок для 25,9 млн. объектов и более 60, тыс. публикаций резюме статей (19 основных астрофизических журналов).
Имеется возможность поиска: по названиям астрономических объектов; по их координатам; по характеристикам; по типам и классам объектов; по библиографическому коду; по библиографическим описаниям, содержащимся в БД:
по названиям объектов, с возможностью задания дополнительного критерия поиска по ключевым словам и выбора из предлагаемого списка типа объектов, диапазона или области исследования;
по авторам, с аналогичным дополнением, как для первого пункта;
по ключевым словам;
по выходным данным статьи (название журнала из списка, год, том, страницы).
WEBDA (Австрия) [URL: http://www.univie.ac.at/webda/] БД WEBDA — электронная версия БД, известной как BDA (Base Donnes Amas), посвященная звездным скоплениям в Галактике и Магеллановых облаках. Первая Информационное обеспечение науки: новые технологии версия (1987 г.) содержала информацию о 570 рассеянных скоплениях [2], а с 1995 г. — данные для более, чем 100 тыс. звезд из скоплений каталогов NGC, IC и «анонимных» скоплений [3].
БД имеет сложную структуру, она содержит несколько уровней со своими описаниями, информационным содержанием и поисковыми запросами: 1) «уровень БД» — общее содержание БД с включением новых данных. Позволяет искать информацию по параметрам и доступным измерениям рассеянных скоплений, количеству звезд и типу данных. 2) «уровень скоплений» — список рассеянных звездных скоплений с возможностью сортировки по прямому восхождению, галактической долготе, расстоянию и названию. 3) «уровень звезд» — список звездных скоплений, содержащих различные типы звезд (на выбор). 4) «библиографический уровень» — собрана библиографическая информация о звездных скоплениях с возможностью поиска по авторам, ключевым словам (приведен список возможных) и году публикации. 5) «разное» — каталоги скоплений и таблицы параметров с возможностью поиска по данным источника. 6) «архивный уровень» — файлы с архивными данными по самим объектам, таблицы перекрестных ссылок на литературные источники, список более 450 изображений звездных скоплений с их астрофизическими характеристиками и ссылками на публикации и др.
BAX (Франция) [URL: http://bax.ast.obs-mip.fr] БД X-Rays Galaxy Clusters Database — астрономическая БД по рентгеновскому диапазону, сокращенно BAX с 2002–2003 гг. [4, 5], содержащая информацию из статей о скоплениях в рентгеновском диапазоне и данные о более чем 2 тыс. групп и скоплений галактик для более чем 1,8 тыс. объектов с доступными измерениями потоков и более чем 500 скоплений с имеющимися данными по измерениям температур.
Имеется возможность поиска: по названиям скоплений или групп галактик; по их координатам; по физическим характеристикам (красные смещения, потоки в рентгеновском диапазоне, рентгеновские светимости, рентгеновские температуры); по библиографическим Информационное обеспечение науки: новые технологии описаниям при помощи приведенных в БД ключевых слов; по многокритериальному поиску, позволяющему соединить использование сразу нескольких критериев из вышеперечисленных пунктов.
HyperLeda (Франция) [URL: http://leda.univ-lyon1.fr/] БД HyperLeda — БД по физике галактик [6], созданная на основе каталога LEDA (Linked Extragalactic Databases and Archives), 1983 г. [7]. На сегодняшний день содержит свыше 3 млн. объектов, из которых 1,5 млн.
подтвержденных галактик. Приводятся данные по фотометрии и спектрофотомерии, астрометрии, морфологии, активности ядер, астрофизическим характеристикам (положения, размеры, расстояния и др.), а также данные о внутренней динамике (скорости вращения звезд, газа и др.).
Gravitational Lensing (Бельгия) [URL:
http://vela.astro.ulg.ac.be/themes/extragal/gravlens/bibdat /grav_lens.html] БД Gravitational Lensing Bibliography and Database — двуязычная (англ., фр.) БД по гравитационному линзированию. Она состоит из библиографической БД, появившейся на основе публикации A. Pospieszalska-Surdej и др. в 1993 г. [8], и БД изображений гравитационных линз и их кандидатов.
В библиографической БД собраны ссылки на более чем 2,7 тыс. публикаций по тематикам «гравитационное линзирование» и «гравитационные линзы» в астрофизических журналах и трудах конференций. БД включает публикации, начиная с 1955 по 2004 гг. с возможностью поиска: по авторам, по словам в названиях публикаций, по названиям журналов, по годам публикаций.
БД изображений гравитационных линз и их кандидатов содержит изображения более 60 квазаров с указанием статуса и источника данных (автора и обзора/диапазона/прибора/обсерватории), а также информацию по их астрофизическим характеристикам и морфологии со ссылками на источники.
Информационное обеспечение науки: новые технологии Библиографические БД ADS NASA (США) [URL: http://adswww.harvard.edu/];
БД NASA (ADS Smithsonian/NASA) преимущественно отражает информацию в области астрономии и астрофизики, а также физики и геофизики. Ретрофонд БД ADS на сегодняшний день составляет около 10,1 млн. публикаций, начиная с XVI века (первая запись относится к публикации 1502 г.), и пополняется новыми. Из них свыше 1,9 млн. содержится в астрономической БД, включая ~164 тыс. резюме журналов по планетарным наукам и по Солнечной физике. Более 6,7 млн. — в физической БД, из которых ~527 тыс. приходятся на журналы Американского физического общества (APS), а ~340 тыс. — на труды конференций Международного общества по оптике и фотонике (SPIE).
Особенностью этой БД является включение большого пласта авторских публикаций — архив электронных препринтов (arXiv e-print), где в свободном доступе находятся полнотекстовые статьи на английском языке. В нем содержится свыше 838 тыс. статей.
Имеется возможность поиска с дополнительным выбором БД и тематик: по авторам; по названиям объектов или их положениям (новая возможность); по словам в названиях публикаций; по словам в текстах рефератов (при их наличии); по номерам в архиве электронных препринтов; по выходным данным журналов.
ScienceDirect (Нидерланды) [URL: http://www.sciencedirect.com/];
БД ScienceDirect (Нидерланды) — БД, центральной составляющей которой являются печатные и электронные издания издательства Elsevier, основанного в 1880 г.
БД ScienceDirect содержит свыше 11 млн. публикаций, начиная с 1823 г. по настоящее время. В ней отражаются статьи из более, чем 2,5 тыс. журналов и 11 тыс. книг.
Имеется возможность поиска: по словам с дополнительным выбором тематики, года и источника публикации (журнал, книга, справочное издание); по авторам, (с такими же дополнительными возможностями поиска); по Информационное обеспечение науки: новые технологии словам в полных текстах, содержащихся в БД; по выходным данным журналов; по тематикам.
Особенностью этой БД является возможность поиска по понятиям в изображениях, включенных в статьи, с дополнительным указанием ограничений по их виду (графики, видео), тематике и году издания.
Scopus (Нидерланды) [URL: www.scopus.com/home.url] БД Scopus (Нидерланды) — создана в начале 90-х гг.
XX века, содержит около 49 млн. записей, из которых 78% имеют резюме. Фонд БД насчитывает 19,5 тыс. рецензируемых журналов, из них ~1,9 тыс. находящихся в свободном доступе, 400 отраслевых изданий, 360 книжных серий и 5,3 млн. статей трудов конференций.
Имеется возможность поиска: по словам с дополнительным указанием года и типа документа (статья, обзор, заметка, опечатка, статья из трудов конференции и др.); по авторам с функцией дополнительного указания места работы; по месту работы авторов.
Особенностью этой БД является наличие аналитической обработки ее информации. Так, при выборе места работы автора выдается информация не только по списку публикаций, но и данные самого учреждения, а также статистические сведения — количество документов, количество авторов, количество статей по предметным областям в процентном соотношении, институты, в которых совместно работают авторы или с которыми сотрудничают, и др. А также можно получить данные анализа журналов. По названию журнала, ISSN или издательству с возможностью дополнительного указания тематики выводятся сведения о цитировании с численным и графическим отображениями изменений во времени — SCImago Journal Rank (SJR), Source Normalized Impact per Paper (SNIP), количество цитирований и документов и др.
SpringerLink (Нидерланды, Германия, США…) [URL: http://link.springer.com/];
БД SpringerLink — международная БД, основой содержания которой являются печатные и электронные издания одного из крупнейших издательств научной литературы Springer с более чем 170-летней историей, приИнформационное обеспечение науки: новые технологии надлежащего компании, носящей с 2003 г. название «Springer Science+Business Media». Ретрофонд БД SpringerLink с 1832 г составляет свыше 7,6 млн. публикаций. В ней отражаются более 2,7 тыс. журналов, ~ тыс. печатных и электронных книг и свыше 3,8 тыс.
книжных серий, ~31 тыс. протоколов лабораторных исследований и 265 справочников и справочных изданий, содержащих более 288 тыс. статей.
Имеется возможность поиска: по словам или фразам, по словам в названиях публикаций, по авторам, по годам публикаций, по тематикам.
IOPscIence (Великобритания) [URL: http://journals.iop.org/];
БД IOPscIence (Великобритания) — БД, основой которой являются научные журналы издательства IOP Publishing Британского института физики (Institute of Physics). БД IOPscIence с 1874 г. содержит свыше тыс. публикаций и отражает статьи из более, чем журналов, а также свыше 500 тыс. препринтов.
Имеется возможность поиска: по словам с дополнительным выбором тематики, года и журнала; по выходным данным журналов; по годам публикации; по авторам или их местам работы; по словам в полных текстах, содержащихся в БД; по тематикам.
В контексте данной статьи БД интересна тем, что в ней содержатся журналы, являющиеся ядерными для рассматриваемой области науки (Astronomical Journal, Astrophysical Journal и др).
Wiley Online Library (Великобритания) [URL: http://onlinelibrary.wiley.com/];
БД Wiley Online Library (Великобритания) — политематическая БД, созданная как on-line отображение печатных и электронных изданий международного издательства Wiley-Blackwell, выпускающего научную, техническую, медицинскую и образовательную литературу.
БД Wiley Online Library содержит свыше 4 млн. публикаций из более чем 2 тыс. журналов, ~14 тыс. книг и книжных серий, а также сотни справочных изданий и протоколов лабораторных исследований.
Рис. 1. Динамика потока публикаций по тематике «скопления галактик»:
1 — БД ADS NASA, 2 — БД Scopus, 3 — БД ScienceDirect, 4 — БД SpringerLink, 5 — БД IOPscIence, 6 — БД Wiley Online Library.
Имеется возможность поиска: по словам (в заглавиях, резюме и др.); по годам публикации; по авторам; местам работы авторов; по словам в полных текстах, содержащихся в БД; по названиям журналов (алфавитный порядок); по тематикам и др.
В БД Wiley Online Library, как и в IOPscIence, можно найти публикации из ядерных астрономических журналов (Monthly Notices of the Royal Astronomical Society и др.).
Проведение сравнительного анализа БД — это очень непростая задача, поскольку, как видно из вышеприведенного обзора, все БД имеют свои отличия и особенности. Поэтому проанализируем библиографические БД по наполнению, взяв для примера рассмотрения довольно узкую тематику «скопления галактик» («СГ»). Анализ потока публикаций в БД позволяет оценить состояние работ в определенной тематической области, по выделенному направлению. На рис. 1. приведены результаты исследования динамики потоков по тематике «СГ» в БД ADS NASA, Scopus, ScienceDirect, SpringerLink, IOPscIence и Wiley Online Library (Wiley).
Информационное обеспечение науки: новые технологии Первые публикации по изучению этих объектов относятся к началу XX века, ко времени их открытия. Временной интервал с 1920-х до 1970-х гг. характеризуется небольшим, но стабильным потоком информации. Затем с середины 70-х гг. прошлого столетия начинается плавный рост, который значительно усиливается с 1990-х гг., в связи с запусками технически оснащенных спутников и, как следствие, получением новых наблюдательных данных по этим объектам. Если количественно проанализировать соотношения суммарных потоков в этих БД, то получится, что БД NASA отражает ~ в 4 раза больше информации, чем БД Scopus и БД SpringerLink, в 5,5 раз — БД Wiley, в 18,6 раз — БД IOPscIence и в 124 раза — БД ScienceDirect. Однако если взглянуть какой процент составляет поток по «СГ» от общего наполнения той или иной БД, то «места» распределятся иначе: БД IOPscIence — 0,83%, БД ADS NASA — 0,82%, БД Wiley — 0,34%, БД SpringerLink — 0,24%, БД Scopus — 0,04% и БД ScienceDirect — 0,01%. Хотя все эти данные и не могут полностью отразить наполняемость БД, но могут свидетельствовать о ее направленности, а также о развитии выбранного направления. Отметим, что наиболее полное отражение информации по тематике «СГ» имеет место в специализированной библиографической БД ADS NASA.
Литература 1. Monica M. Grady. Catalogue of Meteorites, 5th ed., Cambridge University Press, 2000, 689 pp.
2. Jean-Claude Mermilliod. Description of a database for stars in open clusters, 1988, Bull. Inform. CDS 35, 77–91.
3. Jean-Claude Mermilliod. The database for galactic open clusters (BDA), 1995, Information & on-line data in astronomy, 127–138.
4. R. Sadat, A. Blanchard, C. Mendiboure. BAX: A dedicated X-Rays galaxy clusters Database, 2003, arXiv:astro-ph 0302171.
5. R. Sadat, A. Blanchard, J.-P. Kneib et al. Introducing BAX: A database for X-ray clusters and groups of galaxies, 2004, A&A, 424, 6. P. Prugniel, P. F. Ortiz, L. Binette et al. HYPERLEDA: a Tool for Studying Galaxies, Mining the Sky: Proceedings of the MPA/ESO/MPE Workshop Held at Garching, Germany, July 31 — August 4, 2000, ESO ASTROPHYSICS SYMPOSIA. Springer-Verlag, 7. G. Paturel, P. Fouque, L. Bottinelli, L. Gouguenheim. An extragalactic database. I — The Catalogue of Principal Galaxies, 1989, A&A Sup. Ser., 80, 299–315.
8. A. Pospieszalska-Surdej, J. Surdej, P. Vron. A non exhaustive bibliography on gravitational lensing. 31 st Lige International Astrophysical Colloquium: Gravitational lenses in the Universe, 1993, p.