«КРУГ ИДЕЙ: РАЗВИТИЕ ИСТОРИЧЕСКОЙ ИНФОРМАТИКИ ТРУДЫ II КОНФЕРЕНЦИИ АССОЦИАЦИИ ИСТОРИЯ И КОМПЬЮТЕР Издательство Московского городского объединения архивов Москва, 1995. ББК 73. К84. Редакционный Совет: д.и.н. Ю.П. Бокарев ...»
В этой связи осталось добавить, что одним из результатов анализа структуры сведений нашего источника явилось формирование двух списков: списка несоответствий сведений и списка противоречий в сведениях. Теперь исследователь может не только отсеивать противоречивую информацию, но и проводить собственный анализ несоответствий и противоречий исходя из поставленных им целей исследования.
Приложение II. Структура семантических несоответствий в
ПРОБЛЕМЫ СОЗДАНИЯ БАЗ ДАННЫХ И НЕКОТОРЫЕ
ИСТОЧНИКОВЕДЧЕСКИЕ ВОПРОСЫ
С развитием компьютерной техники и расширением предоставляемых программным обеспечением возможностей анализа исторических источников, появляется возможность и возникает необходимость создания баз данных, в которых хранится информация источников в удобном для исследования виде. При этом наиболее верным представляется создание не исследовательской базы данных, т.е. такой, в которую входит только та информация источника, которая интересует ученого в данный момент, в данном конкретном исследовании, а источнико-ориентированной базы данных, которая представляла бы собой компьютерную модель содержащейся в источнике информации, доступную для использования при решении "возможно более широкого спектра задач". Особенности средневекового исторического источника и стандартные возможности коммерческих программ заставляют исследователей искать неординарные решения при создании источнико-ориентированных баз данных, разрабатывая специализированное программное обеспечение, позволяющее наиболее полно включать материал источника в базу данных с тем, чтобы максимально сократить потерю информации. С этой точки зрения известна система KLEIO, созданная М.Таллером и специально ориентированная на решение многочисленных проблем, возникающих при работе с нарративными источниками и при обработке больших массивов данных. Программа Я.Олдерволла создана специально для обработки переписей. Ученые работают и со стандартными коммерческими пакетами, создавая целые библиотеки 1. М. Таллер. Что такое "источнико-ориентированная обработка данных"; что такое "историческая информатика"? // История и компьютер: Новые Писцовые книги XVI-XVII вв. Проблемы создания баз данных...дополнительных программ, специально нацеленных на обработку специфических данных - данных исторических источников (Л.Брере).
Таким образом, на современном этапе историк должен уметь работать не только в архиве, делая традиционный источниковедческий анализ, но и с компьютером. С другой стороны, умение смоделировать данные, составить запрос, обработать информацию с помощью математических методов и интерпретировать полученные результаты не исключает, а предполагает профессионализм на уровне первичной оценки исторического источника с точки зрения истории и условий его возникновения, сохранности, структуры, качества сообщаемой информации и т.д.
Создание базы данных (БД) - работа очень трудоемкая, однако она оправдывает затраченные усилия, так как после того, как информация введена в компьютер, можно быстро осуществлять поиск необходимых данных, а также проводить любой необходимый анализ как в СУБД, так и в различных пакетах. БД может быть тематической, т.е. объединять информацию нескольких источников по какой-либо проблеме или теме. Так, по писцовым книгам первой половины XVII в.
Л.В.Миловым, М.Б.Булгаковым и И.М.Гарсковой была создана база данных CADASTR, легшая в основу монографии "Тенденции аграрного развития России первой половины XVII столетия". БД может включать данные одного источника. В случае с писцовыми книгами, содержащими большой объем разноплановой информации, несомненно, что создание такой БД будет оправдано - она будет содержать информацию только одной писцовой книги, но вследствие различного рода текстовых потерь, в ней могут быть объединены данные из различных, иногда разновременных, списков одной и той же книги. Необходимо отметить, что при создании БД возникает множество проблем и вопросов, связанных с формализацией данных, формой их ввода в БД, дублированием информации в различных частях БД, организацией информационные технологии в исторических исследованиях и образовании.
St. Katharinen, 1993. С. 7.
. С. Журавлев, В. Тяжельникова. Проблемы формирования базы данных об иностранных гражданах в СССР (20-30-е годы): использование экспертного знания. // История и компьютер: Новые информационные технологии в исторических исследованиях и образовании. St. Katharinen, 1993.; См.
также: И.М. Гарскова. Базы и банки данных в исторических исследованиях. М.-Геттинген, 1994. Приложение 1. Например, БД AGRAR (с.133), COMANDARM (c.142), DUMA1 (c.153), MILITAR (c.159) и др.
. И.М. Гарскова. Указ.соч. С.138.
ключевых полей, т.е. вопросов, связанных с процессом нормализации.
Однако прежде, чем начинать моделирование данных, необходимо составить представление об источнике.
Писцовые книги обладают определенным формуляром, в соответствии с которым составлялось описание, и представляют собой слабоструктурированный источник. Мельчайшей единицей описания является описание населенного пункта. Группа селений составляет либо описание владения какого-либо типа: поместье, светская или церковная вотчина, либо описание черных, дворцовых или порозжих земель. По каждой такой группе подведены итоги. Различные группы описаний составляют описание стана или волости, по которым также подводятся итоги. Завершается описание итогом по всему уезду.
Описание каждого владения начинается непременно ссылкой на документы о праве на владение землей, а в итоге указываются владения в других местах уезда или страны. С незначительными изменениями, обусловленными условиями составления описания или особенностями уезда, такой формуляр присутствует во всех писцовых книгах.
Писцовые книги Пусторжевского уезда конца XVI и начала XVII в. представлены в архиве в виде списков, подлинники этих книг не сохранились. В писцовой книге конца XVI в. отсутствуют начальные и последние листы, датирующего заголовка нет. Время составления описания упоминается в тексте. Так, из поместья П.Г.Рябинина крестьяне "вышли в Олянский стан в черную волость в нынешнем в 90м году...". В другом месте писцы описывают грамоту, данную Никольскому Плесскому монастырю на владение землями Ошевского стана: "Да Николы ж чюдотворца Плиского монастыря игумен Нафанаил з братьею клал на ту монастырскую землю государя царя и великого князя Ивана Васильевича всея Руси жаловалную грамоту нынешнего году за приписью дьяка Ондрея Щелкалова...". Таким образом, уезд описывался не менее двух лет - в 1582 и 1583 гг. Имена писцов в тексте книги не упоминаются. Они восстанавливаются по актовому материалу. 10 октября 1605 г. Плесскому Никольскому монастырю была. РГАДА. Ф.2309. К № 8183. Л.784-784об.
. Там же. Л.427-427об.
Писцовые книги XVI-XVII вв. Проблемы создания баз данных...
дана Лжедмитрием I тарханно-несудимая грамота. Такую же тарханнонесудимую грамоту получил в год составления описания уезда игумен Нафанаил от Ивана IV. Текст грамоты был полностью скопирован писцами и сохранился в тексте писцовой книги. Поскольку в 1605 г.
челобитье другого игумена того же монастыря - Пимина - состояло в том, чтобы "старую грамоту на Борисово имя Годунова" переписать на имя Лжедмитрия I, постольку можно заключить, что в правление Б.Годунова грамота, подтверждающая привилегии монастыря, была дополнена выпиской из писцовой книги: "А по выписи из Пусторжевских писцовых книг, писма и дозору Игнатья Зубова с товарыщи лета 7091, в Ошевском стану написано...". Текст выписи полностью совпадает с описанием владений монастыря в писцовой книге. Тождество текстов позволяет не только выяснить, кто описывал уезд в начале 80-х гг. XVI в., но и дополнительно подтвердить дату составления описания. Подъячий Григорий Гаврилов, скрепа которого стоит на полях списка № 8183, вместе с князем Семеном Даниловичем Шеховским описывал Пусторжевский уезд в 1627гг.. Список № 8167 скреплен дьяком Венедиктом Маховым, который был дьяком Поместного приказа в 1622-1633 гг.. Время, когда работали в Поместном приказе В.Махов и Г.Гаврилов, позволяет говорить о том, что перед нами списки с писцовой книги, выполненные в 20-е годы XVII в. На это указывает также и бумага, на которой сделан список № 8167. Таким образом, списки были составлены не позднее 1627 г., когда началось описание, и не раньше 3 мая 1626 г., когда сгорел архив Поместного приказа, результатом которого явилось то, что большинство дошедших до наших дней писцовых книг XVI в. являются сделанными с сильно. АИ. Т.II. № 347.
. РГАДА. Ф.1209. К № 8183. Л.427-430об.
. Там же. Л.415-424об.
. Об Игнатии Зубове известно, что в 1578-1579 гг. он был дьяком Поместного приказа, в 1584-1585 гг. описывал г.Арзамас и Арзамасский уезд. // С.Б. Веселовский. Дьяки и подъячие XV - XVII вв.
М., 1975.
. АПД. Т.2. Вып.1. М., 1917. № 8 - 1627-1635 г."
. С.Б. Веселовский. Дьяки и подъячие. XV - XVII вв.
поврежденных оригиналов приправочными списками с писцовых книг.
Не исключение и Пусторжевская книга. Внимательный текстологический анализ списков, их дословное сравнение, дьяческие скрепы на полях приводят к выводу, что сохранившиеся после пожара листы были механически собраны и переписаны. Так, выясняется, что расположенное в одном стане поместье П.А.Пушечникова записано следующим образом: итог на листах 138об-139об, сами селения после итога на листах 139об-150; поместье Г.С.Боброва - начало на листах 248об-249об, а окончание и итог - 254об-255; поместье Ф.Я.Кустова - начало на листах 823об-830об, окончание и итог - 368об-369;
поместье З.И.Елагина - начало на листах 602-602об, продолжение и итог - 811-813об. Подобное дробление коснулось не только отдельных поместий, но и целостности описаний станов. Таким образом, потери текста в книге двоякого рода: во-первых, то, что было уничтожено пожаром, и, во-вторых, то, что пропало уже в архивах, где были утеряны последние тетради обоих списков.
По содержанию список № 8183 охватывает большее количество поместий, чем список № 8167. Так, после описания поместья Ивана Юрьевича Карамышева, которым обрывается список № 8167, список № 8183 сохранил итоги по Кудеверскому стану, описание поместья, данного пятнадцати заволоцким рассыльщикам, и некоторых других, расположенных в Борутском и Полисском станах.
Описание города неполно в обоих списках, но содержание и скрепа на полях списка № 8167 свидетельствуют о том, что в нем были утеряны первые 3 листа. Кроме того, первый из сохранившихся листов настолько потемнел, что фактически не читается. Описание города занимает в этом списке 23 листа, в списке № 8183 - только 13, в нем утерян текст, расположенный на листах 14-16об списка № 8167. Текст, посвященный описанию уезда, дословно совпадает в обоих списках. Но в списке № 8183, кроме дефектов, о которых было сказано, при соединении были перепутаны местами тетради, в результате чего часть текста пропала. Сравнение списков позволило восстановить первоначальный порядок расположения тетрадей.
. Указная книга Поместного приказа. // Историко-юридические материалы, издаваемые Архивом Министерства Юстиции. Вып.I. М.,1889. С.27. См.
также: В.Б. Павлов-Сильванский. Писцовые книги России XVI в. М., 1991.
Писцовые книги XVI-XVII вв. Проблемы создания баз данных...
Писцовая книга начала XVII в. явилась результатом описания Пусторжевского уезда в 1627-1628 гг. князем Семеном Даниловичем Шеховским и подъячим Григорием Гавриловым. Она также сохранилась в двух списках. Первый список - второй половины ХVII в.. Он дошел до нашего времени не полностью. Первый лист имеет номер "в", т.е.
второй, и на нем записано описание итога по поместью Луки Головина. Отсутствует также лист 8. Вся книга написана скорописью второй половины XVII в. на бумаге с филигранью "шут" - наиболее распространенной на протяжении всего XVII в. Первые 332 листа скреплены дьяком Борисом Протопоповым. На листе 333 стоит дата "194-го апреля в 13 день" (13 апреля 1686 г.) и далее список до конца, т.е.до 599 листа, скреплен дьяком Анисимом Невежиным.
Вероятно, этот список был составлен в период подготовки и проведения описания и межевания земель 1684-1687 гг. Второй список - XVIII в.. Сверху на первом листе написано: "Из межевой канцелярии 17 октября 1740 принята" и дальше идет полный заголовок: "Копия с писцовой пусторжевской книги писма и меры князь Семена Шеховского да подъячего Григорья Гаврилова 135, 136 и 137 году". Копия снабжена подробным оглавлением. Она - полная, в ней присутствуют листы, отсутствующие в списке XVII в.
Текстологический анализ списка XVII в. показывает, что пропусков в тексте нет, за исключением двух указанных утерянных листов. При этом на протяжении всей книги стоят пометки: "С подлинными книгами счол такой-то". В одних случаях указаны только имена тех, кто "счол" - Хрисанко Игнатьев (л.71об), Митка Воронов (л.332об), в других - указаны еще и главы, которые были сверены: с 26 по главу (л.139об), с 103 по 155 главу (л.201об).
При создании баз данных основным, определяющим для нас моментом была структура самого исторического источника и характер сообщаемой им информации. С одной стороны, данные писцовых книг условно можно разделить на два уровня: информация о землевладельце и информация о населенном пункте. Связующими моментами между этими. Состоящие из отдельных тетрадей, книги имеют одинаковый формат - в четвертку, написаны разными почерками конца XVI - начала XVII вв.
Список № 8167 насчитывает 880 листов, № 8183 - 824 листа.
. РГАДА. Ф.1209. К № 8168.
. РГАДА. Ф.1209. К № 822.
двумя уровнями являются имя землевладельца и название стана или волости, в которых расположены принадлежащие этому землевладельцу населенные пункты. С другой стороны, данные каждого уровня можно разделить на два типа: информация статистического характера и описательная. Таким образом, стуктура БД должна отражать описанную структуру писцовой книги и присущие каждому типу данных особенности. Логичная структура самого источника позволила минимизировать процесс нормализации данных, которые были приведены к отношению в первой нормальной форме, т.е. были удалены повторяющиеся группы, составившие первичный ключ связи между файлами. Поля, составившие ключ, - имя землевладельца и название стана. По этим полям может осуществляться поиск информации в БД:
имя землевладельца позволит извлечь все необходимые данные для анализа поместья или вотчины в целом, а населенные пункты сами по себе, без ссылки на владельца, дают представление о составе селений уезда, их категориях по населенности и хозяйстве каждого из них. В наиболее общем виде структура базы данных представлена на рис.1, из которого также видно, что базы данных по писцовым книгам Пусторжевского уезда являются реляционными.
Первый файл является справочным, он содержит только два поля : имя землевладельца (фамилия, имя, отчество) и название стана.
Второй файл - основной. В нем заключена информация, ориентированная на населенный пункт. Поля этого файла можно. Подробно о теории проектирования базы данных см.: Гарскова И.М. Указ.
Писцовые книги XVI-XVII вв. Проблемы создания баз данных...
разделить на несколько групп. Первое поле - это номер листа в источнике. Вторая группа полей - название населенного пункта (иногда два или даже три), его категория - сельцо, деревня, пустошь и др., географические ориентиры - в каком стане расположено, реки или озера, возле которых находится селение, иногда указывается, на какой границе оно лежит (псковский рубеж, невельский рубеж и т.д.). Третья группа полей связана с владением.
Это тип владения (поместье, вотчина (светская или церковная), для книги конца XVI в. - поместье или церковная вотчина) и владелец на момент описания и один или два предыдущих, иногда с указанием степени родства, а также один или несколько владельцев у селения и какой частью каждый из них владеет. Четвертая группа полей касается хозяйства и содержит статистическую информацию:
количество дворов по категориям (владельческие, холопские, крестьянские, бобыльские, пустые), численность населения (число мужчин во дворе), сведения о пашне (качество земли, количество пашни паханой, переложной, наезжей, лесом поросшей), размер сенокосных угодий, оклад. Наконец, последнее поле - поле примечаний. Сюда заносилась информация, не укладывающаяся в структуру полей, но представляющая интерес. Это данные об угодьях и числе владельцев этих угодий, о церквях, лесе, сенокосных местах. Сведения о лесе вносились именно в это поле потому, что единицы измерения лесных угодий в писцовых книгах очень своеобразны (поверстный лес, десятинный и т.д.) и могут быть интересны и значимы только для общей оценки наличия лесных угодий.
Третий файл содержит информацию о землевладельце. Он также может быть разбит на несколько групп полей. Первая - о помещике. В этой группе полей собрана, в основном, информация заголовков описаний владений: имя землевладельца, статус (т.е. недоросль, иногда с указанием возраста, на прожитке, вдова, редко имеются сведения о служилом чине, для книги конца XVI в. - время испомещения: старый пусторжевец или новый помещик), документы на владение землей (тип грамоты, кем подписана, год выдачи) - эти сведения есть только в книге начала XVII в. Вторая группа полей содержит статистическую информацию о поместье или вотчине в целом.
Здесь собраны данные итогов описаний владений: общее количество соч.Ч 2.
дворов на владение, населенность владения, общая площадь пашенных и сенокосных угодий. При этом в одном поместье могла быть земля разного качества, поэтому данные о пашне сгруппированы, как и в источнике, по качеству земли с подведением общего итога. Последнее поле, как и во втором файле, поле примечаний. Сюда вносилась информация о том, в каком еще стане Пусторжевского уезда или прилегающем районе имеются владения у данного помещика, а также другая информация, не укладывающаяся в описанную структуру.
При создании баз данных большая проблема связана с вводом повторяющейся информации. Ввести одну и ту же информацию в БД несколько раз и избежать при этом ошибок достаточно сложно, точность же ввода данных, а, значит, их непротиворечивость, очень важна, особенно на стадии обработки информации, содержащейся в БД.
Чтобы избежать дублирования данных и сэкономить место в памяти компьютера, исследователи обычно решают эту проблему путем организации не одного, а нескольких файлов, логически связанных друг с другом через ключевые поля, и один или несколько файлов в такой структуре являются справочными, содержащими те данные, которые в однофайловой структуре БД пришлось бы повторять. В базах данных по писцовым книгам Пусторжевского уезда конца XVI и начала XVII вв. таким справочным файлом, как было отмечено, является первый файл, содержащий имена землевладельцев и названия станов и волостей внутри уезда. При этом данный файл организован таким образом, что каждая его запись содержит комбинацию из трех полей:
1) имя землевладельца, 2) название стана или волости, 3) код комбинации первых двух полей. Выделение этого файла связано в основном с тем, чтобы не повторять имена землевладельцев и названия районов внутри уезда во втором и третьем файлах, а заменять их кодом.
Структура обоих баз данных по писцовым книгам Пусторжевского уезда схожа. Различие состоит лишь в количестве полей, которое в свою очередь обусловлено особенностями каждой из книг.
Отличия в первом файле связаны с названиями станов. Письмом 80-х гг. в Пусторжевском уезде были розданы в поместья черные волости. Поэтому итоги по отдельным административным единицам подводились иначе, чем в начале XVII в. Так, в книге 1582-1583 гг.
каждый стан внутри еще делится на волости черных или поместных земель, и итоги подведены по каждой такой волости. Отсюда и первый Писцовые книги XVI-XVII вв. Проблемы создания баз данных...
файл этой БД содержит 4 поля: имя землевладельца, название стана, название волости и код. Что касается информации третьего файла, то в писцовой книге 1582-1583 гг. нет сведений о документах на право владения помещиками землей, что обусловлено приправочным характером списков с этой книги. В книге же 1627-1628 гг. эта информация довольно часто встречается даже дважды на одно описание поместья, т.к. помещик имел несколько разновременных документов на разные части своего поместья. В книге 1582-1583 гг. есть подробные данные о размере поместного оклада и о том, какая часть этого оклада "не дошла", причем эти данные приведены для каждого землевладельца. В книге же 1627-1528 гг. применена другая система:
в самом конце есть список помещиков, у которых "после перечневого списка" "объявилась примерная земля". В книге 1582-1583 гг. более сложен итог по поместью: в селениях пашня исчисляется в обжах, а в итоге приведена суммарная информация о разных категориях пашни в обжах и общая цифра пашни паханой и в пусте в четвертях. Кроме того, в книге конца XVI в. гораздо подробнее описана живущая пашня: пашня паханая владельческая и крестьянская, пашня паханая "из четвертного оброку", наездом, "наездом из четвертного оброку".
В книге же 1627-1628 гг. - пашня паханая владельческая и крестьянская, наезд.
Что касается второго файла, то, во-первых, в селениях пашня описана по тем же категориям, что и в итогах, о чем было сказано выше. Во-вторых, особенностью книги 1582-1583 гг. можно назвать очень подробную фиксацию причин запустения того или селения.
Поскольку эта информация очень интересна и важна, особенно если учесть, что Пусторжевский уезд расположен на границе с Литвой, то она была включена в БД в виде отдельного поля.
При заполнении БД также возникают вопросы, связанные в формой ввода данных. Далее мы остановимся на некоторых из них. Первый вопрос связан с вводом номера листа в источнике. Как уже отмечалось, обе писцовые книги дошли в списках и содержат утраты текстов. При этом сравнение списков позволяет наиболее полно ввести информацию. Для этого один из списков был выбран за основу:
список № 8183 книги 1582-1583 гг. и список XVII в. для книги 1627гг. В случае, когда данные вводились из другого списка, то перед номером листа источника ставилась цифра (2).
Второй вопрос связан с именем землевладельца. Как уже было отмечено, имя землевладельца является одним из ключевых полей, по которому осуществляется поиск информации. Программное обеспечение, на котором создавались базы данных по книгам Пусторжевского уезда, таково, что, для того, чтобы компьютером была найдена вся содержащаяся в БД информация по владениям того или иного помещика, необходимо, чтобы во всех записях имя одного и того же землевладельца было написано одинаково. Отсюда вытекает еще одна причина организации дополнительного файла (первого), в котором это имя записано минимальное количество раз, чтобы по возможности избежать ошибок. Однако известно, какова была грамматика в XVI и XVII вв. Значит, прежде, чем вводить данные, необходимо проверить разночтения в именах. Так, например, фамилия "Монастырев" в книге 1627-1628 гг. встречается в пяти различных написаниях: Манастырев, Мнстрев (с выносной "с"), Монастырев, Мнстырев (с выносной "с"), Монастырв; фамилия Шаховской - Шахавской, Шеховской, Шаховской;
фамилия "Бухвостов" как Бухвостов и как Бухвастов и т.д. При внимательном анализе видно, что, например, Орина Шаховская и Орина Шеховская - одно и то же лицо, т.к. если сравнить указанные в итогах сведения о владениях (стан и размер), то оказывается, что данные во всех случаях совпадают: и первое лицо и второе владело 63 четями в Кудеверском стану и 7 четвертями в Оршанском. Отличие же одной буквы приведет к тому, что О.Шаховская и О.Шеховская будут восприниматься компьютером как два разных человека. Поэтому перед вводом данных были проанализированы такие разночтения, и все фамилии были приведены к одному виду. Возможность проведения такой идентификации объясняется еще и тем, что писцовая книга - это замкнутый источник, содержащий данные об ограниченном круге лиц, испомещенных в данном уезде, и предоставляющий дополнительные возможности для выводов о том, кто есть кто, в виде перечней.
Еще одна проблема возникла при вводе данных о причинах запустения по писцовой книге 1582-1583 гг. При всем разнообразии эти причины сформулированы в источнике достаточно лаконично и унифицированно для того, чтобы счесть наилучшим решением выделение отдельного поля и ввод в него всего текста. Например, две причины "запустели те деревни лет з десять" и "запустели те деревни лет с тринадцать" объясняют 8 % запустения селений в уезде. Формулировка источника "дворы сожгли и крестьян побили литовские люди" Писцовые книги XVI-XVII вв. Проблемы создания баз данных...
описывает причину гибели 14 % всех крестьян-дворохозяев уезда. Еще о 103 дворохозяинах сказано, что они "сошли от войны литовских людей".
Наконец, еще один вопрос связан с единицами измерения пашни.
В БД по книге 1582-1583 гг. размер пашни вводился в обжах и четвертях, пересчитывались только доли обжи или четверти (пол, полпол, полполпол). В БД же по книге 1627-1628 гг. размер пашни пересчитывался из четвертей в десятины.
Ввод в компьютер информации такого источника, как писцовые книги позволяет удобно и быстро анализировать его информацию не только для изучения социально-экономического развития России, но и более точно и быстро проводить источниковедческий анализ, хотя в этом случае все равно не обойтись без предварительного изучения самого текста источника. Предварительный анализ представляется необходимым, когда речь идет о средневековом источнике вообще и об источнике такой сохранности, как писцовая книга Пусторжевского уезда 1582-1583 гг., в частности. Ученые XIX и XX в. считали ее непригодной для какого-либо серьезного анализа. Данные этой писцовой книги были использованы В.Л.Яниным и Л.А.Бассалыго в совместной статье, посвященной выяснению границ уезда в XV в..
Однако, к сожалению, авторы не дали критики этой писцовой книги, "значительные дефекты" которой - это не только выпадение текста, а и очень сложные его перестановки, что вкратце уже было указано выше (подробное оглавление книги, в котором видны наиболее существенные дефекты, приведено в приложении), и списки не "идентичны вплоть до перестановки нескольких листов", о чем также уже было упомянуто. Мое знакомство с источником и отсутствие его критики в статье В.Л.Янина и Л.А.Бассалыго сразу ставит вопрос о том, на каком основании тот или иной населенный пункт был отнесен к тому или иному стану или волости. В оглавлении книги 1582- гг., приведенном в приложении, видно, как были раздроблены. Н.А. Рожков. Сельское хозяйство Московской Руси в XVI в. М.,1899.
С.502; С.В.Рождественский. Служилое землевладение в Московском государстве в XVI в. СПб., 1897. С.237, 269, 370-371; Н.Б. Шеламанова.
Образование западной части территории России в XVI в. в связи с ее отношениями с Великим княжеством Литовским и Речью Посполитой. Дисс.
на соиск. уч. степ. канд. ист. наук. М., 1970. Гл. 4. С. 6.
. В.Л. Янин, Л.А. Бассалыго. Пусторжевская земля в XV веке: территория и границы // Отечественная история. 1993. № 5.
описания, естественно, что установить в каком месте о каком стане идет речь стало возможным после тщательного источниковедческого анализа, проведенного с использованием базы данных.
Первый этап работы с источником - работа в архиве - позволил выяснить, в каком виде дошли до настоящего времени списки с писцовой книги 1582-1583 гг. и поставил перед необходимостью установить, насколько отывочны сведения, сообщаемые этой книгой.
Второй этап работы был связан с обработкой БД по книге 1582гг. с целью ответить на вопрос о полноте ее сохранности.
Для начала нужно отметить, что особенностью письма начала 80-х годов в этом районе России является то, что этим описанием испомещались "в Пусторжевском и в Невельском уезде" "дети боярские немецких городов, которые выведены из немецких городов". Видимо, эти два уезда описывались вместе, почему в росписях указываются владения помещиков также и в Невельском уезде. "Дети боярские немецких городов" испомещались еще в Великолуцком уезде, где им были розданы в поместья черные и дворцовые волости, в то время, как в Пусторжевском уезде - черные волости и порозжие поместные земли. Само появление этой категории помещиков в писцовых книгах связано с политикой служилого землевладения, проводившейся в годы Ливонской войны на вновь присоединенных, а затем утерянных Россией территориях. Описание стана в Пусторжевской писцовой книге 1582-1583 гг. делится на категории помещиков, во-первых, по времени испомещения ("старые пусторжевцы" или "новые помещики немецких городов") и по отношению к службе (с одной стороны, новые помещики немецких городов, старые пусторжевцы, с другой - новики, недоросли), во-вторых, относительно земель, на которых они испомещены (черные или поместные). По каждой группе поместий подведены итоги, которые складываются в общие итоги по станам, объединенные в итог по уезду. В общие итоги по станам не входят сведения о поместьях, данных в черных волостях, а также о монастырских вотчинах.
Затем было установлено, где это возможно, в каком стане расположено каждое из описанных поместий. Такую возможность дают росписи поместья в итогах, где в конце обязательно указано, в. РГАДА. Ф.1209. К № 8167. Л.10.
. РГАДА. Ф.1209. К № 244. Л.1022, 1079об, др.
Писцовые книги XVI-XVII вв. Проблемы создания баз данных...
каком еще стане Пусторжевского, а также Невельского уезда, есть поместья у данного служилого человека, и сколько там он имеет пустой и живущей земли. Соответственно стан, к которому принадлежит данное описание, в этом списке отсутствует. Если поместье расположено в нескольких станах, то сравнение таких записей позволяет определить, к какому стану какое описание относится. Например, у князя Ивана Федоровича Оболенского поместье расположено в трех станах Пусторжевского уезда, описаний же в книге сохранилось только два. В одном из них - в итоговой записи названы поместные земли Борутского стана, Пятницкого стана, Часепского стана Невельского уезда, в другом - поместные и черные земли Борутского стана, Часепский стан Невельского уезда. Значит, в первом случае описание принадлежит к черным землям Борутского стана, во втором - поместным землям Пятницкого стана, а описание части поместья, расположенного в поместных землях Борутского стана, не сохранилось. Некоторые поместья лежат в двух станах, и часто в итоговой записи названы оба, так что сразу ясно, о каком стане идет речь в конкретном итоге. Например, после описания поместья Ивана Даниловича Горяинова сказано: "Да за ним же поместья в Борутском стану... И всего за Иваном в дву станех, в Ошевском да в Борутском стану...". То есть цитированная часть итога относится к описанию части поместья, находящейся в Ошевском стану, а другая часть поместья расположена в Борутском стану, и она описана на лл.818-819об.
Далее на языке dBASE мной была написана программа, которая подсчитывала число сел, деревень, починков, селищ, пустошей, дворов крестьянских, помещичьих, бобыльских и людских, количество пашни паханой, переложной и лесом поросшей в каждом поместье. При этом данные из БД отбирались по уже выясненным условиям: имени землевладельца и названию стана или волости, в которой эта часть поместья расположена, и расчеты делались для каждой части поместья. Программа не только делала расчет, но и записывала результаты в третий файл - файл "землевладелец". Полученные результаты сравнивались с итогом по каждому поместью. Равенство значений свидетельствовало о полной сохранности описания. Кроме. РГАДА. Ф.1209. К № 8183. Л.28об-29, 263об.
. Там же. Л.398об.
того, выяснялось, насколько точно суммировались данные самими писцами. И здесь нужно отметить, что во всех случаях, когда описание части поместья сохранилось полностью, расхождений между теми цифрами, которые рассчитывал компьютер, и теми данными, которые приведены в книге, обнаружено не было.
Далее - программа была несколько видоизменена: она подсчитывала число сел, деревень, починков, селищ, пустошей, дворов крестьянских, помещичьих, бобыльских и людских, количество пашни паханой, переложной и лесом поросшей в каждой группе поместий. Полученные результаты были опять сравнены с итогом, но теперь уже по каждой группе поместий. Равенство значений свидетельствовало о полной сохранности описания. В результате всех этих вычислений было выяснено, что из восьми сохранившихся описаний станов, полностью присутствуют описания поместных земель четырех из них: Оршанского, Пятницкого, Ошевского и Кудеверского (а не только Пятницкий стан, как считают В.Л.Янин и Л.А.Бассалыго). Описания черных волостей этих станов сохранились не полностью, за исключением Столбушенской волости Оршанского стана. От Кудеверской черной волости уцелело одно описание, итоговые записи позволяют выяснить, что еще 7 человек имели там поместья; от Засоротской волости Оршанского стана - 7 поместий, владельца устанавливаются по итогам. Описания остальных четырех станов (Борутского, Ополенского, Влитского, Полисского) фрагментарны. Сравнение писцовой книги конца XVI в. и книги начала XVII в. показывает, что полностью отсутствует описание Подгородного, Туровского, Олянского, Остренского станов и черных волостей Борутского и Полисского станов. Должна была быть описана еще и Долысская волость. Однако она была утеряна Россией в начале XVII в., и в описании 1627-1628 гг. по этому поводу сказано: "Да Пусторжевского уезду была Долысская волость в поместье за луцкими помещики за Маем Козловым да за Олексеем Бибиковым с товарыщи, и тою волостью завладели с Невля литовские люди и о том к государю царю и великому князю Михаилу Федоровичу всеа Русии изо Ржевы Пустые писано. И во 135 году сентября в 24 день прислана государева царева и великого князя Михаила Федоровича всеа Русии грамота за приписью дьяка Венедихта Махова, а по той. В.Л. Янин, Л.А. Бассалыго. Указ. соч.. С. 112.
Писцовые книги XVI-XVII вв. Проблемы создания баз данных...
государеве грамоте тое Долысские волости писати не велено, а сколько в ней четвертные пашни и того не ведомо и в приправочных книгах тое Долысские волости не написано".
Cовершенно непонятно, как В.Л.Янин и Л.А.Бассалыго пришли к выводу, что Острейский и Подгородный станы "были приписаны к Пусторжевскому уезду из Невельского между 1582 и 1626 гг., поскольку в 1582/1583 гг. Острейский стан... числился в Невельском уезде, а Подгородный стан (окрестности города Заволочье), отделенный от Пусторжевского уезда Острейским станом, скорее всего также входил в Невельский уезд, хотя город Заволочье и являлся административным центром Пусторжевского уезда (его описание входит в книгу 1583 г.)". Таким образом, авторы утверждают, что, хотя город Заволочье и являлся административным центром Пусторжевского уезда и был описан в книге конца XVI в., что совершенно верно, стан же, расположенный вокруг этого города, относился в другому, соседнему Невельскому, уезду. Трудно поверить в существование на границе России с другим государством подобного анклава в XVI в. Что касается Острейского стана, то несколько выше авторы пишут, что в книге 1583 г. есть неоднократные ссылки на то, что Острейская волость входила в состав Невельского уезда, однако ни одного примера или хотя бы ссылки на источник не приведено. Из 880 листов одного списка и 824 листов другого Острейская волость вместе с Невельским уездом упоминается только в двух местах. В первом случае написано в итоге по поместью Н.Ф.Шишкина: "Да за ним же поместья в Острейской черной волости черных деревень пашни паханые и в пусте 2 обжи без полчети, а четвертные пашни 63 четей с осминою. И всего за Неудачею в Пусторжевском уезде помесных земель и в черной волости пашни паханые и в пусте 14 обеж с четью и полполполтретью обжи, а четвертные пашни 250 чети бес полуосмины. Да за ним же поместья в Невелском уезде в Невелском стану 28 чети. И всего за Неудачею в Пусторжевском и в Невелском уезде пашни паханые и в пусте 278 четей без полуосмины...". Из этого текста видно, что Острейская волость не имеет никакого. РГАДА. Ф.1209. К № 8168. Л.599.
. В.Л. Янин, Л.А. Бассалыго. Указ. соч. С.112.
. РГАДА. Ф.1209. К № 8183. Л.284 об.
отношения к Невельскому уезду. В другом месте сказано в итоге по поместью Шарапа и Ондреяна Андреевичей Ивачовых: "Да за ними же поместья в черной в Острейской волости черных деревень да в Невельском уезде, а пашня и оклад писан подлинно в Острейской волости под их поместьем". Отсюда также не следует, что Острейская волость принадлежала Невельскому уезду. И, наконец, в итоге по поместью С.В.Дубровского и И.И.Маврина записано: "Да за ними же поместья в Острейской в черной волости черных деревень да в Кудеверской в черной волости черных деревень поместья, а пашня и оклад подлинно писан в черной в Острейской волости под его поместьем".
Из приведенных текстов итогов, кроме того, вытекает и другой вывод, что черная Острейская волость была также роздана письмом 80-х гг. в поместья, но ее описание вообще не сохранилось. По поводу Туровского стана в книге 1627-1628 гг. прямо сказано: "А помесных земель в ней не было, все черные волости были".
Возможно, были черными и Подгородный и Олянский станы и, значит, как и Туровский стан, вообще не описывались письмом 80-х гг.
В заключение было проведено сравнение становых итогов и общего итога по уезду, что показало: в списках с писцовой книги Пусторжевского уезда 1582-1583 гг. сохранилось около 60 % описания поместных земель, о полноте описания черных волостей было сказано выше. Результат же всех вычислений - оглавление писцовой книги 1582-1583 гг., представленное в приложении.
Подобным же образом мной была обработана писцовая книга 1627гг. По поводу этой книги нужно сказать, что она представляет собой книгу оптимального варианта согласно классификации, предложенной Л.В.Миловым. Основной чертой этого типа писцовых книг 20-х гг. XVII в. является то, что в них "с одной стороны, реализована система расчета и распределения тягловых окладов, опирающаяся на исходные данные о численности крестьянских и бобыльских дворов, с другой стороны, в силу традиции и точного исполнения боярского приговора 28 мая 1627 г. в данном варианте писцовых книг содержится весь комплекс сведений о категориях. Там же. Л. 352.
. Там же. Л. 763 об.
. РГАДА. Ф. 1209, К № 8168, л. 546 об.
Писцовые книги XVI-XVII вв. Проблемы создания баз данных...
"четвертной земли" и угодий". Не вдаваясь в подробные расчеты, свидетельствующие о том, что книга Пусторжевского уезда 1627- гг. действительно относится к этому типу книг, приведу несколько примеров. Итоги каждого поместья и стана подведены как по формуле "сошного писма в живущем и в пусте" столько-то, так и по формуле "а платить з живущего" с такого-то размера пашни. Первая формулировка относится к сошному письму, а вторая к живущей четверти. По докладу из Поместного приказа от19 марта 1630 г. во Ржеве Пустой было велено положить "на живущую пашню" против Кашина, т.е. 8 дворов крестьянских и 4 двора бобыльских. Однако, уже 29 октября 1630 г. "бедные и разоренные холопи твои, пусторжевские помещики все городом" подали челобитную, в которой, ссылаясь на крайнее разорение и порубежное расположение, просили, чтобы уезд "отверстати в платеже от Мещовска и Мядыни для нашие бедности и разорения, што б наши бедные крестьянишки, которые призваны на льготу после разорения, за рубош в Литву не розбрелися". И 30 ноября поступил указ положить в живущую четверть в Пусторжевском уезде "против Мещовска и Медыни" дворов крестьянских и 8 дворов бобыльских. Расчеты показывают, что, действительно, формула "платить с живущего" связана с живущей четвертью. Например, в итоге по поместью А.И.Дубровского в Венеболоцкой волости сказано, что за ним 5 дворов крестьянских и дворов бобыльских, а "платить з живущего с осмины без полчетверика пашни". Если пересчитать четверть в бобыльские дворы, она составит 32 бобыльских двора. У А.И.Дубровского в пересчете было 15 бобыльских дворов. Значит осмина составит 16 бобыльских дворов, а полчетверика - 2. В результате получаем, что один бобыльский двор не был учтен. В итогах по станам также дается и сошное письмо, и живущая четверть. Так, например, в итоге по Подгородному стану сказано: "А по государеву цареву и великого князя Михаила Федоровича всеа Русии и отца ево государева великого государя святейшего патриарха Филарета Никитича Московского и всея Русии указу платити изо всего Подгородного стану з живущего с трех.Л.В. Милов, М.Б. Булгаков, И.М. Гарскова. Тенденции аграрного развития России первой половины XVII столетия. М., 1986. С. 132.
. АПД. Т.II. М., 1917. C.160.
. Там же. С. 181.
четвертей и с четвериком и с полполчетверика пашни". В этом же стане в итоге записано наличие 35 крестьянских и 31 бобыльского двора. Исходя из живущей четверти в 12 крестьянских и 8 бобыльских дворов, 24 крестьянских и 16 бобыльских дворов составят 2 живущих четверти, оставшиеся 11 крестьянских и 15 бобыльских дворов составят еще одну четверть, и в остатке будет 5 бобыльских дворов, 4 из них - это четверик (или восьмая часть четверти) и 1 двор полполчетверика (или тридцать вторая часть четверти). Во всех итогах указывается сошное письмо, но только в пяти становых итогах - по Оршанскому, Ошевскому, Пятницкому, Туровскому станам и Столбушенской волости - указан размер сохи, который оказывается разным для разных волостей. В Столбушенской волости соха составляет 950 четвертей: "А положено в Столбушенской в черной волости в соху четвертную пашню против приправочных книг Игнатья Зубова с товарыщи 90-го году по 950 четей". В Оршанском, Ошевском и Пятницком станах "положено четвертные пашни в сохи по 450 четей против приправочной книги". В Туровском же стане размер сохи стандартен: "А положено в Туровском стану четвертные пашни в соху по 800 четей, потому что в нем мешалась добрая и середняя земля с худою землею, а помесных земель в ней не было, все черные волости были". Действительно, в Туровском стане общий итог пашни в четверти приблизительно равен сошному письму в "3 сохи с четвертью и полчети и полполчети сохи, а перешло 22 чети и малой третник пашни". Исходя же из размера сохи в Столбушенской волости в четвертей, общий размер пашни в 3035,625 четей равен сошному письму "в живущем и в пусте 3 сохи с полчетью и полполчети сохи, а перешло за сошным письмом 7 четей с полтретником".
Программа, подобная применявшейся для БД по книге 1582- гг., была написана и для БД по книге 1627-1628 гг. Она также суммировала данные о числе сел, деревень, пустошей, количестве дворов владельческих, холопских, крестьянских и бобыльских, площади пашни паханой владельческой и крестьянской, наезда,. РГАДА. Ф. 1209. К № 8168. Л. 93 об.
. Там же. Л. 187об, 383об, 515.
Писцовые книги XVI-XVII вв. Проблемы создания баз данных...
перелога и пашни лесом поросшей по пометьям. Также, как и в БД по книге 1582-1583 гг., суммировались данные, выбранные из всего комплекса для каждого землевладельца в каждом стане или волости.
Целью этих расчетов было получить в итоге и записать в файл "землевладелец" действительные данные о пашне. Дело в том, что, как уже было вскользь отмечено, в конце книги есть список из помещиков, у кого обнаружилась примерная земля. Как сказано в изложении текста указа в книге, "те их дачи одобрены, а из дач земли не убавлено", и в списке приведена разница между действительной пашней, т.е. площадью пашни худой или средней земли, и той, которая дана в перечне по каждой части поместья в виде пашни доброй земли. Так, например, у Б.Е.Патрушева поместье расположено в двух станах: в Подгородном и в Радежской волости. В Радежской волости он владеет тремя жеребьями в одной деревне с площадью пашни худой земли 100 четвертей. А в Подгородном стане ему принадлежат две деревни и пустошь. В деревне Черепягина за ним записано: "пашни паханые худые земли 2 чети, перелогу 2 чети, лесом поросло 20 четей в поле, а в дву по тому ж. И всего пашни худые земли 24 чети, а доброю землею с наддачею 16 четей в поле, а в дву по тому ж". Так же одобрена земля и во второй деревне и в пустоши. В итоге же по части поместья в Подгородном стане приведены данные только о пашне "доброй земли". И получается, что по итогам Б.Е.Патрушев владеет в Пусторжевском уезде четвертями доброй и худой земли, а на самом деле - 184 четвертями худой. И вот эта разница в 28 четвертей приведена в списке владельцев примерной земли. Для составления действительной картины и были предприняты расчеты с помощью специальной программы.
Сравнение данных, полученных в результате расчетов, с данными самой книги показало крайнюю неравномерность в точности вычислений как в размере пашни, так и в количестве крестьянских и бобыльских дворов. Применение системы одабривания уже при описании селений склоняет меня к мысли, что более точно были описаны все населенные пункты, а на итоги обращалось меньшее внимание. Да, видимо, пропуск в итоге одного или двух дворов и не играл большой роли, так как при таком размере живущей четверти (12 дворов крестьянских. Там же. Л.435об.
и 8 бобыльских) и при крайне низкой для такой живущей четверти населенности поместья, а также при наличии большого числа поместий без крестьянского населения вообще, это не могло сильно повлиять на размер тяглового оклада: терялись мельчайшие доли живущей четверти.
Базы данных по писцовым книгам Пусторжевского уезда 1582- гг. и 1627-1628 гг. были реализованы в пакете dBASE III+. Это достаточно простая в использовании СУБД, в которой можно организовать множество запросов к базе данных с помощью набора команд. Однако полностью этот пакет не удовлетворил моих требований. Например, отсутствует возможность организации контекстного поиска в полях примечаний (типа memo), которые в базах данных по писцовым книгам содержат значимую информацию из текста источника, которая по разным причинам не может быть внесена в структуру полей. Кроме того, этот пакет, ориентированный на компьютеры класса AT-286, относительно медленно работает с большими объемами данных. Библиотека программ SOCRATES, написанная для пакета dBASE IV доктором Л.Брере, специально для того, чтобы иметь возможность объединять исходный текст источника с вычлененной из него информацией, записанной в поля БД, несомненно более мощный инструмент, а, главное, ориентированный специально на исторический источник. Однако для того, чтобы полноценно работать с этим пакетом, организовывать запросы, анализировать данные БД, необходимо знать язык программирования dBASE. Мне пришлось столкнуться с тем, что для некоторых пользователей необходимость писать запросы на языке является почти непреодолимой преградой.
Кроме того, гораздо удобнее выбрать опцию меню и получить необходимые данные или результат, чем писать сложный запрос в виде команд. Наличие огромного корпуса источников (писцовых книг), требующих применения компьютерных методов обработки в силу их специфики, а также появление СУБД, позволяющих создавать приложения, независимые от ядра программы и предоставляющие возможность учитывать требования пользователя в полном объеме, натолкнули меня на мысль о создании программного обеспечения, ориентированного на особенности писцовых книг как исторического Писцовые книги XVI-XVII вв. Проблемы создания баз данных...
источника, позволяющего в удобной форме вводить данные, создавать запросы к БД путем использования опций меню. В общих чертах такая программа должна предоставить пользователю возможность модифицировать структуру базы данных, исходя из особенностей конкретной писцовой книги, ввести данные, отредактировать их, проанализировать, распечатать необходимую информацию, а также при необходимости выбрать данные для анализа в любом другом коммерческом пакете, например, статистическом. Написание подобной унифицированной программы позволило бы в будущем объединить отдельные базы данных в информационную систему по писцовым книгам России, в которой исследователь мог бы выбрать одну или несколько баз данных для обработки. На сегодняшний момент мной написан в виде независимой программы с пользовательским интерфейсом и опробован в работе модуль, позволяющий вводить и редактировать данные писцовой книги, осуществлять поиск конкретного поместья, а также производить расчеты, связанные с источниковедческим анализом книги, описанным выше. Общая структура базы данных остается прежней. Несколько изменилась файловая структура, но это незаметно для пользователя, - вместо одного справочного файла появилось два:
один содержит имена землевладельцев, а второй названия станов и волостей. Пользователь выбирает в меню тот раздел, с которым он будет работать: населенные пункты или поместья и вотчины.
Несомненным удобством является то, что нигде пользователь не видит никаких кодов. Вводя в опреденном месте один единственный раз имя землевладельца или название района, во всех остальных случаях исследователь выбирает из предложенного списка то имя или тот район, который его интересует, далее компьютер сам записывает выбранную информацию в "карточку".
Конечно, работа по написанию такой программы займет достаточно много времени, но, повторяясь, хочу отметить, что огромный массив писцовых книг, хранящийся в архиве, оправдает затраченные усилия.
ПРИЛОЖЕНИЕ
. Л. Брере. Реляционные базы данных и свободный текст: Contradictio in terminis? // История и компьютер: Новые информационные технологии в исторических исследованиях и образовании. St. Katharinen, 1993.
ПЛАН СОХРАНИВШЕЙСЯ ЧАСТИ СПИСКА С ПИСЦОВОЙ КНИГИ
(нумерация листов дана по списку: РГАДА, ф.1209, К № 8183)ЧАСТЬ СТАНА, ЛИСТЫ В
СТАН КАТЕГОРИЯ ЗЕМЛЕВЛАДЕЛЬЦЕВ КНИГЕ
Оршанский черная Столбушенская волость, 58-119об Кудеверски черная Кудеверская волость, 240об- Писцовые книги XVI-XVII вв. Проблемы создания баз данных...Ошевский монастырь Николы чудотворца на 415-430об Полисский монастырь Преображенья Спасова в 478-
РЕМЕСЛО В ПРОСТРАНСТВЕ.
КОЛЕБАНИЯ В ГЕОГРАФИЧЕСКОМ И
ХРОНОЛОГИЧЕСКОМ ИЗМЕРЕНИЯХ
1. Предмет исследования.1.1. География и время.
Исследуемое географическое пространство образуют административные округа в районе торговой палаты Граца. Она существовала с середины XIX века и охватывала всю территорию Средней, Западной и Восточной Штирии. Взяты 8 округов: город Грац, Дойчландсберг, Фельдбах, окрестности Граца, Хартберг, Лейбниц, Радкерсбург и Вейц. Границы этого района были практически тождественны позднейшим политическим границам федеральной земли Штирии, которая граничила с федеральной землей Бургенланд (до года принадлежала Венгрии) и королевством Югославией, поэтому не происходит пересечения с данными по бывшей Нижней Штирии, которая также принадлежала к торговой палате Граца. Хронологические рамки исследования - с 1853 до 1902 года, то есть со времени "открытия" промыслов для свободного рынка до рубежа столетий - интенсивная индустриальная фаза второй половины XIX века.
1.2 Данные.
Под промыслами понимаются все большие и малые виды производства, за исключением сельского хозяйства, горного дела, служб (военной, на железной дороге или на почте и т.п. или частной), но включая фабрики, пути сообщения, торговлю и финансы.
В качестве исходных данных были собраны сведения об абсолютном числе предприятий, абсолютном числе самостоятельных хозяев и наемных работников, занятых в промыслах в целом и по отдельности в производстве (включая ремесла) и в торговле.
Дополнительными данными послужили абсолютное число населения и абсолютное число хозяев в сельском хозяйстве. Эти данные брались прежде всего из статистических показателей торгово-ремесленной палаты Граца и из статистики Австрии.
Итак, данные происходят из подсчетов палаты и официальных переписей населения, а также переписей предприятий. Основной показатель (абсолютное число предприятий) оказалось возможным сравнивать (не для всех переменных одинаково, но сопоставимо) за годы 1853, 1857, 1859, 1865, 1866, 1867, 1868, 1869, 1870, 1874, 1880, 1890 и 1902. Для остальных названых показателей большая часть данных имеется за годы 1853, 1857, 1880, 1890 и 1902, так что и здесь представлен законченный ряд данных.
1.3 Проблемы представления данных.
Проблемы возникли из-за произвольного отбора предприятий тогдашними статистическими органами. Так, в справке торговой палаты за 1853 г. (первая в этом роде со времени ее основания) содержатся только предприятия подлежащие продаже (при этом не частные), и к тому же только те из них, в которые не вложены деньги. Можно, однако, исходить из того, что государство пренебрегало отсутствием в документах за 1853 год частных предприятий и предприятий, имевших недвижимость. Этот недостаток был устранен при систематизации 1859 года.
Следующая проблема состоит в разнице между подсчетом по профессиям и по числу предприятий, т.к. одно лицо могло владеть больше чем одной профессией, также как владеть или руководить несколькими предприятиями. С другой стороны, предприятие могло быть во владении нескольких лиц. Подсчеты торговой палаты с до 1890 гг ориентировались на предприятия, а в 1902 г. состоялась государственная перепись предприятий, так что только для 1890 г.
удалось сопоставить число предприятий с данными переписи населения.
За число предприятий было решено взять число хозяев плюс число тех лиц, которые были побочно заняты в торговле и производстве, чтобы таким образом, по крайней мере прилагать равный масштаб для всех микрообщностей (административных округов).
Возможно, поэтому число предприятий было несколько меньше в менее заселенных районах, хотя установление дополнительных занятий и производств, согласно тогдашним органам учета, наталкивалось на методические трудности и часто не могло быть выполнено. Меньшую степень специализации и более многостороннюю деятельность людей, занятых в производстве, надо предполагать в первую очередь как раз для аграрных районов. По поводу сельских хозяев можно указать, что, к сожалению, в профессиональной переписи 1880 года в качестве собственников указывались и мужья, и жены. В результате для района Фельдбаха можно насчитать до 20.000 хозяев. Лишь в переписи профессионалов в 1890 хозяевами стали считать только мужчин.
Поэтому в этом году имеются сведения приблизительно о 10. сельских хозяев.
Проблема сведений о людях, владевших несколькими предприятиями в сельском хозяйстве не может быть решена на основе официальных переписей. Для годов 1880, 1890 и 1900 возможен только подсчет занятых по профессиям и только в 1902 г. опять представлен подсчет предприятий.
2. Концепция анализа.
Преследовались следующие цели:
1. Представить по годам динамику абсолютного числа предприятий (проблема кризисных годов, удачных годов, старта), наблюдая при этом, по возможности, различные варианты развития ремесел и торговли.
2. Сопоставить абсолютное число предприятий с ростом сельскохозяйственным фактором с помощью значений средней плотности населения.
3. Описать динамику этих показателей внутри отдельных округов и затем отфильтровать сходные и несходные группы с помощью кластерного анализа.
Обычная кластерная модель использовалась здесь так, что отдельные годы с данными являются отличительными признаками округов. Факторный анализ абсолютного числа предприятий с 1853 до 1902 года (более 13 годов с данными) дает в итоге только один фактор, а именно - показывает, что исходный 1853 год на 99 % определяет общее развитие в течение всех последующих лет. Это означает, что позиции регионов были заданы уже в 1853 и не менялись заметно ни в одном из последующих годов вплоть до 1902 г.
Но это, с другой стороны, значит, что кластеризация за годы 1857 содержит только излишнюю информацию, и все, собственно говоря, можно предсказать по данным 1853 г. Следовательно, нужно искать динамическое кластерное решение, которое принимало бы во внимание изменения по годам в каждом отдельно взятом округе относительно себя самого. Идеальной, конечно, была бы база данных, в которой присутствовали бы все 13 факторов (= 13 годов с данными) с примерно одинаковой достоверностью. Подобную базу данных, конечно, нельзя найти, да и эмпирически трудно ожидать.
Тем не менее, имеется база данных о росте в процентах для каждого округа по отношению к истекшему году. Отсюда - 4 фактора для каждого округа, а именно - 1857 г. (указанное изменение г. (указанное изменение - 20,6 %) 1865 г. (указанное изменение - 13.7 %), 1866 г. (указанное изменение 11,0 %). Отсюда видно, что для исходного 1857 года, первого в целом удачного, также как для 1859 г. - удачного для "открытия" предприятий для свободного рынка и для первых последующих кризисных годов (1865 и 1866 гг.), устанавливаются отклонения в соотношениии для отдельных районов относительно роста в процентах для каждого района до 1902 г. 1874 год (биржевой кризис 1873 г.) проявляется только в уменьшении роста, также как и кризисный для всей экономики год.
Старт для всех округов, по видимому, имел место в 1880-е годы, причем он сначала сказывался в ускорении роста торговли, в то время как число производственных предприятий в 1890 г.
уменьшилось по сравнению с 1880 г. Возможно, это были последствия кризисной эпохи 1880-х, которые можно уловить по числу предприятий, но которые еще не сказались в 1880 году.
Картина развития производства по округам была также в целом весьма предопределена, причем город Грац, в смысле старого Граца (то есть первые шесть и сегодня городских районов) занимал, как и следовало ожидать, ведущее место и устойчиво продолжал его занимать в течение всех рассмотренных лет. Замыкающими были округа Радкерсбург и Дойчландсберг. Среднее место принадлежало окрестностям Граца, вплотную за которыми следовал Фельдбах, и на несколько большем расстоянии - Лейбниц, Хартберг и Вейц.
ИМЕННОЙ КАТАЛОГ БЫВШЕГО СПЕЦХРАНА.
ИСТОРИЯ, ФОРМУЛЯР, РЕПРЕЗЕНТАТИВНОСТЬ,
ВОЗМОЖНОСТИ СОЗДАНИЯ БАЗЫ ДАННЫХ
(На материалах Госархива Тульской области) Вхождение компьютера в инструментарий историка неизбежно не только потому, что дает новые методические возможности, но и потому, что это будет диктовать сама источниковая база, формирующаяся в современный период. Пока же приходится преодолевать сложности в выявлении уже имеющихся баз данных на машиноориентированных носителях и завоевывать или оплачивать свободу доступа к ним. У современного источниковедения появилась новая задача: при изучении традиционных "старых" источников обращать внимание на возможности их исследования при помощи компьютерных технологий.Сегодня историографы отмечают оформившуюся тенденцию гуманизации исторических исследований. Доступная исследователям информация о социальном облике и жизненном пути человека собиралась и накапливалась различными ведомствами. Органы МВД регистрировали миграцию населения, ЗАГСы собирали данные о браках, рождениях и смертях, производственные предприятия - о величине зарплаты, уровне образования, квалификации, характере трудовой деятельности и т.д. В этот перечень не входят архивы КГБ с массой их досье и персональных дел, по-прежнему закрытые для исследователей.
Однако в отечественной истории был определенный период, когда КГБ активно встраивал свои структуры (особые отделы, спецхраны). Моисеенко Т., Свищев М. Изучение аграрной истории России последних десятилетий: Перспективы компьютерного источниковедения // История и компьютер: Новые информационные технологии в исторических исследованиях и образовании.
St.Katharinen, С.160.
. См.: Медушевская О.М. О проблемах генеалогии // Советские архивы. 1989. N.6. С.27; Peronet М. Genealogie et histoire;
approches metodiques // Revue historique. Paris, 1968. Vol.239.
Janv.-mars. P.111.
практически во все общественные институты, в т.ч. в госархивы.
Существуют материальные следы этой совместной деятельности, ставшие доступными исследователям после волны массового рассекречивания спецхранов архивов в конце 80-х годов. В Госархиве Тульской области это именной каталог бывшего спецхрана, который в среде архивистов имеет также и другое название (менее точное, но более короткое) - каталог репрессированных. Методически очень верно то, что он сохранил чистоту первозданности: слияний и других манипуляций с его объемом не проводилось. Он насчитывает приблизительно 220 тыс. карточек. Этот вид научно-справочного аппарата, не имеющий себе равного в областных архивах (именной каталог открытого доступа насчитывает всего 8-10 тыс. карточек), представляет собой богатейшую базу данных, которую можно очень удачно использовать в компьютерных исследованиях. Но этот каталог практически неизвестен даже "традиционным" историкам.
Обстоятельства его формирования и те цели, с которыми он был создан, объясняют отсутствие сведений и упоминаний о такого рода каталогах в советской печати. К пользованию ими исследователи и даже обычные сотрудники архива не допускались (только сотрудники спецхрана).
Такие именные каталоги должны были создаваться в фискальных целях по всей стране на основании серии циркуляров ГАУ НКВД СССР 1939 года и спецприказа НКВД СССР N 001345 от 23 октября 1940 года за подписью Л. Берия "Об использовании архивных материалов в оперативно-чекистской работе". В соответствии с приказом они должны иметься во всех областных архивах, но сведения, которыми мы распологаем, говорят, что это не так.
В Госархиве Тульской области карточки для этого именного каталога составлялись двумя-тремя сотрудниками на протяжении почти 20 лет (с 1940 по конец 50-х годов). Работа не прекращалась, ни когда гитлеровские танки были на подступах к Туле, ни когда архив находился в эвакуации в Павлодаре. Карточки имеют следующий формуляр:
1. Фамилия имя и отчество. Имя и отчество указаны: полностью, сокращенно или отсутствуют. В формуляре нет специальной графы "национальность", но об этом позволяет судить имя собственное.
. Корнеев В.Е., Копылова О.Н. Архивы на службе тоталитарного государства (1918 - нач. 1940-х гг.) // Отечественные архивы.
1992. N.3.
2. Год рождения. Полная дата рождения указана чрезвычайно редко.
Иногда год рождения указан след. образом: "37 лет в 1913 г."
3. Место рождения/Место рождения и место жительства. Данные этой графы позволяют исследовать миграцию населения, в том числе вынужденные миграцию по политическим соображениям (желание скрыть свое прошлое и происхождение, уехав из места, где многие жители это знали).
4. Место службы и род занятий/Место работы и занимаемая должность.
Графа аккумулирует перечень профессий как досоветского периода (священник, монах, иеромонах, псаломщик, владелец мельницы, красильни, торговец, бывший помещик, пристав, конный стражник полиции, городовой, стражник, сыщик, прапорщик, делопроизводитель, канцелярский чиновник, ст.кондуктор, извозный промысел по городу), так и советского (рабочий, токарь, слесарь, столяр, земледелец, техник-конструктор, инженер, зав.пункта госторга, зав.секцией электро-радио. Кроме того, в этой же графе можно встретить такие названия, как "жена пристава", "дочь пристава", "отец проживавшего на доходы от крупорушки", "находится на иждивении лица, лишенного избирательного права", "прибегал к наемному труду с целью извлечения прибыли", "ученик II класса Тульской классической гимназии, член боевой организации", "австрийский подданный, военный шпион". Анализ содержания данной графы позволяет проследить изменения в профессиональной структуре общества после установления советской власти, адаптации представителей преследуемых социальных слоев к новым условиям, например, выявить, в какие профессии "ушли" представители, скажем, дворянства.
5. Политическое прошлое. Графа - одна из наименее заполненных, что даже несколько неожиданно при тематической направленности каталога. Это говорит о том, что это было не главным при его составлении.
6. Социальное положение/Социальное происхождение. Вариация названия графы расширяет основания на преследование личности государством, вводя в круг отслеживания генеалогический момент. Некоторые категории "советских граждан", защищаясь от прессинга государства, пытались найти способ, так сказать, маскировки или обмана: с т а т ь рабочим, крестьянином, жениться на рабочей, крестьянке и др. Вариация названия графы исключала эту возможность.
7. Судимость. Графа присутствует не во всех вариантах формуляра.
Чаще всего указан номер статьи, по которой было вынесено обвинение.
8. Дата документа. Указан, как правило, лишь год создания документа, находящегося на хранении в архиве.
9. Род документа. Личное дело, формулярный список, регистрационная карточка, справка, заявление, ходатайство, прошение, жалоба, опись (имущества). Список, алфавитный список, именной список (избирателей, заключенных, тылового ополчения, налогоплательщиков и т.п.).
Постановление, выписка из протокола заседания, журнал заседаний, приказ, приговор (сельского схода), приговор (суда). Рапорт, сообщение, сведения.
Переписка, книга регистрации [арестованных и т.п.], настольный реестр, журнал розыска (розыскной журнал), исходящий журнал. Ведомость, требовательная ведомость. Местная периодика (Губернские ведомости, Коммунар).
Один только перечень видов документов позволит исследователю точнее ориентироваться в выборе источников по конкретной теме, укажет на виды документов, не введенные в научный оборот или редко используемые.
Для источниковеда-теоретика будет любопытно исследование источников в системной целостности, их иерархии и информационной насыщенности, "перетекания" информации из одного источника в другой, необходимости и условия ее дублирования в различных видах источников, трансформации ее объемов, что позволяет увидеть взаимосвязь различных частей всей источниковой базы современного периода. Систематический анализ как внешних факторов, влияющих на появление того или иного комплекса массовых материалов так и, главным образом, его внутренней природы позволяет изучать логику расположения информации, составляющей "рисунок" источника, учитывать всю полноту контекста и реконструировать документ в форме компьютерной модели. Это делает возможным принципиально новый уровень источниковедческих исследований.
Поскольку необходимость создания документов или их комплексов в той или иной форме - всегда решение человеческого мозга, постольку это дает возможность выхода на изучение глубинных ментальных структур общества через изучение различных видов источников в их взаимосвязи и исторической преемственности наиболее распространенных видов. Восхождение по различным слоям информации, заложенной в источнике, позволяет в "результате таких последовательных преобразований извлечение информации все более высокого уровня, применение все более точных и строгих методов ее обработки, соответственно расширяющих наши познавательные возможности.
Проверка одного источника другим позволяет выявить периода.
. Тихонов В.И., Тяжельникова В.С., Юшин И.Ф. Методика оценки информационного потенциала комплексов массовых источников // Круг идей: новое в исторической информатике. М., 1994.
. Соколов А.К. О современном состоянии и перспективах работы с архивом машиночитаемых документов // Круг идей: новое в исторической информатике. М., 1994. С.71-76.
10. Примечание/Дополнительные сведения. Эта графа наименее формализована. Сюда могли ошибочно вносить информацию, уместную в иной графе: адрес проживания, должность и место работы, политическая принадлежность, социальное происхождение. В этой графе указывалось основание, по которому человек был обвинен, осужден или лишен избирательного права (например: непризнание декрета СНК, участие в восстании, проживал в Германии в 1915-31 гг., участник собрания, где были убиты продработники), а также восстановлен в избирательных правах.
Обозначалось наказание и его размеры: срок осуждения, выслан по суду, разыскивается угрозыском, ВЧК, как дезертир, направлен в ОГПУ.
Всегда особо фиксировались сведения об имущественном положении:
опись и перечень собственности, частный владелец (мельницы, крупорушки и т.п.), брал патент, был выборщиком в Государственную Думу, занимался мясной, рыбной и др. видами торговли, отмечался факт репрессии хозяйства, уточнялось, в какой именно список был внесен (домо- и землевладельцев, налогоплательщиков и т.п.).
11. Источник: N фонда, описи, дела, листа. Особенность этой графы заключается в том, что указывался не N фонда, а его словесное обозначение. После окончания работы по созданию каталога были случаи переименования фондов, их слияния, включения части одного фонда в другой.
Для преодоления этого препятствия в архиве уже созданы соответствующие переводные таблицы.
12. Составитель. Указывается фамилия составителя и дата составления карточки.
К сожалению, карточек с полностью заполненными реквизитами не так много. Сведения, приведенные выше, были получены путем весьма малочисленной (менее одной тысячи карточек) случайной выборки, которая только и доступна при "ручной" обработке. При таких объемах информации, несомненно, необходимо применение компьютера.
Наиболее интересные результаты вероятны при работе с этой базой данных прежде всего методом контент-анализа.
На одну персоналию могло быть составлено несколько карточек, поскольку источниковая база по выявлению информации для каталога была довольно обширной. Она объединяет фонды как советского, так и досоветского периодов, как городских, так и сельских жителей.
Персоналии выявлены путем полистного просмотра дел следующих фондов:
- органы власти и управления (канцелярия губернатора, городская управа, губернское правление, губернский, городской и районные исполкомы);
- органы гражданского и военного правосудия (областной и окружной суды, тулгуброзыск, военный прокурор войск НКВД, тулгубревтрибунал);
- жандармерия и полиция (губернское жандармское управление, тульское отделение Московско-Курского жандармского полицейского управления, уездные полицейские управления, уездные исправники);
- тульский окружной отдел учета военнообязанных;
- милиция и т.п. подразделения (губернская и уездная милиция, тульский сводный революционный отряд, управление ЧОН по Тульской губернии);
- карательные органы советской власти (ВЧК, ОГПУ, комиссия по выселению помещиков из усадеб, тульский окружной комитет по рассмотрению жалоб раскулаченных, комиссия по чистке советского аппарата и списки исключенных из ВКП(б), лагерь N 1 тулгуботдела управления, тульский лагерь принудительных работ, тулгубконцлагерь);
- предприятия и учреждения (тульский оружейный завод, тульский отдел Ко "Зингер", тулгубфинотдел, налоговый финансовый инспектор Туло-Басовского участка, тульский окружной земельный отдел, тулгубстаткомитет, губернский отдел народного образования, тульский краеведческий музей, список служителей религиозного культа); - органы по реализации избирательного права (тулгубизбирком, тульская окружная избирательная комиссия, районные комиссии по лишению и восстановлению избирательных прав, тульский губернский ведомостной список, списки лишенцев);
- документы, фиксирующие политическую принадлежность (тульский комитет "Союза 17 октября", списки членов различных политических партий, публиковавшиеся в местной периодике).
Для удобства практического пользования (сотрудниками НКВД) в процессе работы над каталогом архивисты выявляли и составляли списки людей по определенному признаку: землевладельцы, домовладельцы, владельцы промышленных предприятий, купцы, торговцы, налогоплательщики, дворяне, буржуазия, чиновники, служители религиозного культа, члены крестьянских обществ, иностранцы, лица, состоящие в иных политических партиях, провокаторы, шпионы, контр-революционный элемент.
Набор признаков обрисовывал доминанту замысла создателей. Это была попытка новой классификации "людского материала" по способу его мышления относительно единственно значимого предмета:
признания или непризнания коммунистической идеи, составляющей суть нового тоталитарного режима. Цель - истребление инакомыслия или даже возможности такового. Причем, исходя их анализа подбора алфавитов, можно определить те основания, которые, по мысли создателей, формируют антикоммунистическое мышление.
Это, в первую очередь - наличие частной собственности и связанная с ней социальная принадлежность, принадлежность к другим политическим партиям и течениям, принадлежность к определенным профессиям (например, жандарм, полицейский, офицер царской армии), национальность и - родство с инакомыслящими. Последнее - это попытка борьбы с инакомыслием на генетическом уровне. Такого рода опыта не имеет ни одна другая страна. В.И. Тихонов, В.С. Тяжельникова, И.Ф. Юшин, пришли к выводу, что значительное их число носит сугубо следственный характер, отражая соответствующую бюрократическую процедуру. Анкеты в личных делах при приеме на работу в 30-х годах требовали заполнения граф о родственниках до третьего колена и указания мест захоронения умерших. Для возвращения избирательных прав требовалось доказать не только свою непричастность к нетрудовым и эксплуататорским элементам, но и своих близких родственников.
"Достижением" советского периода стали многочисленные трагедии разрывов родственных связей поколений, когда дети, чтобы сохранить жизнь, отказывались от своих родителей, мужья от жен.
Сведения о "политически неблагонадежных" предках и родственниках скрывались, их стыдились. Отношения между поколениями были извращены настолько, что имущество семьи конфисковывалось в пользу государства, а по наследству передавалась только вина: младшие члены рода лишались возможности голосовать (и иметь заборные карточки) получать высшее образование, быть членами партии, а в худшем случае - обязаны были следовать за своими родственниками в ссылку или в лагерь.
Для того, чтобы наилучшим образом контролировать все население, и были созданы эти именные каталоги по всей стране.
Здесь мы сталкиваемся с тем редким случаем, когда работа, проделанная из сомнительных в нравственном отношении целей, в итоге может быть обращена во благо.
Именной каталог бывшего спецхрана является прекрасным источником по изучению менталитета советского общества, по формированию государственной машины тоталитарного режима, силе и. См.: Тихонов В.И., Тяжельникова В.С., Юшин И.Ф. Об адекватном представлении структуры источников в базе данных (построение компьютерной модели личного дела лишенца в системе обработки исторических данных КЛИО) // Компьютер и историческое знание.
Барнаул, 1994. С.126-137.
способам сопротивления различных слоев общества ее прессингу, в наболее общем виде это отношения "личность - государство".
Возможно создание просопографического портрета людей, попавших под наблюдение и контроль властей как при царском режиме, так и при советской власти. Именной каталог дает определенное количество примеров такого рода. Эти персоналии можно выявить сопоставляя данные двух граф: ФИО и источник. Наличие определенного источника как досоветского (например, фонд жандармского управления), так и советского (например, фонд ВЧК) периодов по одной и той же персоналии будет основанием для отбора. Существует множество не менее интересных вариантов агрегирования данных по другим признакам.
Как нам представляется, репрезентативность этого вида НСА (научно-справочного аппарата) еще не только не осмыслена во всей ее глубине, но даже не осознана в достаточной мере. Далеко не исчерпывающий анализ позволяет понять, что в каталоге заложены многие и многие темы исследований по социальной истории, источниковедению, генеалогии, биографике, социальной психологии, демографии, ономастике и др.
Каталог - это форма научно-справочного аппарата, а не сами документы. Расширенный формуляр карточки именно этого каталога выделяет его в особое положение и допускает ведение серьезных научных исследований уже на уровне каталога. В некоторых случаях информация, "свободная" от конкретных деталей, позволяет более отчетливо увидеть явление, процесс. Конкретика не является утерянной, поскольку в необходимых случаях всегда можно обратиться к документу, на который дает выход каждая карточка.
Однако одному исследователю создание такой базы данных, пожалуй, не по силам. Было бы весьма разумно формирование, если можно так выразиться, государственной базы данных общего пользования.
С появлением в последнее время в архивах, в том числе в Госархиве Тульской области самостоятельного отдела компьютеризации и информатики начали создаваться поисковые системы на языке программирования 4-го уровня ISIS. Есть реальная основа и для создания в перспективе гипербаз данных. В современной ситуации необходимо квалифицированное руководство этой работой, чтобы избежать в дальнейшем дорогостоящих и сложных переделок. Было бы полезно также выявление других имеющихся в Госархивах потенциальных баз данных, подобных именному каталогу бывшего спецхрана. Координирование такой работы позволит избежать создания на начальном этапе однотипных баз данных, что весьма важно в первую очередь для ученых-историков.
В Госархиве Тульской области уже обсуждался вопрос о переводе информации именного каталога бывшего спецхрана в форму электронного каталога. Решение этой задачи пока отложено.
Субэтнография русских в свете компьютерной ономастики...
СУБЭТНОГРАФИЯ РУССКИХ
В СВЕТЕ КОМПЬЮТЕРНОЙ ОНОМАСТИКИ.
КЛАССИФИКАЦИЯ ПЕРВОЙ СОТНИ ФАМИЛИЙ
Андреевича Никонова (1904-1988) по реконструкции политической географии времен феодальной раздробленности (XIII в.) и выявлению этнических восточнославянских компонент, впоследствии сложившихся в русский этнос, на основе географии современных русских фамилий.В.А. Никонов первым обратил внимание на жесткую географическую привязку происхождения русских фамилий (теперь перемешанных) и разделил европейскую территорию России по наиболее распространенным фамилиям на:
(1) Ивановию, которую он ассоциировал с бывшими ПсковскоНовгородскими землями, (2) Смирновию - бывшие Владимиро-Суздальские земли, (3) Поповию - Русский Север и (4) Кузнецовию - территорию более позднего (XVI-XVII вв.) заселения к югу и востоку от (1) и (2), указывая при этом на некоторую перемешанность (3) и (4).
Нами предполагалось, что применяя компьютерные методы, можно "раскрасить карту" большим количеством цветов, увязывая их с некими государственно-этническими образованиями, и при этом пользоваться менее "чистыми", но более доступными источниками (городскими телефонными справочниками, а не материалами сельских загсов). Если Владимир Андреевич писал, что географией фамилий надо заниматься "не годами, а десятилетиями), то мы постарались вывернуть это выражение наизнанку: "не годы, а месяцы". Благодаря математическим и компьютерным методам нам это, хотя и отчасти, удалось.
. Никонов В.А. География фамилий. М.: Наука, 1988.
Первоначальная таблица числа абонентов f-ой фамилии в g-ом городе, регистрировавшая 31 фамилию по 60 городам, рядом итераций была расширена до размера 103 фамилии на 516 городов. Большую часть источников составляли телефонные справочники, кроме того в единичных случаях использовались алфавитные указатели к похозяйственным книгам, адресные книги, загсовские материалы, материалы антропологической экспедиции.
По собранной вручную таблице частот 103 фамилий на городов в среде FoxPro просчитывалась таблица относительных частот фамилий:
где Yfg - число абонентов f-ой фамилии (f=1,...,103) в g-ом городе (g=1,...,516), yfg - относительная частота, и таблица "дважды относительных частот":
- средняя относительная частота фамилии по 516 городам; т.е.
если yfg > 1, то f-ая фамилия встречается в g-ом городе чаще, чем в среднем по 516 городам.
В принципе уже эта таблица (4 x 7 АЦПУ-шных листов в узком формате) пригодна для ручной обработки, т.е. выявления исконных для данной фамилии населенных пунктов.
В настоящей работе (одной из серии работ, заголовки которых предполагается унифицировать по первой половине) рассматривалась только классификация фамилий по кластерам с географической привязкой (если таковая имелась у Вл. Анд. Никонова), по части кластера или без нее в противном случае. Для классификации фамилий просчитывалась таблица коэффициентов корреляции (КК) 103 фамилии на 103 фамилии (2 x 2 АЦПУ-шных листа; поскольку таблица. Самых частых по Списку абонентов московской городской телефонной сети. М., 1971-1972. Т.1-4.
Субэтнография русских в свете компьютерной ономастики...
симметрична относительно диагонали (1,1)...(103,103), выводилась только ее "северо-восточная" половина).
Кроме самой таблицы, выводился ее вариант, где значения, не выходящие за пределы среднего значения всех КК по таблице плюс/минус два стандартных отклонения (реально: от -0,59 до +0,61), заменялись точками; оставшиеся в таблице числа (>0,61) выделяли пары фамилий высоко коррелирующих между собой, т.е.
которые которые можно было подозревать в принадлежности к одному