На правах рукописи
Скабин Артём Викторович
МАТЕМАТИЧЕСКИЕ МОДЕЛИ,
МЕТОДЫ И АЛГОРИТМЫ
ДЕШИФРОВКИ ИСТОРИЧЕСКИХ СТЕНОГРАММ
Специальность 05.13.18 – Математическое моделирование,
численные методы и комплексы программ
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Петрозаводск 2013 1
Работа выполнена на кафедре теории вероятностей и анализа данных ФГБОУ ВПО «Петрозаводский государственный университет»
Научный руководитель: Доктор технических наук, профессор Рогов Александр Александрович Жабко Алексей Петрович, доктор
Официальные оппоненты:
физико-математических наук, профессор, заведующий кафедрой теории управления ФГБОУ ВПО «СанктПетербургский государственный университет»
Суровцова Татьяна Геннадьевна, кандидат технических наук, старший преподаватель кафедры прикладной математики и кибернетики ФГБОУ ВПО «Петрозаводский государственный университет»
Ведущая организация: ФГБУН Санкт-Петербургский институт информатики и автоматизации РАН
Защита состоится «26» декабря 2013г. в 11:00 часов на заседании диссертационного совета Д 212.190.03 на базе ФГБОУ ВПО «Петрозаводский государственный университет» по адресу: 185910, г. Петрозаводск, пр. Ленина, 33.
С диссертацией можно ознакомиться в научной библиотеке Петрозаводского государственного университета.
Автореферат разослан «.......» ноября 2013 г.
Ученый секретарь диссертационного совета Р. В. Воронов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы исследования.
Автоматизированное распознавание рукописных текстов востребовано в различных областях человеческой деятельности. Существует большое количество различных разработок для решения данной задачи. Большой вклад в развитие оптического распознавания рукописных символов внесли ученые Н. Д. Горский, В. Л. Арлазаров, А. А. Масалович, В. Анисимов.
Существующие системы оптического распознавания (ABBYY FineReader, CuneiForm, Google Tesseract) ориентированы на распознавание современных языков и печатных текстов. Исходными данными для таких систем являются документы хорошего качества, как первоисточник (страницы рукописей, четкие, контрастные снимки, с четко разделенным фоном и символами), так и хорошего написания (строки прямые, без искривлений, отсутствие исправлений и зачеркиваний).
Дешифровка стенограмм, частного случая рукописного текста, является актуальной задачей, в результатах решения которой заинтересованы, прежде всего, филологи и историки.
В архивах России находится большое количество недешифрованных исторических рукописных стенограмм — это связанно, в первую очередь, с тем, что на сегодняшний момент не осталось специалистов, обладающих знаниями о стенографических системах. Стенографист в записи мог также использовать уникальные символы, не встречающиеся в стенографической системе, так как и дешифровкой впоследствии предполагал заниматься самостоятельно. Плохое качество первоисточника (пожелтевшая бумага, наличие исправлений и зачеркиваний, искривление строк). Всё это делает невозможным применение существующих систем распознавания к историческим стенографическим записям.
Дешифровка подобных документов позволяет внести в научный оборот новые исторические документы. Применение информационных технологий и математического моделирования позволяет автоматизировать процесс дешифровки исторических рукописных стенограмм.
Таким образом, задачи, рассматриваемые в данном диссертационном исследовании, остаются актуальными.
Степень разработанности темы исследования.
Не смотря на активные разработки в данной области, существующие информационные системы распознавания позволяют распознавать только небольшие фрагменты текстов, например, подпись, банковские чеки и т.д.
Цель работы: получение дешифрованного текста на русском языке из исторических рукописных стенограмм.
Для достижения поставленной цели необходимо решить следующие задачи:
1. провести анализ существующих информационных систем оптического распознавания символов;
2. разработать метод бинаризации документов низкого качества (пожелтевшая бумага, текст написан простым карандашом) для получения наиболее четкого и с наименьшим количеством шумов изображения;
3. разработать алгоритм построения строк рукописного документа, выявления надстрочных и подстрочных символов;
4. разработать алгоритм поиска схожих символов;
5. построить математическую модель дешифрования символов;
6. разработать численный метод определения параметров математической модели;
7. реализовать разработанные алгоритмы в компьютерной системе.
Научная новизна:
1. описан алгоритм подбора наилучшего метода бинаризации исторических рукописных документов;
2. предложен пороговый метод, основанный на яркостной характеристике с плавающим порогом;
3. разработана математическая модель дешифровки рукописных стенографических документов.
Методология и методы исследования: Использованы методы теории вероятностей, математической и прикладной статистики, численные методы кластерного анализа, вычислительной геометрии и обработки изображений.
Положения, выносимые на защиту:
1. алгоритм выбора метода бинаризации рукописных исторических документов плохого качества с использованием сравнения методов на контрольной выборке;
2. математическая модель дешифровки стенографических документов, содержащая информацию как о форме и месте символов, так и извлеченную из текстов автора;
3. численные методы определения параметров математической модели, позволяющие их рассчитывать на основе информации об используемой стенографической системе и расшифрованных стенограммах;
4. программный комплекс (ИС HisReg), реализующий предложенный метод выбора бинаризации стенографического документа и использующийся для построения алфавита стенографического текста и дальнейшей дешифровки стенограммы.
Теоретическая и практическая значимость.
Предложенные методы, математическая модель и алгоритмы могут быть использованы для обработки и дешифровки исторических рукописных документов, в том числе на малоиспользуемых и «мёртвых»
языках и стенографических записях, которые сделаны в неиспользуемых стенографических системах.
Степень достоверности.
Достоверность результатов проведенных исследований подтверждена проведением исследований рукописных стенографических записей Сниткиной (Достоевской) Анны Григорьевны — наброски к «Дневнику Писателя» за 1881 г. и «Из воспоминаний А. Г. Достоевской».
Апробация работы.
Результаты диссертационного исследования были представлены на следующих конференциях:
1. V Международная научная конференция «Компьютерные технологии и математические методы в исторических исследованиях»
(Петрозаводск, 2013);
2. VII Международная научно-практическая конференция «Информационная среда ВУЗа XXI века» (Петрозаводск, 2013);
3. XIV Всероссийская научная конференция «Электронные библиотеки: Перспективные методы и технологии, электронные коллекции RCDL'2012» (Переславль—Залесский, 2012);
4. Всероссийская научная конференция «Анализ изображений, сетей и текстов АИСТ’12» (Екатеринбург, 2012);
5. IV Международная научная конференция «Информационные технологии и письменное наследие El’Manuscript—2012» (Петрозаводск, 2012);
6. VI Международная научно-практическая конференция «Информационная среда ВУЗа XXI века» (Куопио, Финляндия, 2012);
7. V Международная научно-практическая конференция «Информационная среда ВУЗа XXI века» (Петрозаводск, 2011);
8. Международная конференция «Компьютерные технологии и математические методы в исторических исследованиях» (Петрозаводск, 2011);
9. XIV Всероссийская конференция «Интернет и современное общество» (Санкт—Петербург, 2011);
Проведенные исследования производились в рамках гранта Российского гуманитарного научного фонда на тему «Автоматизированная система распознавания и дешифровки стенограмм XIX — начало XX вв.» № 11-01-12026 (руководитель Рогов А. А.). Программы для ЭВМ, входящие в состав программного комплекса, были зарегистрированы в Объединённом фонде электронных ресурсов «Наука и образование»
(ОФЭРНиО) № 19509 от 23.09.2013. По теме исследования опубликовано 11 работ, в том числе 3 публикации в журналах из перечня ведущих рецензируемых научных журналов и изданий.
Структура и объём диссертации. Диссертация состоит из введения, трёх глав, заключения, библиографического списка использованной литературы (107 наименований), имеет объём 101 страницу машинописного текста, содержит 41 рисунок и 8 таблиц.
СОДЕРЖАНИЕ РАБОТЫ
Во введении содержится обоснование актуальности темы диссертации, формулируется цель диссертации, представлены основные результаты, научная новизна, практическая значимость работы, а так же описание структуры диссертации. Во введении рассматриваются особенности автоматизации оптического распознавания символов и распознавания рукописных документов, описываются трудности, возникающие при распознавании рукописного текста, стенографических документов и документов плохого качества. Приводится анализ автоматизированных систем дешифровки стенографической системы Питмена.
В первой главе сравниваются методы бинаризации. Предлагается пороговый метод, основанный на яркостной цветовой компоненте с плавающем порогом и алгоритм подбора наилучшего метода бинаризации.
В исследовании при бинаризации рукописных исторических документов возникал ряд сложностей, связанных с низким качеством документов:
1. получение цифрового изображения происходило методом фотографирования документов со вспышкой. При этом документ освещался неравномерно: центр светлее, чем края документа;
2. плохое состояние исходных документов:
a. наличие механических повреждений;
b. зачеркивание и исправления в тексте;
c. просвечивание записей с обратной стороны;
d. записи сделаны на пожелтевшей бумаге простым карандашом.
3. большое количество шума (черных пикселей, не относящихся к символам записи) после бинаризации документа (более 30%).
В данной главе проанализированы бинаризации: методы Отцу, Бернсена, Эйквиля, Ниблека и пороговые методы, основанные на различных цветовых схемах, таких как RGB, HSB. Для улучшения результатов бинаризации возможна предобработка изображения, которая заключается в применении к фрагменту изображения следующих преобразований: гауссовское размытие, сглаживание, выделение границ.
Использование порогового метода для бинаризации заключается в выборе порога по какой-либо из цветовых характеристик таким образом, чтобы разделить пиксели изображения на два класса: те пиксели значение цветовых компонент которых меньше заданного порога, принадлежат к классу символов, а те, у которых больше,— к классу фона.
Проведены эксперименты со стенографическими документами, как видно на рисунке 1, ни одна из компонент цветовых схем RGB и HSB не даёт явного разделения на два класса.
Для обработки данных стенографических документов в диссертационном исследовании предложен пороговый метод, основанный на яркостной цветовой компоненте, с выбором порога, основываясь на плотности текста (модифицированный пороговый метод — МПМ).
Бинаризация выполняется по цветовому свойству — яркость. Порог бинаризации выбирается в зависимости от плотности текста. В рассматриваемых стенографических документах плотность текста составляла 13% пикселей от общей площади текста.
На рисунке 2 продемонстрированы результаты работы некоторых методов бинаризации: методы Отцу, Бернсена, Эйквеля, Ниблэка, пороговый метод, основанный на яркостной цветовой компоненте (МПМ), фрагмент предобработанный гауссовским размытием, бинаризованный МПМ.
Для каждого документа автоматизированная система обработки стенографических документов должна подбирать методы бинаризации.
Алгоритм выбора метода бинаризации и настраиваемых параметров заключается в следующем.
Пусть — пиксель на контрольном фрагменте, полученномпри бинаризации k—ым методом бинаризации. — пиксель на эталонном бинаризованном фрагменте, где i = 1, …, n; j = 1, …, m; n,m — Рисунок 2. Результаты работы некоторых методов бинаризации ширина, высота сравниваемого фрагмента. Предложена оптимизационная задача подбора наилучшего метода бинаризации так чтобы:
Для каждого из методов бинаризации рассчитывается точность (2), полнота (3) и F—мера (F1—мера) (4) по следующим формулам:
где s — количество одинаковых пикселей эталонного изображения и фрагмента, полученного в процессе бинаризации К-тым методом.
На рисунке 3 представлены результаты эксперимента. Проведённый анализ основанный на F-мере показал, что чаще наиболее подходящим является МПМ метод бинаризации.
Во втором параграфе первой главы рассматриваются методы выделения связных областей на бинарных изображениях, в третьем параграфе — методы поиска схожих символов такие как: логическое сравнение с эталоном, сравнение со скелетом эталона, метод сравнения расстояний, метод моментов, комбинированный метод, метод корзин.
Алгоритм метода корзин выглядит следующим образом:
Шаг 1. На символе произвольно выбираются 100 пикселей см. рисунок 4-a. Данная операция выполняется для двух сравниваемых символов;
Шаг 2. Для каждого пикселя строится 60 «корзин» см. рисунок 4-b;
Шаг 3. Для каждого пикселя считается количество пикселей, попавших в каждую из корзин, тем самым получаем 60-ти разрядные вектора для каждого из выбранных пикселей;
Шаг 4. Решается оптимизационная задача нахождения минимального расстояния между векторами, которая в данном диссертационном исследовании решается венгерским методом.
Достоинство данного метода определения схожести символов заключается в том, что он слабо чувствителен к разрывам символов, которые могут происходить при бинаризации изображения.
Во второй главе приводится математическая модель дешифровки исторических рукописных документов и численных методов оценки её параметров. Дешифровка стенограмм происходит на основе полученной информации о символе, а также на основе информации полученной из текстов автора.
Обозначим через x1,...,xn последовательность стенографических символов. Очень часто стенографические символы распознаются неоднозначно. Для символа xk обозначим через x1k,...,xlk множество его возможных распознаваний. Каждому распознанному символу xik определяются его возможные трактовки y1ki,..., y kiki. Тогда распознанный текст примет вид yj1i1,..., y nijnnki. Надо найти такой набор индексов, чтобы вероятность правильного распознавания была максимальной.
На основании формулы умножения вероятностей она равна:
при 3 k 5 выглядит следующим образом:
Для k < 3, оценка вероятности упрощается. Первое слагаемое формулы (6) оценивает точность распознавания стенографического символа.
Второе слагаемое формулы (6) оценивает насколько данный фрагмент текста, принадлежит автору. Коэффициент настраиваются в зависимости от качества распознавания стенограммы.
Первое слагаемое формулы (6) заключается в оценке точности распознавания символа. Точность распознавания символа рассчитывается использующихся при записи данных стенографических документов, необходимо найти те, расстояние до которых минимально. Для расчёта данного расстояния необходимо знать коэффициенты i и i,которые вычисляются исходя из системы уравнений (7).
Где точ — расстояние, при котором появляется первое вхождение символа не схожего с текущим, пол— расстояние при котором вошли все символы из данного класса, схожие с текущим. В диссертационном исследовании расчёт расстояния был произведен при помощи метода корзин. В таблице 1 приводятся расстояния, коэффициенты, для некоторых символов.
Значение стенографического символа может зависеть от того, к какому типу символов относится текущий стенографический символ:
основной, надстрочный и подстрочный. Для определения типа символа строится линия аппроксимации по центрам символов (см. рисунок 5), оценка рассчитывается по следующей формуле: — оценка вероятности того, что символ является основным, — оценка вероятности того, что символ является подстрочным или надстрочным. Где — расстояние от центра символа до линии аппроксимации, — настроечный параметр.
Оценка второго слагаемого формулы (6) заключается в оценки появления данного фрагмента текста и равна:
для k = 5, для остальных значений k, аналогично. Данные числовые характеристики вычисляются на основе аналогичных произведений, а лучше принадлежащих тому же автору. Приведем пример ее вычисления на основании произведений Ф. М. Достоевского.
Для вычисления оценки вероятности (8) строились пятерки слов y jk 5 i y ki. Для этого необходимо было построить матрицы количества вхождения данного слова после всех возможных четверок слов в произведениях. Для вычислений использовался словарь программной системы Smalt. В базе данных данной системы находится порядка 80 000 слов.
Расчёт оценок появления пятерок эквивалентен построению сильно разряженной матрицы большой разрядности в таблице 2 представлены наиболее часто встречаемые тройки, четверки и пятёрки слов, с рассчитанной для них оценкой появления в тексте.
В третьей главе приводится описание программного комплекса по обработке стенографических документов, созданного в качестве инструмента для проведения исследований, связанных с распознаванием рукописных исторических документов. В данном программном комплексе реализованы описанные методы бинаризации, алгоритм выбора метода бинаризации.
Модуль, предназначенный для составления алфавита стенографических записей и извлечения информации о символах, которая в дальнейшем будет использоваться при дешифровке стенографических документов.
Корпорація студентовъ какъ особое званіе Четверки слов Тройки слов Программный комплекс включает в себя следующие составляющие:
1. Модуль для извлечения данных из стенограммы, включающий 1.1 Методы обработки изображений;
1.2 Инструменты поиска схожих символов.
2. Модуль обработки полученных данных, включающий в себя:
2.1 Инструменты редактирования бинарного представления;
2.2 Инструменты редактирования полученных данных.
3. Программа тестирования и подбора методов бинаризации;
4. Информационная система формирования алфавита с возможностью просмотра различных написаний и отображения символов и их расположения на исходном документе;
5. Программную систему дешифровки стенограмм, включающую 5.1 Инструменты дешифровки символов, с представлением пользователю возможных вариантов трактовок;
5.2 Инструменты редактирования дешифровок стенограмм.
Разработанная система является универсальной для дешифровки стенограмм. Таким образом, пользователи могут самостоятельно наполнить базу данных символами той стенографической системы, записи в которой необходимо дешифровать. Для построения алфавита стенографической системы необходимо обработать стенографические записи при помощи модуля извлечения данных из стенограммы, построения алфавита стенографических записей. При обработке стенограммы пользователю необходимо загрузить изображение оригинальной стенограммы в данный модуль. На рисунке 6, представлен внешний вид модуля.
Рисунок 6. Внешний вид модуля обработки стенограммы Основное окно программы представляет собой две области. В левой области находится оригинальное изображение (оригинальная стенограмма), на которой пользователь выделяет необходимый символ. Место выделения отображается на второй области. В данной области находится обработанная стенограмма, т.е. все полученные ранее символы, находящиеся в местах, соответствующих символам в оригинальном изображении. Далее система производит бинаризацию выделенного фрагмента и поиск связных областей. Если сегментов получено несколько, то система предлагает пользователю выбрать, какой сегмент или сегменты соответствуют оригинальному символу. При выборе нескольких сегментов, система производит связывание разорванных «кусков»
и предлагает пользователю результат. В случае, когда результат устраивает пользователя, символ записывается в базу знаний и располагается в правой области соответственно месту (координатам) на оригинальном изображении. Если результат не соответствует требованию пользователя, то возможно редактирование полученного символа при помощи упрощенного графического редактора.
В программном комплексе предусмотрен модуль тестирования и подбора метода бинаризации, в результате работы которого будет наименьшее количество шума и наиболее точное соответствия бинаризованного фрагмента оригинальным графикам стенографических символов. В данной программе реализовано 9 методов бинаризации, 3 метода предобработки изображения. Программа определяет наилучшую комбинацию метода предобработки и бинаризации, чтобы количество получаемого шума было минимально, а бинарное представление символа наиболее соответствовало оригинальной графике символа.
При помощи модуля формирования алфавита, основываясь на оригинальных графиках символов, полученных при помощи модуля извлечения данных о стенографических символах, пользователь наполняет базу данных системы возможными трактовками символов стенографической записи. Исходя из того, что символ может иметь различные трактовки, в системе предусмотрена обработка данной неоднозначности. Эти трактовки символа использовались при дешифровке стенограмм, при оценке возможности существования данных словосочетаний в текстах автора.
Разработка веб-приложения позволяет организовать удаленную работу по обработке стенограмм. На рисунке 7 представлен внешний вид прототипа программного комплекса для дешифровки рукописных исторических документов в виде веб-приложения. В процессе обработки и дешифровки стенограмм будет указываться, кто из исследователей дешифровал данную стенограмму, так как разные пользователи могут по-разному трактовать однотипные записи.
Рабочая область данного программного комплекса, при дешифровке, разделена на две области. В левой находится оригинальное изображение стенограммы. В правой области расположены бинаризованные символы стенограммы, а при необходимости пользователь может включить и прорисовку строк, которые построила система. Для дешифровки символа пользователю необходимо выделить его на оригинальной стенограмме.
Далее система бинаризует данный фрагмент подобранной ранее комбинацией метода предобработки изображения и метода бинаризации при помощи соответствующего модуля. Пересчитываются все ранее определённые строки на обработанной стенограмме, и далее комплекс производит расчёты, исходя из данных о символах, которые находятся в одной строке с текущим обрабатываемым символом. Строится линия аппроксимации данной строки, для определения типа символа. При помощи формулы (7) рассчитываются оценки возможных трактовок для каждого символа. Трактовка с максимальной оценкой считается «правильной»
и записывается в третью рабочую область программного комплекса, находящуюся внизу окна. Пользователю предоставляется список возможных трактовок в порядке убывания оценки правильности дешифровки символа. Если пользователь не согласен с «правильной» дешифровкой, он может выбрать вариант из предложенных или написать свой. При использовании своего варианта дешифровки символа, база значений символов автоматически дополняется.
Рисунок 7. Внешний вид прототипа веб-приложения автоматизации дешифровки В заключении формулируются результаты диссертационного исследования.
ЗАКЛЮЧЕНИЕ
Основные результаты диссертационного исследования:1. разработан алгоритм выбора метода бинаризации рукописных исторических документов плохого качества со сравнением их на контрольной выборке. Апробация алгоритма показала его универсальность, поскольку реализованные методы бинаризации позволяют достичь высокого качества бинаризации и малого количества шума.
2. разработана математическая модель дешифровки символов, основанная на информации о символах, их значениях и типе. И для увеличения правильности трактовки дешифровки используются тексты автора;
3. приведены численные методы определения параметров математической модели, позволяющие рассчитывать параметры на основе информации об используемой стенографической системе и расшифрованных стенограммах.
4. программный комплекс (ИС HisReg), реализующий предложенный метод выбора бинаризации стенографического документа и использующийся для построения алфавита стенографического текста и дальнейшей дешифровки стенограммы.
Программный комплекс был использован для обработки 28 листов стенографической записи, из которых было получено порядка 6000 начертаний стенографических символов, использованных при записи документов.
Работа имеет законченный характер, к перспективам её развития можно отнести: реализацию веб-приложения, прототип которого представлен в диссертации, усовершенствования метода, оценки точности дешифровки символа.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Рогов А. А. Бинаризация и выделение символов исторической стенограммы / А. А. Рогов, А. В. Скабин // Ученые записки Петрозаводского государственного университета. Серия «Естественные и технические науки». —2013. —№ 4 (133). — С. 110—115.2. Гиппиев М. Б. Распознавание строк в стенографических документах / М.Б. Гиппиев, А.В. Жуков, А.В. Скабин, А.А. Рогов // Современные проблемы науки и образования. — электрон. ст. — М.: Издательский дом “АКАДЕМИЯ ЕСТЕСТВОЗНАНИЯ, 2013. — № 4. — Режим доступа: http://www.science—education.ru/110—9725.
3. Рогов А. А. Математическая модель распознавания символов / А. А. Рогов, А. В. Скабин // Ученые записки Петрозаводского государственного университета. Серия «Естественные и технические науки». —2013. —№ 6 (135). — С. 73—76.
4. Skabin A. Computerized Recognition System for Historical Manuscripts // Proceedings of 2nd International Workshop on Concept Discovery in Unstructured Data 2012 (Leuven, Belgium — May 2012). — Leuven, Belgium, 2012. — P. 87 — 94.
5. Рогов А. А. О дешифровке рукописных исторических документов / А. А. Рогов, А. В. Скабин, И. А. Штеркель // Электронные библиотеки:
перспективные методы и технологии, электронные коллекции: Труды XIV Всероссийской научной конференции RCDL 2012. — С. 111—117.
6. Скабин А. В. Автоматизированная система распознания рукописных исторических документов. / А.В. Скабин, И.А. Штеркель // Доклады всероссийской научной конференции «Анализ Изображений Сетей и Текстов» (АИСТ'12) (Екатеринбург — 2012). — С. 245—254.
7. Рогов А. А. Автоматизированная информационная система распознавания исторических рукописных документов. / А.А. Рогов, А. В. Скабин, И.А. Штеркель // Информационная среда вуза XXI века:
Материалы VI международной научной конференции. 4—10 декабря 2012 г. Купио (Финляндия). — С. 127—130.
8. Рогов А. А. О дешифровке рукописных исторических документов / А. А. Рогов, А. В. Скабин, И. А. Штеркель // Информационные технологии и письменное наследие El'Manuscript—2012: материалы IV Международной научной конференции (3—8 сентября 2012). — C. 230—233.
9. Рогов А. А. Автоматизация дешифровки исторических стенограмм / А. А. Рогов, А. В. Скабин, И. А. Штеркель // Информационная среда ВУЗа XXI века: материалы V международной научно—практической конференции (26—30 сентября 2011 г.).— Петрозаводск: Изд—во ПетрГУ, 2011. — С. 164—168.
10. Рогов А. А. Автоматизированная система распознавания рукописных исторических документов / А.А. Рогов, А.В. Скабин // Информационный бюллетень ассоциации «История и компьютер», № 37. Труды международной конференции. Июль 2011 г. — Петрозаводск:
Изд—во ПетрГУ, 2011. — С. 92—96.
11. Рогов А. А. Некоторые особенности создания автоматизированной системы дешифровки исторических стенограмм. / А. А. Рогов, А. В. Скабин, А. Н. Талбонен, И. А. Штеркель // Интернет и современное общество: сборник научных статей. Материалы XIV Всероссийской объединенной конференции «Интернет и современное общество». Санкт—Петербург, 12—14 октября 2011 г. — СПб.: Из—во ООО «МультиПрожектСистемСервис», 2011. — С. 132—138.
Подписано в печать 19.11.13. Формат 6084 116.
Бумага офсетная. Печ. л. 1. Тираж 100 экз. Изд. № 434.
Федеральное государственное бюджетное образовательное учреждение Высшего профессионального образования
ПЕТРОЗАВОДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСТИТЕТ
Отпечатано в типографии Издательства ПетрГУ Республика Карелия, 185910, г. Петрозаводск, пр. Ленина, 33.