На правах рукописи
МИШУКОВ АНДРЕЙ АНДРЕЕВИЧ
МОДЕЛИРОВАНИЕ ПРОЦЕССОВ УПРАВЛЕНИЯ РЕЧЕВОЙ
РАЗБОРЧИВОСТЬЮ В МНОГОКАНАЛЬНЫХ СИСТЕМАХ
КОНФИДЕНЦИАЛЬНОЙ ГОЛОСОВОЙ СВЯЗИ
Специальности: 05.13.18 Математическое моделирование, численные
методы и комплексы программ.
05.13.19 Методы и системы защиты информации, информационная безопасность
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Воронеж 2
Работа выполнена в Воронежском институте МВД России
Научный руководитель: доктор технических наук, профессор Дворянкин Сергей Владимирович.
Официальные оппоненты:
Душкин Александр Викторович, доктор технических наук, доцент, начальник кафедры управления и информационно-технического обеспечения Воронежского института ФСИН России Авсентьев Олег Сергеевич, доктор технических наук, профессор, профессор кафедры информационной безопасности Воронежского института МВД России
Ведущая организация: Российский государственный гуманитарный университет (г. Москва)
Защита диссертации состоится «10» июля 2012 г. в 13 часов 00 минут в ауд. 215/1 корп. на заседании диссертационного совета Д 203.004. в Воронежском институте МВД России по адресу: 394065, г. Воронеж, Проспект Патриотов, дом
С диссертацией можно ознакомиться в библиотеке Воронежского института МВД России.
Отзывы в двух экземплярах, заверенные печатью, просьба направлять по адресу: 394065, г. Воронеж, Проспект Патриотов, дом
Автореферат разослан «09» июня 2012 г.
Ученый секретарь диссертационного совета: Голубинский Андрей Николаевич
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. В настоящее время проблема защиты информации от несанкционированного доступа является одной из основных проблем современной человеческой деятельности.
По оценкам отечественных и зарубежных специалистов значительная часть передаваемой по общедоступным каналам электросвязи информации приходится на долю аудиовизуальной информации, важную часть которой составляют речевые сообщения. Задачи защиты и обработки речевой информации (РИ) занимают одно из ведущих мест в решении общей проблемы информационной безопасности.
Современное состояние проблемы защиты речевой информации (ЗРИ) характеризуется постоянным расширением арсенала средств негласного съема и перехвата акустических (речевых) сигналов, технические характеристики и способы применения которых, неуклонно совершенствуются. В связи с этим особый интерес представляют исследования, направленные на выявление принципиально новых подходов к защите РИ, позволяющих существенно усложнить процесс негласного съема акустических (речевых) сигналов (РС) с каналов голосовой связи.
Разработке и исследованию различных методов обработки и защиты речевой информации, определения разборчивости речевых сообщений, как основного показателя их защищенности, посвящено множество работ зарубежных и отечественных исследователей: Фанта Г., Фланагана Дж., Рабинера Р., Шафера Р., Продеуса А.Н., Калинцева Ю.К., Сапожкова М.А., Макарова Ю. К., Хорева А.А., Каргашина В.Л., Кириллова С.Н., Малинина Ю.И, Голубинского А.Н. и др.
Все алгоритмы и устройства защиты речевой информации можно разделить на 3 основные группы:
шифраторы, в которых осуществляется преобразование речевого сигнала в цифровую форму с последующей защитой по сложному криптографическому алгоритму;
скремблеры, в которых используется сложные операции преобразования исходного речевого сигнала в неразборчивый речеподобный в частотной и временной областях, при этом осуществляется постоянное изменение ключа речевого преобразования (РП) в ходе сеанса связи;
маскираторы, в которых используются относительно несложные операции преобразования над речевым сигналом в частотной и временной областях с целью введения неразборчивости, причем алгоритм самого технического закрытия РС в ходе сеанса связи не изменяется.
Последние обладают рядом неоспоримых преимуществ, как-то:
достаточно невысокая стоимость; относительно высокая стойкость;
максимальная оперативность; повышенное качество восстановленного сигнала; устойчивая работа на каналах среднего и низкого качества (за счет асинхронного режима); возможность работы в многоканальных системах (данная возможность требует дополнительных исследований). Поэтому интерес исследователей к созданию новых типов эффективных маскираторов постоянно растет и это объясняется следующими причинами.
Во-первых, прогресс в вычислительной технике вызвал резкое уменьшение массогабаритных характеристик устройств компьютерной телефонии, и прежде всего смартфонов, с различными функциями речевой обработки при наращивании их вычислительной мощности. Сегодня особый интерес представляют быстрые алгоритмы маскирования, адаптированные под большинство мобильных устройств и приложений, способные в режиме реального времени преобразовывать РИ в защищенный формат.
Во-вторых, многоканальность современной голосовой связи предопределяет право абонентов на выбор наиболее приемлемого канала речевого общения, обуславливает новые требования к защите РИ от НСД, прежде всего, при организации многосторонних аудио-видеоконференций и вебинаров, на которых обсуждаются вопросы, связанные с коммерческой, врачебной, служебной и другими видами тайн, относящимися к разряду конфиденциальной информации.
Удовлетворить требованиям современных групповых пользователей по защите конфиденциальной РИ, передаваемой по различным общедоступным каналам связи, таких как: проводная телефония, сотовые и компьютерные сети связи, довольно трудно. Тем не менее, это возможно осуществить на основе разрабатываемых в работе методов управления речевой разборчивостью (РР), реализованных в маскираторах РС на основе стандартных средств вычислительной техники.
Таким образом, актуальность темы диссертационной работы обусловлена востребованной необходимостью разработки эффективных устройств маскирования речевых сообщений, обеспечивающих высокую степень защиты и скрытности передаваемой речевой информации от действий злоумышленника (ЗЛ).
Объектом исследования являются технологии моделирования систем защиты конфиденциальной речевой связи от умышленного несанкционированного доступа к защищаемой РИ.
Предметом исследования являются модели, методы и алгоритмы управления речевой разборчивостью с целью создания и применения новых типов эффективных речевых маскираторов для защиты конфиденциальной голосовой связи.
Целью диссертационного исследования является разработка и совершенствование математических моделей и методов управления речевой разборчивостью с последующим внедрением в создаваемых на их основе новых типах маскираторов речи, а также повышение эффективности защиты РИ от действий злоумышленника в многоканальных системах конфиденциальной голосовой связи.
Основные задачи исследования. В диссертации поставлены и решены следующие задачи:
1. Анализ существующих современных систем управления защитой речевой информации и особенностей их применения при конфиденциальной многосторонней речевой связи в общедоступных сетях и каналах голосовой связи (КГС).
2. Разработка модели угроз речевой информации при е передаче в общедоступных каналах и сетях голосовой связи.
3. Разработка математической модели преобразования РИ через изменение и обработку изображений амплитудных спектрограмм (графических образов – ГО) защищаемого РС с обратным переходом к его волновой реализации.
4. Разработка модели управления РР через рассечение – разнесение (сепарацию) речевой информации, изменение огибающей спектра и микширования РС с маскирующими квазигармоническими сигналами помехи, синхронизирующими процессы речевого маскирования.
5. Экспериментальное тестирование предложенных моделей и алгоритмов.
Методы исследования. Для решения задач исследования использованы методы математического моделирования, цифровой обработки сигналов и изображений, методы спектрального и корреляционного анализа, экспертного оценивания, теории информационной безопасности, теории управления. Общей методологической основой проведения исследования является системный подход.
Для проведения вычислительного эксперимента и получения первичных результатов оценки применялись существующие возможности программного продукта Matlab версии 7.8.0 и специализированного программного обеспечения «Лазурь» версии 2.0.
Научная новизна работы заключается в следующем:
1. Предложена модель модификации и обработки огибающей спектра РС и связанной с ней фонетической функцией (ФФ), отвечающей за РР, позволяющие моделировать работу известных, создавать и тестировать новые типы процедур речевого маскирования.
2. Предложен алгоритм защиты РИ посредством разделения ГО исходного РС с последующим синтезом на несколько речеподобных сигналов, имеющих заранее заданную разборчивость ниже определенной нормы, с дальнейшей модификацией ФФ и передачей каждой части исходного сообщения по различным независимым КГС, обратными преобразованиями и сборкой на приемном конце.
3. Сформулированы новые направления прикладных исследований в сфере защиты речевой информации, основанные на различных аспектах управления речевой разборчивостью в многоканальных системах и КГС.
Практическая ценность работы. Разработанные методы и подходы к речевому маскированию – управлению РР, через изменение и обработку графических образов РС, позволят создать бюджетные устройства по защите конфиденциальной РИ в многопользовательских системах голосовой связи, сравнимые по стойкости к НСД с дорогими устройствами, использующими сертифицированные средства криптографической защиты.
Разработанное в процессе работы ПО речевого маскирования пригодно для массового применения в телефонных смартфонах на базе ОС «Андроид».
Кроме того, предложенные в работе подходы, за счет избыточности используемых КГС, позволят создавать системы голосовой связи с повышенной помехозащищенностью для использования в чрезвычайных ситуациях и охраны правопорядка.
Основные положения, выносимые на защиту:
математическая модель управления РР, за счет изменения ФФ через обработку спектральных огибающих, в процессе внутреннего и/или внешнего речевого маскирования на основе технологии образного анализасинтеза речи («звук – изображение – звук»), позволяющая моделировать работу традиционных и перспективных речевых маскираторов;
математическая модель управления РР через рассечение – разнесение (сепарацию) РИ путем рассечения-разнесения и обработки ГО РС (изображений узкополосных сонограмм), позволяющая реализовать совместно с методами изменения ФФ новые процедуры речевого маскирования с заданным уровнем остаточной разборчивости;
алгоритм зашиты речевой информации с обоснованием возможности его функционирования в многопользовательских системах голосовой связи посредством разделения образа исходного голосового сообщения, с последующим синтезом нескольких речеподобных сигналов, имеющих заранее заданную разборчивость ниже определенной нормы, с дальнейшей модификацией ФФ и передачей каждой части голосового сообщения по различным независимым каналам связи, обратными преобразованиями и сборкой на приемном конце;
Внедрение результатов работы. Основные результаты работы были использованы в Департаменте информационных технологий, связи и защиты информации МВД России. Теоретические и практические результаты, полученные в ходе выполнения диссертационного исследования, использованы в учебном процессе НИЯУ МИФИ, МГТУ им. Н.Э. Баумана и РосНОУ, о чем имеются соответствующие акты внедрения.
Результаты исследований использовались в целевой НИР по теме:
«Образный анализ-синтез акустических (речевых) сигналов и его приложения к задачам обработки и защиты аудиовизуальной информации», шифр заявки «2010-1.1-214-032-079», Государственный контракт от 29 марта 2010 г. № 02.740.11.0655 в рамках ФЦП «Научные и научнопедагогические кадры инновационной России» на 2009-2013 годы.
Результаты работы внедрены в виде ПО речевого маскирования для создания защищенных смартфонов на базе ОС «Андроид» в ООО «Новилаб Мобайл».
Апробация работы. Основные результаты диссертационной работы докладывались на следующих конференциях: третьем Евразийском форуме:
Международные аспекты информационной безопасности – «ИнфофорумЕвразия», 2007 г.; конгрессе по интеллектуальным системам и информационным технологиям «ais-it’09», Москва, 2009 г.; шестом Евразийском форуме: Международные проблемы информационного взаимодействия и информационной безопасности «Инфофорум-Евразия», г. Москва, 2010 г.
Обоснованность и достоверность результатов диссертации определяется корректным применением использованных методов исследования. Достоверность основных положений диссертационной работы обеспечивается корректностью применения математического аппарата, доказанностью выводов, совпадением теоритических результатов с экспериментальными данными, успешной практической реализацией результатов в образовательной деятельности, апробацией на научнотехнических конференциях и семинарах, а также внедрением результатов в практическую деятельность ряда организаций.
Публикации. По основным положениям диссертационной работы опубликовано 10 печатных работ: 4 статьи в изданиях, рекомендованных ВАК; 3 тезиса докладов; отчет о научно-исследовательской работе; 2 статьи в профильных журналах.
Структура и объем работы. Диссертация содержит 152 страницы машинописного текста и состоит из введения, четырех глав, заключения, списка использованных источников. Основная часть диссертации содержит 142 страницы текста, 38 рисунков и 7 таблиц. Список источников включает 144 наименования.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертационного исследования, сформулированы цели и задачи исследования, приведены научная новизна и практическая ценность работы, указаны положения, выносимые на защиту.
В первой главе выполнен анализ состояния проблемы обеспечения безопасности речевой информации в общедоступных каналах и сетях связи, также рассмотрены речевые технологии, применяемые в системах информационного обмена и безопасности.
В последние годы наблюдается интерес со стороны пользователей к защищенной от прослушивания голосовой конференцсвязи. Также нельзя не замечать повышенный интерес к видеоконференцсвязи со стороны высшего руководства страны и руководителей других звеньев. Однако эффективных и современных технологий защиты РИ от различного рода информационных угроз для мультимодальных систем голосовой связи пока не разработано.
В процессе рассмотрения различных технологий защиты речевых сообщений от прослушивания в общедоступных каналах и сетях голосовой связи были выделены три основных направления развития таких технологий.
Это аналоговое скремблирование, цифровые (криптографические) методы защиты и маскирование речи. Для решения поставленных задач в данной работе, наиболее целесообразным видятся технологии маскирования.
На рис. 1 показано сравнение современных технологий защиты конфиденциальных речевых сообщений с учетом особенностей современной голосовой связи. Как видно из рис. 1, маскираторы не занимают лидирующие положения среди «инструментов» по защите речевой информации, однако применяя новейшие устройства обработки речевой информации и перспективные алгоритмы описания РС, можно существенно повысить уровень защиты и качество восстановленного сигнала маскираторами.
Стратегический уровень защиты Уровень защиты Рис. 1. Характеристики методов и устройств защиты речевой информации Для оценки уровня защиты речевых сообщений при передаче их по открытым каналам связи, предложено использовать показатели речевой разборчивости и критерии эффективности, разработанные для защиты РИ от утечки по техническим каналам в выделенных помещениях (см. табл. 1).
Указанные в табл. 1 показатели нормированных значений РР для ВП, предлагается применять для оценки эффективности защиты РС, передаваемых в каналах голосовой связи, сравнивая их текущую РР с нормой.
Для управления речевой разборчивости в многоканальных системах защиты конфиденциальных переговоров, было выдвинуто предположение о возможности разделения РС каждого из абонентов конфиденциальных переговоров на несколько частей с РР меньше заданной нормы и передачи каждой части по отдельному каналу связи.
При этом речевой сигнал каждого из абонентов конфиденциальных переговоров можно описать совокупностью, а иногда и как сумму нескольких речеподобных сигналов, каждый из которых имеет свою речевую разборчивость со значением менее заданного уровня (нормы) и может быть передан другому собеседнику по своему отдельному голосовому каналу.
Табл. 1. Технические каналы утечки речевой информации и критерии эффективности защиты выделенных помещений переговоров в акустовибрационный, акустооптический, переговоров в ВП переговоров в ВП Скрытие содержания Прямой акустический без применения переговоров в ВП технических средств (непреднамеренное Такой отдельный речевой сигнал, будучи потенциально перехваченным в одном из контролируемых каналов связи, уже не будет понятен нарушителю. У легального же пользователя на приемном конце все полученные по разным маршрутам элементарные сигналы снова сшиваются по определенным правилам в один, теперь уже разборчивый сигнал.
Организационно-техническая модель такой защищенной голосовой связи для одновременно используемых 4-х каналов (три сотовых оператора «большой тройки» плюс канал VoIP) показана на рис. 2 и может быть расширена на большее число абонентов.
Динамик Рис. 2. Общая схема многоканальной системы маскированной речевой связи Математическая модель в общем виде, описывающая схему многоканальной системы маскирования речевой информации представлена в (1), (2) и (3):
где, k – номер канала голосовой связи.
Введем понятия внешнего и внутреннего маскирования. Для первого:
где, Sk (t ) – исходный сигнал, Sk (t ) – маскированный сигнал, смешанный с помехой, Sk (t ) – демаскированный сигнал, N k (t ) – внешняя помеха.
С помощью процессов 2-го типа можно создавать системы ЗРИ с преобразованием спектральных характеристик исходной речи. Например, данный вид маскирования может имитировать различные способы инверсии спектра РС, частотных перестановок и т.п.
где, M Sk ( w, t ) – функция частотно-временного преобразования с целью маскирования речевых сигналов, M 1 Sk ( w, t ) – обратная функция (демаскирование).
Тогда критерием защиты РИ будет являться (4):
где Wsk – разборчивость РС в одном КГС, а Wn – значение нормы РР.
Сформированы основные требования к перспективным видам маскираторов речи с возможностью адаптации к системам конфиденциальной голосовой связи, построенных с их использованием.
Для создания нового типа маскираторов требуется разработка функций управления речевой разборчивостью для регулирования и контроля потенциальной разборчивости в канале передачи речевой информации.
В рамках проведенных работ по анализу перспектив развития современных систем защищенной голосовой связи, выявлена необходимость дальнейших исследований технологии образного анализа-синтеза акустических (речевых) сигналов, уточнения модели РС, создания специализированной компьютерной системы синтеза речеподобных сигналов по изображениям узкополосных спектрограмм.
Во второй главе проведены исследование методов и алгоритмов образного анализа-синтеза акустических (речевых) сигналов.
Отмечено, что речевые вокализмы играют существенную роль в процессах формирования и маскирования смыслового содержания речевого сигнала, его восстановления из шумов, помех и в других важных приложениях защиты речевой информации. В этих приложениях вокализованный участок в частотно-временной области удобно представлять в виде модуляции гармонической структуры обертонов формантной огибающей спектра:
f i. – частота основного тона; k – номер гармоники, обертона.
Для математического описания как вокализованных, так и иных коротких участков речевых сигналов предложено применять уточненную Гауссовскую модель, где РС представлен суперпозицией элементарных узкополосных квазигармонических сигналов:
где Ak – соответствующая амплитуда k-ой гармоники; t k – коэффициент затухания амплитуды k-ой гармоники; 0k, 0k – соответственно центральная частота и начальная фаза KrR узкополосных сигналов составляющих звуковой сигнал; предполагаем, что функция ошибки представления или шума на шаге анализа-синтеза rR стремится к 0.
Результаты исследований показали, что данные, необходимые для расчета параметров узкополосных сигналов – {Ak, 0k, 0k}t=rR., составляющих звучание исследуемого звука, могут содержаться в динамических спектральных развертках аудиосигнала, в виде амплитудно-частотнофазовых характеристик локальных максимумов, находимых на модулях текущего спектра с заданным шагом наблюдения (анализа) по времени и по частоте. Эти временные развертки модулей кратковременных спектров будут составлять столбцы формируемых изображений динамических спектрограмм при построении и использовании ГО звуков и речи.
Определены следующие оптимальные параметры работы системы образного анализа-синтеза сложных аудиосигналов (речи и помех): N>1024;