«Методы слепой обработки сигналов и их приложения в системах радиотехники и связи Москва Радио и связь 2003 УДК 621.396 Горячкин О.В. Методы слепой обработки сигналов и их приложения в системах радиотехники и связи. – ...»
О.В. Горячкин
Методы слепой обработки
сигналов и их приложения
в системах радиотехники
и связи
Москва
«Радио и связь»
2003
УДК 621.396
Горячкин О.В. Методы слепой обработки сигналов и их приложения
в системах радиотехники и связи. – М.: Радио и связь, 2003. – 230с.: ил.
ISB 5-256-01712-8.
Книга посвящена новому направлению цифровой обработки сигналов, известному как «слепая обработка сигналов». Методы и алгоритмы слепой обработки сигналов находят свои приложения в системах связи, задачах цифровой обработки речи, изображений, сигналов радиолокации и радиоастрономии, в медицине.
Рассмотрены вопросы теории и практического применения методов слепой обработки сигналов в задачах оценки каналов связи с межсимвольной интерференцией, широкополосной радиолокации, компенсации искажений в космических РЛС с синтезированной апертурой, задачах обработки многозональных оптических изображений.
Описан ряд новых алгоритмов слепой обработки сигналов, в том числе, основанных на использовании полиномиальных статистик случайных векторов.
Для научных работников, специалистов, занимающихся разработкой радиотехнических систем различного назначения, цифровой обработкой сигналов и изображений. Может быть полезна аспирантам и студентам, интересующимся новыми направлениями ЦОС и её приложениями.
Табл. 2. Ил. 93. Библиогр.146 назв.
Рецензенты: д.т.н.,проф. Д.Д. Кловский, д.т.н.,проф. С.М. Широков Горячкин О.В. ISB 5-256-01712-
ПРЕДИСЛОВИЕ
Задачу слепой обработки сигналов (СОС) можно определить как цифровую обработку сигналов, прошедших через канал с неизвестными характеристиками на фоне шумов.Подобные задачи возникают в различных приложениях цифровой обработки сигналов и изображений. Это цифровая связь, радиолокация, радионавигация, радиоастрономия, распознавание речи, обработка изображений, медицина и т.п.
Исторически, решение этих задач строились в рамках специфических условий конкретных приложений. По мере накопления результатов в последние годы создались предпосылки для построения систематической теории решения «слепой проблемы».
Настоящая книга, пожалуй, первая попытка систематического изложения современной теории и практики слепой обработки сигналов на русском языке.
Основные методы СОС представленные в монографии отражают область научных интересов и результаты автора, полученные в последние годы. Среди них следует отметить новый подход к решению задач СОС на основе полиномиальных статистик, разработанный автором на основе объединения методов теории вероятностей и алгебраической геометрии.
Несмотря на то, что основные приложения СОС, рассматриваемые в данной книге, это цифровая связь по каналам с рассеянием и замираниями, космическая радиолокация с синтезированием апертуры, обработка многоспектральных изображений, предлагаемые методы универсальны, и могут быть применены в любых других приложениях СОС.
Автор выражает глубокую благодарность своему научному руководителю проф. Д.Д. Кловскому за многолетнюю, отеческую поддержку, а также ряд полезных замечаний и советов высказанных при рецензировании монографии.
Автор благодарен рецензенту книги проф. С.М. Широкову за высказанные замечания, советы и интересные дискуссии по теме монографии.
Автор выражает глубокую признательность руководству Поволжской государственной академии телекоммуникаций и информатики (ПГАТИ), всячески способствовавшему научной работе автора и выходу монографии.
Глава 1.
ЗАДАЧИ И ОСНОВНЫЕ ПРИЛОЖЕНИЯ СЛЕПОЙ
ОБРАБОТКИ СИГНАЛОВ
1.1. Обобщенная формулировка проблемы Слепая обработка сигналов (СОС) (blind signal processing) это относительно новая технология цифровой обработки сигналов (ЦОС), получившая свое развитие в течение последних 10-15 лет. Методы и алгоритмы слепой обработки находят свои приложения в системах связи, в задачах цифровой обработки речи, изображений, сигналов радиолокации и радиоастрономии.В общем виде задачу слепой обработки можно сформулировать как цифровую обработку неизвестных сигналов, прошедших линейный канал с неизвестными характеристиками на фоне аддитивных шумов.
Область наблюдения Область неопределенности Векторный x y канал H v Подобные задачи возникают в различных приложениях цифровой обработки сигналов и изображений, поэтому достаточно часто решение этих задач строились на учете специфики конкретного приложения. По мере накопления результатов в последние годы создались предпосылки для построения систематической теории решения «слепой проблемы».
Различают два основных типа задач слепой обработки сигналов:
слепая идентификация канала (оценка неизвестной импульсной характеристики или передаточной функции), слепое выравнивание (или коррекция) канала (непосредственная оценка информационного сигнала). В обоих случаях для обработки доступны только реализации входного сигнала приемного устройства.
В случае слепой идентификации оценка импульсной характеристики может далее использоваться для оценки информационной последовательности, т.е. является первым этапом слепого выравнивания.
Задачи слепой обработки предполагают широкий класс моделей для описания наблюдаемых сигналов. В наиболее общем случае непрерывная модель системы описывается следующим выражением:
где: y (t ) - наблюдаемый векторный сигнал со значениями в Cm, H (t, ) - m n неизвестная матрица импульсных характеристик (ИХ) с элементами hi, j ( ) ; v(t ) - аддитивная помеха (векторный случайный процесс со значениями в Cm, как правило с независимыми компонентами);
x( ) - неизвестный информационный сигнал со значениями в Cn.
Системы, описываемые выражением (1.1) называют системами с множественным входом и множественным выходом (в англоязычной литературе Multiple-Input Multiple-Output или MIMO).
В частном случае, когда H (t, ) = H(t ) мы имеем случай стационарной системы, при этом (1.1) имеет вид:
Если компоненты матрицы H ( ) имеют вид hi, j ( ), мы получаем модель, используемую в задачах слепого разделения источников (Blind Source Separation или BSS):
где: H - m n неизвестная, комплексная, т.н. «смешивающая» матрица с элементами hi, j ; x( ) - неизвестные сигналы.
В частном случае, когда сигналы источников являются реализациями стационарных, статистически независимы друг от друга случайных процессов, мы имеем задачу, которую в последние годы все чаще называют анализом независимых компонент [18] (АНК).
При этом модель, используемую в анализе независимых компонент, часто представляют в виде:
где: y и v - случайные вектора, x - случайный вектор с независимыми компонентами, H - детерминированная неизвестная матрица.
Задача АНК формулируется как задача поиска такой проекции вектора y на линейное пространство векторов x компоненты, которой статистически независимы. При этом доступна только некоторая выборка случайного вектора y и известна статистика шумового вектора v.
АНК является некоторым развитием хорошо известного в статистике метода принципиальных компонент, где вместо более сильного свойства статистической независимости используется свойство некоррелированности.
Если в (1.2) n = 1 и m > 1, то модель системы может быть описана более простым выражением:
где h( ) - неизвестная импульсная характеристика m -мерного канала; x( ) - неизвестный комплексный информационный сигнал со значениями в С.
Системы, описываемые моделями вида (1.5) называют системами с одним входом и множественным выходом (Single-Input Multiple-Output или SIMO).
В случае, если n = 1 и m = 1, то мы имеем модель системы с одним входом и выходом (Single-Input Single-Output или SISO):
Задачи слепой идентификации канала на основе моделей (1.5) и (1.6) далее мы будем называть задачами стационарной слепой идентификации векторного и скалярного канала соответственно.
Под идентифицируемостью системы вслепую понимается возможность восстановления импульсной характеристики системы с точностью до комплексного множителя только по выходным сигналам.
С первого взгляда подобная задача может показаться некорректной, однако это не так, если слепое оценивание канала опирается на использование структуры канала или известные свойства его входа. Естественно, что в свою очередь подобные свойства зависят от особенностей конкретного приложения методов слепой идентификации.
1.2. Основные приложения и модели СОС Существующие и потенциальные области применения технологий СОС можно классифицировать следующим образом:
• Системы передачи информации o системы цифровой коротковолновой связи o системы радиоразведки, несанкционированного доступа, радиоконтроля цифровых систем передачи информации.
• Радиолокация o сверхширокополосная радиолокация o космические радиолокаторы дистанционного зондирования Земли o радиолокационные системы контроля космического пространства • Другие приложения СОС o компенсация искажений в системах формирования и обработки изображений o компенсация искажений в системах распознавания речи o цифровая обработка сигналов в медицинской технике o технологии обработки сигналов в задачах геологии 1.2.1. СОС в системах связи В практике цифровых систем связи, рассчитанных на высокоскоростную передачу через каналы с различного вида рассеянием, ИХ канала, как правило, не известна с достаточной точностью для возможности синтеза оптимальных модуляторов и демодуляторов.
Например, при цифровой связи по коммутируемым телефонным сетям ИХ канала связи меняется каждый раз при наборе нового номера, т.к.
маршрут по каналу каждый раз различен. Это пример стационарного проводного канала, характеристики которого просто не известны априори [16].
В радиоканалах ИХ нестационарны в основном вследствие многолучевого распространения радиоволн на трассе передатчик – приемник, эффектов рефракции и дифракции широкополосных радиосигналов в тропосферных и ионосферных слоях.
К числу таких каналов относятся каналы ионосферной радиосвязи в диапазоне частот 3 – 30 МГц, каналы радиосвязи с тропосферным рассеянием в диапазоне частот 300 – 3000 МГц и в полосе частот 3000 – МГц, каналы космической связи с ионосферным рассеянием в диапазоне частот 30 – 300 МГц [16].
В системах подвижной связи в диапазоне от 1000 – 2000 МГц многолучевой характер распространения сигнала вызван в основном переотражениями радиоволн от зданий и сооружений, особенностей рельефа.
Подобные эффекты возникают и в подводных акустических каналах.
В системах цифровой транкинговой связи, использующих TDMA, системах удаленного радиодоступа, локальных офисных радиосетях каналы также характеризуются существенным временным рассеянием.
Тенденции развития современных систем связи характеризуются все более ужесточающимися требованиями к максимальному использованию объема канала.
В системах последовательной передачи дискретных сообщений по каналам, характеризующимся возникновением эффекта межсимвольной интерференции, компенсация рассеяния с помощью тестирования канала испытательным импульсом - это ключевая технология реализации эквалайзеров различного типа [16].
Однако время (от 20% до 50%), затрачиваемое на тестирование канала, все более привлекательный ресурс для модернизации стандартов TDMA, особенно в системах подвижной связи (например, в стандарте GSM примерно 18% информационного кадра используется для передачи испытательного импульса).
Еще один пример, это компьютерные сети, где связь между терминалами и центральным компьютером устанавливается в асинхронном режиме так, что в некоторых случаях, обучение приемника невозможно.
Альтернативой тестированию канала в этих системах является использование методов слепой обработки сигналов.
Модель системы передачи дискретных сообщений с учетом рассеяния в канале может быть представлена в виде следующего выражения [78]:
где: y (t ) - сигнал в приемнике; {an } - последовательность информационных символов алфавита A = {a1,..., ak,..., aM } ; sk (, ak ) - канальный сигнал, соответствующий k-му символу; h(, t ) - импульсная характеристика канала связи; v(t ) - аддитивная помеха, T - тактовый интервал. Для линейной цифровой модуляции (1.7) можно преобразовать к виду (1.8).
Для каналов с медленными временными замираниями справедливо следующее упрощение:
В различных случаях априорной параметрической и структурной неопределенности модель канала содержит ряд параметров и/или функций неизвестных на приемной стороне.
Неопределенность в рассматриваемом контексте может возникать не только вследствие прохождения информационных сигналов систем передачи через неизвестный искажающий канал, но и в случаях неизвестной структуры и параметров тестовых сигналов, используемых в системе передачи. Подобная проблема может возникнуть в задачах радиоразведки или радиоконтроля.
В случае «полной» непараметрической неопределенности относительно импульсной характеристики канала и канального сигнала мы имеем дискретно-временную модель системы передачи в виде (1.10), соответствующую модели с одним входом и выходом (1.6):
где: x(l ) - неизвестная информационная последовательность, описываемая той или иной статистической моделью, h(l ) - неизвестная импульсная характеристика сквозного дискретного канала системы передачи, L - память канала, v(l ) - неограниченная последовательность статистически независимых, произвольно «окрашенных» отсчетов шума.
Импульсная характеристика сквозного канала может рассматриваться как детерминированная, так и случайная функция. Когда канал стационарный, выходная последовательность стационарна в дискретном времени. Для линейных, постоянных во времени, детерминированных каналов, когда частота дискретизации выше скорости передачи символов (обычно в целое число m раз), дискретизированный сигнал является циклостационарным, или, что эквивалентно, может быть представлен как вектор стационарной последовательности, лежащий в основе модели с одним входом и множественным выходом (1.5), где мы складываем в стек m последовательность входных отсчетов, в течение приема очередного входного символа.
Тогда дискретно-временная модель системы передачи может быть представлена в виде:
В этом выражении y (l ) и h(n ) m -мерные вектора сигнала в приемнике и импульсной характеристики.
Другой случай, описываемый моделью векторного канала (1.11) возникает в случае пространственного разнесения нескольких приемных антенн (разнесенный прием).
В последние годы большой интерес исследователей в области связи вызывает возможность использования шумовых сигналов. По некоторым оценкам подобные системы могут обеспечить скорости передачи в радиоканале до 1 Гбит/с (сегодня экспериментально достигнутый уровень скорости передачи составляет десятки Мбит/с).
Основная идея здесь, это использование шумового (хаотического) сигнала в качестве несущего колебания системы передачи информации (т.н. прямохаотические системы связи [31]).
Информация вводится в хаотический сигнал с помощью амплитудной модуляции шумового сигнала или путем изменением параметров источника детерминированного хаоса. Поэтому использование специального тестового сигнала в этих системах становится нецелесообразным. В тоже же время, использование шумового сигнала в качестве несущего колебания создает широкие возможности применения в этих системах как детерминированных, так и статистических методов слепой идентификации.
Впервые алгоритм прямого слепого выравнивания канала связи в цифровых системах с амплитудной модуляцией был предложен, повидимому, Сато в 1975г. [19]. Алгоритм Сато был впоследствии обобщен Д. Годардом в 1980г. [20] для случая комбинированной амплитуднофазовой модуляции (известен также как «алгоритм постоянных модулей»).
В общем виде алгоритмы данного типа относятся к классу так называемых стохастических градиентных алгоритмов слепого выравнивания, которые строятся по принципу адаптивного эквалайзера (данный класс алгоритмов называют также алгоритмами Базганга).
Сигнал ошибки адаптивного эквалайзера в данном случае формируется безинерционным нелинейным преобразованием выходного сигнала, вид которого, зависит от используемой сигнально-кодовой конструкции [16].
Существенным, для алгоритмов данного типа, является то, что входные сигналы в цифровых системах связи, как правило, негауссовы, а влияние канала, приводящее к наложению большого числа этих сигналов, вследствие центральной предельной теоремы теории вероятностей, нормализует наблюдаемые отсчеты сигнала в приемнике. Поэтому сигнал ошибки в этих алгоритмах чувствителен именно к этим свойствам сигналов на выходе эквалайзера. Отличительным достоинством данных алгоритмов является отсутствие требований к стационарности ИХ канала на интервале оценивания. Причем заметим, что абсолютное большинство алгоритмов слепой идентификации и коррекции, так или иначе, требуют такой стационарности.
Этапом в развитии методов слепой обработки сигналов в системах связи стало использование статистик высокого порядка для идентификации каналов, входные сигналы которых описываются моделью стационарных негауссовских случайных процессов [6,16]. В рамках данных методов, как правило, удается найти явное решение для неизвестного канала.
Относительно недавно понятая возможность использования статистик 2-го порядка для слепой идентификации векторного канала связи ( m > 1 ) существенно приблизила перспективу внедрения технологий слепой обработки в системы связи и спровоцировала целое направление работ последних лет [13,21], в рамках которого на сегодняшний день найдено целое семейство быстросходящихся алгоритмов идентификации. При этом для идентифицируемости канала существенно наличие хотя бы 2-х независимых каналов приема.
Использование статистик 2-го порядка для слепой идентификации скалярного канала ( m = 1 ) возможно в целом для нестационарной модели входного сигнала и в частном случае периодически-коррелированного (циклостационарного) сигнала.
Рис. 1.2. Модель нестационарного по входу канала связи.
Возможность слепой идентификации в случае циклостационарности сигнала на выходе была показана в [22], для принудительной циклостационарной модуляции сигнала на входе в [23] (Рис.1.2), в общем случае для нестационарного входа в [17].
Дискретно-временная модель широкого класса систем передачи дискретных сообщений может быть записана в виде:
где: hl, l = 0,..., L 1 - импульсная характеристика канала связи;
xi, i = 0,..., + L 2 - информационная последовательность. В зависимости от вида модулирующей последовательности мы можем получить различные структуры передаваемых сигналов (Рис.1.3).
Рис.1.3. Входные сигналы системы передачи: а) стационарная последовательность; б) последовательность с пассивной паузой; в) последовательность с активной паузой; г) последовательность с циклостационарной модуляцией Системы с модулирующими последовательностями, показанными на Рис.1.3.б,в,г относятся к классу систем с нестационарным входом. Наличие такого типа нестационарности в входных сигналов уже является достаточным условием для идентифицируемости канала связи вслепую.
При этом в системах с активной паузой (системы с испытательным импульсом) на тестирование канала тратится максимальное время. В тоже время в системах с циклостационарной модуляцией общего вида (Рис.1.3.г), как и в системах со стационарным входом мы не тратим время на тестирование неизвестного канала связи.
1.2.2. СОС в радиолокации В современной радиолокации использование для зондирования все более широкополосных электромагнитных импульсов напрямую связано с увеличением временной разрешающей способности и, следовательно, информативности этих систем.
Однако влияние тракта и среды распространения радиоволн возрастает пропорционально полосе частот используемых сигналов, что часто приводит к потере когерентности системы. Особенно этот эффект существенен для сверхширокополосной радиолокации.
Задачу слепой обработки сигналов в данном случае можно сформулировать как проблему оптимального когерентного приема неизвестных сигналов отраженных от протяженного объекта конечных размеров.
Такая проблема возникает в частности при активной радиолокации космических объектов через атмосферу Земли. РЛС подобного типа используются сегодня не только в системах противовоздушной, противоракетной и космической обороны, системах предупреждения о ракетном нападении, но и в задачах контроля за космическим «мусором», который за 40 лет космической эры заполняя околоземное космическое пространство, создает все большие проблемы для космической деятельности человечества.
Рис.1.4. Радиолокация космических объектов через ионосферу Земли.
В этом случае пачка зондирующих сигналов РЛС, проходя туда и обратно через атмосферу (см. Рис.1.4) получает искажения, вызванные частотной зависимостью коэффициента преломления ионосферы и поляризационной дисперсией, возникающей вследствие эффекта Фарадея.
Масштабы влияния данного эффекта рассмотрены в [32]. В соответствии с этими данными существенные дисперсионные искажения радиосигнала возникают уже в S диапазоне и быстро возрастают при увеличении полосы частот и длины волны.
В большинстве случаев модель сигнала РЛС, отраженного от пространственно распределенной цели можно представить в виде:
где: yn (t ) - последовательность отраженных импульсов; (, n ) коэффициент обратного рассеяния лоцируемого объекта; h(t ) - искаженный зондирующий импульс РЛС.
Коэффициент обратного рассеяния зависит от структуры и геометрии объекта, ориентации объекта и РЛС, их относительного движения, параметров зондирующего сигнала. Эта информация может быть использована для решения задач распознавания радиолокационного объекта и получения данных об его форме [25,26].
Геометрическую структуру радиолокационного объекта можно восстановить при достаточно большом пространственном разнесении приемников РЛС (радиолокационной базе) [27,28]. В этом случае реализуется возможность получения многоракурсных проекций, и задача сводится к использованию томографических методов [29].
В случае локации объекта из одной точки пространства распознавание объекта может быть осуществлено по временным, поляризационным или время-частотным портретам радиолокационной цели (сигнатурам).
Во всех этих задачах для восстановления коэффициента обратного рассеяния мы должны точно знать форму зондирующего импульса РЛС. В тоже время при распространении зондирующего импульса его форма меняется при прохождении через атмосферу [30] и приёмный тракт.
В этом случае для восстановления коэффициента обратного рассеяния лоцируемого объекта мы имеем задачу слепой идентификации скалярного или векторного радиолокационного канала. Причем в отличии от приложений слепой идентификации в системах связи, где практически всегда можно использовать технику испытательных импульсов для идентификации неизвестного канала, в радиолокации подобный подход практически невозможен.
Радиолокация поверхности Земли с летательных аппаратов с помощью радиолокаторов с синтезированной апертурой (РСА) за последние лет прошла путь от единичных научных экспериментов до устойчиво развивающейся отрасли дистанционного зондирования Земли (ДЗЗ) [33].
От применения этих систем научное сообщество ожидает в ближайшем будущем существенного прогресса в решении таких глобальных проблем, как предсказание землетрясений и извержений вулканов, понимания процессов глобального изменения климата и в науке о Земле в целом.
Помимо научного назначения эти системы сегодня являются уникальным инструментом при решении таких практических задач, как контроль чрезвычайных ситуаций, экологический мониторинг, картография, сельское хозяйство, мореплавание во льдах и прочее. Следует также отметить, что эти системы являются одним из эффективных инструментов контроля за выполнением договоров по разоружению.
Расширение областей применения РСА стимулирует постоянный рост требований к их пространственному разрешению, а также освоению новых частотных диапазонов.
При этом становится все более значимым эффект деградации пространственного разрешения радиолокационных изображений (расфокусировка), который возникает в этих системах вследствие погрешности траекторных измерений, влияния среды распространения, движения цели.
Задача автоматической фокусировки изображений радиолокаторов с синтезированной апертурой впервые стала актуальной в связи с повышением пространственного разрешения авиационных РСА до уровня единиц метров в конце 80-х и первой половине 90-х годов. Проблема была вызвана тем, что навигационные системы самолета не могли с необходимой точностью обеспечить измерение траектории перемещения фазового центра антенны РСА, что является необходимым условием получения высокого пространственного разрешения [34].
Рис.1.5. Радиолокационное изображение авиационной РСА L – диапазона «МАРС» (ЦРМ ДЗЗ им. А.И. Калмыкова, г. Харьков, Украина) дефокусированное изображение слева, фокусированное изображение справа.
Если параметры относительного движения объекта и РЛС известны то, используя методы прямого или обращенного синтеза апертуры возможно построение радиолокационного изображения объекта. В этом случае модель отраженного сигнала может быть представлена в виде:
где: (, ) - комплексный коэффициент отражения подстилающей поверхности; h(t,,, ) - пространственно-временной сигнал РЛС с синтезированной апертурой, отраженный точечной целью (импульсная характеристика радиолокационного канала);, - координаты элемента подстилающей поверхности (азимут, дальность); t, - временные координаты двумерного отраженного сигнала.
В системах, использующих методы обращенного синтеза апертуры, телескопических РСА размер области интегрирования D(t, ) значительно больше размера объекта в плоскости t, модель сигнала (1.14) можно представить в виде двумерной свертки:
Качественно, процесс формирования радиолокационных изображений в РСА показан на Рис.1.5.
В целом задача формирования радиолокационных изображений относится к классу обратных задач. Неопределенность относительно одного или нескольких параметров псевдообратного или регуляризирующего оператора H 1 и составляет существо проблемы параметрической фокусировки радиоизображений [35].
В такой постановке проблема в большинстве случаев была успешно решена разработкой алгоритмов цифровой автофокусировки изображений РСА.
Широко известны две основных группы алгоритмов автофокусировки, это: алгоритмы, основанные на использовании критерия качества в виде локальных статистик РСА изображений и алгоритмы, использующие корреляционные свойства расфокусированных изображений [35,36].
В большинстве случаев, эти алгоритмы обеспечивают достижение заданного уровня разрешения, однако, в случае, когда РСА устанавливается на летательных аппаратах легкого класса (малая авиация, вертолеты, беспилотные самолеты), вариации параметров фокусировки становятся сравнимы с интервалом синтеза апертуры. В этом случае получение заданного уровня разрешения требует использования более адекватных моделей траекторного сигнала и более эффективных алгоритмов автофокусировки.
В отличие от задачи параметрической фокусировки, когда неизвестны один или несколько параметров траекторного сигнала; в задаче непараметрической фокусировки приходится восстанавливать неизвестный оператор H 1 в целом [35].
Задача непараметрической фокусировки (слепой идентификации) возникает в основном вследствие эффектов распространения сигналов РСА в атмосфере [37] и характерна в большей степени для РСА космического базирования и авиационных РСА, уровень пространственного разрешения которых достигает единиц сантиметров и требует использования сверхширокополосных сигналов.
1.2.3. Слепая обработка изображений Коррекция линейных искажений изображений различного происхождения (оптических, акустических, рентгеновских, инфракрасных) это задача восстановления двумерного, пространственно ограниченного, неотрицательного сигнала [39], искаженного линейным оператором.
Модель такого сигнала также может быть описана выражениями (1.14) или (1.15) с учетом того, что y (t, ) и (, ) положительные, пространственно ограниченные функции. В тех случаях, когда изображение формируется как интенсивность поля некоторого когерентного источника, модель такого изображения может быть представлена в виде:
Источники линейных искажений это, например дефокусировка объектива оптической системы формирования изображения, скоростной сдвиг (смаз) изображения вследствие движения объекта в процессе экспозиции, различного рода дифракционные ограничения (т.е. ограничение пространственного спектра изображения регистрирующим устройством), влияние среды распространения (например, атмосферная турбулентность).
Часто исследователю известна форма импульсной характеристики искажающего изображение канала [39], тогда коррекция изображения может быть осуществлена линейным оптимальным или субоптимальным фильтром, построенным в соответствии с той или иной стратегией регуляризации [40].
Слепая коррекция изображений (blind image deconvolution) задача, возникающая в случае отсутствия априорной информации об ИХ канала формирования.
Особенно актуальна задача слепой коррекции линейных искажений изображений в задачах дистанционного зондирования Земли, астрономии, медицине.
Возможности слепой идентификации скалярных двумерных каналов несколько шире, чем одномерных. Это обстоятельство не раз отмечалось в литературе [41] и исторически привело к более интенсивному внедрению методов слепой обработки в данном случае.
Хорошо известно, например, что ковариационные функции стационарного процесса на выходе линейной системы не содержат информации о фазе её передаточной функции, и слепая идентификация канала по модулю передаточной функции возможна только для узкого класса систем с минимальной фазой.
Интересно, что для дискретных случайных полей это, вообще говоря, не так. Т.е. для двумерных дискретных сигналов возможности восстановления фазы по модулю передаточной функции значительно шире. Этот несколько неожиданный результат был получен методом математического моделирования Фьенапом в 1978г. (см. обзор [42]).
Объяснение этому факту заключается в том, что в кольце полиномов от двух и более переменных над полем комплексных чисел существует достаточно мощное множество неприводимых полиномов в отличие от кольца полиномов от одной переменной где, как известно, не существует неприводимых полиномов, степень которых больше 1.
Поэтому если двумерный дискретный сигнал имеет z преобразование, неразложимое на более простые множители, то очевидно используя единственность факторизации многочлена на неприводимые множители мы можем восстановить дискретный сигнал по его автокорреляции или что эквивалентно по его амплитудному спектру [43].
Естественно, что данное свойство двумерных сигналов можно использовать и для решения задачи детерминированной слепой идентификации канала формирования изображения [44].
Рассмотрим модель двумерной дискретной свертки:
Это же соотношение может быть записано в виде произведения полиномов кольца С[z1, z2 ] :
Если полиномы h( z1, z 2 ) и x( z1, z 2 ) неприводимы в кольце С[z1, z2 ], то факторизуя y ( z1, z 2 ) мы решаем проблему слепой идентификации.
Конечно, практическое применение подобного подхода существенно ограничено сложностью процедуры факторизации полиномов от многих переменных и наличием шума.
Алгоритм, имеющий некоторое практическое значение и основанный на свойстве неприводимости полиномов (1.18) известен как алгоритм «нулевого листа» был предложен в [45]. Алгоритм использует свойства поверхностей, точки которых являются корнями полиномов канала и истинного изображения. Концептуально близкий алгоритм был предложен в [46].
Дополнительным некоторым ограничением области применения данного подхода является использование предположения о пространственной ограниченности сигналов.
Помимо свойств z -преобразований от сигналов конечной протяженности для слепой идентификации используются также неотрицательность истинного изображения, различные параметрические модели (см.
обзор [47]).
1.2.4. Другие приложения СОС В последние годы наблюдается бурное развитие биомедицинских компьютерных технологий. Возможности цифровой обработки электрокардиограмм, энцефалограмм, электромиограмм, магнитоэнцефалограмм существенно расширили возможности диагностики широкого класса заболеваний.
Особенностью применения данных методов является необходимость разделения сигналов изучаемых органов от шумов различного происхождения и мешающих сигналов (например, разделение кардиограмм матери и ребенка).
В этих технологиях находят своё прямое применение методы слепого разделения источников и анализа независимых компонент. Модели наблюдаемых сигналов, используемые в этих приложениях, описываются выражениями (1.2) и (1.3) [144].
Проблема распознавания речи ключевая задача во многих областях робототехники и кибернетики. Технологии распознавания речи могут использоваться для управления действием различного рода машин и механизмов, ввода и поиска данных в компьютере и т.п.
В системе регистрации звуковой информации, доступный для распознавания сигнал это свёртка первоначального речевого сигнала и импульсной характеристики датчика и окружающей среды.
При этом параметры датчика также как и параметры среды изменяются чрезвычайно. Телефонные трубки различаются по степеням искажения, спектрального состава и уровня сигнала. Микрофоны изготовляются разнообразными способами и расположены в различных позициях телефонной трубки, с отверстиями различных размеров, расположены в различных точках в пределах звукового поля вокруг рта. Устройство распознавания, которое хорошо подходит для одного специфического датчика в одной специфической среде, могло бы работать очень плохо в других условиях. Поэтому, желательно чтобы эти параметры не влияли на работу алгоритма распознавания. Слепая идентификация используется в данной задаче для восстановления первоначального речевого сигнала [48,144].
Борьба с реверберацией необходима, в тех случаях, когда первоначальный речевой сигнал искажён акустикой окружающей среды, т.к. акустика окружающей среды зависит от геометрии и материалов комнаты и местоположения микрофона.
Так как первоначальный речевой сигнал неразличим и акустика окружающей среды неизвестна, слепая идентификация может использоваться в адаптивной борьбе с реверберацией.
Одной из показательных задач иллюстрирующих проблематику слепого разделения независимых источников является т.н. проблема разделения нужного разговора на фоне других говорящих людей, музыки, посторонних шумов (cocktail party problem). Мы можем заметить, что наш мозг легко с этим справляется, в тоже время, для компьютера это очень сложная задача.
Прикладное значение эта проблема имеет для разработки адаптивных систем прослушивания при записи звуковой информации на несколько микрофонов, установленных в помещении.
В задачах геологии, сейсмологических исследованиях используются технологии регистрации сигналов источников механических колебаний как искусственного происхождения (закладка в шурф динамита), так и естественного (землетрясение). Эти сигналы используются для оценки коэффициентов отражения различных пластов земной коры.
Слепая проблема возникает здесь вследствие непредсказуемости и соответственно неопределенности формы возбуждающего импульса [144].
ОСНОВНЫЕ ТЕОРЕМЫ СЛЕПОЙ ИДЕНТИФИКАЦИИ
2.1. Идентифицируемость векторного канала Рассмотрим задачу слепой идентификации векторного канала, т.е.канала со скалярным входом и векторным выходом. Условия слепой идентифицируемости канала обычно формулируются в отсутствии шумов.
При этом различают задачи статистической и детерминированной идентификации, имея в виду модель информационной последовательности.
С практической точки зрения это означает, что в случае детерминированной идентификации нам доступны одна или крайне ограниченное количество реализаций входного сигнала, для статистической идентификации мы имеем в принципе неограниченную выборку.
Под идентифицируемостью системы вслепую понимается возможность восстановления передаточной функции и/или импульсной характеристики канала с точностью до комплексного множителя только по выходным сигналам.
Пусть идентифицируемый канал описывается следующими выражениями:
В этом выражении: yl(k ) (z ) - полином степени (t 1) над полем комплексных чисел, образованный блоком из t отсчетов на выходе k -го канала, k = 1,..., M, l = 0,..., 1 - номер блока выходных отсчетов;
L = max{L1,..., LM } - максимальная длина векторного канала; xl (z ) - полином степени (t 1) над полем комплексных чисел, образованный блоком из t информационных отсчетов на входе канала.
Наша задача найти условия, которым должны удовлетворять информационная последовательность и отсчеты векторного канала, при выy( )(z ),..., y( (z )} h01),..., hL 1,..., h0M ),..., hLM1) и коэффициенты информационной последовательности.
Пример 1. Пусть M = 2 и пусть известно, что L = 2.
а) Если y (1) = (0,2,0,0), y (2 ) = (2,0,2,2 ) то задача слепой идентифиh (1) = (1,1), h(2 ) = (1,1) x = (1,1 1,1,1).
б) Если y (1) = (2,0,2,0 ), y (2) = (0,2,0,2), то задача слепой идентификации имеет, по крайней мере, два решения 1) h (1) = (1,1), h(2 ) = (1,1) и x = (1,1 1,1,1), 2) h(1) = (1,1), h(2 ) = ( 1,1) и x = (1,1 1,1,1).
Заметим, что если бы мы знали информационную последовательность, т.е. решали задачу классической идентификации, то в обоих случаях имелось бы единственное решение для канала.
Действительно пусть y (k ) = y0k ),..., y (k 1, тогда:
где: h (k ) = h0k ),..., hLk)1, X H (L ) - ганкелева матрица, составленная из отсчетов информационной последовательности. Тогда известна следующая теорема [3], являющиеся прямым следствием теоремы КронекераКапелли.
Теорема 1. Для идентифицируемости скалярного канала по известной информационной последовательности для любых значений h = h0,..., hL 1 необходимо и достаточно, чтобы rank (X H (L )) L.
Очевидно, что данная теорема устанавливает также необходимое условие для слепой идентификации.
В рассмотренном примере rank (X H (2 )) = 2 и соответственно имеется единственное нормальное решение для каждого канала при известном входе.
Однако как это видно из примера задача слепой идентификации требует значительно более жестких ограничений на информационную последовательность, чем задача классической идентификации.
Рассмотрим случай детерминированной идентификации векторного канала для M = 2 в полиномиальной интерпретации.
Анализируя структуру преобразования (2.1) легко заметить, что если = L, то справедливо следующее соотношение:
В этом уравнении 2 L неизвестных h01),..., hL 1, h02 ),..., hL21. Выберем 2 L различных значений формальной переменной z1,..., z 2 L. Тогда используя (2.3) мы можем записать 2 L однородных линейных уравнений относительной 2 L неизвестных коэффициентов канала.
В матричной форме, получим:
Y1(z1,..., z2 L )h = Для того, чтобы система линейных уравнений (2.4) имела единственное нетривиальное решение в соответствии с теоремой КронекераКапелли необходимо и достаточно чтобы ранг матрицы Y1 (z1,..., z2 L ) был равен (2 L 1). Используя формулы (2.1) матрицу системы уравнений (2.4) можно представит в виде:
= X(z1,..., z2 L )H1,2.
Т.о. для идентифицируемости системы необходимо и достаточно, чтобы выполнялись два условия:
1) ранг (2 L 2 L 1) матрицы X( z1,..., z2 L ) равен (2 L 1), для любых различных z1,..., z2 L ;
Для того чтобы матрица H1,2 имела ранг (2 L 1) необходимо что бы нашелся не равный нулю минор порядка (2 L 1). Используя перестановку строк матрицу H1,2 для случая L2 L1 можно представить в виде:
Где T - матрица перестановки, Syl (h1(z ), h2 ( z )) это матрица Сильвестра, образованная коэффициентами полиномов h1 ( z ) и h2 (z ), которые det (Syl (h1(z ), h2 (z ))) = 0 только если полиномы h1 ( z ) и h2 (z ) имеют общий корень. Тогда если длина L2 = L, то главный минор матрицы (2.6) равен Первое условие содержит в себе еще два ограничения которые становятся более очевидны, если представить матрицу X( z1,..., z2 L ) в виде:
Где: Vt2 L (z1,..., z 2 L ) - матрица Вандермонда имеет ранг 2 L 1 если t 2 L 1, X H (2 L 1) - ганкелева матрица, составленная из отсчетов информационной последовательности.
Линейная сложность детерминированной последовательности это наименьшее значение D такое, что X H (D ) имеет полный ранг по столбцам или существуют такие не равные нулю одновременно j для которых:
Линейная сложность характеризует степень предсказуемости детерминированной последовательности ограниченной длины. Для того чтобы матрица X H (2 L 1) имела полный ранг по столбцам, линейная сложность информационной последовательности должна быть больше (2 L 2 ).
Теперь мы можем объяснить пример 1. В случае а) идентификация возможна, т.к. линейная сложность входной последовательности равна 3, в случае б) несмотря на то, что каналы не имеют общих нулей, идентификация неоднозначна т.к. линейная сложность входной последовательности равна 2.
Т.о. мы определили необходимые и достаточные условия идентифицируемости векторного канала для случая M = 2. Сформулируем этот результат в виде следующей теоремы, обобщив его на случай M > 2.
Теорема 2. Для идентифицируемости детерминированного векторного канала необходимо и достаточно выполнения следующих условий:
1) полиномы h1(z ),..., hM (z ) не должны иметь общих корней;
2) линейная сложность информационной последовательности 3) длина информационной последовательности должна быть больше (4 L 3) или длина вектора данных больше (3L 2).
Доказательство:
Случай M = 2 был нами доказан. Докажем теперь общий случай.
Уравнение (2.3) для любой пары образованной i -м и j -м каналом имеет вид:
Среди этих уравнений нетривиальных и несовпадающих K = M (M 1) 2 для L M неизвестных. Из них мы всегда можем сформировать дополнительные, выбирая сечения z1,..., z s так что s K L M.
Запишем (2.8) в матричной форме, аналогично (2.4).
Yi ( z1,..., z s ) имеет размер ((M i ) s L M ) и Y(z1,..., z s ) соответственно Определим вектор hT = h01),..., hL 1,..., h0M ),..., hLM1), тогда (2.4) можно записать в виде:
Для однозначной идентификации необходимо и достаточно, что бы для любых различных чисел z1,..., z s ранг матрицы Y( z1,..., z s ) был равен Пусть H (i ) - тёплицева матрица вида:
rank (X ) = min{s K, (2 L 1) K }. Тогда в соответствии с неравенством Фробениуса и неравенством s K L M то rank (Y(z1,..., z s )) rank (H ).
Очевидно, что rank (H ) < M L, поскольку легко проверить равенство Покажем, что при выполнении условия 1) rank (H ) = (M L 1).
Введем новые переменные vT = v01),..., v L 1,..., v0K ),..., vLK 1, так что имеют место следующие уравнения:
тогда уравнение Hh эквивалентно условию rank (H) = (K (2 L ) 1). Проведя элементарные преобразования по аналогии с (2.6) легко убедиться в справедливости последнего утверждения, для чего необходимо и достаточно выполнение условия 1). Теорема доказана.
Данная теорема (впервые сформулированная по видимому в [2,5]) играет ключевую роль в задачах слепой детерминированной идентификации векторных каналов.
Необходимые условия идентифицируемости, сформулированные в данной теореме, могут быть ослаблены. Возможно, что достаточные условия этой теоремы также могут быть ослаблены [5], но в этой области требуются дальнейшие исследования. Условия теоремы по существу гарантируют следующие интуитивные требования:
1) все каналы в системе должны отличаться друг от друга, например они не могут быть идентичны;
2) входная последовательность должна быть достаточно сложна.
Она не может быть нулевой, константой или одиночной синусоидой;
3) в наличии должно быть достаточно отсчётов выхода.
Сформулируем теперь важную теорему для решения задачи коррекции векторного канала.
Теорема 3. Если известен hT = h01),..., hL 1,..., h0M ),..., hLM1), то для однозначного решения задачи коррекции канала при любой информационной последовательности необходимо и достаточно, чтобы полиномы h1(z ),..., hM (z ) не имели общих корней или эквивалентно обобщенная матрица Сильвестра H S = H (1),..., H (M ) Доказательство:
YL ( z ) = y0 ) (z ),..., y L 1(z ),..., y0M )(z ),..., y LM1 (z ) ков X2 L 1(z ) = x0 ( z ),..., x2 L 2 (z ), тогда:
Для любого z если rank (H S ) = 2 L 1, то найдется единственный вектор X 2 L 1 (z ), являющийся решением системы уравнений (2.19).
Докажем эквивалентность условия на ранг матрицы H s и условия отсутствия общих корней у полиномов h1(z ),..., hM (z ) от противного.
Пусть rank (H S ) = 2 L 1. Нуль-пространство матрицы H s образовано линейно независимыми векторами V = (v1,..., v s ) C 2 L 1, где c11),..., c L )1,..., c1M ),..., cLM )1 корни полиномов h1(z ),..., hM (z ). Тогда очеM видно, что если найдется хотя бы один совместный корень c полиномов h1(z ),..., hM (z ), то найдется ненулевой вектор v = 1, c, c 2,.., c 2 L 2 принадлежащий нуль-пространству матрицы H s, т.е. ранг rank (H S ) < 2 L 1.
Для доказательства обратного утверждения, т.е. если h1(z ),..., hM (z ) не имеют общих корней то rank (H S ) = 2 L 1, мы должны показать, что вектора, образованные совместными корнями полиномов образуют базис нуль-пространства матрицы H s. Для этого заметим, что если c1,..., cs совместные корни одиночной кратности h1(z ),..., hM (z ), то V - матрица Вандермонда, имеет ранг s. Если среди корней c1,..., cs будут кратные корни, то часть базисных векторов может быть сформирована, используя производные соответствующего порядка наибольшего общего делителя полиномов h1(z ),..., hM (z ). Более подробное доказательство можно найти в [4].
В задачах статистической идентификации условия идентифицируемости могут обсуждаться в более широком контексте. Например, если число доступных отсчётов на выходе канала бесконечно и вход - негауссовский стационарный случайный процесс, то система может быть идентифицирована точно по статистикам высшего порядка даже тогда, когда полиномы каналов имеют общие нули. Или, например, если на входе стационарный случайный процесс (в том числе и гауссовский) система может быть идентифицирована, если известны точно статистики второго порядка выхода и совместные нули полиномов каналов находятся внутри единичной окружности (условие минимума фазы) [6].
Сформулируем теперь условия, ограничивающие статистические методы слепой идентификации векторного канала. Рассмотрим условия статистической идентификации для случая, когда входная последовательность стационарна и число доступных отсчетов на выходе канала т.е. нам доступна статистика выхода любого порядка.
Теорема 4. Для возможности статистической слепой идентификации векторного канала достаточно выполнения следующих условий:
1) полиномы h1(z ),..., hM (z ) не должны иметь общих корней;
2) отсчеты информационной последовательности {xi }, таковы, что Доказательство:
Утверждение теоремы достаточно очевидно, если использовать эквивалентность условия на ранг матрицы H s и условия отсутствия общих корней у полиномов h1(z ),..., hM (z ) доказанного в Т3. Пусть в (2.19) t = или эквивалентно z = 0. Тогда если нам доступна (L M L M ) ковариационная матрица выходных отсчетов R y = M YL (0)YL (0), то:
условия следует, что R x = I 2 L 1, и R y = H S H*. Для известных R y и 2 первое условие теоремы гарантирует единственность решения задачи слепой идентификации.
Итак, как для случая детерминированной, так и статистической идентификации векторного канала присутствует условие отсутствия общих корней у полиномов h1(z ),..., hM (z ). Это означает, что для идентификации мы в полной мере используем перекрестные связи каналов. Естественно, что избавиться от этого ограничения, можно только решив задачу идентификации скалярного канала. С другой стороны отсутствие возможности использовать перекрестные связи каналов существенно обедняет возможности слепой идентификации, особенно в задачах детерминированной идентификации.
2.2. Идентифицируемость скалярного канала Пусть последовательность сигнальных блоков на выходе канала в полиномиальной интерпретации описывается выражением:
Рассмотрим необходимые условия детерминированной идентификации.
Теорема 5. Для идентифицируемости детерминированного скалярного канала необходимо, чтобы линейная сложность информационной последовательности была больше (2 L 2 ).
Запишем (2.2) для скалярного канала в виде:
Где y L (z ) = y0 ( z ),..., y L 1(z ) и X H, L ( z ) - полиномиальная ганкелева L L матрица, составленная из полиномов x0 (z ),..., x2 L 2 (z ). Если система идентифицируема, то необходимо чтобы rank (X H (L )) = L (Т1).
Нетрудно показать, что в этом случае rank X H, L (z ) = L для z C. Это означает, что для z C матрица X H, L ( z ) имеет обратную матрицу X 1, L ( z ) такую, что X1, L (z ) X H, L (z ) = I L. Пусть для фиксированного y L (z ) имеет место равенства:
Если система идентифицируема, то для (2.23) имеется только тривиальное решение X1H, L (z ) = cX2 H, L (z ) и h1 = 1 / c h2. Тогда должно быть, по крайней мере, так что:
где A(z ) - L L полиномиальная матрица полного ранга. Так как X1H, L (z ) и X2 H, L (z ) матрицы ганкелевой структуры, то (2.24) можно переписать в виде системы 2 L 3 однородных уравнений для неизвестных элементов матрицы A(z ). Поскольку равенство (2.24) справедливо для z C, рассмотрим 2 L сечений z1,..., z2 L, тогда:
где a( zi ) - вектор длины 2 L, составленный из коэффициентов первого и последнего столбца матрицы A(zi ). Эта система имеет единственное нетривиальное решение, если ранг матрицы ее коэффициентов равен 2 L 1. Нетрудно заметить, что главный минор этой матрицы порядка 2 L 1 det (X( z1,..., z2 L 1 )) 0 при выполнении условия теоремы (см. (2.6)).
Отсюда следует в частности, что A(z ) = cI L. Теорема доказана.
Итак, мы показали, что если X H, L ( z ) - ганкелева матрица, составленная из коэффициентов входной последовательности, линейная сложность которой больше 2 L 2 то B(z ) = X1H, L ( z ) A(z ) X2 H, L (z ) 0 для всех A(z ) cI L.
Однако этого условия недостаточно для слепой идентификации, поскольку равенство (2.24) может выполняться, если B(z ) h = 0. Т.е. помимо условия на информационную последовательность мы должны наложить дополнительные ограничения на вектор канала и результат взаимодействия канала с информационной последовательностью.
Обычно отправным пунктом для обеспечения слепой идентифицируемости скалярного канала по одной реализации служит предположение о конечности алфавита информационных символов. Для этого случая известна следующая теорема [7], которую мы приведем без доказательства.
Теорема 6. Если информационная последовательность принимает значения на множестве {± 1,±3,..., q 1} Z, то для идентифицируемости детерминированного скалярного канала достаточно, чтобы:
1) линейная сложность информационной последовательности была больше (2 L 2 ) ;
2) отсчеты канала h0,..., hL 1 были линейно независимы на подмножестве целых чисел 0,±1,±2,...,±2(q 1)2 L 1 LL / 2 (t0 L + 1)L, t0 - номер первого символа информационной последовательности, начиная с которого линейная сложность информационной последовательности больше L.
Доказательство теоремы можно найти в [7], более мягкие условия для канала в [8].
Статистическая идентификация предоставляет значительно более широкий диапазон возможностей для слепой оценки скалярного канала.
Прежде всего, отметим, что в общем случае наличия на входе канала последовательности с гауссовским распределением на выходе нам доступны только вектор математического ожидания и ковариационная матрица.
Поскольку математическое ожидание как правило равно нулю, то для стационарного гауссовского случайного процесса единственной статистической характеристикой является корреляционная функция или автокорреляционная последовательность.
Известно, что автокорреляция не содержит информации о фазе передаточной функции канала. Действительно оценку автокорреляции на выходе канала для белого шума на входе можно записать в виде:
где ry (z ) - полином, коэффициенты которого являются отсчетами автокорреляционной функции на выходе канала. Если априори известно, что все нули полинома канала находятся внутри (системы с минимальной фазой) или вне (системы с максимальной фазой) окружности единичного радиуса, то, зная ry (z ), мы можем идентифицировать канал. В общем случае для стационарного гауссовского входа идентификация невозможна.
Для негауссовских стационарных случайных последовательностей условие идентифицируемости можно сформулировать в следующем виде.
Теорема 7. Для идентифицируемости скалярного канала достаточно, чтобы отсчеты информационной последовательности, при M{xi } = 0 и M xi x* = 2 (i j ), описывались негауссовыми расj пределениями.
Доказательство:
Обратное утверждение было доказано нами выше. Конструктивное доказательство фактически будет нами представлено в гл.4.
Аналогичное утверждение мы можем сформулировать для нестационарных по входу систем:
Теорема 8. Для идентифицируемости скалярного канала достаточно, чтобы независимые отсчеты информационной последовательноM{xi } = 0 имели по крайней мере нестационарную диссти, при Доказательство:
Убедимся в правоте данного утверждения рассмотрев более общий непрерывный случай [82].
Пусть модель системы описывается выражением (1.6).
Тогда в отсутствии шума, в соответствии с [90], мы можем записать наблюдаемый случайный процесс в виде следующего стохастического интеграла:
где: x( ) = d ( ) - стандартный комплексный «белый» шум, с нулевым математическим ожиданием и единичной дисперсией [90], x( ) = ( )x( ) - нестационарный случайный процесс.
Тогда корреляционная функция случайного процесса y (t ) имеет вид:
Возьмем двумерное преобразование Фурье от корреляционной функции B y (t1,t 2 ) :
информацию только о модуле передаточной функции системы h( ).
Во всех остальных случаях канал идентифицируем.
Запишем (2.28) в виде равенств отдельно для модуля и фазы B y (1,2 ) :
Фиксируя разность 1 2, получаем уравнения, как для модуля, так и для фазы передаточной функции, которые определяют её с точностью до комплексного множителя и некоторого постоянного временного смещения.
Утверждения теорем Т.7 и Т.8 могут быть распространены на случай, когда отсчеты информационной последовательности зависимы. Условия идентифицируемости и алгоритмы идентификации в данном случае представлены в гл.4.
МЕТОДЫ СЛЕПОЙ ИДЕНТИФИКАЦИИ ВЕКТОРНОГО
КАНАЛА
3.1. Метод взаимных отношений Рассмотрим задачу слепой идентификации векторного канала. Условия слепой идентифицируемости канала для этого случая сформулированы в теоремах Т.2 и Т.4 для случаев детерминированной и статистической идентификации соответственно.Алгоритмы слепой идентификации, рассматриваемые в данном разделе, основаны на свойстве взаимной симметрии выходных сигналов каналов, на входе которых присутствует одна и та же информационная последовательность. Данное свойство было использовано нами в доказательстве Т.2 при записи выражения (2.3).
В соответствии с этим свойством при выполнении условий теоремы Т.2 матричное уравнение (2.12) в отсутствии шума имеет единственное, с точностью до комплексного множителя, решение для любых различных чисел z1,..., z s.
Y( z1,..., z s ) является линейной оболочкой единственного базисного вектора hT = h(1),..., h (1),..., h(M ),..., h (M ) или что эквивалентно h является собL 1 L ственным вектором матрицы Y* (z1,..., z s )Y(z1,..., z s ), соответствующим нулевому собственному числу.
Наличие шума заставляет нас искать приближенное решение наилучшее, с точки зрения некоторого критерия качества.
Идентифицируемая система в этом случае описывается следующим выражением:
где vl(k ) (z ) полином степени (t 1) над полем комплексных чисел, образованный блоком из t отсчетов на выходе k -го канала.
Для небольших значений уровня шума весьма эффективным оказывается метод наименьших квадратов, в соответствии с которым [10]:
где: • 2 - евклидова векторная норма.
Эквивалентно, оценка канала h может быть получена из собственного вектора, связанного с наименьшим сингулярным значением матрицы Y* (z1,..., z s )Y(z1,..., z s ) [11]:
Метод слепой идентификации, описываемый выражениями (3.2) или (3.3) в несколько иной форме хорошо известен в литературе как «метод взаимных отношений» [12].
Метод был впервые предложен в [9], а также независимо рядом других авторов (см. библиографию в [13]).
В отличие от большинства известных статистических методов слепой идентификации [12], метод взаимных отношений является весьма эффективным для небольших выборок при большом отношении сигнал-шум.
В [9] методом моделирования показано, что данный метод дает оценку близкую к границе Рао-Крамера.
Главные недостатки метода, это необходимость точного знания длины канала L, а также необходимость работы в уравнениях (3.2) или (3.3) с разреженными матрицами большого размера.
Использование полиномиальных представлений позволит нам далее несколько упростить вычислительную структуру алгоритма взаимных отношений.
Для этого запишем выражение (2.3) в виде:
Использование свойства симметрии для решения уравнения (2.8) относительно неизвестных полиномов h0 (s ),..., hL 1(s ) означает, что мы должны выбрать их таким образом, чтобы полином симметричен по переменным s1 и s2.
Выберем 2 L 1 различных значений формальной переменной z1,..., z2 L 1. Тогда используя (2.8) мы можем записать 2 L 1 однородных линейных уравнений относительной L неизвестных полиномов h0 (s ),..., hL 1(s ).
В матричной форме, получим:
При выполнении условий теоремы Т2 полиномиальная матрица Y1(z1,..., z2 L1, s1, s2 ) имеет ранг 2 L 1, действительно:
Ранее при доказательстве теоремы Т2 мы показали, что ранг (2 L 1 2L 1) матрицы X(z1,..., z2 L 1 ) для любых различных z1,..., z2 L личных s1 и s2. Это условие эквивалентно условию 1) теоремы Т.2.
В отсутствии шума легко получить явное решение однородной системы уравнений (3.5). Так как, по условию теоремы Т.2, матрица Y1(z1,..., z2 L1, s1, s2 ) имеет ранг 2 L 1, то хотя бы один из ее миноров порядка 2 L 1 M i ( z1,..., z 2 L 1, s1, s2 ) i = 1,...,2 L - номер столбца, отличен от нуля. Пусть это будет M 2 L (z1,..., z2 L 1, s1, s2 ), тогда полагая значение полинома hL1 (s2 ) произвольным, получим следующую невырожденную систему 2 L 1 линейных уравнений с коэффициентами над полем C :
где: j = 1,...,2 L 1. Решая ее методом Крамера [1], получим общее решение системы в виде:
В силу произвольности hL1 (s2 ) положим его равным ( 1)2 L M 2 L (z1,..., z2 L 1, s1, s2 ), точностью до произвольного комплексного коэффициента будет иметь вид:
Заметим также, что нам нужно вычислить только L миноров, т.к. из анализа структуры матрицы (3.5) следует, что:
Таким образом, мы нашли значения неизвестных полиномов h0 (s ),..., hL 1(s ) в точках s1 и s2. Если M = 2 этого достаточно для оценки всех коэффициентов неизвестного векторного канала:
Для того чтобы найти решение системы для произвольного числа каналов, мы должны выполнить вычисления (3.9) в кольце C [s1, s2 ]. Поскольку решение системы (3.5) по формулам (3.9) не содержит операции деления, то мы получим решение с точностью до некоторого полинома g (s1, s2 ) C [s1, s2 ].
Поскольку полиномы hl (s1 ) и hl (s2 ) очевидно не имеют общих множителей, то неизвестный множитель g (s1, s2 ) мы можем найти как наибольший общий делитель полиномов M l ( z1,..., z 2 L 1, s1, s2 ) и M L +l (z1,..., z 2 L 1, s1, s2 ), используя, например алгоритм Евклида. Конечно такой алгоритм не имеет практического значения из-за больших вычислительных затрат.
Альтернативный путь состоит в формировании системы линейных уравнений для M значений полиномов канала hl (s1 ),..., hl (sM ).
h(s1,..., sM ) = (h0 (s1 ),..., hL 1(s1 ),..., h0 (sM ),..., hL 1(sM ))T. Тогда система линейных уравнений в матричной форме имеет вид:
где: Y(z1,..., z r, s1,..., s M ) (M 1) r L M комплексная матрица ранга Общее решение для коэффициентов канала может быть найдено далее по интерполяционной формуле Лагранжа:
где: Li (s ) - элементарные лагранжевы интерполяционные многочлены, определяемые формулой:
Т.о. в отсутствии шума алгоритм слепой идентификации канала сводится к вычислению базиса нуль-пространства матрицы Y(z1,..., z r, s1,..., s M ). Условия теоремы Т.2 обеспечивают единственность решения этой задачи, т.е. наличие единственного нулевого собственного числа и соответствующего ему единственного собственного вектора с точностью до комплексной константы, за счет строгого равенства rank (Y( z1,..., zr, s1,..., sM )) = ML 1.
Наличие аддитивного шума в матрице входных данных Y( z1,..., zr, s1,..., sM ) = Y( z1,..., zr, s1,..., sM ) + V (z1,..., zr, s1,..., sM ) создает условия, когда rank Y(z1,..., zr, s1,..., sM ) может быть равен ML или может быть меньше (LM 1). В первом случае нуль-пространство матрицы состоит только из нулевого вектора, а во втором содержит несколько базисных векторов. Поэтому задача слепой идентификации может вообще не иметь решения или решение задачи становится неоднозначным.
Как уже отмечалось выше, в этом случае мы можем использовать стратегию метода наименьших квадратов, т.е. в качестве решения задачи для случая rank Y( z1,..., zr, s1,..., sM ) = ML взять собственный вектор, соответствующий минимальному по модулю собственному числу матрицы Y* (z1,..., zr, s1,..., sM )Y(z1,..., zr, s1,..., sM ) :
В этом случае решение задачи всегда единственно и, как известно [10] минимизирует функционал Y(z1,..., zr, s1,..., sM )h(s1,..., sM ), при ограничении нормы h(s1,..., sM ) = 1.
Поскольку выбор числа уравнений и соответственно числа строк в матрице Y (z1,..., z r, s1,..., s M ) в отличие от традиционного подхода [13] в нашей интерпретации произволен, то мы можем выбрать их число строго равным (LM 1). Тогда rank Y( z1,..., zr, s1,..., sM ) ML 1 теперь уже за r = (L M 1) (M 1) целое только в частных случаях, то мы выбираем r как наименьшее целое, а r так, что (M 2) r + r = L M 1. Тогда:
Теперь мы можем решать задачу слепой идентификации векторного канала при наличии шума, используя алгоритмы точного решения однородной системы уравнений. При этом, поскольку нуль-пространства матриц Y(z1,..., zr, s1,..., sM ) и Y* (z1,..., zr, s1,..., sM )Y(z1,..., zr, s1,..., sM ) сов- падают, то решение, получаемое, например, по формулам (3.9) и решение вариационной задачи (3.15) совпадают с точностью до комплексного множителя, и являются нормальным псевдорешением однородной системы уравнений (3.12).
Несмотря на то, что формулы (3.9) дают явное решение, непосредственное их использование для нахождения численного решения однородной системы, задаваемой матрицей (3.16) нецелесообразно даже при сравнительно небольших размерах матрицы, поскольку требует вычисления (L M 1) определителей размера (L M 1). При этом, как известно [15], число операций комплексного деления и умножения при вычислении только одного определителя равно (L M 2) (L M 1)2 + (L M 1) + 3 3.
Поэтому более целесообразно использование алгоритмов имеющих меньшие вычислительные затраты.
Одним из таких методов может быть несколько модифицированный метод Перселла [15]. В рамках данного подхода мы интерпретируем систему однородных уравнений с матрицей (3.16) как условия ортогональности вектора h(s1,..., s M ) с (L M 1) линейно независимыми строками матрицы (3.16). При этом решение системы находится путем построения базисов подпространств унитарного линейного пространства C LM убывающих размерностей:
где: Rk - подпространство, состоящее из векторов, ортогональных к первым k строкам y1,..., y k матрицы Y(z1,..., zr, s1,..., sM ).
Базис подпространства Rk строиться из базиса подпространства Rk 1 в виде следующих линейных комбинаций:
Коэффициенты cik определяются из условия ортогональности строк матрицы Y(z1,..., zr, s1,..., sM ) и вектора решения, в виде:
Для реализуемости процесса необходимо, чтобы скалярные произведения y k, e k 1 были отличными от нуля. Если k = 0, то в качестве баk зиса берется естественный базис в C LM : e1 = (1,0,...,0),..., e0 = (0,...,0,1).
Подпространство RLM 1 является нуль-пространством матрицы Y(z1,..., zr, s1,..., sM ), т.к. единственный базисный вектор этого подпространства ортогонален ко всем линейно независимым векторам y1,..., y LM 1 и является численным решением системы однородных уравнений, заданных матрицей (3.16).
Теперь рассмотрим вопрос о выборе значений формальных переменных z1,..., z r, s1,..., s M при формировании системы уравнений (3.12).
Ранее мы требовали, чтобы эти множества не содержали совпадающих значений. Если матрица Y(z1,..., zr, s1,..., sM ) содержит отсчеты аддитивного шума, то выбор значений формальных переменных будет влиять на обусловленность матрицы и соответственно на погрешность алгоритма.
Поэтому мы должны выбрать различные значения формальных переменных z1,..., z r, s1,..., s M так, чтобы минимизировать в некотором унитарном пространстве переменных z1,..., z r, s1,..., s M функционал погрешности алгоритма слепой идентификации.
Анализ возмущений собственных векторов матриц произвольного вида со случайными коэффициентами задача крайне трудная и в полном объеме не решенная до сих пор.
Поэтому при анализе устойчивости решения проблемы собственных чисел и линейных уравнений обычно предполагается, что соответствующие решения непрерывно зависят от малых вариаций коэффициентов матрицы. Это позволяет оценить погрешность решения и сформировать некоторую систему чисел обусловленности, которая характеризует устойчивость системы уравнений к малым возмущениям коэффициентов.
Как мы уже отмечали выше алгоритмы данного раздела эффективны при малых значениях дисперсии шума. Поэтому мы с полным правом можем использовать при анализе погрешности теорию малых возмущений [14].
Y* (z1,..., zr, s1,..., sM )Y(z1,..., zr, s1,..., sM ) и соответствующее ей нормальное решение (3.12) h(s1,..., sM ). Тогда в соответствии с [15] относительную погрешность оценки собственного вектора, соответствующего нулевому сингулярному числу, можно оценить сверху с помощью следующего неравенства:
где • - спектральная норма матрицы, равная квадратному корню из максимального собственного числа, (•) - вариация, {i } - ненулевые собственные числа матрицы Y* (z1,..., zr, s1,..., sM )Y(z1,..., zr, s1,..., sM ), упорядоченные по возрастанию.
Используя свойство самосопряженности спектральной нормы, а также то, что:
получим следующее неравенство:
h(s1,..., sM ) h(s1,..., sM ) Y (z1,..., z r, s1,..., s M ) ранга (LM 1) по отношению к собственному вектору, соответствующему нулевому собственному числу в виде:
Положим теперь (Y(z1,..., zr, s1,..., sM )) V (z1,..., zr, s1,..., sM ). Тогда используя известные неравенства для спектральной нормы [15], относительную погрешность можно оценить следующим неравенством:
где параметр q 2 ( z1,..., z r, s1,..., sM ) имеет смысл отношения сигналшум.
Итак, для малых шумов погрешность оценки вектора значений полиномов канала h(s1,..., sM ) = (h0 (s1 ),..., h0 (sM ),..., hL 1(s1 ),..., hL 1 (sM ))T ограничена неравенством (3.19).
hT = h01),..., h0M ),..., hL 1,..., hLM1) мы в соответствии с интерполяционной формулой Лагранжа (3.13) можем найти оценку h в виде:
Известно, что если возмущена только правая часть невырожденной системы линейных уравнений, то возмущение решений этой системы ограничены следующим неравенством [14]:
где 2 (s1,..., s M ) - число обусловленности невырожденной матрицы VM (s1,..., sM ), которое в соответствии с [14] определяется следующим выражением:
Окончательно, используя (3.19) погрешность слепой оценки можно оценить следующим неравенством:
Т.о. значения формальных переменных z1,..., z r, s1,..., s M должны быть выбраны так, чтобы обеспечивать максимальное значение отношения сигнал шум и одновременно минимизировать значение чисел обусловленности 1 (z1,..., zr, s1,..., sM ) и 2 (s1,..., sM ).
Далее оценим сверху величину отношения сигнал-шум. Без потери общности положим, что r = r. Нетрудно показать, что если комплексные гауссовы отсчеты аддитивного шума независимы, имеют одинаковую дисперсию 2 и нулевое математическое ожидание, то:
Для мощности полезного сигнала мы можем использовать оценку сверху. Определим энергию l -го блока отсчетов полезного сигнала длины t на выходе k -го канала в виде:
Пусть энергия El, k = t P не зависит от номеров блока и канала. Тогда нетрудно показать справедливость следующего неравенства:
Т.о. из (3.20), (3.25) и (3.27) следует, что q 2 ( z1,..., z r, s1,..., sM ) имеет точную верхнюю грань по всем реализациям наблюдаемых отсчетов, независящую от значений формальных переменных z1,..., z r, s1,..., s M и равную отношению tq 2 = tP 2. Тогда (3.24) можно записать в виде:
При этом наибольший вклад в значение погрешности слепой оценки вносят именно числа обусловленности.
Т.о. для стационарной информационной последовательности выбор значений формальных переменных z1,..., z r, s1,..., s M можно провести минимизируя в некотором унитарном пространстве функционал в правой части неравенства (3.28).
Известно, что 2 (s1,..., sM ) 1, при этом равенство достигается, если матрица VM (s1,..., sM ) = cU, где U - унитарная матрица, c - некоторая константа. Положим соответственно si = exp( j 2i M ), i = 1,..., M, тогда легко убедиться, что в этом случае VM (s1,..., sM ) 1 ( z1,..., zr, s1,..., sM ) не столь очевидно в общем виде, поскольку матрица Y (z1,..., z r, s1,..., s M ) зависит от реализаций выходного сигнала.
Заметим, однако, что при значении t = r = r оценка канала, полученная алгоритмами, основанными на вычислении базиса нульпространства, вообще не зависит от значений переменных z1,..., z r. Действительно, в этом случае мы можем записать:
При t = r = r, для различных z1,..., z r квадратная матрица V (z1,..., zr ) имеет полный ранг, за счет линейной независимости строк.
нульпространство матрицы Y (z1,..., zr, s1,..., sM ) определяется Тогда только матрицей Y(s1,..., sM ).
Если мы используем алгоритм (3.15) и положим zi = exp( j 2i r ), i = 0,..., t 1, тогда легко убедиться, что в этом случае V (z1,..., zr ) с точностью до константы унитарная матрица и соответственно при выполнении условия t = r = r оценки, получаемые алгоритмами нулевого подпространства и наименьших квадратов, совпадают, т.к.
V (z1,..., zr )* V ( z1,..., zr ) = t I.
В целом, как мы уже отмечали выше, при наличии сосредоточенных помех, различия параметров аддитивного шума в разных каналах, корреляции отсчетов шума, выбор сечений z1,..., z r, s1,..., s M должен проводиться минимизацией правой части (3.24).
На Рис.3.1 показаны результаты математического моделирования алгоритма слепой идентификации векторного канала при различных параметрах алгоритма.
Относительная погрешность оценки канала оценивалась по формуле:
При моделировании в качестве входных отсчетов, отсчетов шума и отсчетов векторного канала дискретной модели использовались независимые реализации гауссовых случайных векторов в свою очередь с независимыми компонентами. При вычислении выборочного математического ожидания в формуле (3.30) при моделировании усреднялись как реализации шума, так и отсчеты информационной последовательности и канала.
Относительная погрешность алгоритма восстановления существенно зависит от уровня аддитивного шума. Приемлемый уровень погрешности достигается при отношении сигнал-шум более 30Дб.
При увеличении длины канала погрешность растет линейно, однако при увеличении числа каналов для больших отношений сигнал шум длина канала практически не влияет на величину погрешности.
Рис.3.1.a. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом взаимных отношений от отношения сигнал-шум в [Дб] (по горизонтали) для M =2 и различных максимальных длин Рис.3.1.б. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом взаимных отношений от отношения сигнал-шум в [Дб] (по горизонтали) для M =4 и различных максимальных длин канала: «о» - L=2; «х» -L=4; «+» - L=6; «*» - L=8.
Рис.3.1.в. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом взаимных отношений от отношения сигнал-шум в [Дб] (по горизонтали) для M =6 и различных максимальных длин Рис.3.1.г. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом взаимных отношений от отношения сигналшум в [Дб] (по горизонтали) для M =8 и различных максимальных длин канала: «о» - L=2; «х» -L=4; «+» - L=6; «*» - L=8.
Рис.3.1.д. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом взаимных отношений от отношения сигнал-шум в [Дб] (по горизонтали) для M =10 и различных максимальных Рис.3.1.a. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом взаимных отношений от отношения сигнал-шум в [Дб] (по горизонтали) для M =12 и различных максимальных 3.2. Метод максимального правдоподобия В предыдущем разделе, адаптируя метод взаимных отношений для случая наличия в наблюдаемых данных аддитивного шума, мы использовали стратегию наименьших квадратов, которая не требует знания статистических характеристик шума. В данном разделе мы рассмотрим идентификацию системы на фоне аддитивного шума, статистика которого нам известна, следуя в основном работе [48].
Пусть мы имеем по выходных отсчетов на выходе каждого из M каналов. Пусть в (2.19) t = 1, тогда:
y = y01),..., y (1)1,..., y0M ),..., y (M Пусть комплексные отсчеты шума v = v01),..., v (1)1,..., v0M ),..., v (M независимы и имеют круговое гауссово распределение:
где 2 - дисперсия шума.
Тогда функционал правдоподобия можно записать в виде:
Совместная оценка максимального правдоподобия H s и x как известно это:
Если выполняются условия теоремы Т2, то из теоремы Т3 следует, что H s имеет полный ранг по столбцам, тогда для любой фиксированной матрицы H s минимум (3.34) по x достигается, если:
где: PrH s - оператор ортогонального проецирования пространство матрицы H s. Подставляя (3.35) в (3.34), получим:
Минимизация (3.36) в вычислительном отношении тяжелая задача.
В литературе описано достаточно большое число итерационных подходов к нелинейной оптимизации данного типа (смотри, например библиографию в [13,16]).
В [48] описана весьма эффективная методика вычисления (3.36), в основе которой следующие утверждение, которое мы приведем без доказательства.
Пусть G M матрица, созданная из векторов каналов согласно следующему правилу:
где: q=3,…,М, H i - блоки обобщенной матрицы Сильвестра H s.
Тогда, при условии, что все каналы не имеют общих нулей и 2 L, ортогональной матрицей дополнений обобщенной матрицы Сильвестра H s является G M, то есть:
Данное соотношение следует из свойства взаимной симметрии выходных сигналов каналов, на входе которых присутствует одна и та же информационная последовательность, использованного нами в предыдущем разделе. Доказательство данного утверждения можно найти в [9].
где: «#» обозначает псевдоинверсию Мура-Пенроуза.
Используя коммутативное свойство линейной свёртки G M y = YM h (3.39) можно записать в виде:
В соответствии с [48] алгоритм максимального правдоподобия (МП) (3.40) эквивалентен следующей последовательности шагов [48]:
Заметим, что первый шаг этого алгоритма эквивалентен алгоритму взаимных отношений.
На Рис.3.2. показаны результаты математического моделирования 1го и 2-го этапов алгоритма максимального правдоподобия.
При моделировании использовались те же условия, что и при моделировании алгоритма взаимных отношений в полиномиальной интерпретации в предыдущем разделе.
Т.е. в качестве входных отсчетов, отсчетов шума и отсчетов векторного канала дискретной модели использовались независимые реализации гауссовых случайных векторов с независимыми компонентами.
При вычислении выборочного математического ожидания в формуле (3.30) при моделировании усреднялись как реализации шума, так и отсчеты информационной последовательности и канала.
Заметим, что в отличие от алгоритма взаимных отношений в полиномиальной интерпретации (п.3.1., Рис.3.1.) алгоритм МП и алгоритм взаимных отношений (3.43) имеют более резкий рост погрешности при малых отношениях сигнал-шум.
Погрешность алгоритма (3.43) при увеличении отношения сигналшум и увеличении длины реализации не достигает погрешности алгоритма (3.44), что является следствием асимптотической эффективности оценок максимального правдоподобия.
Однако из Рис.3.2 видно, что выигрыш в погрешности алгоритма МП относительно алгоритма (3.43) может быть крайне незначительным, хотя наблюдается некоторый рост выигрыша при увеличении длины канала и числа отсчетов на входе.
Рис.3.2.а. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом максимального правдоподобия «о» и алгоритмом взаимных отношений [48] «+» от отношения сигнал-шум в [Дб] Рис.3.2.б. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом максимального правдоподобия «о» и алгоритмом взаимных отношений [48] «+» от отношения сигнал-шум в [Дб] (по горизонтали) для различных максимальных длин канала L=4, M=3.
Рис.3.2.в. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом максимального правдоподобия «о» и алгоритмом взаимных отношений [48] «+» от отношения сигнал-шум в [Дб] (по горизонтали) для различных максимальных длин канала L=6, M=3.
Рис.3.2.г. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом максимального правдоподобия «о» и алгоритмом взаимных отношений [48] «+» от отношения сигнал-шум в [Дб] (по горизонтали) для различных максимальных длин канала L=8, M=3.
Рис.3.2.д. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом максимального правдоподобия «о» и алгоритмом взаимных отношений [48] «+» от отношения сигнал-шум в [Дб] (по горизонтали) для различных максимальных длин канала L=10, M=3.
Рис.3.2.ж. Зависимость относительной погрешности слепого восстановления канала (по вертикали) алгоритмом максимального правдоподобия «о» и алгоритмом взаимных отношений [48] «+» от отношения сигнал-шум в [Дб] (по горизонтали) для различных максимальных длин канала L=12, M=3.
3.3. Метод канального подпространства Метод канального подпространства предложен в [49] и основан на свойствах матрицы H M. В данном разделе мы представим данный метод в полиномиальной интерпретации.
Представим модель идентифицируемой системы в соответствии с (2.19) в виде:
Сформируем ML ML ковариационную матрицу R y (z ) в следующем виде:
Если отсчеты аддитивного шума некоррелированы, имеют нулевое математическое ожидание и дисперсию 2, независящею от номера канала, то ковариационная ML ML матрица R v (z ) имеет блочно диагональную структуру вида:
где: элементы ri, j (z ) L L матрицы R L (z ) имеют вид:
Если t 2 L 1 и статистика информационной последовательности такова, что найдется такое z = z0, при котором квадратная матрица R x ( z0 ) имеет полный ранг, то если выполняются условия теоремы Т3, нуль-пространство оператора H s может быть вычислено разложением по собственным векторам матрицы R y (z0 ) R v (z0 ) :
где: E(z0 ) - ML ML матрица собственных векторов.
Пусть U (z0 ) - ML ML 2 L 1 матрица собственных векторов матрицы R y (z0 ) R v (z0 ), соответствующая нулевым собственным значениям.
U* (z0 )x = 0 для ML неизвестных имеет ровно 2 L 1 нетривиальных решений, которые можно записать в виде:
Поскольку матрица R y (z0 ) R v (z0 ) формируется как выборочная ковариация, то для оценки канала мы можем использовать метод наименьших квадратов, т.е.:
(z ) R ( z ), соответствующая нулевым собственным значениям;
R y ( z0 ) - выборочная ковариация.
В частном случае, когда отсчеты информационной последовательri,xj (z )} 2 L 1 2 L 1 матрицы ности некоррелированны, то элементы R x (z ) имеют вид:
Перепишем (3.45) в виде:
где: k = 0,..., W, где W - параметр окна.
Выборочная ковариационная матрица последовательности векторов выходного сигнала имеет вид:
В соответствии с (3.46) при структуру:
Т.к. R x имеет полный ранг, то нуль-пространство оператора H s может быть вычислено разложением по собственным векторам матрицы где: E - матрица собственных векторов.
Поскольку R y - эрмитова, можно показать, что при выполнении условий идентифицируемости теоремы Т2 и выбора параметра W=L+1:
Как указано в [49,48], метод канального подпространства практически совпадает с методом взаимных корреляций для M = 2. Погрешность метода примерно равна погрешности метода МП. Метод подпространства также как и другие методы, рассмотренные в данной главе, требует априорного знания длины канала.
МЕТОДЫ СЛЕПОЙ ИДЕНТИФИКАЦИИ СКАЛЯРНОГО
КАНАЛА
В этой главе мы рассмотрим задачу слепой идентификации скалярного канала. Условия слепой идентифицируемости канала для этого случая сформулированы в теореме Т.6 для случая детерминированной и в теоремах Т.7 и Т.8 для статистической идентификации.Жесткие ограничения возможностей слепой идентификации скалярного канала в детерминированном случае, сформулированные в теореме Т.6 существенно ограничивают область применения этих методов. Поэтому в этом разделе мы будем рассматривать задачу слепой идентификации в статистической интерпретации.
Основной подход при слепой статистической идентификации это метод моментов, суть которого, в замене уравнений, связывающих сигналы на входе и выходе системы, уравнениями, связывающими соответствующие моментные функции.
4.1. Некоторые методы слепой идентификации, основанные на использовании моментных функций Исторически основные проблемы статистической идентификации неизвестной неминимально-фазовой характеристики канала связывались с невозможностью восстановления фазочастотной характеристики (ФЧХ) канала по моментам гауссовых распределений выходных сигналов при стационарном входе.
В этой связи естественно, что первые результаты по «слепой» идентификации были получены для информационных последовательностей, имеющих существенно негауссову статистику, поскольку в этом случае спектры высших порядков (обычно используется биспектр или триспектр) сохраняют информацию о ФЧХ канала [6,16].
Следующим относительно недавним этапом в развитии методов «слепой» идентификации каналов связи стало использование свойств периодически стационарных случайных последовательностей, возникающих в результате структурных особенностей систем последовательной передачи дискретных сообщений (см. например [13]). При этом для восстановления фазовой информации использовались статистики 2-го порядка избыточно дискретизированного сигнала в приемнике (1.11).
К относительно недавним результатам в данной области можно отнести алгоритмы, основанные на анализе систем периодически стационарных по входу (одна из первых публикаций [23]). В этом случае для систем связи используется периодическая модуляция информационных сигналов при передаче, или возникает естественным образом, например в результате наличия «тихих битов» в системах TDMA (Рис.1.2.б).
Независимо от этих исследований, применительно к проблеме оценки неизвестной передаточной функции пространственно-временного канала РЛС с синтезированной апертурой в [35,50,51] также развивался подход, основанный на нестационарной модели входных сигналов.
В рамках данного подхода мы полагаем, что мы имеем некоторое множество доступных для обработки реализаций сигнала на выходе системы, сигналы на входе которой описываются моделью нестационарного процесса.
4.1.1. Моментное описание нестационарных по входу линейных Рассмотрим непрерывную модель идентифицируемой системы типа (1.6) и (1.13). При этом достаточно широкий класс пространственновременных каналов радиолокации и связи может быть описан моделью свертки неизвестной импульсной характеристики и некоторого множества реализаций информационного, в общем случае, нестационарного случайного процесса на фоне аддитивного шума, т.е.:
где: n - номер реализации информационной последовательности.
Статистические характеристики случайного процесса на входе и выходе системы (4.1) могут быть полностью описаны моментными, кумулянтными или квазимоментными функциями [52,53].
Моментной функцией случайного процесса y (t ) k -го порядка называют функцию r переменных вида:
k,..., k r (t1,..., tr ) может быть получена соответствующей подстановкой переменных t1,..., t r из симметричной моментной функции вида:
Заметим, что симметричную моментную функцию m y (t1,..., t k ) можно определить, дифференцируя соответствующую k -мерную характеристическую функцию случайного процесса [53]:
Часто более удобно использование кумулянтных функций, которые определяются следующим выражением:
Кумулянтные функции могут быть вычислены, используя известные линейные соотношения через соответствующие моментные функции [53].
Используя введенное в [53] понятие кумулянтных скобок и их свойства, кумулянтные функции случайного процесса y (t ) можно определить также в виде:
Используя свойства линейности кумулянтных скобок, мы можем легко получить соотношения между кумулянтными функциями на входе и выходе линейной системы.
Если x (t1,..., tk ) - k-я симметричная кумулянтная функция входного нестационарного случайного процесса x(t ) и n (t1,...,tk ) - кумулянтная функция шума, то в соответствии с [53] кумулянтные функции процесса y(t) можно записать в виде:
Представление (4.7) можно значительно упростить, если использовать понятие кумулянтного спектра.
Пусть y (t1,...,tk ) - k-я симметричная кумулянтная функция нестационарного случайного процесса y(t), тогда кумулянтный спектр k-го порядка определяется следующим выражением:
Fy (1,...k ) =... x (t1,...,tk )exp( j(1t1 +... + k tk ))dt1...dtk. (4.8) Достаточным условием существования кумулянтного спектра является условие абсолютной интегрируемости последовательности кумулянтных функций.
Известно, что идея спектрального представления кумулянтных функций принадлежит А.Н. Колмогорову [6]. Помимо термина «кумулянтный спектр» в литературе также используются термины «полиспектр», «спектр высшего порядка», «спектральный кумулянт».
Если Fx (1,...k ) k-й спектральный кумулянт нестационарного процесса x(t ), то связь между входными и выходными кумулянтными спектрами описывается следующим выражением:
Fy (1,...,k ) = H (1 )...H (k )Fx (1,...,k ) + Fn (1,...,k ), (4.9) где: H ( ) - передаточная функция канала.
Существо статистического подхода к слепому оцениванию передаточной функции канала можно сформулировать как задачу решения интегрального уравнения типа (4.7) во временной области и алгебраического уравнения типа (4.9) в спектральной.
Рассмотрим некоторые простые примеры случайных процессов x(t ).
Пример 4.1. Пусть x(t ) - стационарный случайный процесс, тогда уравнение (4.9) принимает вид:
= H (1 )...H (k ) (1 +... + k )Fx (2,...,k ) + Fn (1,...,k ) где: () - функция Кронекера.
Уравнение (4.10) разрешимо относительно ФЧХ, только если процесс x(t ) негауссов (см. подробнее в [10]).
Пример 4.2. Пусть x(t ) - нестационарный по дисперсии случайный процесс. Тогда x(t ) = (t )x(t ), где x(t ) - стационарный процесс с нулевым м.о. и (t)0. Уравнение (4.9) в этом случае примет вид:
Уравнение (4.11) разрешимо для любых k2, т.е. и в гауссовом случае. Такая модель была успешно использована для решения задачи идентификации пространственно-временного канала РСА по статистикам второго порядка [35,50,51].
Для систем связи уравнение (4.11) можно получить путем использования дополнительной амплитудной модуляции сигналов на передаче. Отметим, что [5], является в некотором смысле частным случаем данного подхода, поскольку в [5] предполагается дополнительное условие периодичности функции (t).
Пример 4.3. Пусть x(t ) - нестационарный по среднему значению случайный процесс, т.е. x(t ) = a(t ) + x(t ), где x(t ) - стационарный процесс с нулевым математическим ожиданием, тогда:
= H (1 )...H (k )( A(1 )...A(k ) + (1 +... + k )Fx (2,...,k )) +. (4.12) Очевидна возможность идентификации в данном случае по статистикам даже первого порядка, поскольку этот способ предусматривает наличие в информационной последовательности тестового сигнала.
Отметим при этом, что наряду с хорошо отработанными алгоритмами идентификации по тестовым сигналам, в данном контексте возможна оценка канала по неизвестной тестовой последовательности и информационному сигналу одновременно.
Пример 4.4. Пусть x(t ) - случайный процесс с нестационарной по времени частотной структурой, т.е. x(t ) = x(t µ (t )), где x(t ) - стационарный процесс с нулевым математическим ожиданием и µ (t ) 0, тогда уравнение (4.9) примет вид типа (4.11). Этот способ идентификации также может быть использован, например, для систем связи использующих ВИМ, ШИМ или ЧИМ вид модуляции.
Пример 4.5. Пусть x(t ) - случайный периодически коррелированный случайный процесс [54,16] общего вида, тогда уравнение (4.9) примет вид:
В данном случае задача идентификации сводится к (4.11) только в дискретном множества точек спектральных кумулянтов нестационарного процесса. Можно показать также, что все рассмотренные выше пути возникновения нестационарности входных процессов можно распространить на этот случай при дополнительном условии периодичности функций (t), a(t) и µ(t).
При таком подходе появляются дополнительные условия идентифицируемости канала:
1) Если нули канала кратны 1/T, то Fy (1,...,k ) = Fn (1,...,k ) и 2) Если нули канала не кратны 1/T, то мы имеем отсчеты передаточной функции канала, взятые с шагом 1/T. Тогда для однозначного восстановления финитной импульсной характеристики канала (например, ИХ ограниченной временным интервалом Рассмотрим некоторые очевидные пути решения уравнений (4.7) и (4.9) для нестационарного входа.
Пусть мы имеем выборочные оценки кумулянтных функций y (t1,...,t2 ), полученные в результате усреднения некоторого множества реализаций.
Общим условием идентифицируемости канала можно считать условие (4.14), которое должно выполняться в заданной полосе частот канала.
Решение (4.7) и (4.9) в аналитической форме можно записать, если положить в левой части выражений (4.15) и (4.16) t2=…=tk=0 и 2=…=k=0 соответственно. Очевидная избыточность данных решений позволяет в некоторых случаях значительно ослабить условие (4.14).
В принципе, как это уже отмечалось выше, решение задачи статистической слепой идентификации для систем с нестационарным входом возможно по статистикам уже 2-го порядка.
Рассмотрим решение уравнения (4.9) в этом случае.
Перепишем (4.15) в виде:
В этом выражении равенство достигается только, если (, ) = F (, ). Поскольку мы имеем оценку кумулянтного спектра с некоторой погрешностью, то в качестве оценки передаточной функции мы можем взять H () наиболее близко соответствующую равенству (4.18) в соответствии с выбранным критерием оптимальности.
Воспользуемся методом наименьших квадратов, тогда:
Пусть левая часть уравнения (4.18) пронормирована таким образом, что B(1,2 ) = 1, тогда (4.20) можно записать в виде:
Для нахождения экстремума функционала в (4.22) с ограничением вида H ( ) = 1 (4.22) можно записать в виде:
В соответствии с [55] необходимое условие экстремума (4.22) можно получить в виде:
где - множитель Лагранжа.
Т.е. оценка передаточной функции канала является собственной функцией эрмитова ядра в уравнении (4.23).
Из (4.23) легко получить, что:
В соответствии с (4.20) решением оптимальным с точки зрения метода наименьших квадратов является собственная функция ядра B(1,2 ), соответствующая максимальному собственному числу.
Возможность статистической слепой идентификации канала по моментным функциям случайного процесса 2-го порядка на выходе канала обеспечивается приданием в общем случае стационарному информационному сигналу дополнительных нестационарных свойств, способствующих последующей слепой идентификации. При этом модель периодически коррелированного процесса на входе является частным случаем для общей нестационарной модели пространственно-временного канала.
Приведем некоторые известные факты для стационарного случая (пример 4.1). Кумулянтный спектр 2-го порядка на выходе линейной системы имеет вид:
Данная функция отлична от нуля, только если 1 + 2 = 0, и в этом случае мы имеем соотношение только для модуля передаточной функции системы: