WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

На правах рукописи

Поров Антон Викторович

АДАПТИВНОЕ СКАЛЯРНОЕ КВАНТОВАНИЕ СПЕКТРАЛЬНЫХ

КОЭФФИЦИЕНТОВ ДЛЯ СИСТЕМ СЖАТИЯ АУДИО СИГНАЛОВ

Специальность 05.13.01 – Системный анализ, управление и обработка

информации (в технике и технологиях)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург – 2006

Работа выполнена в Государственном образовательном учреждении высшего профессионального образования “Санкт-Петербургский государственный университет аэрокосмического приборостроения” (ГУАП).

Научный руководитель:

доктор технических наук, доцент Кудряшов Борис Давидович

Официальные оппоненты: доктор технических наук, профессор Малыхина Галина Федоровна кандидат технических наук, доцент Канатов Иван Иванович

Ведущая организация – ОАО «Российский Институт Мощного Радиостроения» (РИМР), г.

Санкт-Петербург.

Защита состоится “_” _ 200 г. в часов на заседании диссертационного совета Д 212.233.02 при Государственном образовательном учреждении высшего профессионального образования “Санкт-Петербургский государственный университет аэрокосмического приборостроения” по адресу: 190000, Санкт-Петербург, ул.Б.Морская,67, ГУАП.

С диссертацией можно ознакомиться в библиотеке ГУАП.

Автореферат разослан “_” _ 200 г.

Ученый секретарь диссертационного совета доктор технических наук, профессор Осипов Л.А.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Алгоритмы сжатия аудио информации используются для получения компактного представления аудио сигналов. Эффективность сжатия важна с точки зрения уменьшения затрат на передачу информации по каналам связи или хранения информации на цифровом носителе. Целью кодирования аудио сигнала является представление сигнала наименьшим числом бит при условии, что последующее его воспроизведение удовлетворительно с точки зрения субъективного восприятия. Разработка устройства кодирования опирается на особенности восприятия аудио сигналов человеком.

Эти особенности в большей степени зависят от спектрального состава сигнала, совместного влияния спектральных коэффициентов друг на друга и частотного диапазона. Квантование является одной из основных составляющих алгоритмов кодирования аудио информации.

Так как в реальных системах сжатия аудио информации качество передачи зависит от выбранного способа квантования, то актуальной является задача разработки алгоритмов квантования спектральных коэффициентов, обеспечивающих необходимое качество передачи сигнала и большую эффективность сжатия. Актуальным является также определение характеристик способов квантования, позволяющих предварительно оценить эффективность сжатия и выбрать наилучшие параметры передачи аудио информации.

Цель и задачи работы. Разработка способов квантования спектральных коэффициентов аудио сигнала.

Для достижения цели исследования необходимо решить следующие задачи:

• Построение математической модели квантуемых данных.

• Идентификация модели по выборке данных малого объема.

• Адаптивный выбор параметров квантователя в зависимости от кодируемого сигнала и параметров распределения.

• Адаптивное квантование спектральных коэффициентов в зависимости от требуемой ошибки квантования.

Научная новизна работы. На основе анализа информационных характеристик модели и источника показано, что в качестве модели источника аудио данных может быть использовано одномерное обобщенное гауссово распределение. В работе показано, что анализ оценки параметров распределения данных позволяет более эффективно выбирать параметры скалярного квантователя. Характеристики предложенного метода квантования значительно превосходят характеристики наиболее часто применяемых алгоритмов скалярного квантования (Макса-Ллойда, равномерного) и близки к оптимальному скалярному квантованию в области низких скоростей кодирования.

Положения, выносимые на защиту.

• Алгоритм квантования с расширенной нулевой зоной, оптимизированный по скорости и ошибке кодирования.

• Алгоритм субоптимального квантования с расширенной нулевой зоной, позволяющий получить характеристики, близкие к предельно достижимым, при всех распределениях вероятностей рассматриваемого класса.

• Алгоритм адаптивного скалярного квантования с расширенной нулевой зоной на основе модели распределения спектральных коэффициентов.

• Метод вычисления перцептуальной энтропии для квантования с расширенной нулевой зоной при заданных параметрах модели распределения спектральных Практическая значимость. Разработан алгоритм субоптимального квантования с расширенной нулевой зоной, обеспечивающий выигрыш порядка 0.5 дБ по сравнению с обычным равномерным квантованием при скорости порядка 1 бит на отсчет. Потери энергетической эффективности лежат в пределах 0.05 дБ от теоретически достижимого предела для скалярного квантования.



Разработан простотой метод вычисления оценки перцептуальной энтропии, позволяющий эффективно реализовать на практике адаптацию параметров квантования к изменению параметров сигнала.

Применение на практике нового метода вычисления перцептуальной энтропии позволяет более эффективно осуществлять распределение бит между участками спектра сигнала. Как следствие, уменьшается число итераций при управлении ошибкой квантования или скоростью кодирования.

На основе проведенных экспериментов с интеграцией квантования с расширенной нулевой зоной в аудио кодек показано, что при передаче полного спектра достигается значительный выигрыш по скорости и увеличение качества (в среднем на 8.71 кбит/c и 0. дБ или 14.44% в скорости и 2.25% по ошибке).

Экспертные оценки методом слепого тестирования при фиксированной целевой скорости показали: с внедрением квантования с расширенной нулевой зоной в кодек субъективное качество существенно возросло (в среднем на 15.03 балла).

Апробация работы. Основные положения и результаты диссертации докладывались на 8, 9 конференции аспирантов ГУАП, на 8 международной конференции «Цифровая обработка сигналов», публиковались в журнале «Цифровая обработка сигналов», оформлена заявка на патент США и докладывались на научных семинарах института прогрессивных технологий Самсунг и кафедре информационных систем ГУАП.

Структура и объем работы. Диссертационная работа состоит из введения, пяти глав, списка использованных источников (59 наименований). Основная часть работы изложена на 134 страницах машинописного текста, содержит 55 рисунков и 6 таблиц.

В первой главе диссертационной работы приведен обзор методов обработки и кодирования аудио сигналов. Особое внимание уделено методам квантования и сформулирована постановка задачи построения адаптивного скалярного квантователя в системе кодирования аудио сигналов. Вторая глава посвящена информационным характеристикам квантования и построению модели спектральных коэффициентов аудио данных. Третья глава посвящена анализу предлагаемого метода квантования и сравнению его информационных характеристик с другими известными методами квантования. В четвертой главе рассматриваются вопросы управления квантованием, построения оценки перцептуальной энтропии и приведены алгоритмы для нахождения необходимых параметров. Пятая глава демонстрирует результаты применения предлагаемого метода квантования в аудио кодеке.

СОДЕРЖАНИЕ РАБОТЫ

В первой главе диссертационной работы приведен обзор методов обработки и кодирования аудио информации. Источником данных системы сжатия аудио данных является дискретизированный по времени сигнал s (n) с частотой дискретизации f d. К настоящему времени существует целый класс аудио кодеков, основанных на кодировании коэффициентов ортогонального преобразования. Каждая из этих систем содержит стандартные модули, такие как блок фильтров, модель субъективного восприятия, квантование, модуль распределения бит, модуль сжатия информации без потерь, формирователь битового потока. Типовая структурная схема устройства, сжимающего аудио информацию методом кодирования спектральных коэффициентов на выходе блока фильтров, показана на рис. 1.

Рис. 1. Структурная схема устройства сжатия аудио информации Блок фильтров выполняет преобразование временного сигнала в частотный спектр, а также вычисляет амплитудный спектр. Для получения косинусного спектра сигнала используют модифицированное дискретное косинусное преобразование (МДКП) сигнала взвешенного с окном h(i ) = sin [ (i + 1 / 2) / 2 N ], i = 0,K, N 1 :

модифицированное синусное преобразование (МДСП):

Амплитудный спектр сигнала при известных коэффициентах преобразований МДКП (1) и МДСП (2) вычисляется как:

где S ( f ) – коэффициенты косинусного преобразования, S ' ( f ) – коэффициенты синусного преобразования, N – длина преобразования.

Оба спектра разбиваются на спектральные поддиапазоны. Модуль, называемый «модель субъективного восприятия» оценивает требуемую ошибку квантования аудио данных для каждого поддиапазона. Модуль распределения бит оценивает битовые затраты для полос спектра на основе допустимой ошибки, полученной из модуля построения модели субъективного восприятия. Оценка битовых затрат базируется на величине перцептуальной энтропии, о которой подробнее будет сказано позже. Модуль квантования определяет необходимые параметры квантователя для каждой полосы и квантует совокупность полос спектра. Квантование является одной из основных составляющих алгоритмов кодирования аудио информации. Модуль сжатия информации без потерь выполняет контекстное кодирование информации, затем следует модуль упаковки битового потока.

Рассмотренная структурная схема кодирования аудио информации предполагает модуль квантования, управляемый по ошибке или скорости кодирования. Выбор метода квантования в общем случае основывается на его характеристиках, определяющих качество квантования: скорость и ошибка кодирования. Предпочтительнее выбрать тот метод квантования, который дает наименьшую скорость при фиксированной ошибке или наименьшую ошибку при фиксированной скорости кодирования. Немаловажными являются ограничения, накладываемые областью применения квантователя. Учитывая рассматриваемую область применения (сжатие аудио данных), также необходимо обратить внимание на возможность управления квантованием. В действительности, необходимость управления квантованием вытекает из наличия модели субъективного восприятия, которая определяет допустимый уровень ошибки для разных участков спектра. В связи с этим появляется задача распределения битовых ресурсов между полосами спектра для улучшения субъективного качества. К ограничениям на выбор метода квантования можно также отнести вычислительную сложность и возможность адаптивного квантования данных. В диссертационной работе приведено сравнение методов скалярного квантования.

В работе приведен обзор характеристик известных методов квантования.

Сравнительный анализ этих методов приводит к следующим выводам. Равномерное скалярное квантование обеспечивает возможность управления качеством квантования за счет изменения шага квантования; по вычислительной сложности равномерное скалярное квантование также лучше других методов, однако, равномерное скалярное квантование проигрывает по информационной характеристике скорость-искажение по сравнению с другими методами, что делает его применение весьма непривлекательным на практике.

Во второй главе диссертации, посвященной построению модели источника данных, исследуются информационные характеристики потока аудио данных, модель источника данных и влияние предварительной спектральной обработки на функцию скоростьискажение источника. В качестве информационной характеристики предложено использовать функцию скорость-искажение источника данных, которая может быть получена численными методами. Для дискретного стационарного источника без памяти, функция скорость-искажение вычисляется с помощью алгоритма Блейхута. Для непрерывного источника данных известна нижняя граница Шеннона на функцию скоростьискажение, которая может быть использована для оценки скорости кодирования при заданной ошибке. Оценка влияния предварительной спектральной обработки на информационную характеристику выполняется на основе разбиения спектра сигнала на полосы, использования принципов модели субъективного восприятия и анализа полос спектра на шумность. Использование предварительной обработки сигнала позволяет варьировать качество передачи спектральных коэффициентов в зависимости от требуемого уровня шума квантования данных и получить достаточно гибкую модель обработки источника данных при низких скоростях кодирования.

Модель непрерывного стационарного источника независимых сообщений полностью описывается одномерной функцией плотности вероятности f (x). При известной модели можно рассчитать функцию скорость-искажение источника, построить эффективную шкалу квантования. Построение модели одномерного распределения заключается в нахождении такого теоретического распределения, которое будет находиться в согласии со статистическим распределением на заданной выборке опытных значений величины X. Для решения этой задачи необходимо выбрать класс теоретических распределений, с которыми проверяется согласие. Наиболее подходящим классом распределений является обобщенное гауссово распределение, задаваемое функцией плотности вероятности, поскольку оно охватывает широкое множество распределений, включая: нормальное, Лапласа и равномерное.

Обобщенное гауссово распределение случайной величины описывается функцией плотности вероятностей:

где – экспоненциальная скорость ослабления, – среднеквадратическое отклонение, () – гамма функция. При параметре = 2 получается нормальное распределение, при = 1 – распределение Лапласа, а при – равномерное распределение.

Параметр определяется соотношением дисперсии и первого абсолютного момента случайной величины. Поэтому для вычисления оценки используется следующее уравнение, в котором в левой части вместо дисперсии и абсолютного первого момента подставлялись их оценки по выборке:

где () – гамма функция, 2 – дисперсия выборки, E[| x |] – первый абсолютный момент случайной величины выборки.

Заметим, что для практического применения данной модели источника данных достаточно совпадения информационных характеристик модели и источника данных (в данном случае, функции скорость-искажение источника). Результаты расчетов и моделирования представлены на рис. 2 при типичном для аудио сигналов значении параметра.

Рис. 2. Функция скорость – искажение для источника данных и построенной модели Для построения кривых использовался алгоритм Блейхута. Из представленных результатов понятно, что точность оценок, построенных по модели, достаточно высока, что позволяет использовать в качестве модели источника данных обобщенное гауссово распределение.

В диссертационной работе исследовано влияние предварительной спектральной обработки на величину нижней границы Шеннона и на скорость при заданном искажении. К предварительной спектральной обработке относятся: разбиение спектра сигнала на полосы, применение абсолютного порога слышимости согласно модели субъективного восприятия и анализ спектральных коэффициентов на шумность.

Разбиение исходного диапазона частот спектра на полосы является эффективной техникой для кодирования сигнала, которая может быть оценена функцией скоростьискажение источника. Эффективность разбиения спектра сигнала на частотные диапазоны заключается в том, что функция H (D) некоторого процесса на исходном диапазоне частот больше, чем средняя H (D) по полосам частот. Этот факт следует из выпуклости средней взаимной информации I ( X ; Y ). В диссертационной работе рассмотрено два способа разбиения спектра на полосы: полосы равной длины и шкала Барка. Достоинством полос Барка по сравнению с полосами равной длины является согласованность между субъективным восприятием частотных диапазонов и шириной полос шкалы.

Использование абсолютного порога слышимости позволяет выявить спектральные коэффициенты, которые не важны с точки зрения субъективного восприятия. На практике коэффициенты спектра, энергия которых меньше значения абсолютного порога слышимости, передаются с незначительным уровнем качества или исключаются из рассмотрения.

В общем случае кодируемый сигнал можно рассматривать как сумму гармонических составляющих и шума S (t ) = H (t ) + N (t ). Можно предположить, что гармоническая составляющая H (t ) сигнала эффективно приближается суммой небольшого числа синусноподобных функций, а шумовая составляющая N (t ) – гауссовским шумом. Таким образом, спектр сигнала состоит из двух видов коэффициентов, сгруппированных по признаку тональности: тональные и шумовые коэффициенты спектра. Используя некоторые критерии тональности, выделяются полосы спектра, которые считается незначимыми, и обрабатываются аналогично полосам лежащим ниже абсолютного порога слышимости.

Рис. 3. Средние битовые затраты на отсчет для различных способов кодирования На рис. 3 приведены функции скорость-искажение при различных способах спектральной обработки и длине кадра N в спектральной области. В случае полос равной длины рассмотрен случай с переключением длин кадров на основе изменения характеристик временного сигнала. На графике можно видеть, что использование абсолютного порога слышимости и анализа на шумность позволяет существенно сократить битовые затраты на передаваемый сигнал.

Выводы: в качестве модели источника данных может быть использовано обобщенное гауссово распределение с параметрами и ; функция скорость искажение источника является инструментом определения минимально возможной скорости по заданной ошибке;

алгоритм Блейхута позволяет численно оценить функцию скорость-искажение источника;

разбиения спектр сигнала на полосы позволяет уменьшить битовые затраты на представление кодируемого сигнала; кодируемый сигнал можно разделить на две составляющие компоненты: шум и тон; использование абсолютного порога слышимости позволяет исключить из рассмотрения полосы спектра с малым уровнем звукового давления.

Исследованию скалярного квантования посвящена третья глава диссертационной работы. В ней исследуются границы эффективности скалярного квантования, равномерное скалярное квантование, оптимальное равномерное и неравномерное скалярное квантование.

В данной главе рассматривается еще один подход к построению неравномерного скалярного квантования: скалярное квантование с расширенной нулевой зоной. Его преимуществом является то, что номера квантов и аппроксимирующие значения вычисляются практически с той же сложностью, что и для равномерного скалярного квантования. Важной особенностью рассматриваемого квантования является малое число параметров, требуемых для его описания. Это свойство имеет большое значение в тех случаях, когда требуется подстройка квантования к изменениям статистических свойств источника. Предложен алгоритм адаптивного скалярного квантования с расширенной нулевой зоной. Предполагается, в соответствии с результатами второй главы, что модель источника описывается одномерной функцией плотности вероятности обобщенного гауссова распределения. Также рассмотрены сравнительные характеристики различных способов квантования и потери энергетической эффективности скалярного квантования при различных параметрах обобщенного гауссовского распределения.

Рассмотрим теоретические границы эффективности скалярного квантования. В качестве нижней границы можно принять функцию скорость-искажение источника (эпсилонэнтропия) или ее нижнюю оценку – границу Шеннона:

где D – среднеквадратичная ошибка, H 0 ( X ) – относительная энтропия источника, вычисляемая по формуле:

где f (x) – функция плотности вероятности источника.

Граница Шеннона (9) для обобщенного гауссова распределения может быть в явном виде выражена через его параметры и :

Известна асимптота Кошелева, показывающая избыточность скалярного квантования по отношению к функции скорость-искажение источника:

Следует отметить, что добавка к границе Шеннона в формуле (6) справедлива при условии среднеквадратичной меры искажения. Оценка Кошелева асимптотически точна для высоких скоростей кодирования D 0.

Функция скорость-искажение оптимального скалярного квантования определяется минимальной энтропией выходного алфавита квантователя при ошибке не больше заданной:

Функция скорость-искажение RОРСК (D) для оптимального равномерного скалярного лучше, чем для равномерного скалярного квантования RРСК (D). Наша цель – разработка скалярного квантования c характеристиками не хуже, чем для оптимального равномерного квантования, и по возможности, близкими к предельно достижимым (7):

На графике показаны кривые скорость-искажение для равномерного скалярного квантования RРСК (D ), оптимального равномерного скалярного квантования RОРСК (D), функции скорость-искажение источника H (D) и граница Шеннона H Sh (D), пунктиром показана асимптота Кошелева. Графики функций, представленных в цепочке неравенств (8), приведены на рис. 4 для нескольких значений параметров обобщенного гауссова распределения.

Рис. 4. Границы эффективности скалярного квантования для различных значений Граница Кошелева показана на графиках пунктиром. Функция скорость-искажение источника обозначена как H (D). Видно, что возможен выигрыш в скорости по сравнению с равномерным скалярным квантованием для диапазона низких скоростей. Также, можно видеть, что асимптота Кошелева справедлива только в области высоких скоростей кодирования. Графики построены для параметров альфа 0.5 и 1.0 при единичной дисперсии.

В случае параметра альфа 1.0 графики построены с помощью методов численного интегрирования, для параметра альфа 0.5 – моделированием. Длина выборка была выбрана такой, чтобы точность вычислений не была ниже 1% от оцениваемой величины. Для этого процесс моделирования продолжался до тех пор, пока флюктуации оцениваемого параметра не оказывались меньше 1% оцениваемой величины.

Квантование с расширенной нулевой зоной (КРНЗ) задается параметрическим набором шкал:

Каждой шкале соответствует набор границ квантов bi B( j, ), аппроксимирующих значений y i и масштабирующий коэффициент. Индекс j определяет индекс шкалы. При параметре j равном нулю получается шкала равномерного скалярного квантования, а при параметре j равном двум – нулевой квант расширен в 4 раза, как показано на рис. 5.

Рис. 5. Параметрический набор шкал квантования с расширенной нулевой зоной Рассмотрим три типа квантования КРНЗ. В случае КРНЗ аппроксимирующие значения выбираются в середине кванта:

Для оптимального КРНЗ аппроксимирующее значение соответствует среднему по величинам, попавшим в квант:

Субоптимальное КРНЗ только для первого ненулевого кванта использует аппроксимирующее значение как среднее значение, в остальных квантах аппроксимирующее значение – середина кванта:

Сравним кривые скорость-искажение для различных способов квантования (см. рис. 6).

Рис. 6. Сравнительные характеристики скалярного квантования Можно видеть, что информационная характеристика КРНЗ очень блика к характеристике оптимального равномерного скалярного квантования во всем диапазоне скоростей. Квантование согласно процедуре Макса-Ллойда значительно уступает КРНЗ.

График приведен для единичной дисперсии. В случае параметра альфа 1.0 графики построены с помощью методов численного интегрирования (за исключением кривой R ЛМ (D) ), для параметра альфа 0.5 – моделированием. Длина выборка была выбрана такой, чтобы точность вычислений не была ниже 1% от оцениваемой величины. Для этого процесс моделирования продолжался до тех пор, пока флюктуации оцениваемого параметра не оказывались меньше 1% оцениваемой величины.

Для более детального анализа функций скорость-искажение ОРСК, РСК и КРНЗ вычислены потери энергетической эффективности квантователей по сравнению с предельно достижимой эффективностью. Энергетический выигрыш квантования вычисляется по формуле:

где 2 дисперсия источника, а D ошибка квантования.

Без потери общности в (9) положим 2 = 1. Максимальный энергетический выигрыш определяется функцией скорость-искажение источника:

Потери энергетической эффективности можно выразить как разницу между максимальным выигрышем (10) и выигрышем рассматриваемого квантователя (9):

Графики функций L( R ) для различных распределений вероятностей и различных методов скалярного квантования приведены на рис.7.

Рис. 7. Потери энергетической эффективности скалярного квантования при различных параметрах обобщенного гауссова распределения Самые большие потери энергетической эффективности у равномерного скалярного квантования. В диапазоне скоростей от 0 до 1,4 бит (параметр альфа 0,5) потери энергетической эффективности ОРСК больше, чем для КРНЗ. В диапазоне скоростей от 0 до 1,8 бит (параметр альфа 1,0) потери энергетической эффективности РСК больше, чем для КРНЗ. Наименьшими потерями энергетической эффективности обладает ОКРНЗ.

Субоптимальное КРНЗ практически полностью исчерпывает выигрыш ОКРНЗ. График приведен для единичной дисперсии.

Алгоритм адаптивного КРНЗ состоит из нескольких шагов: вычисление параметра распределения, оценивание индекса используемой шкалы и масштабирующего коэффициента по заданной ошибке квантования, сам процесс квантования.

Эффективность использования адаптивного квантования с расширенной нулевой зоной можно оценить с помощью моделирования. Рассматривается кодер аудио сигналов, основанный на кодировании коэффициентов модифицированного косинусного преобразования. В качестве кодируемых образцов выбран типичный речевой сигнал и музыкальный фрагмент. В обоих случаях частота дискретизации равна 44.1 кГц, а длина кадра во временной области – 2048 отсчетов. В силу перекрытий кадров каждому кадру n соответствует N = 1024 спектральных коэффициента. Отдельно рассматривается диапазон частот от 500 до 1500 Гц. Этому диапазону соответствуют 46 спектральных коэффициентов одного кадра.

Рис. 8. Характеристики квантования и параметры распределений для музыкального образца Результаты моделирования, приведенные на рис. 8 показывают, что оптимизация квантователя по приведенному выше алгоритму позволяет получить выигрыш по скорости кодирования порядка 0.2 бита на отсчет по сравнению с наиболее часто применяемым равномерным скалярным квантованием. Для речевого образца результаты аналогичны.

Выводы: для обобщенного гауссовского распределения с параметром [0.25,2] граница Шеннона H Sh (D) практически совпадает с функцией скорость-искажение H (D) при H ( D) H Sh ( D) > 2.5 бит на отсчет; при значениях параметра [0.25,2] и скорости квантования выше 2.5 бит на отсчет характеристики РСК и ОРСК практически совпадают и избыточность близка к асимптотической оценке Кошелева 0.255 бит на отсчет; при скорости квантования ниже 2 бит на отсчет асимптотическая оценка Кошелева является плохим ориентиром при оценке эффективности квантования. В этом диапазоне скоростей возможен существенный выигрыш неравномерного или оптимального равномерного скалярного квантования по сравнению с равномерным квантованием; оптимальное равномерное скалярное квантование весьма близко по своим характеристикам к оптимальному скалярному квантованию и его недостаток – большое количество параметров, требуемых для его описания; полученные результаты для КРНЗ убеждают в том, что при всех распределениях вероятностей рассматриваемого класса, характеристики близкие к предельно достижимым, могут быть получены с помощью СОКРНЗ, т.е. квантователя, описываемого относительно небольшим числом параметров (шаг квантования, номер шкалы j, аппроксимирующее значение для младшего ненулевого кванта). Выигрыш СОКРНЗ по сравнению с обычным равномерным квантованием при скорости порядка 1 бит на отсчет может превышать 0.5 дБ, а проигрыш по сравнению с оптимальным скалярным квантованием находится в пределах 0…0.05 дБ.

В четвертой главе диссертационной работы рассматриваются вопросы о вычислении допустимого уровня шума квантования и перцептуальной энтропии на основе модели субъективного восприятия, управления квантованием и определение параметров квантования с расширенной нулевой зоной на основе заданной ошибки, вычисление перцептуальной энтропии для квантования с расширенной нулевой зоной. Величина требуемой ошибки квантования определяется согласно стандарту MPEG1.

В диссертации вычисление перцептуальной энтропии выполняется на основе функции скорость-искажение для используемого способа квантования при заданной ошибке кодирования. Получена следующая формула для перцептуальной энтропии на основе полиномиальной аппроксимации приведенных выше оценок функции скорость-искажение:

где аппроксимация порога Db :

и аппроксимация коэффициентов:

Сравнение перцептуальной энтропии вычисленной в диссертации (12) с перцептуальной энтропией стандарта MPEG1 показывает, что предложенный вариант вычисления дает более достоверную оценку битовых затрат при одной и той же оценке ошибки, чем перцептуальная энтропия стандарта MPEG1 (см. рис. 9).

Рис. 9. Перцептуальная энтропия стандарта MPEG1, оценка по функции скоростьискажение (12) и действительные битовые затраты Средняя оценка действительных битовых затрат составляет 0,38 бита на отсчет, средняя оценка перцептуальной энтропии стандарта MPEG1 равна 1,13 бит на отсчет, а предложенный вариант вычисления перцептуальной энтропии показывает среднюю оценку в 0,54 бита на отсчет. Для эксперимента использовался тестовый файл с частотой дискретизации 44100 Гц, длина спектра – 1024 отсчета.

Выводы: выражение перцептуальной энтропии стандарта MPEG 1 определяет битовые затраты исключительно для равномерного скалярного квантования и не точна, поскольку основано на равномерности распределения величин, попадающих в квант и не учитывает особенности распределения входных данных; на низкой скорости кодирования возможна достаточно точная полиномиальная аппроксимация в зависимости от входного распределения данных; для высокой скорости кодирования, где наблюдается линейный участок кривой R (D), допустимо использовать нижнюю границу Шеннона и асимптоту Кошелева для оценки перцептуальной энтропии; простота вычисления оценки перцептуальной энтропии дает возможность эффективно использовать ее на практике;

применение на практике оценки (12) позволяет более эффективно задать первоначальное распределение бит между передаваемыми участками сигнала и как следствие этого уменьшается число итераций при управлении ошибкой квантования или скоростью кодирования.

В пятой главе диссертационной работы рассмотрен анализ эффективности адаптивного КРНЗ встроенного в аудио кодек, приведены оценки субъективного и объективного качества для адаптивного КРНЗ и предыдущего варианта квантования, а также показано, что уменьшение битовой скорости достигается исключительно за счет изменение процедуры квантования.

Оценка объективного качества выполняется на основе сравнения скорости и ошибки кодирования. В качестве тестовых последовательностей принят набор файлов с частотой дискретизации 44100 Гц, используемый для тестирования аудио кодека. В обоих случаях использовался один и тот же способ обработки аудио данных, за исключением модуля квантования. Результаты сравнения приведены на рис 10.

Рис. 10. Зависимость скорости кодирования и ошибки от номера звукового фрагмента Из графиков на рис. 10 видно, что квантование КРНЗ существенно лучше по скорости кодирования, чем предыдущий вариант, использованный в аудио кодеке. При этом отношение сигнал-шум для квантования КРНЗ несколько выше, чем в предыдущей модели квантовании. Оценивая среднюю разницу в скорости кодирования между предыдущим квантованием и КРНЗ, можно видеть, что КРНЗ квантование экономит в среднем 8,71 кбит/c или 14,44% от скорости кодирования потока аудио данных. При этом средняя разница в отношении сигнал-шум между КРНЗ и предыдущем составляет 0,44 дБ или 2,25% по отношению к предыдущему варианту квантования.

Сравнивая битовые затраты на каждый вид информации о сигнале для нескольких файлов можно убедиться, что выигрыш в скорости кодирования достигается только за счет смены квантователя на КРНЗ. Битовые затраты на кванты отражены черным прямоугольником на рис.11.

Рис. 11. Битовые затраты на каждый вид информации при использовании разных Как правило, для низких скоростей кодирования производится оценка субъективного качества, которая основана на слепом прослушивании тестовых фрагментов группой экспертов. Для каждого фрагмента, используемого в тестировании, определен набор файлов:

оригинал, оригинал с отфильтрованным сигналом выше 3 и 7 кГц, файл который требуется оценить и несколько вариантов сторонних аудио-кодеков (обычно около 3-х). Затем эксперт выставляет оценки каждому звуковому фрагменту на основе следующих данных: оригинал 100 баллов, оригинал с отфильтрованным сигналом выше 3 кГц получает 20 баллов, выше кГц – 40 баллов, остальным файлам оценки выставляются в пределах от 40 до 100 баллов.

После слепого прослушивания результаты всех экспертов усредняются. На основе средних данных строится график, где по оси ординат отложены средняя оценка, а по оси абсцисс – имя звукового фрагмента (см. рис. 12). Чем выше оценка, тем выше субъективное качество сигнала.

Средняя оценка экспертов Рис. 12. Оценка субъективного восприятия для ЛМ и КРНЗ квантования Целевая скорость кодирования 18 кбит/с, тип звуковых фрагментов – стерео, частота дискретизации – 48000 Гц. Набор тестовых последовательностей был изменен с целью исключения результатов полученных только для настроечных файлов. Тестирование проводилось в институте прогрессивных технологий Самсунг. Средняя разница по звуковым фрагментам между оценками экспертов составляет 15,03 балла.

РЕЗУЛЬТАТЫ

1. Построена вероятностная модель для коэффициентов преобразования сигнала ортогональными фильтрами.

2. Исследована зависимость потенциальных характеристик эффективности квантования от параметров модели, предложена новая формула перцептуальной энтропии на основе аппроксимации функции скорость-искажение.

3. Применение на практике нового метода вычисления перцептуальной энтропии позволяет более эффективно осуществлять распределение бит между передаваемыми участками сигнала.

4. На основе проведенных экспериментов с интеграцией квантования с расширенной нулевой зоной в аудио кодек показано, что достигается уменьшение средней скорости на 8.71 кбит/с (14.44%) и увеличение отношения сигнал/шум на 0.44 дБ (2.25%).

5. Эксперименты слепого тестирования при фиксированной целевой скорости показали, что при использовании квантования с расширенной нулевой зоной субъективное качество возросло в среднем на 15.03 балла.

Основное содержание диссертационной работы изложено в следующих публикациях:

1. Поров А.В. Анализ эффективности квантования спектральных коэффициентов аудио сигнала// Восьмая научная сессия аспирантов ГУАП, часть первая, технические науки:

Сб. докл./ СПбГУАП. СПб., 2005. С. 327.

2. Осипов К.С., Поров А.В. Сравнительный анализ эффективности банков фильтров// Девятая научная сессия аспирантов ГУАП, часть первая, технические науки: Сб. докл./ СПбГУАП. СПб., 2006. С. 298.

3. Кудряшов Б.Д., Поров А.В. Скалярные квантователи для случайных величин, имеющих обобщенное гауссовское распределение// Цифровая обработка сигналов. 2005. №4.

4. Егоров А.А., Кудряшов Б.Д., Петров С.Е., Поров А.В. Сравнительный анализ методов совместного кодирования каналов стерео сигнала// Цифровая обработка сигналов и её применение: Сб. науч. тр./ Российского научно-технического общества радиотехники, электроники и связи имени А.С.Попова, выпуск VIII, Москва, 2006.

5. Пат. 20060004566 США, МКИ G10L 21/00. Low-bitrate encoding/decoding method and system. Oh Eunmi, Kim Junghoe, Kim Sangwook, Egorov Andrew, Porov Anton, Osipov Konstantin, Kudryashov Boris.

Формат 60х84 1/16. Бумага офсетная. Печать офсетная.





Похожие работы:

«ЦУКАНОВА Екатерина Геннадьевна ВОСПИТАНИЕ СПЕЦИАЛЬНОЙ МЫШЕЧНОЙ ВЫНОСЛИВОСТИ У ЮНЫХ БЕГУНИЙ на 800 м ПРИ ИСПОЛЬЗОВАНИИ ТРЕНИРОВОЧНЫХ ЗАДАНИЙ НА ТРЕНАЖЕРАХ 13.00.04 – теория и методика физического воспитания, спортивной тренировки, оздоровительной и адаптивной физической культуры АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата педагогических наук Москва – 2013 2 Диссертационная работа выполнена на кафедре теории и методики спортивной тренировки Педагогического...»

«РЫБАКОВ Роман Вячеславович ПРАВО СОБСТВЕННОСТИ ХОЗЯЙСТВЕННЫХ ОБЩЕСТВ 12.00.03 – гражданское право; предпринимательское право; семейное право; международное частное право АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Саратов – 2013 2 Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования Саратовская государственная юридическая академия Научный руководитель кандидат юридических...»

«Тамбовцева Наталья Николаевна УПРАВЛЕНИЕ ПРОЦЕССОМ ФОРМИРОВАНИЯ КОРПОРАТИВНОЙ ИДЕНТИЧНОСТИ Специальность: 08.00.05. – Экономика и управление народным хозяйством (менеджмент) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата экономических наук Москва, 2012 Работа выполнена на кафедре корпоративного управления Государственного университета управления. Научный руководитель : доктор экономических наук, профессор Антонов Виктор Глебович Официальные оппоненты : доктор...»

«КОЗЛОВА АНАСТАСИЯ ВИКТОРОВНА МЕТОДИКА ВНЕДРЕНИЯ WEB 2.0-ТЕХНОЛОГИЙ В ОРГАНИЗАЦИЮ САМОСТОЯТЕЛЬНОЙ РАБОТЫ ПО ИНФОРМАТИКЕ СТУДЕНТОВ ГУМАНИТАРНОГО НАПРАВЛЕНИЯ ПОДГОТОВКИ 13.00.02 – теория и методика обучения и воспитания (информатика, уровень профессионального образования) Автореферат диссертации на соискание ученой степени кандидата педагогических наук Челябинск – 2012 Работа выполнена на кафедре информационных технологий в ФГАОУ ВПО Российский государственный...»

«Ван Шилу ИНТЕРНЕТ-ЗАВИСИМОСТЬ У УЧАСТНИКОВ КОМПЬЮТЕРНЫХ ИГР (НА МАТЕРИАЛЕ КИТАЙСКОЙ КУЛЬТУРЫ) Специальность: 19.00.01 – Общая психология, психология личности, история психологии Автореферат диссертации на соискание ученой степени кандидата психологических наук Москва - 2013 Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования Московский государственный университет имени М.В. Ломоносова Научный руководитель :...»

«НА ПРАВАХ РУКОПИСИ УСАТОВА ЮЛИЯ НИКОЛАЕВНА ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ В СОЦИАЛЬНО-ИСТОРИЧЕСКОМ РАЗВИТИИ (ЛИНЕЙНЫЕ И НЕЛИНЕЙНЫЕ РЕПРЕЗЕНТАЦИИ) Специальность 09.00.11 – Социальная философия АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата философских наук Ставрополь – 2013 Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования Таганрогский государственный педагогический институт имени А. П. Чехова Научный руководитель:...»

«Тараненко Елена Владимировна ПОЛИМЕРНЫЕ КОМПОЗИЦИОННЫЕ МАТЕРИАЛЫ НА ОСНОВЕ ТЕРМОРЕАКТИВНЫХ ОЛИГОМЕРОВ, МОДИФИЦИРОВАННЫХ КРЕМНИЙОРГАНИЧЕСКИМИ ЭФИРАМИ Специальность 05.17.06 – Технология и переработка полимеров и композитов. АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Москва – 2008 www.sp-department.ru Работа выполнена на кафедре химии и технологии переработки пластмасс и полимерных композитов Федерального государственного образовательного...»

«Королев Евгений Валерьевич Разработка унифицированного стека сетевых протоколов для полевых шин корабельных систем управления техническими средствами Специальность 05.13.06. Автоматизация и управление технологическими процессами и производствами (судостроение) АВТОРЕФЕРАТ диссертации на соискание учной степени кандидата технических наук Санкт-Петербург – 2011 Работа выполнена в ОАО Концерн НПО Аврора Научный руководитель кандидат технических наук Третьяков Владимир...»

«Соболев Сергей Игоревич УПРАВЛЕНИЕ ПОТОКАМИ ЗАДАНИЙ В РАСПРЕДЕЛЕННЫХ НЕОДНОРОДНЫХ ВЫЧИСЛИТЕЛЬНЫХ СРЕДАХ Специальность 05.13.11 – математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей Автореферат диссертации на соискание учёной степени кандидата физико-математических наук Москва – 2008 Работа выполнена в Научно-исследовательском вычислительном центре Московского государственного университета имени М.В. Ломоносова Научный руководитель :...»

«ФИЛИППОВ Сергей Александрович ТЕОРЕТИЧЕСКИЕ И ПРАКТИЧЕСКИЕ АСПЕКТЫ ГРАЖДАНСКОГО ПРОЦЕССУАЛЬНОГО СОУЧАСТИЯ 12.00.15 — гражданский процесс; арбитражный процесс АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Саратов — 2011 2 Работа выполнена в Государственном образовательном учреждении высшего профессионального образования Саратовская государственная академии права. Научный руководитель — кандидат юридических наук, доцент Цепкова Татьяна...»

«Остертак Дмитрий Иванович РАЗРАБОТКА ТЕОРЕТИЧЕСКИХ ОСНОВ И МЕТОДИКИ ПРОЕКТИРОВАНИЯ ЭЛЕКТРОСТАТИЧЕСКИХ МЭМП МЕХАНИЧЕСКОЙ ЭНЕРГИИ В ЭЛЕКТРИЧЕСКУЮ Специальность: 05.27.01 – Твердотельная электроника, радиоэлектронные компоненты, микро- и наноэлектроника, приборы на квантовых эффектах АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата технических наук Новосибирск – 2009 2 Работа выполнена в государственном образовательном учреждении высшего профессионального...»

«Маргания Кетеван Рамазовна Совершенствование системы управления эффективностью предприятий реального сектора экономики Специальность 08.00.05 – Экономика и управление народным хозяйством (предпринимательство; экономика, организация и управление предприятиями, отраслями, комплексами-промышленность) Автореферат на соискание ученой степени кандидата экономических наук Москва - 2009 Работа выполнена на кафедре Макроэкономика Государственного университета управления Научный...»

«Костецкий Владислав Андреевич ДИВЕРСИФИКАЦИЯ МАРКЕТИНГОВЫХ КОММУНИКАЦИОННЫХ КАНАЛОВ ПРЕДПРИЯТИЙ НЕПРОДОВОЛЬСТВЕННОГО РИТЕЙЛА Специальность 08.00.05 – Экономика и управление народным хозяйством: маркетинг АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата экономических наук Краснодар 2013 Диссертация выполнена на кафедре маркетинга и торгового дела ФГБОУ ВПО Кубанский государственный университет Научный руководитель : Воронов Александр Александрович, доктор...»

«ПУЗЫНИНА Светлана Александровна СОВЕРШЕННЫЕ РАСКРАСКИ БЕСКОНЕЧНОЙ ПРЯМОУГОЛЬНОЙ РЕШЕТКИ специальность 01.01.09 – дискретная математика и математическая кибернетика Автореферат диссертации на соискание учёной степени кандидата физико-математических наук Новосибирск, 2008 Работа выполнена в Институте математики им. С. Л. Соболева СО РАН Научные руководители: кандидат физико-математических наук,...»

«ДУРНОВ АЛЕКСАНДР СЕРГЕЕВИЧ ГРАЖДАНСКО-ПРАВОВАЯ ОТВЕТСТВЕННОСТЬ ПО ДОГОВОРУ УЧАСТИЯ В ДОЛЕВОМ СТРОИТЕЛЬСТВЕ МНОГОКВАРТИРНЫХ ДОМОВ Специальность 12.00.03 - гражданское право; предпринимательское право; семейное право; международное частное право АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Владикавказ 2011 Работа выполнена на кафедре гражданского права и процесса Государственного образовательного учреждения высшего профессионального образования...»

«Сабирзянова Нурия Нургаязовна Право общей собственности на земельный участок Специальность 12.00.03 - гражданское право; предпринимательское право; семейное право; международное частное право Автореферат диссертации на соискание ученой степени кандидата юридических наук Казань – 2008 2 Работа выполнена на кафедре гражданского и предпринимательского права Государственного образовательного учреждения высшего профессионального образования Казанский государственный университет...»

«Жданов Андрей Геннадьевич ПОВЫШЕНИЕ НАДЕЖНОСТИ АНАЛИЗА ДАННЫХ ВИХРЕТОКОВОГО КОНТРОЛЯ ТЕПЛООБМЕННЫХ ТРУБ ПАРОГЕНЕРАТОРОВ АЭС Специальность 05.11.13 – Приборы и методы контроля природной среды, веществ, материалов и изделий АВТОРЕФЕРАТ Диссертации на соискание ученой степени кандидата технических наук Москва – 2014 Работа выполнена на кафедре Электротехники и Интроскопии Федерального государственного бюджетного образовательного учреждения высшего профессионального образования...»

«ФАТЬЯНОВА Елена Витальевна РАЗВИТИЕ КРОНЫ ХУРМЫ КАВКАЗСКОЙ (DIOSPYROS LOTUS L., EBENACEAE) В УСЛОВИЯХ ЧЕРНОМОРСКОГО ПОБЕРЕЖЬЯ КАВКАЗА 03.02.01 – Ботаника АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук Санкт-Петербург 2010 Работа выполнена на кафедре геоботаники и экологии растений СанктПетербургского государственного университета Научный руководитель : кандидат биологических наук, доцент Антонова Ирина Сергеевна Официальные оппоненты : доктор...»

«Мирошникова Юлия Вячеславовна Предотвратимые потери здоровья населения при диабете 14.00.33 – Общественное здоровье и здравоохранение АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата медицинских наук Москва - 2008 Работа выполнена в Центральном научно-исследовательском институте организации и информатизации здравоохранения Министерства здравоохранения и социального развития Российской Федерации доктор медицинских наук, р Научный руководитель Ф.И. БАДАЕВ доктор...»

«Бубнова Наталья Александровна Ключевые слова социального словаря как инструмент речевого воздействия и манипуляции сознанием в аналитической публицистике Специальность: 10.02.01 – русский язык АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук Москва – 2012 3 Работа выполнена на кафедре общего и русского языкознания филологического факультета Российского университета дружбы народов Научный руководитель : доктор филологических наук, доцент...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.