профессиональное образование
а. В. остроух
ВВод и обработка
цифроВой
информации
уЧЕбник
Рекомендовано
Федеральным государственным автономным учреждением
«Федеральный институт развития образования» (ФГАУ «ФИРО»)
в качестве учебника для использования
в учебном процессе образовательных учреждений,
реализующих программу НПО по профессии 230103.02
«Мастер по обработке цифровой информации»
Регистрационный номер рецензии 504
от 23 декабря 2011 г. ФГАУ «ФИРО»
2-е издание, стереотипное УДК 004.9(075.32) ББК 32.81я722 О-79 Рецензент — Методист отдела информационно-методического обеспечения образовательного процесса ГБОУ Учебно-методического центра по профессиональному образованию Департамента образования г. Москвы С. В. Янина Остроух А.В.
О-79 Ввод и обработка цифровой информации : учебник для студ.
учреждений сред. проф. образования / А.В.Остроух. — 2-е изд., стер. — М. : Издательский центр «Академия», 2014. — 288 с.
ISBN 978-5-4468-0685- Учебник создан в соответствии с Федеральным государственным образовательным стандартом по профессии 230103.02 «Мастер по обработке цифровой информации».
Представлен материал по основам применения мультимедиа-технологий в профессиональной деятельности мастера по обработке цифровой информации. Рассмотрены требования к аппаратному и программному обеспечению персонального компьютера для эффективной работы с мультимедийными программами и приложениями. Основное внимание уделено использованию возможностей компьютерной графики, цифрового звука и видео.
К данному учебнику выпущен электронный образовательный ресурс «Ввод и обработка цифровой информации».
Для студентов учреждений среднего профессионального образования.
УДК 004.9(075.32) ББК 32.81я Оригинал-макет данного издания является собственностью Издательского центра «Академия», и его воспроизведение любым способом без согласия правообладателя запрещается © Остроух А.В., © Образовательно-издательский центр «Академия», ISBN 978-5-4468-0685-0 © Оформление. Издательский центр «Академия», Уважаемый читатель!
Данный учебник является частью учебно-методического комплекта по профессии 230103.02 «Мастер по обработке цифровой информации».
Учебник предназначен для изучения профессионального модуля ПМ.01 «Ввод и обработка цифровой информации».
Учебно-методические комплекты нового поколения включают в себя традиционные и инновационные учебные материалы, позволяющие обеспечить изучение общеобразовательных и общепрофессиональных дисциплин и профессиональных модулей. Каждый комплект содержит учебники и учебные пособия, средства обучения и контроля, необходимые для освоения общих и профессиональных компетенций, в том числе и с учетом требований работодателя.
Учебные издания дополняются электронными образовательными ресурсами. Электронные ресурсы содержат теоретические и практические модули с интерактивными упражнениями и тренажерами, мультимедийные объекты, ссылки на дополнительные материалы и ресурсы в Интернете. В них включен терминологический словарь и электронный журнал, в котором фиксируются основные параметры учебного процесса: время работы, результат выполнения контрольных и практических заданий. Электронные ресурсы легко встраиваются в учебный процесс и могут быть адаптированы к различным учебным программам.
ПреДисловие Впервые термин «мультимедиа» появился в 1965 г. и активно использовался вплоть до конца 1970-х гг. для описания экстравагантных для того времени театрализованных шоу, использующих разные виды и формы представления информации: слайды, кино, видео- и аудиофрагменты, световые эффекты и живую музыку.
В конце 1970 — начале 1980-х гг. под «мультимедиа» понимали представления, основанные на статических или динамических изображениях от нескольких проекторов, сопровождавшихся звуком или «живой» музыкой.
Таким образом, средства мультимедиа воздействовали сразу на несколько органов человеческих чувств и представляли информацию в разных формах: визуальной, вербальной и аудиальной, что оказывало (и оказыает) более глубокое эмоциональное воздействие и принесло успех и популярность этому виду театрализованных представлений. Возможность влияния на эмоциональную сферу человеческой психики является важным фактором при обучении, так как способствует более эффективному усвоению знаний. Однако только в последнее десятилетие с развитием персональных компьютеров и повсеместной информатизацией образования мультимедиатехнологии стали востребованы в российской школе.
К техническим средствам мультимедиа также можно отнести современные мобильные телефоны, с которых можно посылать фотографии с голосовыми подписями. Термин «мультимедиа» все еще продолжает развиваться по мере возникновения и использования новых технологий.
Настоящий учебник поможет овладеть профессиональными компетенциями:
подготавливать к работе и настраивать аппаратное обеспечение, периферийные устройства, операционную систему персонального компьютера и мультимедийное оборудование;
выполнять ввод цифровой и аналоговой информации в персональный компьютер с различных носителей;
конвертировать файлы с цифровой информацией в различные форматы;
обрабатывать аудио- и визуальный контент средствами звуковых, графических и видеоредакторов;
создавать и воспроизводить видеоролики, презентации, слайдшоу, медиафайлы и другую итоговую продукцию из исходных аудиовизуальных и мультимедийных компонентов средствами персонального компьютера и мультимедийного оборудования.
Для овладения указанным видом профессиональной деятельности и соответствующими профессиональными компетенциями обучающийся в ходе освоения материала учебника должен:
получить практический опыт:
подключения кабельной системы персонального компьютера, периферийного и мультимедийного оборудования;
настройки параметров функционирования персонального компьютера, периферийного и мультимедийного оборудования;
ввода цифровой и аналоговой информации в персональный компьютер с различных носителей, периферийного и мультимедийного оборудования;
сканирования, обработки и распознавания документов;
конвертирования медиафайлов в различные форматы, экспорта и импорта файлов в различные программы-редакторы;
обработки аудиовизуального и мультимедийного контента с помощью специализированных программ-редакторов;
создания и воспроизведения видеороликов, презентаций, слайдшоу, медиафайлов и другой итоговой продукции из исходных аудиовизуальных и мультимедийных компонентов;
уметь:
подключать и настраивать параметры функционирования персонального компьютера, периферийного и мультимедийного оборудования;
настраивать основные компоненты графического интерфейса операционной системы и специализированных программредакторов;
управлять файлами данных на локальных, съемных запоминающих устройствах;
производить распечатку, копирование и тиражирование документов на принтере и других периферийных устройствах вывода;
распознавать сканированные текстовые документы с помощью программ распознавания текста;
вводить цифровую и аналоговую информацию в персональный компьютер с различных носителей, периферийного и мультимедийного оборудования;
создавать и редактировать графические объекты с помощью программ для обработки растровой и векторной графики;
конвертировать файлы с цифровой информацией в различные форматы;
производить сканирование прозрачных и непрозрачных оригиналов;
производить съемку и передачу цифровых изображений с фотои видеокамеры на персональный компьютер;
обрабатывать аудио-, визуальный контент и медиафайлы средствами звуковых, графических и видеоредакторов;
создавать видеоролики, презентации, слайд-шоу, медиафайлы и другую итоговую продукцию из исходных аудиовизуальных и мультимедийных компонентов;
воспроизводить аудио-, визуальный контент и медиафайлы средствами персонального компьютера и мультимедийного оборудования;
производить распечатку, копирование и тиражирование документов на принтере и других периферийных устройствах вывода;
использовать мультимедиа-проектор для демонстрации содержимого экранных форм с персонального компьютера;
вести отчетную и техническую документацию;
устройство персональных компьютеров, их основные блоки, функции и технические характеристики;
архитектуру, состав, функции и классификацию операционных систем персонального компьютера;
виды и назначение периферийных устройств, их устройство и принцип действия, интерфейсы подключения и правила эксплуатации;
принципы установки и настройки основных компонентов операционной системы и драйверов периферийного оборудования;
принципы цифрового представления звуковой, графической, видео- и мультимедийной информации в персональном компьютере;
виды и параметры форматов аудио-, графических, видео- и мультимедийных файлов и методы их конвертирования;
назначение, возможности, правила эксплуатации мультимедийного оборудования;
основные типы интерфейсов для подключения мультимедийного оборудования;
основные приемы обработки цифровой информации;
назначение, разновидности и функциональные возможности программ обработки звука;
назначение, разновидности и функциональные возможности программ обработки графических изображений;
назначение, разновидности и функциональные возможности программ обработки видео- и мультимедиа-контента;
нормативные документы по охране труда при работе с персональным компьютером, периферийным, мультимедийным оборудованием и компьютерной оргтехникой.
Раздел Глава 1. Что такое мультимедиа?
Глава 2. Аппаратные и программные компоненты мультимедиа Глава 3. Носители мультимедиа 1.1. ПонятиЕ «мультимЕдиа»
Понятие «мультимедиа» появилось недавно и пока не имеет четкого однозначного определения. Однако основной его смысл сводится к использованию различных форм представления информации для увеличения эффективности ее восприятия. Кроме того, в это понятие включается и возможность со стороны человека управлять потоком этой информации, а не просто пассивно воспринимать ее.
Условно можно выделить шесть основных компонентов, характеризующих мультимедийное представление информации (рис. 1.1).
Однако и обычное кино «владеет» всеми этими средствами. Но компьютерная мультимедиа-программа имеет два принципиальных отличия. Во-первых, пользователь может управлять потоком информации — выбирать различные режимы представления и поведения объектов на экране компьютера, что недоступно для традиционного кино. Это свойство мультимедийных программ принято называть интерактивностью (от англ. interaction — взаимодействие). Кроме того, стоимость производства кинофильма во много раз выше стоимости компьютерной программы.
Мультимедиа можно подразделить на линейный и нелинейный способы представления информации.
Рис. 1.1. Основные компоненты мультимедиа:
а — текст; б — аудио; в — изображения; г — анимация; д — видео;
е — интерактивность Аналогом линейного способа представления информации может являться кино. Человек, просматривающий данный фильм, никаким образом не может повлиять на его вывод.
Нелинейный способ представления информации позволяет человеку участвовать в выводе информации, взаимодействуя какимлибо образом со средством отображения мультимедийных данных.
Участие человека в данном процессе также называется интерактивностью. Такой способ взаимодействия человека и компьютера наиболее полно представлен в категориях компьютерных игр. Нелинейный способ представления мультимедийных данных иногда называется «гипермедиа».
В качестве примера линейного и нелинейного способов представления информации можно рассматривать такую ситуацию, как проведение презентации. Если презентация была записана на пленку и показывается аудитории, то при этом способе донесения информации просматривающие данную презентацию не имеют возможности влиять на докладчика. При «живой» презентации аудитория имеет возможность задавать докладчику вопросы и взаимодействовать с ним, что позволяет докладчику отходить от темы презентации, например, поясняя некоторые термины или более подробно освещая спорные части доклада. Таким образом, «живая» презентация может быть представлена как нелинейный (интерактивный) способ представления информации.
Области применения мультимедиа очень разнообразны.
В образовании мультимедиа используется в учебных курсах, базирующихся на информационных технологиях (медиа-образование).
На производстве, особенно в механической и автомобильной промышленности, мультимедиа используется на стадии проектирования. Это позволяет, например, инженеру рассматривать изделие в различных перспективах, производить другие манипуляции, прежде чем приступать к производству (автоматизированное проектирование).
В медицине мультимедиа применяется в процессе обучения хирургов (виртуальная хирургия).
В науке мультимедиа главным образом используется для моделирования различных процессов.
В искусстве наиболее яркими примерами мультимедиа являются специальные эффекты в кино, компьютерная мультипликация и трехмерная графика.
В области развлечений ярким примером мультимедиа являются компьютерные игры.
1.2. ПринциПы ПрЕдстаВлЕния мультимЕдиа В комПьютЕрЕ 1.2.1. аналоговая и цифровая информация Информация может быть в двух представлениях:
аналоговая;
дискретная.
Аналоговая информация характеризуется плавным изменением ее параметров. Чистый звук, например, может быть разной громкости и разной высоты (частоты). Уровень освещенности (измеряемый в люксах) — тоже аналоговая величина. Основные параметры наиболее простых синусоидальных аналоговых сигналов (амплитуда, частота, фаза) могут непрерывно и плавно меняться во времени.
Дискретная информация базируется на ряде фиксированных уровней представления некоторых параметров. Например, выключатель света в комнате может быть либо включенным, либо выключенным. Если говорить о свете просто как о факте, то он может быть или не быть, т. е. характеризуется всего двумя уровнями. Если этих уровней много, то можно говорить о цифровом представлении информации.
Аналоговую информацию легко преобразовать в цифровую. Для этого достаточно задать аналоговый сигнал рядом дискретных (т. е.
постоянных на хотя бы небольшом отрезке времени) значений. Это делают так называемые аналого-цифровые преобразователи (АЦП).
Главные их показатели — это разрядность (число уровней квантования) и скорость выполнения преобразований.
Например, популярные звуковые оптические компакт-диски содержат высококачественные записи речи и музыки в цифровой форме. При их записи 44 тыс. раз в секунду берется выборка звукового сигнала в отдельные моменты времени. Каждая выборка представляется (квантуется) большим числом уровней — до 65 тыс. Этот поток цифровых данных и записывается в двоичном виде на диск.
В итоге компакт-диск при лазерном считывании информации позволяет воспроизводить звуки любимых певцов и оркестров с невиданным ранее качеством, без шипения и тресков, характерных для виниловой грампластинки.
Частота квантования АЦП в данном примере составляет 44,1 кГц, а разрядность квантования — 16. Действительно, 216 = 65 536 (это и есть число ступенек при квантовании звукового сигнала). Обратное преобразование (цифровых сигналов в аналоговые) обеспечивают цифроаналоговые преобразователи (ЦАП). В настоящее время АЦП и ЦАП выпускаются в виде миниатюрных интегральных схем (микросхем). Они используются в звуковых картах персональных компьютеров (ПК).
На преобразовании аналоговых сигналов в цифровые (и наоборот) основана работа многих устройств, например звуковых карт или аудиоадаптеров в современных ПК. Аналоговый сигнал в таких картах преобразуется в цифровой, который записывается в память ПК, например на его жесткий диск (устройство для долговременного хранения информации на базе магнитных дисков). Обратное преобразование позволяет после усиления аналоговых сигналов воспроизвести их динамиками ПК.
Преобразование аналоговой информации в цифровую позволяет включить в обиход мощные средства компьютерной обработки информации. Становится возможным, например, голосовое управление ПК и ввод в него информации. На пути такого преобразования еще стоят некоторые проблемы, но уже существуют программные продукты для речевого ввода информации в компьютер.
Среди таких проблем самая важная — проблема распознавания реальной речи. Она решена частично и сейчас уже есть много программ для компьютеров, понимающих многие слова, произнесенные их пользователями. Еще немного и вместо отдельных слов компьютер начнет понимать нашу речь полностью, без ошибок. Проблема сканирования и распознания печатных текстов уже решена, как и их звуковое воспроизведение компьютером.
Звук — это распространяющиеся в упругих средах механические колебания, воспринимаемые ухом человека. Он характеризуется такими основными параметрами, как частота, амплитуда и динамический диапазон.
Частота — это количество колебаний в секунду. Единица измерения — герц (Гц), одно колебание в секунду (1 кГц = 1 000 Гц).
Частота колебаний субъективно воспринимается человеком как высота звука. Самый низкий звук, который можно извлечь на фортепиано (нота «ля» субконтроктавы) имеет частоту 27,5 Гц. Самый высокий звук («до» пятой октавы) имеет частоту 4 кГц (4 000 Гц). Звук с частотой ниже 20 Гц называется инфразвуком, а выше 20 кГц — ультразвуком. Ухо человека способно воспринимать звуковые колебания в пределах от 20 Гц до 20 кГц, причем максимальная чувствительность находится в области 3 кГц.
Амплитуда — уровень сигнала, субъективно воспринимаемый человеком как его громкость; измеряется в логарифмических единицах — децибелах (дБ). Так, шелест листвы имеет «громкость» 15 дБ, компьютер шумит на уровне 35 дБ. Максимальная громкость, которую может воспринять ухо человека, — около 120 Дб, что соответствует реву двигателей при взлете реактивного самолета. Это значение принято считать болевым порогом.
Динамический диапазон — соотношение самого тихого и самого громкого звуков во фрагменте, измеренных в децибелах. Считается, что гитара имеет динамический диапазон 15 дБ, а симфонический оркестр — 75 дБ.
Компьютер оперирует данными в цифровом виде, поэтому для ввода в компьютер аналоговый звуковой сигнал нужно представить в цифровом виде. Для этого служит специальное устройство — звуковая плата (карта). Обычно звуковые карты содержат три независимых узла: канал записи-воспроизведения, канал синтезатора и микшер.
Канал записи-воспроизведения, или узел цифрового тракта, преобразует сигнал из аналоговой формы в цифровую — для этого служит аналого-цифровой преобразователь. Процессор звуковой карты осуществляет необходимые операции с оцифрованным сигналом и обмен цифровым потоком с центральным процессором или памятью компьютера. Обратное преобразование осуществляется цифроаналоговым преобразователем.
Кодек (Codec) (сокращение от «кодер — декодер») — программное или аппаратное устройство, отвечающее за обработку цифровых сигналов и преобразование их в аналоговые (например, звук или изображение).
Узел музыкального синтезатора, построенного по частотномодуляционному (FM) или таблично-волновому (TW) принципу, осуществляет запись и воспроизведение музыкальных композиций в MIDI-формате. Аналоговый микшер осуществляет смешивание сигналов с двух предыдущих узлов, а также с линейного и микрофонного входов карты. Все эти устройства функционально независимы и программируются отдельно друг от друга.
На АЦП поступает звуковой сигнал в виде непрерывно меняющегося электрического сигнала и подвергается в нем дискретизации и квантованию. Источником сигнала может быть микрофон, который преобразует звуковые волны в электрические сигналы, магнитофон или другое устройство.
На рис. 1.2 приведена осциллограмма сигнала с микрофона при произнесении слова «зима». Отчетливо видно, что слово состоит из двух слогов.
Рис. 1.2. Осциллограмма звукового сигнала В процессе дискретизации непрерывный аналоговый сигнал разбивается на последовательность его мгновенных значений — отсчетов, и эти точки соединяются прямыми линиями. В итоге получается ломаная кривая, аппроксимирующая исходный сигнал (рис. 1.3). Чем выше частота дискретизации, тем точнее аппроксимируется исходный сигнал, точнее передается его звучание, но тем выше требования к аппаратным компонентам звуковой карты (и самого ПК) и больше размер файла, хранящего эти данные.
Для хорошей звукопередачи частота дискретизации должна быть не меньше, чем удвоенная частота сигнала на входе АЦП. Поскольку ухо человека воспринимает частоты до 20 кГц, частота дискретизации звука должна быть не менее чем 40 кГц. Звуковые карты общего назначения обычно имеют диапазон дискретизации от 8 до 48 кГц.
Одновременно с дискретизацией сигнала в АЦП происходит его квантование, в результате чего цифровое значение каждого отсчета кодируется целым числом в диапазоне 0 … 255 (8-разрядная оцифровка) или 0 … 65 536 (16-разрядная оцифровка). С увеличением разрядности квантования размер конечного файла также возрастает, но зато улучшается передача звука и уменьшаются увеличивается.
В современных звуковых картах используется в основном 16- и 20-битное квантование.
Итак, аналого-цифровое преобразование звукового сигнала характеризуется двумя основными параметрами: частотой дискретизации и разрядностью квантования.
Рис. 1.3. Ломаная кривая, аппроксимирующая исходный сигнал Частота дискретизации — это количество отсчетов в секунду (т. е. сколько раз в секунду измеряется амплитуда сигнала). От нее зависит максимальная частота звука, которую может оцифровать АЦП. Измеряется частота дискретизации в килогерцах. Увеличение частоты дискретизации влечет за собой пропорциональное увеличение размера файла.
Разрядность квантования — это «точность», с которой измеряется амплитуда. Использование 8-разрядного квантования обеспечивает 28 = 256 уровней, а 16-разрядное квантование обеспечивает 216 = 65 536 уровней и влечет за собой двухкратное увеличение размера файла.
Таким образом, за качество оцифровки звука приходится «расплачиваться» размером звуковых файлов.
т а б л и ц а 1.1. Зависимость размера звукового файла от качества записи линия Из табл. 1.1 видно, что увеличение частоты дискретизации в два раза ведет к удвоению размера файла, использование стереозаписи (двухканальной) тоже увеличивает размер файла в два раза. Поэтому для разных сигналов используются различные параметры оцифровки. Так, для телефонной линии используется частота дискретизации 11 кГц, поскольку основной частотный диапазон речи не выходит за пределы 4 кГц. Возможности встроенных в телефонную трубку микрофона и динамика также не выходят за эти пределы. 16-разрядное квантование обеспечивает приемлемое качество записи речевого сигнала.
Подсчитаем размер файла, в котором будет записана 1 с сигнала с телефонной линии:
112 байт (16 бит) = 22 кбайт.
Эфирное качество звука радио- и телепередач обеспечивается частотой дискретизации 22 кГц и 16-разрядным квантованием. Файл, содержащий 1 с оцифрованного звука, будет иметь размер:
222 байт (16 бит) = 44 кбайт.
Высококачественная стереозапись на компакт-диске обеспечивается частотой дискретизации 44,1 кГц при 16-разрядном квантовании. Размер файла при этом будет составлять:
44,12 байт2 канала = 176,4 кбайт.
Таким образом, на стандартном компакт-диске объемом 700 Мбайт можно записать примерно 70 мин музыки очень хорошего качества.
В результате обработки аналогового сигнала АЦП формируется поток чисел, который записывается на соответствующий носитель информации (жесткий диск). При считывании звукового файла последовательность цифровых отсчетов поступает на цифроаналоговый преобразователь звуковой карты, где осуществляется обратное его преобразование в непрерывный звуковой сигнал, который после усиления поступает на акустические колонки. Они преобразуют электрический сигнал в акустический, который мы и воспринимаем как звук.
Все современные звуковые карты поддерживают запись и воспроизведение звука на частотах дискретизации до 44,1 кГц с 16-разрядным квантованием. Карты для профессиональной работы со звуком поддерживают частоты дискретизации 48 кГц и выше и 20-разрядное квантование.
В связи с развитием различных форм телекоммуникаций, прежде всего Интернета, встал вопрос о передаче сигнала по каналам связи в режиме on-line. Традиционная технология сводится к тому, что звуковой сигнал оцифровывается и записывается в виде файла на информационный носитель. Затем файл передается по каналам связи. После того как он целиком получен на приемном конце линии, он декодируется в обычный звуковой сигнал. Таким образом можно передать, например, звуковое письмо по электронной почте.
Однако осуществить «живую» радиотрансляцию по каналам Интернета таким образом невозможно. Недавно была предложена технология потоковой передачи аудио- и видеосигнала. Идея заключается в том, что сигнал после оцифровки сразу поступает в канал связи и начинает декодироваться получателем еще в процессе его передачи. Такая схема передачи сигнала дает огромные преимущества — получателю не надо ждать, пока сигнал будет сформирован в виде звукового файла и передан ему по каналу. Вопрос только в скорости передачи сигнала по каналу связи — она должна быть не меньше, чем частота дискретизации звукового сигнала.
Для оценки возможности передачи оцифрованного сигнала по каналу связи используется понятие битрейт — это количество информации, которое передается в единицу времени. Обычно битрейт измеряется в килобитах в секунду — [кбит/с] (часто используется англоязычная аббревиатура Kbps (Kilobit per second)). Эта единица, с одной стороны, показывает объем дискового пространства, которое займет запись 1 с звучания с соответствующими параметрами оцифровки, а с другой — определяет пропускную способность, или «ширину» канала связи. Так, если скорость подключения к Интернету по телефонному модему составляет 56 кбит/с, то по такому каналу можно передать звук с битрейтом не более чем 56 кбит/с.
Видео (от лат. video — смотрю, вижу) — множество технологий записи, обработки, передачи, хранения и воспроизведения визуального или аудиовизуального материала, а также распространенное название для собственно видеоматериала, телесигнала или кинофильма, в том числе записанного на физическом носителе (видеокассете, видеодиске и т. п.). Видео отличается от кинематографа только тем, что использует для записи и (или) воспроизведения любой другой носитель, кроме кинопленки. Все большее распространение цифровых технологий при киносъемке и цифровых кинопроекторов окончательно стирает грань между видео и кино.
Цифровое видео является самой ресурсоемкой областью использования персональных компьютеров, за исключением компьютерных игр. Связано это с необходимостью обработки больших объемов информации, представляющей собой видеоизображение, и высокими требованиями к скорости обработки потока данных. Однако быстрый прогресс в области вычислительной техники привел к тому, что обработка видеоинформации стала возможна на компьютерах бытового назначения — домашних и офисных ПК. Связано это с рядом факторов, прежде всего с переходом технологии видеозаписи на цифровой код. Это позволяет избежать самого трудного этапа цифровой обработки изображения — оцифровки аналогового сигнала. Все современные видеокамеры записывают изображение в цифровой форме, что позволяет напрямую вводить поток данных в компьютер.
В свою очередь, параметры современных ПК (прежде всего высокое быстродействие процессора, большой объем оперативной памяти, высокая производительность видеокарт и плат видеозахвата, огромная емкость винчестеров) позволяют быстро и эффективно обрабатывать видеосигнал с помощью специализированных программ видеомонтажа, а новые, разработанные недавно, алгоритмы эффективной компрессии видеоданных позволяют записывать конечный видеопродукт на компактные носители информации — цифровые диски (DVD).
В настоящее время цифровое видео активно используется в целом ряде областей (в том числе, выпуск полнометражных видеофильмов высокого качества с поддержкой многоканального звука на DVD).
Эти фильмы могут просматриваться как в домашних кинотеатрах, так и на компьютерах и видеоплеерах. Фрагменты видеозаписей активно используются в различных обучающих программах, мультимедийных презентациях и электронных изданиях информационного характера (виртуальные энциклопедии, справочники). Практически каждый крупный музей или художественная галерея имеет свой мультимедийный путеводитель.
Еще одна область использования цифрового видео — это любительское кино. С упрощением технологии видеозаписи, ее монтажа и воспроизведения и соответствующим повышением качества получаемых видеоматериалов количество кинолюбителей во всем мире стало резко увеличиваться.
Анимация отличается от видео только тем, что в видео используются реальные фотографии, а в анимации — рисованные картинки.
В этом отношении анимация ближе всего к мультфильмам. Разница заключается в том, что художнику-мультипликатору приходится рисовать 24 картинки, чтобы снять только 1 с мультфильма, а если мультфильм кукольный, то 24 раза изменять положение куклы. Только в этом случае при воспроизведении кинопленки будет получен эффект непрерывного движения.
Компьютерные технологии позволяют значительно упростить и облегчить этот процесс. При этом уже не надо создавать все 24 изоРис. 1.4. Пять ключевых изображений положения поршня двигателя внутреннего сгорания бражения, достаточно выбрать самые ключевые, а соответствующая программа сама рассчитает и построит все промежуточные изображения. В качестве примера приведем пять ключевых изображений положения поршня двигателя внутреннего сгорания. Этого вполне достаточно, чтобы получить эффект непрерывной работы двигателя (рис. 1.4).
Современные технологии создания мультфильмов также основаны на компьютерной анимации, все чаще встречается термин «анимационные фильмы». Простейшие эффекты анимации уже заложены в обычных офисных приложениях MS Office.
Современные компьютеры могут достаточно хорошо воспроизводить и аналоговую видеозапись, только для этого ее надо перевести в цифровую форму — оцифровать. Для эффективной работы с видеоданными служат видеокарты.
Источники видеосигнала могут быть разные: обычный телевизор или видеомагнитофон, бытовая или профессиональная цифровая видеокамера. После оцифровки видеосигнала обычно следует стадия редактирования, для чего служат специальные программы.
Пользователь имеет возможность делать монтаж видеофрагментов, регулировать их цветовые оттенки, яркость, насыщенность и контрастность, смешивать сигналы от различных источников и т. д.
Авторинг — окончательное оформление видеоролика (название, титры и т. д.).
Существует несколько форматов видеозаписи. Некоторые из них могут считываться с привода CD-ROM стандартным медиаплеером ОС Windows. Это большое преимущество, поскольку не требует специального аппаратного и программного обеспечения, однако качество изображения невысокое. Специальные форматы (DV — цифровое видео) обеспечивают очень высокое качество изображения и плотность записи, но требуют специального аппаратного (привод DVD, высокопроизводительная видеокарта) и программного обеспечения.
Кроме того, качественное воспроизведение таких дисков требует повышенных ресурсов компьютера, прежде всего тактовой частоты процессора и объема оперативной памяти. Тем не менее прогресс вычислительной техники идет так быстро, что уже сейчас кроме своих основных функций ПК может использоваться в качестве магнитофона, радиоприемника, телевизора, видеомагнитофона, факса, телефона и т. д. Причем его функциональные возможности по обработке сигналов неизмеримо выше, чем у традиционных устройств.
Характеристики видеосигнала. Количество (частота) кадров в секунду — это число неподвижных изображений, сменяющих друг друга при показе 1 с видеоматериала и создающих эффект движения объектов на экране. Чем больше частота кадров в секунду, тем более плавным и естественным будет казаться движение. Минимальный показатель, при котором движение будет восприниматься однородным, — примерно 10 кадров в секунду (это значение индивидуально для каждого человека). В традиционном пленочном кинематографе используется частота 24 кадра в секунду. Системы телевидения PAL и SЕCAM используют частоту 25 кадров в секунду (25 fps, или 25 Гц), а система NTSC использует частоту 30 кадров в секунду (точнее, 29, fps). Компьютерные оцифрованные видеоматериалы хорошего качества, как правило, используют частоту 30 кадров в секунду.
Верхняя пороговая частота мелькания, воспринимаемая человеческим мозгом, в среднем составляет 39 … 42 Гц и индивидуальна для каждого человека [13]. Некоторые современные профессиональные камеры могут снимать с частотой до 120 кадров в секунду. Специальные камеры для сверхбыстрой съемки снимают с частотой до 1 000 кадров в секунду и выше, что необходимо, например, для детального изучения траектории полета пули или структуры взрыва.
(В отличие от видеокамер существуют кинокамеры, снимающие с частотой миллионы кадров в секунду. В них кинопленка неподвижна и закреплена на внутренней поверхности барабана, изображение развертывается вращающейся призмой. Конечно, съемка ведется в течение очень короткого времени.) Чересстрочная развертка. Развертка видеоматериала может быть прогрессивной (построчной) или чересстрочной. При прогрессивной развертке все горизонтальные линии (строки) изображения отображаются поочередно, одна за другой. При чересстрочной развертке показываются попеременно то все четные, то все нечетные строки (вместе они образуют поле кадра, или полукадр). Чересстрочную развертку часто называют интерле й с (interlace) или интерлейсинг.
Чересстрочная развертка была изобретена для показа изображения на кинескопах. Ее цель — повысить частоту мельканий кинескопа (монитора) до уровня, незаметного человеческому глазу. Аналогично в кинопроекторах использовался двухлопастный обтюратор, повышающий частоту мельканий кинофильма с 24 до 48 Гц. Чересстрочная развертка используется и в настоящее время для передачи видео по «узким» каналам, не позволяющим передавать изображение в хорошем качестве. Системы PAL, SЕCAM (50 полей/с) и NTSC ( полей/с) — это системы с чересстрочной разверткой.
Новые цифровые стандарты телевидения, например HDTV, предусматривают прогрессивную развертку, хотя появились технологии, позволяющие имитировать прогрессивную развертку при показе материала с интерлейсом. Чересстрочную развертку обычно обозначают буквой i после указания вертикального разрешения (например: 720576i50). Жидкокристаллические, плазменные и кинескопные 100-герцовые телевизоры не мерцают, для них чересстрочная развертка теряет всякий смысл.
Для подавления отрицательных эффектов, возникающих при просмотре чересстрочного видео на построчном экране, применяются специальные математические методы, называемые деинтерлейсингом. Таким эффектом является, как правило, расщепление вертикальных границ горизонтально движущихся объектов (эффект «гребенки», или «расчески»).
Разрешение. По аналогии с разрешением компьютерных мониторов любой видеосигнал также имеет разрешение (resolution), горизонтальное и вертикальное, измеряемое в пикселах. Обычное аналоговое телевизионное разрешение составляет 720576 пикселов для стандартов PAL и SЕCAM при частоте кадров 50 Гц (одно поле, 225); 720480 пикселов для NTSC при частоте 60 Гц (одно поле, 229,97). В выражении 720480 первым числом обозначается количество точек в горизонтальной линии (горизонтальное разрешение), а вторым числом — количество самих линий (вертикальное разрешение). Новый стандарт цифрового телевидения HDTV высокого разрешения (high-definition) предполагает разрешения до 1 пикселов при частоте обновления 60 Гц с прогрессивной разверткой, т. е. 1 920 пикселов на линию, 1080 линий.
Разрешение в случае трехмерного видео измеряется в вокселях — элементах изображения, представляющих точки (кубики) в трехмерном пространстве. Например, для простого трехмерного видео сейчас используется в основном разрешение 512512512, демонстрационные примеры такого видео доступны в настоящее время даже на PDA.
Соотношение сторон экрана. Соотношение ширины и высоты кадра (aspect ratio) — важнейший параметр в любом видеоматериале. Еще с 1910 г. кинофильмы имели соотношение сторон экрана 4: (4 единицы в ширину к 3 единицам в высоту; иногда это записывается как 1,33:1, или 1,33). Считалось, что с учетом наличия у человека двух глаз зрителю удобнее смотреть фильм на таком экране. Когда появилось телевидение, то оно переняло это соотношение и почти все аналоговые телесистемы (следовательно, и телевизоры) имели соотношение сторон экрана 4:3.
Компьютерные мониторы также унаследовали телевизионный стандарт сторон, хотя еще в 1950-х гг. это представление о соотношении 4:3 в корне изменилось. Дело в том, что поле зрения человека имеет соотношение не 4:3. Ведь у человека два глаза, расположенных на одной горизонтальной линии, следовательно, поле зрения человека приближается к соотношению 2:1. Чтобы приблизить форму кадра к естественному полю зрения человека (и, следовательно, усилить восприятие фильма), был введен стандарт 16:9 (1,78), почти соответствующий «золотому сечению». Цифровое телевидение в основном тоже ориентируется на соотношение 16:9.
К концу XX в., после ряда дополнительных исследований в этой области, стали появляться и более радикальные соотношения сторон кадра: 1,85, 2,20, вплоть до 2,35 (почти 21:9). Все это, по словам создателей, призвано глубже погрузить зрителя в атмосферу просматриваемого видеоматериала. Есть и альтернативные объяснения переходу на широкий формат: возможность проката в залах, изначально не приспособленных для кино, стремление к ухудшению качества пиратских видеокопий и телевизионных копий.
Количество цветов и цветовое разрешение видеосигнала описывается цветовыми моделями. Для стандарта PAL применяется цветовая модель YUV, для SЕCAM — модель YDbDr, для NTSC — модель YIQ, в компьютерной технике применяется в основном RGB (и RGB), реже HSV, а в печатной технике — CMYK. Количество цветов, которое может отобразить монитор или проектор, зависит от качества монитора или проектора. Человеческий глаз может воспринять по разным подсчетам от 5 до 10 млн оттенков цветов.
Количество цветов в видеоматериале определяется числом бит, отведенным для кодирования цвета каждого пиксела (bits per pixel, bpp). 1 бит позволяет закодировать два цвета (обычно черный и белый), 2 бит — 4 цвета, 3 бит — 8 цветов, …, 8 бит — 256 цветов (28 = = 256), 16 бит — 65 536 цветов (216), 24 бит — 16 777 216 цветов (224).
В компьютерной технике имеется также стандарт 32 бит на пиксел (RGB), но этот дополнительный -байт (8 бит) используется для кодирования коэффициента прозрачности пиксела (), а не для передачи цвета (RGB). При обработке пиксела видеоадаптером RGBзначение будет изменено в зависимости от значения -байта и цвета подлежащего пиксела (который станет «виден» через «прозрачный» пиксел), а затем -байт будет отброшен и на монитор пойдет только цветовой сигнал RGB.
Ширина (скорость) видеопотока, или битрейт (bit rate), — это количество обрабатываемых бит видеоинформации за 1 с (единица измерения — [бит/с] или [Мбит/с]; в английском обозначении — [bit/s] и [Mbit/s] соответственно). Чем выше ширина видеопотока, тем лучше качество видео. Например, для формата VideoCD ширина видеопотока составляет всего примерно 1 Мбит/с, а для DVD — около 5 Мбит/с. Конечно, субъективно разницу в качестве нельзя оценить как пятикратную, но объективно это так.
Формат цифрового телевидения HDTV использует ширину видеопотока около 10 Мбит/с. При помощи скорости видеопотока также очень удобно оценивать качество видео при его передаче через Интернет.
Различают два вида управления шириной потока в видеокодеке:
постоянный битрейт (constant bit rate — CBR) и переменный битрейт (variable bit rate — VBR). Концепция VBR, очень популярная в настоящее время, призвана максимально сохранять качество видео, уменьшая при этом суммарный объем передаваемого видеопотока.
При этом при быстрых сценах движения ширина видеопотока увеличивается, а при медленных сценах, где картинка меняется медленно, ширина потока уменьшается. Это очень удобно для буферизованных видеотрансляций и передачи сохраненного видеоматериала по компьютерным сетям. Но для безбуферных систем реального времени и для прямого эфира (например, для телеконференций) это не подходит — в этих случаях необходимо использовать постоянную скорость видеопотока.
Качество видео измеряется с помощью формальных метрик, таких как PSNR или SSIM, или с использованием субъективного сравнения с привлечением экспертов.
Субъективное качество видео измеряется по следующей методике:
1) выбираются видеопоследовательности для использования в тесте;
2) выбираются параметры системы измерения;
3) выбирается метод показа видео и подсчета результатов измерения;
4) приглашается необходимое число экспертов (обычно не меньше 15);
5) проводится сам тест;
6) подсчитывается средняя оценка на основе оценок экспертов.
Несколько методов субъективной оценки описаны в рекомендациях ITU-T BT.500. Один из широко используемых методов оценки — это DSIS (Double Stimulus Impairment Scale), при котором экспертам сначала показывают исходный видеоматериал, а затем обработанный. После этого эксперты оценивают качество обработки, варьируя свои оценки от «обработка незаметна» и «обработка улучшает видеоизображение» до «обработанный видеоматериал сильно раздра- жает».