Журнал 4PDA. Февраль-Март 2006
Шрифт:
Стандарт MPEG-4 разделён на множество разных подстандартов, из которых к видео относятся:
ISO 14496-2. Продвинутый Простой Профайл (Advanced Simple Profile – ASP). На данное время доступны следующие ASP кодеки: XviD, DivX, DivX4/OpenDivX, ffmpeg/ffvfw/ffdshow, 3ivx, Nero Digital, Skal, Quicktime, mpegable, Envivio, Sorenson и многие другие.
ISO 14496-10. Продвинутое Кодирование Видео (Advanced Video Coding – AVC), так же известное как H.264. В настоящее время наиболее доступны следующие реализации AVC/H.264: x264, MainConcept, Ateme, ffdshow и Nero (тот же Ateme).
Кодеки AVC обеспечивают лучшее сжатие и качество
На первую часть вопроса мы частично ответили в начале статьи. Допустим, мы сохраняем видео без сжатия с размером кадра 352х288 пикселей и цветностью 24 бит на пиксель. Для сохранения минуты видео потребуется примерно 435 Мбайт. В этом и есть основная проблема цифрового видео – неимоверные размеры файлов.
Для борьбы с таким аппетитом существует два основных способа: уменьшение основных параметров видеоряда (размер кадра, кодировка цвета и частота кадров) и сжатие.
Сжатие разделяют на два типа: «без потери качества» и «с потерей качества». Разница между этими типами понятна из их названия. Максимальная степень сжатия, достигаемая с помощью алгоритмов «без потерь», не превышает 3 к 1, поэтому они не очень помогут в решении нашей задачи. В то время, как алгоритмы, работающие с потерей качества, могут сжимать вплоть до 100 к 1 по отношению к несжатому потоку.
Каким же образом методы сжатия видео достигают столь впечатляющих результатов? Как известно, пороговая частота дискретного восприятия человеком сменяющих друг друга графических образов – 25 кадров/сек. В силу этого обстоятельства, наличие в выходном потоке большего числа кадров не оправдано. Более того, смежные кадры содержат одни и те же объекты сцены. Следовательно, хранение каждого из кадров можно заменить хранением изменений, произошедших со времени показа предыдущего кадра. Таким образом, весь фильм можно представить в виде последовательности ключевых кадров, сохраненных с небольшим коэффициентом сжатия и промежуточных (зависимых) кадров, ссылающихся на предыдущие ключевые или зависимые кадры. Зависимые кадры минимальны по размеру и содержат только изменения, которые претерпела сцена. При этом, алгоритм выясняет то, что глаз может не заметить, и выбрасывает это, а затем вычисляет лучший способ для сохранения оставшегося. Вот за счет этого и достигается впечатляющая экономия дискового пространства.
А к каким проблемам приводит сжатие видео? Оно приводит к, так называемым, артефактам. Артефакты – это видимые нарушения качества видео, возникающие в процессе сжатия с потерями. Искажения, получаемые при сжатии, варьируются от алгоритма к алгоритму. Наиболее часто встречающийся артефакт сжатия – разбиение картинки на квадратные блоки. Также часто наблюдаются: «мусор» рядом с контрастными границами и движущимися объектами, «волнующиеся» и «расплывшиеся» цвета или «замыливание» картинки.
Здесь ключевым моментом является количество бит, выделяемых для хранения цвета одного пикселя. В этой связи появляется термин «битрейт». Битрейт – это размер видеопоследовательности в битах, отнесенный к его длительности в секундах.
Итак, из всего вышесказанного можно сделать вывод, что основные параметры, на которые мы можем повлиять – это битрейт и размер картинки. Частоту кадров не стоит трогать, так как это может привести к рывкообразному воспроизведению видеоряда и проблемам синхронизации со звуковой дорожкой.
Но, это еще не все рычаги управления. Повлиять на качество можно, выбирая режимы сжатия. Существует четыре режима: однопроходный с постоянным битрейтом, однопроходный с переменным битрейтом, однопроходный с постоянным качеством и двухпроходный. Рассмотрим подробнее принципы работы каждого из режимов.
Однопроходный режим с постоянным битрейтом
Этот режим – самый простой: каждый кадр имеет одинаковый размер, а результирующий поток видеоданных имеет постоянный битрейт. Алгоритм этого режима весьма прост и, соответственно, нересурсоемок. Однако, результаты, полученные в таком режиме, существенно уступают результатам в других однопроходных режимах. В современных кодеках практически не используется.
Однопроходный режим с переменным битрейтом
Он реализует простейшую схему: если кадр простой для сжатия, то используется лишь часть выделенных для нее битов. Остальные биты «откладываются» в своего рода копилку – резервуар. Благодаря этому на сложных сценах мы можем использовать больше бит для сжатия кадра, заимствуя часть битов из резервуара. Данная схема проста и эффективна, потому она дает лучшее качество изображения, чем в режиме с постоянным битрейтом. Но, реальный битрейт получится на усмотрение кодека, поэтому точно контролировать размер фала не получится.
Однопроходный с постоянным качеством
Название этого режима – «с постоянным качеством», – не совсем корректно. В процессе сжатия остается постоянным так называемый quantizer – численная характеристика степени сжатия кадра. Quantizer задаёт коэффициент потерь в качестве видео. При выставлении его в постоянное значение, качество видео будет одинаково на протяжении всего фильма, не зависимо от количества движения. Уменьшение значения «квантизатора» ведёт к улучшению качества картинки. А, чем этот показатель выше, тем больше сжатие, тем ниже качество, тем более заметны квадраты (артефакты). Основной недостаток этого режима – мы не можем узнать заранее (до сжатия), какой размер будет иметь файл в результате.
Двухпроходный режим
Как можно догадаться из названия, сжатие видео в этом режиме проводится в два прохода и, соответственно, занимает примерно вдвое больше времени. Во время первого прохода собирается статистика о сжимаемости видео материала. Во втором проходе эта статистика используется для перераспределения битов, причем биты могут перераспределяться не только в пределах некоторого небольшого промежутка времени, как было в случае однопроходного режима и схемой с резервуаром битов, а на протяжении всего материала. Поэтому, именно двухпроходный режим обеспечивает максимальное качество видео при заданном битрейте. При этом можно очень точно посчитать, какой размер будет иметь конечный файл.