Перевод

H.264 - стандарт сжатия видео. И он вездесущ, его используют для сжатия видео в интернете, на Blu-ray, телефонах, камерах наблюдения, дронах, везде. Все сейчас используют H.264.

Нельзя не отметить технологичность H.264. Он появился в результате 30-ти с лишним лет работы с одной единственной целью: уменьшение необходимой пропускной способности канала для передачи качественного видео.

С технической точки зрения это очень интересно. В статье будут поверхностно описаны подробности работы некоторых механизмов сжатия, я постараюсь не наскучить с деталями. К тому же, стоит отметить, что большинство изложенных ниже технологий справедливы для сжатия видео в целом, а не только для H.264.

Зачем вообще сжимать что-либо?

Видео в несжатом виде это последовательность двумерных массивов, содержащих информацию о пикселях каждого кадра. Таким образом это трёхмерный (2 пространственных измерения и 1 временной) массив байтов. Каждый пиксель кодируется тремя байтами - один для каждого из трёх основных цветов (красный, зелёный и синий).

1080p @ 60 Hz = 1920x1080x60x3 => ~370 Мб/с данных.

Этим практически невозможно было бы пользоваться. Blu-ray диск на 50Гб мог бы вмещать всего около 2 мин. видео. С копированием так же будет не легко. Даже у SSD возникнут проблемы с записью из памяти на диск.

Поэтому да, сжатие необходимо.

Обязательно отвечу на этот вопрос. Но сперва я покажу кое-что. Взгляните на главную страницу Apple:

Я сохранил изображение и приведу в пример 2 файла:

Это впечатляет, какие еще приёмы существуют?

Цветовая обработка

Человеческий глаз не особо хорошо различает близкие оттенки цвета. Можно легко распознавать наименьшие различия в яркости, но не цвета. Поэтому должен существовать способ избавления от лишней информации о цвете и сэкономить ещё больше места.

В телевизорах, цвета RGB преобразуются в YCbCr, где Y это компонента яркости (по сути яркость черно-белого изображения), а Cb и Cr компоненты цвета. RGB и YCbCr эквиваленты в плане информационной энтропии.

Зачем же тогда усложнять? RGB разве не достаточно?

Во времена чёрно-белых телевизоров, была только компонента Y. А с началом появления цветных телевизоров у инженеров встала задача о передаче цветного RGB изображения вместе с чёрно-белым. Поэтому вместо двух каналов для передачи, было решено кодировать цвет в компоненты Cb и Cr и передавать их вместе с Y, а цветные телевизоры уже сами будут преобразовывать компоненты цвета и яркости в привычный им RGB.

Но вот в чём хитрость: компонента яркости кодируется в полном разрешении, а компоненты цвета лишь в четверть. И этим можно пренебречь, т.к. глаз/мозг плохо различает оттенки. Таким образом можно уменьшить размер изображения в половину и с минимальными отличиями. В 2 раза! Машина будет весить 10 кг!

Данная технология кодирования изображения со снижением цветового разрешения называется цветовой субдискретизацией . Она используется повсеместно уже давно и относится не только к H.264.

Это самые значительные технологии в уменьшении размера при сжатии с потерями. Нам удалось избавиться от большинства детализации и сократить информацию о цвете в 2 раза.

А можно ещё больше?

Да. Обрезание картинки это лишь первый шаг. До этого момента мы разбирали отдельно взятый кадр. Пришло время взглянуть на сжатии во времени, где нам предстоит работать с группой кадров.

Компенсация движения

H.264 стандарт, который позволяет компенсировать движения.

Компенсация движения? Что это?

Представьте, что вы смотрите теннисный матч. Камера зафиксирована и снимает с определенного угла и единственное что движется это мячик. Как бы вы закодировали это? Вы бы сделали что и обычно, да? Трёхмерный массив пикселей, две координаты в пространстве и один кадр за раз, так?

Но зачем? Большая часть изображения одинакова. Поле, сетка, зрители не меняются, единственное что движется это мячик. Что если определить единственное изображение фона и одно изображение мячика, движущегося по нему. Не сэкономило бы это значительно места? Вы видите к чему я клоню, не так ли? Компенсация движения?

И это именно то, что H.264 делает. H.264 разбивает изображение на макроблоки, обычно 16х16, которые используются для расчёта движения. Один кадр остаётся статичным, обычно его называют I-кадр , и содержит всё. Последующие кадры могут быть либо P-кадры , либо B-кадры . В P-кадрах вектор движения кодируется для каждого макроблока на основе предыдущих кадров, таким образом декодер должен использовать предыдущие кадры, взяв последний из I-кадров видео и постепенно добавляя изменения последующих кадров пока не дойдёт до текущего.

Ещё интереснее обстоят дела с B-кадрами, в которых расчёт производится в обоих направлениях, на основании кадров идущих до и после них. Теперь вы понимаете почему видео в начале статьи весит так мало, это всего лишь 3 I-кадра, в которых мечутся макроблоки.

При такой технологии кодируется только различия векторов движения, тем самым обеспечивая высокую степень сжатия любого видео с перемещениями.

Мы рассмотрели статическое и временное сжатия. С помощью квантования мы во много раз уменьшили размер данных, затем с помощью цветовой субдискретизации ещё вдвое сократили полученное, а теперь еще компенсацией движения добились хранения лишь 3х кадров из 300, которые были первоначально в рассматриваемом видео.

Выглядит впечатляюще. Теперь что?

Теперь мы подведём черту, используя традиционное энтропийное кодирование без потерь. Почему нет?

Энтропийное кодирование

После этапов сжатия с потерями, I-кадры содержат избыточные данные. В векторах движения каждого из макроблоков в P-кадрах и B-кадрах много одинаковой информации, так как зачастую они двигаются идентично, как это можно наблюдать в начальном видео.

От такой избыточности можно избавиться энтропийным кодированием. И можно не переживать за сами данные, так как это стандартная технология сжатия без потерь, а значит всё можно восстановить.

Вот теперь всё! В основе H.264 лежат вышеупомянутые технологии. В этом и заключаются приёмы стандарта.

Отлично! Но меня разбирает любопытство узнать, сколько же весит теперь наша машина.

Исходное видео было снято в нестандартном разрешении 1232x1154. Если посчитать, то получится:

5 сек. @ 60 fps = 1232x1154x60x3x5 => 1.2 Гб
Сжатое видео => 175 Кб

Если соотнести результат с оговорённой массой машины в одну тонну, то получится вес равный 0.14 кг. 140 граммов!

Да, это магия!

Конечно же я в очень упрощённом виде изложил результат десятилетних исследований в этой сфере. Если захотите узнать больше, то

Сегодня камеры наблюдения можно увидеть практически на каждом шагу. Возможно, вы также планируете установить одну или несколько камер у себя дома. Такие устройства работают с видеофайлами форматов.264 или H.264. Но как посмотреть видео и чем открыть файл рассмотрим в статье.

Различия и сходства форматов 264 и H.264

Формат.264 – это необработанные элементарные потоки видеофайлов H.264-ES (еще называют временным видео-файлом MPEG-4). В свою очередь H.264-ES является частью спецификации формата H.264. Старые модели видеорегистраторов записывают видео в формате.264. Такие видеофайлы не могут использоваться для прямого просмотра обычными проигрывателями и требуют обработки специальными программами.

Позволяет уменьшить видеозапись до минимального размера. После того, как видеозаписи проходят полное сжатие, качество видео и аудио по-прежнему остается на высоком уровне. С этим форматом работают камеры видеонаблюдения и видеорегистраторы нового образца. Файлы H.264 еще называются MPEG-4 Part 10 AVC/H.264. Несмотря на длинное и страшное название в сети очень легко найти проигрыватель файлов H.264.

Для открытия таких файлов необходимо воспользоваться одним из нижеперечисленных способов:

использовать специальные программы и утилиты;
выполнить конвертацию видеофайлов.

Открытие видео H.264

Практически все популярные программы и конвертеры работают с форматом H.264, Популярными являются:

Работа с форматом.264

Давайте рассмотрим более подробно, чем открыть файл.264 с видеорегистратора или камеры наблюдения.

Специальные программы

Для открытия видео.264 станут полезными следующие программы:

Видеофайлы.264 можно объединить или разъединить. Как это сделать мы рассмотрим дальше.

Утилиты

Чтобы воспроизвести файл.264, необходимо поместить его в контейнерный формат, который сможет распознать любой медиа-проигрыватель. Для этой цели рекомендуем воспользоваться одной из следующих утилит:

Demuxer – умеет создавать записи dsm или mpc. Стоит отметить, что файлы dsm можно воспроизвести только в этой утилите.
MKVcleaver – с ее помощью вы сможете вырезать видео в.MKV.
Mkvmerge – способна изменить, вырезать, объединить или разъединить видеофайлы. После обработки видео качество видео не ухудшается, а формат меняется на.MKV.
Haali Muxer – может помочь в преобразовании, объединении или разъединить видеофайлов. После обработки видео ему присваивается формат.MKV.

16.12.2015

Алгоритм сжатия H.264+ – инновационная разработка компании Hikvision. По своей сути H.264+ представляет собой кодек H.264/AVC, модифицированный под задачи видеонаблюдения и с учетом его специфики, чтобы повысить степень сжатия без ущерба для качества видео.

Специфика видеонаблюдения заключается в следующем:

фон стабилен и практически не изменяется;

движущиеся объекты появляются редко и могут отсутствовать в течение продолжительного времени;

интерес представляют только движущиеся объекты;

наблюдение ведется круглосуточно, а шумы заметно влияют на качество изображения.

H.264+ повышает степень сжатия за счет 3 ключевых факторов:

кодирование с предсказанием на основе модели фона,

фоновое шумоподавление,

долгосрочное управление видеопотоком.

Кодирование с предсказанием

Все современные алгоритмы сжатия, такие как MPEG2, MPEG4, H.264/AVC и самый современный алгоритм HEVC, сочетают внутрикадровое и межкадровое сжатие. I-кадры (опорные кадры) кодируются независимо от других кадров, то есть используется внутрикадровое сжатие, тогда как для кодирования P-кадров (предсказанные кадры) используются I-кадры и другие P-кадры (межкадровое сжатие). В случае межкадрового сжатия эффективность будет сильно зависеть от выбора опорного кадра.

В области видеонаблюдения фон, как правило, стабилен. Его можно извлечь и использовать в качестве опорного кадра.

Рис. 1. Модель фона

На Рис. 1 показана последовательность из 3 кадров, где кадры T0 и T1 уже подверглись обработке кодеком. Здесь можно взять фон в качестве опорного кадра и сжать кадр T2 на основе с учетом сходства и разницы между кадром T1 и фоном. Кадр T0 будет хорошим выбором в качестве фонового изображения.

Для примера возьмем Рис. 2, на котором автомобиль перемещается из области B в A (из кадра T1 в кадр T2). При кодировании кадра T2 область B становится вновь открывшимся участком.

Рис. 2. Объект перемещается из B в A

Если в качестве опорного кадра выбран T1, то никакой оптимизации не получится для области B и информацию о ней придется передавать заново. Поскольку кодируется именно разница между новым и опорным кадром.

Рис.3. Традиционная схема кодирования с опорным кадром

Но если мы возьмем в качестве опорного кадра T0, в большинстве случаев мы получим оптимизированный блок для области B. Тем не менее, если мы сохраним информацию о фоне и возьмем в качестве опорного кадра T1, мы найдем идеальные блоки для кодирования кадра T2, что гарантирует высокое качество изображения и уменьшенный размер видеопотока.

Рис. 4. Схема кодирования с фоном в качестве опорного кадра

Если брать фон в качестве опорного кадра, то можно не только повысить эффективность сжатия неподвижных объектов, но и уменьшить поток данных, который приходится на опорные кадры.

Опорные кадры обновляются каждые несколько секунд при кодировании видеопотока для задач видеонаблюдения. В результате на опорные кадры приходится значительная часть данных в видеопотоке, что особенно заметно в тех случаях, когда в кадре много мелких деталей и мало движения. Иногда на опорные кадры приходится до 50% данных видеопотока. Более того, при стабильном фоне эти данные носят повторяющийся характер.

Для того чтобы уменьшить удельный вес этих повторов в видеопотоке, в кодеке H.264+ используется метод работы с опорными кадрами на основе модели фона, показанный на Рис. 5.

Рис. 5. Работа с опорными кадрами на основе модели фона в H.264+

На Рис. 5. красным цветом показаны опорные кадры фона, в которых используется внутрикадровое сжатие. Синим цветом здесь отмечены кадры обновления, в которых применяется внутрикадровое сжатие для участков с движущимися объектами, обведенными красной рамкой на Рис. 6., и межкадровое сжатие – для неподвижных объектов. Белым цветом показаны обычные кадры с межкадровым сжатием.

Интеллектуальный алгоритм выбирает опорный кадр среди тех кадров, где меньше всего движущихся объектов. Опорные кадры, которые используют модель фона, содержат примерно такой же объем данных, что и обычные опорные кадры в традиционной схеме кодирования, но интервал между ними заметно больше. Кроме того, объем данных, который содержится в кадрах обновления, значительно меньше, чем в опорных кадрах при традиционной схеме кодирования, а интервал между кадрами обновления такой же, то есть фактически кадры обновления заменяют собой опорные.

Рис. 6. Кодирование кадров обновления в H.264+

Шумоподавление

Принимая во внимание тот факт, что фон в видеонаблюдении достаточно стабилен, с помощью интеллектуальных алгоритмов можно отделить его от движущихся объектов. Обычно для сохранения качества движущиеся объекты кодируются вместе с фоновым шумом. Тем не менее, интеллектуальные алгоритмы позволяют применить различные стратегии кодирования для фона и для движущихся объектов.

Участки фона кодируются с более высокой степень сжатия, чтобы уменьшить размер видеопотока, а это также частично подавляет шум. В то же время движущиеся объекты кодируются с меньшей степенью сжатия.

Рис.7. Шумоподавление в H.264+

Долгосрочное управление видеопотоком

При эффективном подавлении шума на фоне размер видеопотока зависит от ого, какая часть изображения приходится на этот фон. Например, для уличного наблюдения на фон придется довольно малая часть изображения, так как в дневное время одновременно движется большое количество пешеходов и машин. В этом случае размер видеопотока заметно возрастает. И наоборот, в ночное время, когда мало машин и пешеходов, площадь фона на изображении возрастает, а размер видеопотока, соответственно, уменьшается.

Рис. 8. Колебания видеопотока в зависимости от времени суток

Управление размером видеопотока для перераспределения его в зависимости от времени суток не только сохраняет высокое качество изображения движущихся объектов, но также позволяет уменьшить размер видеоархива.

Для более полной реализации такой экономии Hikvision предлагает новую концепцию управления видеопотоком, которая подразумевает долгосрочное отслеживание его флуктаций, как правило в течение 24 часов. В дальнейшем H.264+ автоматически подстраивает размер видеопотока в зависимости от времени суток, изменяя степень сжатия, но среднесуточный размер видеопотока остается неизменным в пределах выбранного значения.

Рис. 9. Долгосрочное управление видеопотоком с его перераспределением

На Рис. 9 видно, что в период времени C (активность возрастает и требуется больший размер видеопотока для получения качественного изображения) выделяется дополнительная квота за счет периодов времени A и B (активность низка и размер видеопотока снижается).

Уменьшение размера видеопотока

Для включения сжатия H.264+, необходимо чтобы размер видеопотока был переменным, при этом включается долгосрочное управление видеопотоком. Средний размер видеопотока вычисляется автоматически на основе пиковых значений. В большинстве случаев автоматически определенное значение среднего размера видеопотока не требует дополнительной подстройки. Тем не менее, иногда это может потребоваться, например, если в кадре слишком много или слишком мало движения. На Рис. 10 приведены примеры ситуаций, когда кодек Hikvision H.264+ может существенно уменьшить размер видеопотока. Эта экономия будет зависеть от размера фона и количества движения в кадре.

Внутри помещений
	Активность	Экономия видеопотока

На улице
	Активность	Экономия видеопотока

В темное время суток
	Активность	Экономия видеопотока

Рис. 10. Экономия видеопотока в зависимости от наблюдаемой сцены

Применение

Кодек H.264+ применяется в IP-видеокамерах высокого разрешения. При сохранении качества, сопоставимого с кодеком H.264/AVC, размер видеопотока у H.264+ уменьшается. Например, при малой активности в кадре такая экономия может достигать 75%, а при наличии большого количества движущихся объектов экономия составит 50%. Впрочем, если в кадре присутствует постоянное движение, размер видеопотока у H.264+ и H.264/AVC будет сопоставимым.

Более того, пиковые значения размера видеопотока у H.264+ будут превышать среднее выбранное значение, чтобы сохранить высокое качество изображения у движущихся объектов. Чем больше таких объектов, тем больше размер видеопотока H.264+, но он никогда не превысит аналогичного значения у H.264/AVC.

Кодек H.264+ соответствует стандарту H.264/AVC и совместим практически со всем программным и аппаратным обеспечением, которое поддерживает этот стандарт. В некоторых случаях может потребоваться лишь незначительная подстройка, чтобы улучшить воспроизведение.

Оценить возможности кодека H.264+ в сравнении с H.264/AVC и его эффективность в различных условиях вы можете, посмотрев следующий видеоролик, который подготовила для вас компания Hikvision.

Сегодня у телекомпаний есть свобода выбора в вопросах касательно сжатия телесигнала. Форматы MPEG‑2, H.264 и JPEG 2000 являются наиболее конкурентными вариантами для выполнения сжатия видеопотока на профессиональном уровне. В конечном итоге, инфраструктура сети, полоса пропускания и бюджет являются решающими факторами для телекомпании, которые помогают определиться с «правильным» выбором. Форматы MPEG‑2 и H.264 являются эффективными решениями сжатия мультимедийных приложений с целью их последующего воспроизведения.

Веские аргументы можно привести в пользу формата JPEG 2000, который основан на передовых внутрикадровых методах кодирования и обеспечивает высокую степень гибкости и управляемости, не сравнимую с гибкостью и управляемостью других форматов сжатия. Более того, факт появления все больших и больших разновидностей передаваемых видеоприложений, которые требуют более низкого времени задержки и более высокого качества изображения, делает формат JPEG 2000 оптимальным решением в удовлетворении требований передачи видео в HD-качестве.
Главной задачей всех телекомпаний - независимо от инфраструктуры сети, выбранного метода сжатия и особенностей транслируемых приложений - является передача сигнала максимального качества при заданной полосе пропускания, ограничив при этом расходы с целью получения максимальной прибыли. Имейте в виду, что передача видеопотока представляет собой комплексную цепь процессов. Какой-либо процесс, происходящий внутри цепи, влияет на процесс передачи видео в целом, в результате серьезная недоработка внутри цепи затрагивает все последующие звенья и приводит к ухудшению качества передачи видео в целом. Конечно, то, как выбранный формат сжатия реализовывается, и как осуществляется управление им, также играет крайне важную роль в достижении наилучшей производительности независимо от выбранной схемы сжатия.

MPEG‑2: «устаревший» кодек

Алгоритмы сжатия видео, такие как MPEG‑2 и H.264 являются кодеками, которые основаны на дискретном косинусном преобразовании (ДКП). С целью сокращения объема данных видеосигнала между сериями кадров эти кодеки используют алгоритм межкадрового предсказания. Суть данного алгоритма заключается в методе дифференцированного кодирования, когда последующий кадр сравнивается с исходным, после чего выполняется кодирование только тех пикселей, которые изменились.
В результате количество пикселей, которые необходимо кодировать и передавать, уменьшается. Когда такая кодированная последовательность передается на экран ТВ, полученное видео ничем не отличается от исходной последовательности кадров.
Появление MPEG‑2 было обусловлено необходимостью трансляции сигналов с более высокой скоростью передачи данных - сигналов SD-формата (величина битрейта от 3 Мб/с до 15 Мб/с) и HD-формата (величина битрейта от 15 Мб/с до 30 Мб/с). При передаче видеоизображения с использованием метода предикативного сжатия MPEG‑2 каждый закодированный кадр в последовательности изображений может передаваться как независимо сжатый кадр («I-кадр»), сжатый кадр с использованием предсказания движения в одном направлении («P-кадр») и сжатый кадр с использованием предсказания движения в двух направлениях («B-кадр»). Благодаря сокращению пространственной и временной избыточности MPEG‑2 обеспечивает повышенное сжатие. Тем не менее использование «B-кадров» приводит к появлению задержки предупорядочивания, которая зависит от количества передаваемых «B-кадров». При большом количестве передаваемых «B-кадров» эта задержка может быть очень значительной.
MPEG‑2 до сих пор является широко распространенным кодеком и рассматривается как конкурентоспособный выбор благодаря его низкой стоимости внедрения и поддержке широкого диапазона цветопередачи – 4:2:2. Тем не менее существует ряд ограничений, которые обусловлены как самим кодеком, так и стандартами, которые регулируют его реализацию.
Например, MPEG‑2 по сравнению с конкурирующими кодеками требует, как правило, более высокой пропускной способности для обеспечения достаточно высокого качества видео. Вследствие потоковой битовой структуры сигнала и его формы передачи в виде отдельных пакетов закодированный сигнал в MPEG‑2 крайне чувствителен к ошибкам и любым потерям информации. Потеря или повреждение одного из пакетов оказывает существенное влияние на процесс декодирования, что приводит к «битым» кадрам или выраженным искажениям изображения, а это в конечном итоге приведет к прекращению использования MPEG‑2 в среде профессионального телевещания.

H.264: кодек следующего поколения

H.264 или MPEG-4 Part 10 (Advanced Video Coding) кодек был разработан в качестве альтернативы кодеку MPEG‑2 и характеризуется повышенной производительностью и более широким набором инструментов, что обеспечивает высокую гибкость в отношении передачи информации. В результате H.264, по сравнению с MPEG‑2, обеспечивает эквивалентное качество видео при более низкой скорости передачи данных. При переходе на кодирование H.264, по сравнению с MPEG‑2, пропускная способность, достаточная для передачи изображения аналогичного качества, может быть снижена на величину до 50 процентов. В этом кодеке используется ассиметричная архитектура. Сложность вычислений в нем минимизирована, что обуславливает его высокую гибкость, достаточную для применения этого кодека для широкого спектра приложений, включая трансляцию, хранение и передачу данных по беспроводной мультимедийной связи.
Алгоритм сжатия H.264 схож с алгоритмом MPEG‑2 и основан на тех же основных принципах, включая компенсацию движения с переменным размером блоков и дискретное косинусное преобразование. Более того, H.264 характеризуется высокой производительностью и надежностью. Он выполняет как пространственное предсказание при внутрикадровом кодировании, так и оценку движения при межкадровом кодировании, что улучшает эффективность сжатия. При внутрикадровом кодировании каждый кадр кодируется сам по себе, без использования информации соседних кадров. Кроме того, H.264 использует предварительную обработку этапов, используя для этого соседние пиксели из ранее закодированных блоков, что является преимуществом по сравнению с внутрикадровой пространственной корреляцией.
Ключевые особенности данного стандарта – это эффективность сжатия и передачи данных, а также направленность на сжатие видео широкого спектра приложений. Благодаря тому, что на сегодняшний день кодек поддерживает 17 профилей и 16 уровней, каждый из которых нацелен на конкретный класс популярных передаваемых видеоприложений, достигается высокий уровень гибкости и масштабируемости.
Формату H.264 свойственны такие же ограничения, как и для формата MPEG‑2. В конечном итоге, эти ограничения связаны с возможностью существующей технологии, что препятствует применению формата H.264 в профессиональной среде вещания. На сегодняшний день наиболее технологически продвинутым кодеком, совместимым со стандартами вещания, является H.264, выполняющий сжатие видео со скоростью 80 Мб/с, ограниченный разрешением в 8 бит. Реализация сети на основе H.264 может быть дорогостоящей. Стоимость по сравнению с конкурирующими стандартами может быть в четыре раза выше за счет себестоимости и потребления мощности. Благодаря архитектурной асимметрии кодеков может сложиться впечатление, что высококачественные декодеры обладают низкой стоимостью, в результате чего пользователи очень часто удивляются высокой цене на профессиональные видеодекодеры.

JPEG 2000: выбор прогрессивного метода сжатия

Метод JPEG 2000, предлагаемый современным рынком, является его ключевым достоинством. Стандарт и система кодирования JPEG 2000 основаны на «вейвлет-технологии» сжатия изображения. Изначально он был задуман не как кодек для сжатия видео, а как кодек сжатия графических изображений. Примененная в нем внутрикадровая схема кодирования имеет ряд преимуществ, характерных для всего цикла вещания - доставка, формирование, а также первичное и вторичное распределение.
JPEG 2000, по сравнению с форматами H.264 и MPEG‑2, хорошо известен своим отличным визуальным качеством (см. рисунок 1). JPEG 2000 выполняет кодирование в пределах полного кадра, в то время как другие схемы сжатия требуют, чтобы изображение было разбито на более мелкие блоки, в результате чего ухудшение качества происходит неравномерно и может различаться в пределах кадра. Это приводит к появлению визуально раздражающего искажения, известного как «блокинг-эффект». В случае с JPEG 2000 потеря качества происходит равномерно по всей области кадра и зрительно воспринимается как сглаживание краев, иначе говоря, происходит размытость. Такое искажение визуально является менее раздражающим, чем «блокинг-эффект», так как размытость в большей степени соответствует естественному восприятию человеческого глаза. JPEG 2000 обладает уникальной возможностью доставки информации в первоначальном виде для последующей обработки. За счет обеспечения высокого качества на более низком уровне возможна передача высокого качества на более высокий уровень. Видео JPEG 2000 остается практически нетронутым при осуществлении многократных циклов кодирования/декодирования. Это позволяет сохранить высокое качество видео, передав его по этой цепочке.

JPEG 2000 характеризуется низким временем задержки - порядка 1.5 кадра или меньше на весь цикл кодирования-декодирования. Этот параметр является критичным для интерактивных приложений и может привести к отсутствию связи при переходе от одного кадра к следующему кадру. Низкое время задержки порядка 45 мс при сжатии HD-потока является преимуществом по сравнению с форматами H.264 и MPEG‑2, время задержки в которых достигает от одной до двух секунд.
Высокая скорость передачи, которая достигается за счет сжатия JPEG 2000, также критически важна. При сравнении реализованных проектов замечено, что, как правило, JPEG 2000 может работать при очень высоких скоростях - намного более высоких, чем H.264. Для передачи изображения высокого качества это является ключевым моментом, так как пропускная способность может быть ограничена конкретным типом инфраструктуры, однако ширина полосы пропускания не обязательно является критической. Например, HD-видео при 1.5 Гб/с невозможно передать по сети Ethernet в 1 Гбит, но для этой цели может быть выделен весь канал. Следовательно, передача HD-видео может быть осуществлена, если задействовать всю ширину полосы пропускания и применить «легкое» JPEG 2000 сжатие для достижения как наивысшего качества, так и вписывания в ширину канала или, когда уместно, закодировать с использованием математического сжатия без потерь с целью исключения потерь видеоинформации.
Одним из наиболее значительных преимуществ формата JPEG 2000 является его гибкость. Возможна передача данных по множеству типов сетевых инфраструктур - Ethernet/IP, SONET/SDH/PDH и по оптоволокну. Когда данные упакованы с помощью JPEG 2000 в ASI-поток, то видео может передаваться везде, в любое время и на любое расстояние. JPEG 2000 выполняет независимое кодирование каждого поля и каждого кадра, яркости и цветности компонента. Качество, которое достигается за счет математического сжатия без потерь, сравнимо с качеством математического сжатия с потерями. Видео может быть закодировано путем математического сжатия без потерь, но по причине недостаточной пропускной способности канала может обрезаться и преобразовываться в сжатие с потерями.
Конструктивно для JPEG 2000 характерным является одинаковый уровень сложности как для процесса кодирования, так и для процесса декодирования. Так как JPEG 2000 является симметричным кодеком, одно и то же аппаратное средство может быть предоставлено как в качестве кодера, так и в качестве декодера, в то время как асимметричные кодеки требуют совершенно разных аппаратных средств, особенно при высокой скорости передачи данных. Относительно низкая сложность JPEG 2000 имеет преимущества в стоимости, капитальных и эксплуатационных затратах, а также снижает расходы на электропитание сети.

Подводим итоги

Каждый из рассмотренных в статье кодеков играет свою индивидуальную роль в сфере качественной передачи данных. Кодеки H.264/MPEG-4 и MPEG‑2 по-прежнему актуальны в сфере профессионального телевещания. Они обеспечивают высокое качество в сетях с ограниченной пропускной способностью, но они не обязательно являются единственно правильным выбором во всех возможных сферах применения.
Формат JPEG 2000 обеспечивает высокое качество изображения и низкое время задержки при кодировании в несколько циклов. На сегодняшний день он подтвердил свою значимость во всех сферах видеотехнологий, в сфере передачи данных по IP- и 3G-сетям, а также в HD- и 3D-технологиях.
Помимо качества и инфраструктуры сети, в процессе сравнения и выбора метода сжатия необходимо учитывать степень затрат ресурсов и его стоимость. В целом, методы сжатия MPEG‑2 и H.264 являются дорогостоящими, энергозатратными и требуют применения сложных технологий.
Так как кодек JPEG 2000 по сравнению с другими требует меньше энергозатрат и в целом обеспечивает большую масштабируемость, гибкость и качество изображения, то перед ним открывается блестящее будущее. Все большее число ведущих мировых поставщиков услуг телевещания, а также телекомпаний используют JPEG 2000 для трансляции крупных, глобально значимых событий – особенно с использованием мощностей IP-сетей. Однако существующая ситуация постоянно изменяется, и, возможно, завтра перед нами предстанет новый, более «навороченный» метод сжатия.

Всё более популярным становится формат компрессии видеосигнала H.264. Подробную информацию о преимуществах, которые даёт его использование, вы сможете найти в статье, приведенной ниже. Напомним, что формат сжатия видео H.264 явился совместной разработкой двух международных организаций по стандартизации и ISO/IEC; этот формат также известен под названием MPEG-4 Part 10 AVC (Advanced Video Coding, продвинутая кодировка видеосигнала).

Сжимать еще сильнее

Аппетиты видеонаблюдения в отношении объемов хранения данных и пропускной способности сетей растут: никто не хочет упустить возможность воспользоваться большой частотой кадров и высоким разрешением. Отсюда и ожидания большей эффективности от методов сжатия видеосигнала. Кодер формата H.264 способен уменьшить размер файла, содержащего цифровое видео, более чем на 80% по сравнению с сигналом, сжатым по алгоритму формата Motion JPEG, при аналогичных показателях визуального качества. В сравнении с наиболее "ходовой" разновидностью формата MPEG-4 -- MPEG-4 Part 2 Simple Profile (SP) -- кодек H.264 обычно выигрывает 40-50 процентов от объема видеофайлов.

Сектор мегапиксельных камер растет, и до недавнего времени основным сдерживающим его рост фактором считались повышенные требования к объемам хранения данных, генерируемых камерами высокого разрешения. Использование кодека H.264 способно значительно ускорить процесс внедрения мегапиксельных камер.

По моему личному мнению (то есть мнению Джона Блема - прим. ред.) , формат H.264 почти окончательно вытеснит MPEG-4 (Part 2) в течение буквально нескольких лет. А поставщики решений управления видеонаблюдением примутся встраивать поддержку нового формата уже в ближайшем будущем, равно как и все ведущие производители видеокамер.

Ложка дегтя

Есть, однако, и факторы, сдерживающие восторг от новинки -- ведь, по сути, разработка находится еще в самом начале пути. Да, кодек позволяет снизить нагрузку на сети передачи данных и сэкономить на приобретении средств хранения видеоинформации. Но его использование возможно только в условиях применения высокопроизводительных камер. Новый алгоритм сжатия использует значительно более сложную математику, чем предыдущие стандарты -- скажем, процедура декодирования примерно вдвое превосходит аналогичную процедуру у MPEG-4 Part 2 SP по объемам вычислений -- соответственно этому растет и запрос к вычислительной мощности систем. При этом собственно стандартом H.264 стал относительно давно -- около пяти лет назад, и в некоторых отраслях -- исключая нашу с вами -- уже взят на вооружение. Скажем, он используется в новом поколении потребительских DVD-дисков высокого разрешения (формат Blu-ray).

Как это работает

H.264 является гибридным стандартом блочного кодирования видеоданных с использованием компенсации движения. Собственно компенсация основана на использовании векторов перемещения областей кадра для предсказания изменений в изображении. Поскольку для видеоизображений характерна высокая степень корреляции между двумя последовательными кадрами, возможно использовать это для кодирования не картинки целиком, а лишь векторов перемещения различных частей изображения; кодируется при этом предсказанная разница между текущим кадром и его областями, присутствующими на других кадрах (так называемых ссылочных) в смещенном относительно оригинального положения виде. Эта техника называется "промежуточное предсказание".

Существует два основных метода промежуточного предсказания -- основанное на одном ссылочном кадре (макроблоки типа P) и двунаправленное (макроблоки типа В), где используется комбинация двух ссылочных кадров. Чтобы обеспечить доступ к произвольным участкам видеоизображения и повысить степень защищенности от ошибок, стандартом также предусмотрено так называемое инфракодирование, при котором кодированные данные не зависят от характера и содержания каких-либо сторонних изображений, как это происходит в случае применения промежуточного предсказания.

Стандартом H.264 предусматривается разбиение изображения на макроблоки размером до 16х16 пикселов каждый. Макроблоки объединяются в группы -- одну или несколько -- обычно в порядке сканирования. Таким образом, отдельное изображение может быть закодировано как одна или несколько групп. Использование группирования макроблоков позволяет применять различные методы коррекции ошибок, различные типы кодирования макроблоков, а также такие инструменты, как раздельное кодирование полукадров (на правах групп) при чересстрочной развертке.

В цветных видеоизображениях кодирование яркостной составляющей происходит отдельно от цветовой; учитывая особенности человеческого зрения, при этом, как правило, используется поддискретизация цветового сигнала относительно яркостного. По большому счету, фундаментальных отличий нового формата от предыдущих стандартов кодирования видеосигнала (включая MPEG-4 Part 2) нет: все они так или иначе основаны на разбиении на блоки и являются гибридными.

Новые средства

Помимо улучшений, которым подверглись уже существующие средства кодирования, формат H.264 предусматривает и ряд новых инструментов. Наиболее важными из них являются встроенный адаптивный деблокирующий фильтр, позволяющий существенно снизить блокинг-искажения изображения, запись более чем двух ссылочных кадров для более точного предсказания, деление макроблоков на блоки меньшего размера (вплоть до 4х4 пиксела), предсказание в инфракодировании, а также применение целочисленного преобразования взамен применявшегося в более ранних стандартах дискретного косинусного преобразования (DCT).

В формат H.264 входит принципиальное решение сетевого интерфейса передачи видеоданных (network abstraction layer, NAL), который, будучи установлен поверх программного механизма кодирования видеосигнала (video coding layer, VCL), берет на себя функцию эффективного представления цифрового видео в формате, обеспечивающем легкую интеграцию с целым набором различных протоколов и механизмов передачи данных -- это весьма привлекательно для сетей, работающих на основе Интернет-протокола (IP).

Что в итоге?

Главный результат всех усовершенствований технологии кодирования, воплощенных в стандарте H.264, состоит в том, что новый формат действительно превосходит по своим характеристикам все предыдущие алгоритмы сжатия цифрового видеосигнала -- и потому на сегодняшний день может считаться высшим достижением в области кодирования цифрового видео.

Итак, стОит ли Н.264 всей медиа-шумихи, развернутой вокруг него? Стандарты видеокомпрессии с приходом нового формата стали стремительно меняться -- и сегодня они уже способны сохранить либо даже снизить нагрузку на пропускную способность сетей передачи данных при переходе на видео высокого разрешения. И это является весьма ценным.

Однако же, будем помнить, что все прелести новой технологии кодирования и хлынувших на рынок все более мощных мегапиксельных камер могут быть реализованы лишь при использовании крепкой управляющей платформы, на базе которой формируются решения видеонаблюдения. Применение стопроцентно открытых платформ по управлению IP-видеонаблюдением позволит вам интегрировать новые технологические решения в уже существующую у вас серверную инфраструктуру -- без необходимости полной замены аппаратной части системы.

Джон Блем, директор компании Milestone по информационным технологиям.

Предлагаемый коэффициент сжатия с H.264? Формат сжатия H.264,что это за формат? Сжатие h 264.