Цветовая субдискретизация 4 2 2

Цветовая субдискретизация (англ. Chroma subsampling ) — технология кодирования изображений со снижением цветового разрешения, при которой частота выборки цветоразностных сигналов может быть меньше частоты выборки яркостного сигнала. Основана на особенности человеческого зрения, выраженной большей чувствительностью к перепадам яркости, чем цвета. Цветовая субдискретизация является важным способом снижения размера цифрового потока видеоданных (цифровое сжатие видеоинформации). Используется в системах аналогового и цифрового телевидения, цифровой видеозаписи и алгоритмах сжатия изображений, таких как JPEG.

На практике кодирование изображений осуществляется уменьшением разрешения в цветоразностных каналах при сохранении разрешения в канале яркости.

Содержание

История [ править | править код ]

Метод был впервые разработан в 1950-х Альдой Бедфордом для системы цветного телевидения компании RCA. Позже он получил своё развитие в стандарте NTSC. Впрочем, принцип разделения яркости и информации о цвете был придуман ещё раньше — в 1938 году Джорджесом Валенси.

Введение [ править | править код ]

Для совместимости с черно-белым телевизионным сигналом и для возможности уменьшения полосы частот, требуемой для передачи цветностной информации, в цветном телевидении используются специальные схемы суммирования трёх составляющих видеосигнала Y’ – означает яркость, а R-Y’ и B-Y’ — так называемые цветоразностные сигналы. Для перевода компонентного видеосигнала в цифровую форму в соответствии с рекомендациями ITU-R 601 применяется кодирование по следующим формулам:

Y ′ = 0.299 ⋅ R ′ + 0.587 ⋅ G ′ + 0.114 ⋅ B ′ C R = 0.713 ⋅ ( R ′ − Y ′ ) C B = 0.564 ⋅ ( B ′ − Y ′ ) <displaystyle <eginY’&=&0.299cdot R’&+0.587cdot G’+0.114cdot B’\C_&=&0.713cdot (R’&-Y’)\C_&=&0.564cdot (B’&-Y’)end>>

При передаче таких сигналов возможно восстановление исходных составляющих цветов: красной (R), синей (B) и зеленой (G), которые используются в большинстве систем отображения видеоинформации.

При Y’, Cr, Cb представлении видеосигнала цветоразностные компоненты Cr, Cb передаются с пространственным разрешением, в два раза меньшим разрешения по яркостному сигналу, при этом частота дискретизации для яркостного сигнала Y’ устанавливается равной 13,5 МГц, что в два раза больше, чем для цветоразностных сигналов Cr и Cb — 6,75 МГц. Для цифровых стандартов принято базовое значение частоты дискретизации, равное 3,375 МГц, таким образом, частоты дискретизации яркостного и двух цветоразностных сигналов будут находиться в соотношении 4:2:2.

Для сигналов ТВЧ, согласно части II Рекомендации ITU-R 709-3, установлены частоты дискретизации сигналов яркости 74,25 МГц и цветности 37,125 МГц.

Форматы субдискретизации [ править | править код ]

Структура дискретизации сигнала обозначается как соотношение между тремя частями X:a:b (например, 4:2:2), описывающими число выборок яркостных и цветоразностных сигналов. Также иногда используется обозначение с четырьмя частями (4:2:2:4), где четвёртая цифра, если она включена, должна быть идентична первой цифре, указывающая на наличие сигнала четвертого канала, содержащего информацию прозрачности (альфа-канал). Этими частями являются:

  • X — частота дискретизации яркостного канала, выраженная коэффициентом базовой частоты (ширина макропикселя)
  • a — число выборок цветоразностных сигналов (Cr, Cb) в горизонтальном направлении в первой строке
  • b — число (дополнительных) выборок цветоразностных сигналов (Cr, Cb) во второй строке
  • Alpha — частота дискретизации альфа-канала (по отношению к первой цифре). Может быть опущен, если альфа-компонент отсутствует, и равна X при его наличии.
4:1:1 4:2:0 4:2:2 4:4:4
Y’CrCb
= = = =
Y’
+ + + +
1 2 3 4 X = 4 1 2 3 4 X = 4 1 2 3 4 X = 4 1 2 3 4 X = 4
(Cr, Cb) 1 a = 1 1 2 a = 2 1 2 a = 2 1 2 3 4 a = 4
1 b = 1 b = 1 2 b = 2 1 2 3 4 b = 4
¼ горизонтального разрешения,
полное вертикальное разрешение
½ горизонтального разрешения,
½ вертикального разрешения
½ горизонтального разрешения,
полное вертикальное разрешение
полное горизонтальное разрешение,
полное вертикальное разрешение

8:4:4 Y’CbCr [ править | править код ]

Каждая из цветоразностных компонент Cb и Cr имеют одинаковую частоту дискретизации. Компонента яркости имеет в два раза большее разрешение. Эта система используется сканерами киноплёнки высокого уровня, устройствами телекино.

4:4:4 Y’CbCr [ править | править код ]

Каждая из трех компонент Y’CbCr имеет одинаковую частоту дискретизации. Эта схема иногда используется в дорогих сканерах и кинематографическом пост-продакшн производстве. Как правило, для предоставления такой пропускной способности используется двухканальный интерфейс HD-SDI стандарта SMPTE 372M. Первое подключение – для передачи сигнала 4:2:2, второе подключение — для сигнала 0:2:2, в сочетании будет передано 4:4:4.

4:4:4 R’G’B’ (без субдискретизации) [ править | править код ]

Стоит отметить, что под "4:4:4" может пониматься цветовое пространство R’G’B’, которое вовсе не имеет цветовой субдискретизации. Видеоформаты, такие как HDCAM SR, могут записывать цифровой видеосигнал с частотой выборки 4:4:4 R’G’B’ посредством двухканального HD-SDI.

4:2:2 [ править | править код ]

Используется в научных исследованиях, профессиональных системах и формате MPEG-2. Рекомендация 601 определяет стандарт полного цифрового видеосигнала с соотношением частот дискретизации яркостного и цветоразностных сигналов как 4:2:2. В каждой строке передается полный сигнал яркости, а для цветоразностных сигналов производится выборка каждого второго отсчета. Таким образом, цветовое горизонтальное разрешение снижается вдвое.

4:2:1 [ править | править код ]

Этот режим также определен технически. Используется в ограниченном наборе аппаратных и программных кодеров.

4:1:1 [ править | править код ]

В соотношении 4:1:1 горизонтальное разрешение цветоразностных сигналов снижается до четверти от полного разрешения сигнала яркости, также полоса пропускания сужается (пропускная способность увеличивается) в два раза по сравнению с режимом без субдискретизации. Первоначально 4:1:1 применялся в формате DV, который не считался вещательным и был единственным приемлемым форматом видеозаписи для низкобюджетных и потребительских приложений. В настоящее время DV-формат (с выборкой 4:1:1) используется профессионально для производства новостей и воспроизведения видео при помощи серверов.

В системе NTSC, если частота дискретизации яркости равна 13,5 МГц, то это означает, что каждый из сигналов Cr и Cb будет дискретизован с частотой 3,375 МГц, что соответствует максимальной пропускной способности частоты Найквиста 1,6875 МГц, в то время как традиционный "NTSC кодер высокого класса аналогового вещания" будет иметь частоту Найквиста 1,5 МГц и 0,5 МГц для I/Q каналов. Однако в большинстве единиц оборудования, особенно в дешевых телевизорах и VHS-/Betamax-видеомагнитофонах, каналы цветности имеют пропускную способность только 0,5 МГц для Cr и Cb (что эквивалентно для I/Q). Таким образом, система фактически обеспечивает увеличенную пропускную способность цвета по сравнению с лучшими композитными аналоговыми спецификациями для NTSC, несмотря на то, что используется только 1/4 от полной полосы частот цветовой составляющей "полного" цифрового сигнала. Форматы, которые используют 4:1:1, включают в себя:

  • DVCPRO ( NTSC и PAL )
  • NTSC DV и DVCAM
  • D-7

4:2:0 [ править | править код ]

Различные варианты 4:2:0 конфигураций можно найти в:

  • В стандартах кодирования видео ИСО/МЭК, MPEG, МККТТ и Группы экспертов кодирования видео "H.26x", включая реализации H.262/MPEG-2 Part 2, такие как DVD (хотя некоторые профили MPEG-4 Part 2 и H.264/MPEG-4 AVC позволяют кодировать со структурой выборки более высокого качества, например, такой как 4:4:4)
  • PAL DV и DVCAM
  • HDV
  • AVCHD и AVC-Intra 50
  • Apple Intermediate Codec
  • Наиболее распространенные реализации JPEG / JFIF и MJPEG
  • VC-1

Для цветоразностных компонентов Cb и Cr при дискретизации отбрасывается каждый второй отсчёт по горизонтали и по вертикали. Есть три варианта схем 4:2:0, имеющих различные горизонтальные и вертикальные размещения отсчётов:

  • Отсчеты цветоразностных компонентов в формате 4:2:0, принятом в системе компрессии MPEG-2, не совмещены с отсчётами яркостной составляющей.
  • В JPEG / JFIF, H.261 и MPEG-1, Cb и Cr совмещены и располагаются между альтернативными отсчетами яркости.
  • В 4:2:0 DV, отсчёты цветоразностных компонентов Cb и Cr совмещены с отсчётами яркостной составляющей изображения, может быть получен из прототипной структуры 4:2:2 путём поочередного исключения одного цветоразностного компонента в каждой второй строке каждого поля.
Читайте также:  Что такое пифагорова тройка

Этот вид обработки данных особенно хорошо подходит для цветных систем PAL и SECAM. Большинство цифровых видео форматов PAL используют соответственно 4:2:0, за исключением DVCPRO25, который использует 4:1:1. Оба варианта 4:1:1 и 4:2:0 вдвое сокращают требования к пропускной способности по сравнению с представлением без субдискретизации.

4:1:0 [ править | править код ]

Поддерживается некоторыми кодеками, но используется не слишком широко. При этом соотношении коэффициентов используется половина вертикального и четверть горизонтального цветового разрешения, и лишь одна восьмая часть от полосы пропускания максимального цветового разрешения.

3:1:1 [ править | править код ]

Используется в формате видеозаписи высокой чёткости Sony HDCAM (не HDCAM SR). В горизонтальном направлении производится выборка отсчетов сигнала яркости на три четверти от полной частоты дискретизации HD — 1440 выборок в строке против 1920 в HDCAM SR. В вертикальном направлении, как в канале яркости, так и в канале цветности, производится полная дискретизация HD (1080 отсчетов).

Терминология [ править | править код ]

Термин Y’UV относится к аналоговой схеме кодирования, в то время как Y’CbCr ссылается на цифровые схемы кодирования. Одно из различий между ними в том, что набор коэффициентов компонентов цветности U, V и Cb, Cr различен. Однако термин YUV часто используется ошибочно, обращаясь к кодировке Y’CbCr. Следовательно, выражения типа "4:2:2 YUV" всегда относятся к 4:2:2 Y’CbCr, так как просто нет такого понятия, как 4:x:x в аналоговой кодировке (например, YUV).

Также термином яркость и символом Y часто пользуются ошибочно, обращаясь к яркости, которая обозначается символом Y’. Обратите внимание, что яркость (Y’), принятая у видео-инженеров, отклоняется от яркости (Y) в колориметрии (как определено в CIE). Яркость (в ТВ) формируется как взвешенная сумма компонентов RGB с гамма-коррекцией (трехцветной). Яркость формируется как взвешенная сумма линейных (трехцветной) компонентов RGB.

На практике CIE символ Y часто неправильно используется для обозначения яркости. В 1993 году SMPTE принятое Руководство для инженеров EG 28 уточняет два термина. Обратите внимание, что главным символом ‘ используется, чтобы указать гамма-коррекцию.

Кроме того, понятие хрома/цветность у видеоинженеров отличается от цветности в колориметрии. Хрома/цветность в видеоинженерной практике формируется из весовых компонентов трехцветной, нелинейных компонентов. Условия цветность и насыщенность часто используются как синонимы для обозначения цветности.

Видеоформаты [ править | править код ]

Следующая таблица показывает характеристики большинства видеоформатов и типов применяемой субдискретизации цветоразностных компонент, а также другие связанные с ними параметры, такие как скорость передачи данных и степень сжатия.

Избранные статьи

Статьи раздела

Обсуждаемые статьи

feste 2 декабря 2019, 20:37

Sergio 29 декабря 2019, 16:21

PaulPhoenix 18 ноября 2019, 21:34

PaulPhoenix 27 сентября 2019, 15:34

PaulPhoenix 16 декабря 2018, 23:29

Winni 18 марта 2018, 18:57

Последние темы форума

perfect 24 августа 2019, 09:50

perfect 24 августа 2019, 09:49

perfect 24 августа 2019, 09:48

perfect 24 августа 2019, 09:47

perfect 24 августа 2019, 09:41

Популярные темы форума

axekirov 24 февраля 2019, 12:41

Ilia 5 марта 2019, 11:22

PaulPhoenix 24 марта 2016, 14:34

PaulPhoenix 28 января 2014, 13:07

Автор: Michael J. McNamra, ProjectorCentral.com, 19 марта 2019

Вы когда-нибудь наблюдали сброс кадров или подзависания картинки во время воспроизведения фильмов в Full HD или 4K форматах с компьютера, медиасервера, или при трансляции потокового видео через интернет? Если да, то добро пожаловать в клуб! Это вполне обычные проблемы, связанные с пропускной способностью канала, которые, как правило, можно решить обновлением компьютера, интернет-службы, кабелей HDMI, или всех трех компонентов сразу.

Примечание ProjectorWorld: может быть проще понять данный термин, если вернуться к оригинальному английскому слову «subsampling». Если «Sampling» значит «брать замеры» — например параметры каждого пикселя, то с добавлением приставки «sub-» («под-») мы, стало быть, берем замеры не с каждого пикселя, а с некого их «подмножества». «Subsample» — это «выборка из выборки».

Однако, если бы не повсеместное использование цветовой субдискретизации и различных алгоритмов сжатия данных для хранения видео-данных на ваших Blu-ray и DVD-дисках, жестких дисках и серверах служб интернет-вещания, то проблема эта была бы куда более существенной и труднорешаемой. Все потому, что обе технологии работают сообща, существенно уменьшая требуемую пропускную способность канала и вычислительные мощности, необходимые для отображения видео в высоком разрешении и с частотой кадров 24, 30, 60, и даже 120 кадров в секунду. Без этих технологий лишь самые быстрые компьютеры и графические карты были бы в состоянии обработать и отобразить эти сотни мегабайт-в-секунду видео-данных, генерируемых фильмом в качестве 4K UHD HDR, при этом не сбрасывая кадры и без зависания картинки. К тому же, невероятно большой размер файлов, который потребовался бы для несжатых фильмов в Full HD и 4K, добавил бы много дополнительных часов или даже дней к времени их скачивания у служб потокового вещания; к тому же они бы быстро заполнили все дисковое пространство вашего ПК или медиасервера. Даже если ваше оборудование и интернет-подключение были бы в состоянии справиться с несжатым 4K-контентом, вам бы потребовались топовые кабели HDMI 2.1 и соответствующие интерфейсы у отображающего устройства, чтобы «пропихивать» несжатые видео-данные от плеера к устройству.

Цветовая субдискретизация использовалась с начала эпохи аналогового цветного телевидения, позволяя по узкой полосе пропускания, выделенной для каждого телеканала, одновременно передать черно-белое и цветное изображение, тем самым обеспечивая обратную совместимость с существующими черно-белыми телевизорами. Используемый в области аналогового сигнала термин «Y’UV» относится цветовой модели с субдискретизированным цветом, в которой подканал Y’ содержит нелинейный яркостный сингал* (информацию о яркости, соответствующую воспринимаемым яркости и детализации; в основном данные о яркости берутся из зеленого сигнала), тогда как субканалы U и V содержат цветовой компонент сигнала — красный и синий. Данная модель используется во всем мире для телевещания. Другая аналоговая модель, Y’PbPr, используется в основном для передачи компонентного видео по трем кабелям. В этой модели канал Y’ тоже содержит информацию о яркости (она же содержит основную часть данных, относящихся к цветности и детализации зеленого), тогда как каналы Pb и Pr содержат компонент цветовых данных «Синий минус яркость (Y)» и «Красный минус яркость»). Использование отдельного компонента сигнала для передачи информации о яркости в сочетании с двумя сигналами цветовых различий привело к экономии требуемой ширины канала по сравнению с аналоговым R, G, B сигналом, где каждый канал содержит собственный компонент яркости.

* Нелинейный сигнал, обозначаемый апострофом, означает, что к сигналу применена гамма-коррекция (прим. ProjectorWorld.ru)

Аналоговая модель Y’PbPr ближе соответствует современным цифровым моделям YCbCr и Y’Cb’Cr’ (яркость, цвет: синий; цвет: красный). Как и в аналоговых моделях, условный знак в виде апострофа означает, что изначальные значения для Красного, Зеленого и Синего пикселя, которые были получены камерой или сгенерированы в графическом приложении, были «субдискретизированы» нелинейным способом, который лучше учитывает различную чувствительность человеческого глаза к цветам и различным уровням яркости. Благодаря пониманию принципов работы глаза был сделан вывод, что именно данные о яркости являются наиболее важным компонентом, необходимым для того, чтобы видеть и различать объекты. При этом часть данных о цвете можно опустить без особого ущерба, в результате чего получаем сжатый сигнал, который экономит дисковое пространство и который проще передавать.

В данной статье мы сосредоточимся на трех наиболее широко используемых уровнях цветовой субдискретизации, которые можно обнаружить в рамках модели Y’Cb’Cr’. Эти уровни обычно выражаются в виде тройного отношения, которое соответствует значениям Y’:C’b:C’r. Если вы истинный видеофил, то наверняка встречались с этими «4:4:4», «4:2:2» и «4:2:0». Такие отношения сообщают нам, примерно следующее: «4 доли яркости к 2-м долям цвета (синего) к 2-м долям цвета (красного).» Отношение 4:4:4 используется для описания «недискретизированных» данных R, G, B. Это означает, что в сигнале равные доли выделены на яркость, цветность синего и цветность красного. «4:4:4» полностью соответствует сигналу RGB, как показано на рисунке выше.

Читайте также:  Типы челнока у швейных машин

Высчитываем Y’C’bC’r: Таблица взята из описания стандарта BT.2100 и описывает, как значения Y’C’bC’r высчитываются из изначальных значений R’, G’ и B’, записанных камерой или созданных в графическом приложении. Обратите внимание, что яркостный компонент Y’ содержит преимущественно данные, полученные на основании зеленого канала цветности G’ и практически без участия данных из B’.

Алгоритмы цветовой субдискретизации были созданы чтобы использовать на практике более высокую чувствительность человеческого глаза к оттенкам зеленой части цветового спектра, чем к красной и синей. (Возможно, это результат долгой эволюции человеческого вида в окружении зеленых растений и лесов?) По этой причине яркостный компонент Y’ (см. таблицу выше) и содержит преимущественно данные, которые были получены из зеленого канала. По этой же причине зеленый канал в большинстве цифровых фотографий содержит больше полезных данных, на основании которых можно превратить цветную фотографию в черно-белую (см. фото ниже). Если вы снизите насыщенность цветов на телевизоре или проекторе, то полученные черно-белые изображения на экране будут созданы почти полностью из данных по яркостному каналу, в котором примерно 70% зеленого, 25% красного и лишь 5% синего. В связи с таким «перекосом» нашего зрения в сторону зеленого цвета, цветовая субдискретизация позволяет уменьшить объем информации по цветности, содержащейся в красном и синем каналах, экономя вплоть до 30% трафика (при использовании уровня сжатия 4:2:2) без заметной для большинства зрителей разницы в детализации, цвете или контрастности изображения.

Зеленый канал в большинстве цифровых фотографий вносит больший вклад в черно-белое изображение, чем красный или синий.

Сам по себе метод цветовой субдискретизации позволяет снизить размер файла и требования к полосе пропускания на 30-50% по сравнению с изначальным R, G, B форматом, не приводя при этом к значимой деградации качества изображения. Высший уровень качества 4:2:2 является практически «lossless-сжатием» (без потери качества), зачастую применяемым к изначальному видеоматериалу до монтажа и цветокоррекции, позволяя ускорить процесс редактирования и обработки. Запись у большинства полупрофессиональных видеокамер осуществляется именно в этом формате. В области профессионального кинопроизводства цветовая субдискретизация применяется лишь после того, как несжатый (4:4:4) RGB видеоряд смонтирован и сохранен в качестве мастер-копии. Затем, после цветовой субдискретизации, следует применение общего алгоритма сжатия, который может включать MJPEG, AVC, либо HEVC, каждый из которых потребует меньше вычислительных мощностей и времени для сжатия видео в 4:2:2, чем 4:4:4. Взятые вместе, эти различные методы сжатия данных способны уменьшить размер видеофайла в 5-20 раз, так и не достигнув уровня, при котором качество изображения станет неприемлемым.

Как работает цветовая субдискретизация?

4:4:4 . В соответствии с приведенными выше толкованием стандарта BT.2100, данные по R, G, B, имеющиеся у каждого пикселя видеокадра, сперва используются для вычисления значений Y’C’bC’r для каждого пикселя. Рисунок выше показывает, как эти данные могли бы храниться в массивах по 8 ячеек – до того, как будет применена субдискретизация цветов. На данный момент нет никаких изменений ни относительно требуемого для хранения видеофайла пространства, ни качества изображения, ни точности цветов или их детализации.

4:2:2. Формат 4:2:2 считается навысшим уровнем субдискретизации и сохраняет всю информацию по каналу яркости Y’. (Все прочие описываемые нами уровни также сохраняют полную информацию по яркости, и лишь несколько записывающих устройств субдискретизируют яркостный канал до уровня 3 или 2). А вот значения C’b и C’r берутся в два раза реже по горизонтали, чем параметр яркости, и в итоге каждый второй пиксель в каждой строке массива пикселей хранится без данных C’b и C’r, экономя около 30% ширины канала и дискового пространства. Когда эти видеоданные открываются компьютерной программой, медиаплеером или способным напрямую обрабатывать видео в 4:2:2 устройством отображения, то сперва все доступные данные восстанавливаются в несжатом виде, а затем недостающие ячейки с данными C’b и C’r заполняются данными из соседних по горизонтали пикселей (это также называется интерполяцией).

При субдискретизации 4:2:0 яркостный компонент остается нетронутым, а для улучшения качества изображения, данные о цветовых компонентах могут содержать некую смесь из выброшенных данных.

4:2:0. Теперь все становится чуть запутаннее. При уровне субдискретизации 4:2:0, яркостному каналу все еще позволяется сохраняться в нетронутом виде, но C’b и C’r берутся в два раза реже – не только по вертикали, но и по горизонтали, что дает экономию полосы пропускания и места для хранения порядка 50%. Однако, для улучшения качества, данные, хранящиеся для каждого из оставшихся пикселей могут содержать «смесь» из выброшенных данных (см. рисунок). При этом используются два алгоритма. В итоге, при восстановлении исходного изображения видеоплеером, получается меньше артефактов, более плавные переходы между краями линий в изображении и более тонкие детали, чем если бы просто сохранялась цветность для одного пикселя из четырех (без «смешения» с соседними). Безусловно, более плавные края линий означают, что текст на контрастирующем фоне может выглядеть смазано или нечетко, но данный артефакт изображения также может быть виден при сравнении на компьютерном мониторе с его четким изображением форматов 4:2:2 и 4:4:4.

Заключительное слово по цветовой субдискретизации

Происходит ли заметно большее ухудшение качества изображение при использовании метода 4:2:0 по сравнению с 4:2:2, если наша цель — просмотр кинофильмов? Большинство зрителей, просмотревших любое количество Blu-ray дисков в 4K UHD (SDR и HDR) не согласятся с этим. Все потому, что формат цветовой субдискретизации 4:2:0 является неотъемлемой частью стандарта 4K UHD Blu-ray (наряду с невероятно эффективным общим алгоритмом сжатия HEVC) и используется для хранения практически всех фильмов, которые вы можете посмотреть с помощью сервисов кабельного ТВ или широкополосного интернет-вещания. Перед тем, как начать воспроизведение, обычный UHD Blu-ray 4K плеер проверяет информацию HDMI EDID, которая хранится в проекторе или другом устройстве, чтобы определить, способно ли оно напрямую работать с видео в формате 4:2:2. Большинство устройств способны работать с видео в 4:2:0 или 4:2:2, поэтому плеер сперва преобразует данные с диска в формат 4:2:2 перед тем, как отправлять их на экран. Если устройство отображения не совместимо с 4:2:2, то плеер может отправить на него данные в 4:2:0 или же преобразовать их в 4:4:4 перед отправкой на устройство.

Опираясь на эти крохи информации, большинство UHD Blu-ray плееров оказываются в состоянии отобразить видео даже в чуть лучшем качестве и с большей точностью цветов чем то, что вы можете получить с 4K UHD Blu-ray диска! Все что нужно – это 4K-видеокамера или цифровая зеркалка, либо графическое приложение, позволяющее записывать видео с глубиной цвета 10-12 бит на пиксель с использованием субдискретизации 4:2:2 (не 4:2:0) или даже 4:4:4. Отредактировав такие видеоролики и сохранив их в формате, таком как Apple ProRes 4:2:2, а затем сжав с использованием 10-битного HEVC, их после этого можно записать на USB 3.0 жесткий диск и подключить его к соответствующему разъему Blu-ray плеера, либо даже напрямую подключить этот диск к USB 3.0 разъему проектора или телевизора (если имеется). Поскольку плееру или отображающему устройству не приходится преобразовывать 4:2:0 в 4:2:2, то в тонких цветовых переходах должно сохраниться больше оттенков.

В любом случае, факт остается фактом: сжатие данных и цветовая субдискретизация в том или ином виде необходимы для того, чтобы позволить современным плеерам и отображающим устройствам справляться с видео в 4K-разрешении – и вы можете быть уверены, что эти технологии обретут еще большую значимость, когда широкого распространения достигнет 8K-контент и соответствующие отображающие устройства; особенно – учитывая ограничения по дисковым хранилищам и пропускной способности каналов широкополосного вещания. К счастью, в связи с большей плотностью пикселей у 8K-контента и дисплеев, видео в форматах 4:2:0 и 4:2:2 будет смотреться даже лучше чем сейчас, даже при отображения резкого текста на контрастирующем фоне.

Читайте также:  Смарт часы сами отключаются

Майкл Макнамара – бывший ответственный редактор технологического раздела журнала «Popular Photography» и признанный эксперт в таких областях, как оцифровка, хранение и технологии отображения. Он был удостоен ряда наград как фотограф и оператор и он также является владельцем In-Depth Focus Labs в Хопвелл Джанкшен, штат Нью Йорк.

Видеоурок 2. «Форматы съемки: битность, компрессия и битрейт» в рамках проекта «Берем Canon на тест»

Выбор модели и формата зависит от целей и задач проекта, бюджета и вычислительных возможностей. В этой статье мы рассмотрим основные характеристики видеоматериала и их влияние на процесс постобработки.

Примеры форматов, которые поддерживает камера Canon Cinema EOS C200

Любой видеоматериал имеет контейнер и кодек. Контейнер — это, по сути, расширение файла и заголовок, а кодек — это программный алгоритм сжатия/декомпрессии. Собственно, слово «codec» состоит из первых букв слов compression и decompression. Кодеком задается принцип сжатия, а также такие параметры, как битность, цветовая субдискретизация и битрейт.

Что показывает битность

Битность, или глубина цвета (англ. bit depth) — это, в сущности, количество градаций в каждом из каналов. Само слово bit происходит от английского «binary digit», что означает «двоичная цифра». На базовом уровне компьютер оперирует проводимостью транзисторов, а вычислительные операции осуществляются с двоичными числами, принимающими значение либо 0, либо 1. В цифровом изображении с помощью битов мы можем закодировать определенное количество градаций. Возьмем для начала материала в 1 бит. В этом случае, нам будут доступны всего два значения: 0 и 1. Это значит, мы сможем закодировать только два значения яркости: абсолютно черный (0) и абсолютно белый (1).

Если мы возьмем 2 бита, то это позволит нам закодировать 4 градации, поскольку нам будут доступны 4 вариации: 00, 01, 10, 11. Если мы будем двигаться дальше, то с помощью 4 бит мы получим 16 градаций, а 8 бит – 256 значений яркости. Легко догадаться, что общее количество значений яркости мы можем посчитать по формуле n=2^bit, где n — количество градаций, а bit — это битность материала.

Для нашего глаза в большинстве случаев, достаточно 8 бит на канал. Зная, что в изображении 3 канала, мы можем умножить 256*256*256 и получить 16 777 216 вариаций цвета.

Несмотря на то, что визуально между 8- и 10-битным материалом разницу найти крайне сложно даже профессионалу, все становится гораздо более критично, когда дело доходит до постобработки: в этом процессе чем больше битность материала, тем лучше. Особенно это касается материала с логарифмической гаммой (об этом позже), потому что в этом случае, существенно возрастает контраст и, как следствие, расстояние между отдельными градациями.


Битность материала и количество градаций в каждом канале

Цветовая субдискретизация или цветовая разрядность (chroma subsampling) — это описание того, каким образом происходит сэмплирование цвета. Чтобы сжать материал, во многих кодеках встроен процесс понижения разрешения цветовых составляющих. В этом случае изображение делится не на RGB-каналы, а на яркость и две цветоразностные составляющие. Канал яркости при этом существенно не меняется, только цвет. Для описания сэмплирования цвета используется блок из двух строк по четыре пикселя.

  • Общий формат, в котором описывается разрядность, выглядит так: J:a:b, где J — это длина макропикселя (во всех современных форматах — 4), а — количество уникальных цветовых сэмплов в первой строке, b — количество уникальных цветовых сэмплов во второй строке. То есть, если исходный материал представлен в формате 4:4:4, это означает, что в каждом из рядов будет по четыре уникальных пикселя для цвета. По сути это означает, что цвет представлен в несжатом виде.
  • Разрядность 4:4:4 отлично подходит для серьезной цветокоррекции материала, а также для широкого спектра задач графики, таких как трекинг и кеинг. Разрядность 4:2:2 будет содержать в 2 раза меньше цветовых пикселей и в ней на каждые 2 пикселя яркости будет один цветовой сэмпл. Материал в 4:2:2 по-прежнему неплохо поддается цветокоррекции, но с ним могут возникнуть небольшие проблемы на графике. 4:2:0 — это самый сжатый материал с точки зрения цвета: на 4 пикселя яркости приходится всего один цветовой сэмпл. Такой материал подходит для оперативной съемки, когда серьезное вмешательство с точки зрения цвета и графики не требуется. Отличить на глаз 4:4:4 от 4:2:0 практически невозможно, зато при цветокоррекции эта разница будет очевидна.


Цветовая субдискретизация / Изображение: videomaker.com

Виды компрессии

В современных кодеках есть два типа компрессии материала: пространственная (или внутрикадровая) компрессия и временная (межкадровая). Внутрикадровая компрессия обеспечивает сжатие каждого кадра путем деления его на блоки и приведения общих значений яркости. Нужно понимать, что любая компрессия — это поиск и обозначение повторяющихся блоков информации. При небольших градациях многие алгоритмы сжатия приводят значения к одному среднему, из-за этого на сильно сжатых видеоматериалах мы можем наблюдать так называемый banding или разбиение градаций. Для внутрикадровой компрессии кодеки используют разные виды преобразований: вейвлет, фрактальное, алгоритм Хаффмана и дискретно-косинусное.

Межкадровая компрессия, которая часто называется IPB, обеспечивает достаточно высокую степень сжатия. Базовый модуль такой компрессии называется GOP (group of pictures, англ. «группа изображений»). Он состоит из трех видов кадров: I (intra) используют только внутрикадровую компрессию и содержат полное изображение, то есть их можно отобразить без дополнительных вычислений. Их также называют ключевыми кадрами. B (Bi-directional, англ. «двунаправленные») и P (predictive, англ. «предсказывающий») содержат только информацию о разнице между кадрами и поэтому занимают гораздо меньше места, но для их вычисления программному алгоритму потребуется обратиться к I-кадру, так что в монтажных приложениях на слабых компьютерах работать с материалом IPB будет немного медленнее, чем с ALL-I.


Внутрикадровая и межкадровая компрессия / Изображение: bogotobogo.com

Битрейт

Битрейт показывает, сколько места на носителе информации занимает секунда материала. Единица измерения битрейта — это мегабит в секунду или гигабит в секунду. К примеру, камера Canon Cinema EOS C200 может записывать материал в Cinema RAW Light с битрейтом 1 гигабит в секунду и параллельно — материал для монтажа в MP4 Proxy с битрейтом 35 мегабит в секунду. Место на наших носителях информации обычно измеряется в байтах, а в одном байте — 8 бит. Чтобы перевести значения битрейта в более привычные для нас единицы измерения, мы просто разделим исходные данные на 8. Таким образом, секунда материала в Cinema RAW Light будет занимать 0.125 Гигабайта (125 Мб), а в MP4 Proxy — 4.375 Мб.

Чем меньше значение битрейта, тем больше материал сжимается, и, как следствие, его качество становится ниже, но при этом он занимает меньше места на диске.


Битрейт и визуальное качество материала / Изображение: vimeo.com

Для кино, клипов и рекламы очень желательно снимать в RAW: в этом случае вы получаете возможность максимально гибкой работы с материалом. Но, к примеру, в случае съемки документального кино, RAW будет достаточно дорогим решением, ведь 1 час RAW-материала Canon Cinema EOS C200 будет занимать примерно 450 Гб. Кроме этого, RAW-материал потребует более сложного рабочего процесса. Чтобы получить часть преимуществ RAW, но при этом оставить файлы сжатыми, используется логарифмическая гамма- кривая.

Canon Log 2 (слева), материал после цветокоррекции (справа) / Изображение: WTS Broadcast

RAW, Log, Rec. 709

Гамма — это соотношение исходной и выходной яркости. В зависимости от того, какую из гамма-кривых вы применяете к материалу, вы получаете разный контраст исходного материала и разную проработку с точки зрения динамического диапазона. Таким образом, Canon Log обеспечит вам примерно 12 ступеней диапазона, Canon Log 2 — 15 ступеней, а Canon Log 3 — 14 ступеней.

Обложка: pixabay

Оцените статью
Добавить комментарий

Adblock
detector