No Image

Способ преобразования звука в цифровую форму

СОДЕРЖАНИЕ
0 просмотров
22 января 2020

Простейший метод преобразования, импульсно-кодовая модуляция (ИКМ), состоит в представлении последовательности мгновенных значений уровня сигнала, измеряемого аналого-цифровым преобразователем (АЦП) через равные промежутки времени.

Разновидностью ИКМ является дельта-модуляция, где в каждый момент отсчёта сигнал сравнивается с пилообразным напряжением на каждом шаге дискретизации.

Сигма-дельта модуляция’ — способ представления сигнала на основе принципа избыточной дискретизации и формирования шума квантования, позволяет снизить уровень шума.

Современные методы используют более сложные алгоритмы преобразования. Помимо представления звуковых колебаний в цифровом виде, применяется также создание специальных команд для автоматического воспроизведения на различных электронных музыкальных инструментах. Ярчайшим примером такой технологии является MIDI.

Преимущества битового кода используются при передаче кодированного сигнала на расстояние, шифровании сигнала, цифровой подписи сигнала, восстановлении потерь, вызванных помехами при передаче, а также в прочих приложениях.

Цифровая звукозапись — технология преобразования аналогового звука в цифровой с целью сохранения его на физическом носителе для возможности последующего воспроизведения записанного сигнала.

Представление аудиоданных в цифровом виде позволяет очень эффективно изменять исходный материал при помощи специальных устройств или компьютерных программ — звуковых редакторов, что нашло широкое применение в промышленности, медиа-индустрии и быту.

Для воспроизведения цифрового звука применяют специальное оборудование, например музыкальные центры, цифровые плееры, компьютеры с звуковой картой и установленным программным обеспечением: аудиоплеером или медиаплеером.

Содержание

История [ править | править код ]

  • В 1928Гарри Найквист в работе «Определённые проблемы теории телеграфной передачи» определил требуемую полосу линии связи для передачи импульсного сигнала — основа цифрового звука [1]
  • В 1933 годуВ. А. Котельниковым в работе «О пропускной способности эфира и проволоки в электросвязи» предложена и доказана Теорема Котельникова, согласно которой аналоговый сигнал с ограниченным спектром может быть восстановлен однозначно и без потерь по своим дискретным отсчётам, взятым с частотой строго большей удвоенной максимальной частоты спектра [2]
  • В 1937 году британский ученый Alec Reeves запатентовал первое описание импульсно-кодовой модуляции[3]
  • В 1948 годуКлод Шеннон опубликовал «Математическую теорию связи» [4] , а в 1949 — «Передача данных при наличии шума», где независимо от Котельникова доказал теорему с аналогичными результатами теореме Котельникова, поэтому в западной литературе эту теорему часто называют теоремой Шеннона. [5]
  • В 1950Ричард Хэмминг опубликовал работу по обнаружению и исправлению ошибок [6]
  • В 1952Дэвид Хаффман создал алгоритм префиксного кодирования с минимальной избыточностью (известный как алгоритм или код Хаффмана) [6]
  • В 1959 Алекс Хоквингем создал код исправления ошибок, ныне известный как Код Боуза — Чоудхури — Хоквингема[6]
  • В 1960 сотрудниками лаборатории Линкольна Массачусетского технологического института Ирвином Ридом и Густавом Соломоном изобретён Код Рида — Соломона[6]
  • В 1967 техническим институтом исследований NHK представлен первый цифровой катушечный стереорекордер на 1-дюймовой видеоленте. В устройстве использовалась ИКМ-запись с разрядностью 12-бит и частотой дискретизации 30 кГц с применением компандера для расширения динамического диапазона [6]
  • В 1969Sony представила 13-битный цифровой стереорекордер с частотой дискретизации 47,25 кГц, с записью на 2-х дюймовую видеоленту [6]
  • В 1972 выпущен первый альбом записанный с цифровой мастер-ленты фирмой Nippon Columbia [7]
  • В 1977 на токийской аудио выставке Mitsubishi, Sony и Hitachi продемонстрировали прототипы цифровых грампластинок или аудиодисков [6]
  • В 1979 в Европе Philips демонстрирует прототип компакт-диска диаметром 115 мм, намереваясь его сделать мировым стандартом. 14-битная запись с частотой дискретизации 44,050 кГц не устроила Sony, которые предложили 16-разрядную запись с частотой 50 кГц, но в итоге из-за ограничений формата было решено выбрать частоту дискретизации 44,1 кГц и размер диска увеличить до 120 мм. Диск способен вмещать 74 минуты записи.
  • В 1980 стандарт компакт-диск был официально предложен, но на все согласования и доработки ушло два года [6]
  • В 1982 году в Европе и Японии был принят стандарт на систему компакт-диск[6]
  • Также в 1982 году представлен цифровой формат звукозаписи на катушечную ленту DASH предложенный фирмой Sony для многоканальной студийной записи
  • В 1987Sony и Philips представили формат цифровой компакт-кассеты DAT
  • В 1992Philips и Matsushita представили формат Digital Compact Cassette с применением сжатия MPEG1 layer 1
  • В том же 1992Sony представила систему персонального аудио Min > Принцип цифровой звукозаписи методом периодической дискретизации и квантования сигнала [ править | править код ]

Принцип цифрового представления колебаний звукозаписи достаточно прост:

  • вначале нужно преобразовать аналоговый сигнал в цифровой, это осуществляет устройство — аналого-цифровой преобразователь (АЦП)
  • произвести сохранение полученных цифровых данных на носитель: магнитную ленту (DAT), жёсткий диск, оптический диск или флеш-память
  • для того чтобы прослушать сделанную запись, необходимо воспроизведение сделанной записи с носителя и обратное преобразование из цифрового сигнала в аналоговый, с помощью цифро-аналогового преобразователя (ЦАП).

Принцип действия АЦП тоже достаточно прост: аналоговый сигнал, полученный от микрофонов и электро-музыкальных инструментов, преобразовывается в цифровой. Это преобразование включает в себя следующие операции:

  1. Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
  2. Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени — отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения.
  3. Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин — уровней квантования.
  4. Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.

Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для качественной записи звука в полосе частот 20-20 000 Гц применяется минимальная стандартная частота дискретизации от 44,1 кГц и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192,3 и даже 384,6 кГц). Для получения довольно качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.

Помехоустойчивое и канальное кодирование [ править | править код ]

Помехоустойчивое кодирование позволяет при воспроизведении сигнала выявить и устранить (или снизить частоту их появления) ошибки чтения с носителя. Для этого в процессе записи к отсчётам, полученным на выходе АЦП, добавляется искусственная избыточность (контрольные биты), которая впоследствии помогает восстановить повреждённый отсчёт. В устройствах записи звука обычно используется комбинация из двух или трех помехоустойчивых кодов. Если же выбранный уровень избыточности кодирования не позволяет восстановить правильное значение отсчёта, то производится его замена с помощью интерполяции, чтобы исключить появление скачкообразного изменения уровня сигнала (щелчка).

Для лучшей защиты от пакетных ошибок, вызванных повреждениями носителя информации (царапины на компакт-диске, загибы магнитной ленты) также применяется перемежение.

К полезному сигналу также добавляются вспомогательные данные, которые облегчают последующее декодирование. Это могут быть сигналы временного кода, служебные сигналы, сигналы синхронизации.

Канальное кодирование служит для согласования цифровых сигналов с параметрами канала передачи (записи/воспроизведения). Например, при записи цифровых сигналов на магнитный носитель необходимо исключить появление в токе записи постоянной составляющей и низкочастотных составляющих спектра (возникающих при появлении длинных последовательностей нулей или единиц). Для этого используются таблицы преобразования, по которым производится замена слов из m бит данных на слова из n канальных бит, причем всегда n > m. В устройствах воспроизведения цифровых сигналов канальный декодер выделяет из общего потока данных тактовые сигналы и выполняет обратное преобразование канальных n-битных слов в m-битные слова данных. После коррекции ошибок сигнал поступает в ЦАП.

Принцип действия ЦАП [ править | править код ]

Цифровой сигнал, полученный с декодера, преобразовывается в аналоговый. Это преобразование происходит следующим образом:

  1. Декодер ЦАП преобразует последовательность чисел в дискретный квантованный сигнал
  2. Путём сглаживания во временной области из дискретных отсчетов вырабатывается непрерывный во времени сигнал
  3. Окончательное восстановление сигнала производится путём подавления побочных спектров в аналоговом фильтре нижних частот

Методы цифровой звукозаписи [ править | править код ]

По принципу записи выделяют следующие методы:

  • Магнитная звукозапись — запись цифровых сигналов производится на магнитную ленту. Выделяют два типа записи:
  • продольно-строчная система записи — в которой лента движется вдоль блока неподвижных магнитных головок записи/воспроизведения (DASH,DCC)
  • наклонно-строчная система записи — в которой лента движется вдоль барабана вращающихся магнитных головок и запись осуществляется наклонно отдельными дорожками, что обеспечивает бо́льшую плотность, по сравнению с продольно-строчной системой записи. (R-DAT, ADAT, а также ранние системы, состоящие из ИКМ-приставки и видеомагнитофона)
  • Магнитооптическая запись — запись ведется с помощью магнитной головки на специальный магнитооптический слой и в момент намагничивания кратковременно разогревается лазером до температуры точки Кюри. (Минидиск,Hi-MD)
  • Лазерная запись — запись производится лазерным лучом, который выжигает углубления (питы) на светочувствительном слое оптического носителя. (Компакт-диск, DVD-Audio, DTS, SACD)
  • Оптическая (фотографическая) запись звука — основана на воздействии светового потока на светочувствительный слой носителя (киноленты). (Dolby Digital, SDDS)
  • Запись звука на электронные носители — звуковые данные при помощи персонального компьютера записываются в виде файлов на различные носители (жесткие диски, перезаписываемые оптические диски, флеш-карты, твердотельные накопители), при этом отсутствует ограничение на обязательное соответствие формата звука формату носителя.
  • Читайте также:  Требуется активация айпад что делать

    На цифровых носителях и в персональных компьютерах для хранения звука (музыки, голоса и т. п.) применяются различные форматы, позволяющие выбрать приемлемое соотношение сжатия, качества звука и объёма данных.

    Популярные форматы файлов для персональных компьютеров и соответствующих устройств:

    Параметры, влияющие на качество цифровой звукозаписи [ править | править код ]

    Основными параметрами, влияющими на качество цифровой звукозаписи, являются:

    Также немаловажными остаются параметры аналогового тракта цифровых устройств звукозаписи и звуковоспроизведения:

    Техника цифровой звукозаписи [ править | править код ]

    Запись цифрового звука в настоящее время осуществляется на студиях звукозаписи, под управлением персональных компьютеров и другой дорогостоящей и качественной аппаратуры. Также довольно широко развито понятие «домашней студии», в которой применяется профессиональное и полупрофессиональное звукозаписывающее оборудование, позволяющее создавать качественные записи в домашних условиях.

    Применяются звуковые карты в составе компьютеров, которые производят обработку в своих АЦП и ЦАП — чаще всего в 24 битах и 96 кГц, дальнейшее повышение битности и частоты дискретизации, практически не увеличивает качества записи.

    Существует целый класс компьютерных программ — звуковых редакторов, которые позволяют работать со звуком:

    • записывать входящий звуковой поток
    • создавать (генерировать) звук
    • изменять существующую запись (добавлять семплы, изменять тембр, скорость звука, вырезать части и т. п.)
    • перезаписывать из одного формата в другой
    • конвертировать разные аудиокодеки

    Некоторые простые программы, позволяют осуществлять только конвертацию форматов и кодеков.

    В основе кодирования звука с использованием ПК лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Качество воспроизведения закодированного звука зависит от частоты дискретизации и её разрешения (глубины кодирования звука — количество уровней) [1] .

    Содержание

    Принципы оцифровки звука [ править | править код ]

    Цифровой звук — это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды [2] .

    Оцифровка звука — технология поделенным временным шагом и последующей записи полученных значений в численном виде [2] .
    Другое название оцифровки звука — аналогово-цифровое преобразование звука.

    Оцифровка звука включает в себя два процесса:

    • процесс дискретизации (осуществление выборки) сигнала по времени
    • процесс квантования по амплитуде.

    Дискретизация по времени [ править | править код ]

    Процесс дискретизации по времени — процесс получения значений сигнала, который преобразуется с определенным временным шагом — шагом дискретизации . Количество замеров величины сигнала, осуществляемых в единицу времени, называют частотой дискретизации или частотой выборки, или частотой семплирования (от англ. « sampling» — «выборка»). Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале нами будет получено.
    Это подтверждается теоремой Котельникова (в зарубежной литературе встречается как теорема Шеннона, Shannon). Согласно ей, аналоговый сигнал с ограниченным спектром точно описуем дискретной последовательностью значений его амплитуды, если эти значения берутся с частотой, как минимум вдвое превышающей наивысшую частоту спектра сигнала. То есть, аналоговый сигнал, в котором находится частота спектра равная Fm, может быть точно представлен последовательностью дискретных значений амплитуды, если для частоты дискретизации Fd выполняется: Fd>2Fm.
    На практике это означает, что для того, чтобы оцифрованный сигнал содержал информацию о всем диапазоне слышимых частот исходного аналогового сигнала (20 Гц — 20 кГц) необходимо, чтобы выбранное значение частоты дискретизации составляло не менее 40 кГц. Количество замеров амплитуды в секунду называют частотой дискретизации (в случае, если шаг дискретизации постоянен).
    Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью (хотя исходя из теоремы Шенона и Котельникова это возможно)

    Линейное (однородное) квантование амплитуды [ править | править код ]

    Отведём для записи одного значения амплитуды сигнала в памяти компьютера N бит. Значит, с помощью одного N -битного слова можно описать 2 N разных положений. Пусть амплитуда оцифровываемого сигнала колеблется в пределах от −1 до 1 некоторых условных единиц. Представим этот диапазон изменения амплитуды — динамический диапазон сигнала — в виде 2 N −1 равных промежутков, разделив его на 2 N уровней — квантов. Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс носит название квантования по амплитуде. Квантование по амплитуде — процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Если амплитудная шкала разбита на уровни линейно, квантование называют линейным (однородным).
    Точность округления зависит от выбранного количества (2 N ) уровней квантования, которое, в свою очередь, зависит от количества бит (N), отведенных для записи значения амплитуды. Число N называют разрядностью квантования (подразумевая количество разрядов, то есть бит, в каждом слове), а полученные в результате округления значений амплитуды числа — отсчетами или семплами (от англ. « sample» — «замер»). Принимается, что погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными. Этот способ оцифровки сигнала — дискретизация сигнала во времени в совокупности с методом однородного квантования — называется импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation — PCM).
    Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM (Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.

    Другие способы оцифровки [ править | править код ]

    • Способ неоднородного квантования предусматривает разбиение амплитудной шкалы на уровни по логарифмическому закону. Такой способ квантования называют логарифмическим квантованием. При использовании логарифмической амплитудной шкалы, в области слабой амплитуды оказывается большее число уровней квантования, чем в области сильной амплитуды (при этом, общее число уровней квантования остается таким же, как и в случае однородного квантования). Аналогово-цифровое преобразование, основанное на применении метода неоднородного квантования, называется неоднородной импульсно-кодовой модуляцией — неоднородной ИКМ (Nonuniform PCM).
    • Альтернативным способом аналогово-цифрового преобразования является разностная импульсно-кодовая модуляция — разностная ИКМ (англ. « Differential PCM») — в случае разностной ИКМ квантованию подвергают не саму амплитуду, а относительные значения величины амплитуды. В полной аналогии с ИКМ, разностная ИКМ может сочетаться с использованием как однородного, так и неоднородного методов квантования. Разностное кодирование имеет много разных вариантов [3] .

    Аналогово-цифровые преобразователи (АЦП) [ править | править код ]

    Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП).
    Это преобразование включает в себя следующие операции:

    1. Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
    2. Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени — отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения.
    3. Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин — уровней квантования.
    4. Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.

    Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для записи звука в полосе частот 20-20 000 Гц, требуется частота дискретизации от 44,1 и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192 и даже 384 кГц). Для получения качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.

    Кодирование оцифрованного звука перед его записью на носитель [ править | править код ]

    Для хранения цифрового звука существует много различных способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.

    • Блок оцифрованной аудио информации можно записать в файл без изменений, то есть последовательностью чисел – значений амплитуды. В этом случае существуют два способа хранения информации.
    • Первый – PCM (Pulse Code Modulation – импульсно-кодовая модуляция) – способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. (В таком виде записаны данные на всех аудио CD.)
    • Второй – ADPCM (Adaptive Delta PCM – адаптивная относительная импульсно-кодовая модуляция) – запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).
    Читайте также:  Что дают лайки в интернете
  • Можно сжать данные так, чтобы они занимали меньший объем памяти, нежели в исходном состоянии. Тут тоже есть два способа.
    • Кодирование данных без потерь (lossless coding) – способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К нему прибегают в тех случаях, когда сохранение оригинального качества данных особо значимо. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия.
    • Кодирование данных с потерями (lossy coding). Здесь цель – добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем размере сжатого файла. Это достигается путём использования алгоритмов, «упрощающих» оригинальный сигнал (удаляющих из него «несущественные», неразличимые на слух детали). Это приводит к тому, что декодированный сигнал перестает быть идентичным оригиналу, а является лишь «похоже звучащим». Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). В основе всех lossy-кодеров лежит использование так называемой психоакустической модели. Она занимается этим самым «упрощением» оригинального сигнала. Степень сжатия оригинального сигнала зависит от степени его «упрощения» – сильное сжатие достигается путём «воинственного упрощения» (когда кодером игнорируются множественные нюансы). Такое сжатие приводит к сильной потере качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания [4] .
    • Терминология [ править | править код ]

      • кодер – программа (или устройство), реализующая определенный алгоритм кодирования данных (например, архиватор, или кодер MP 3), которая в качестве ввода принимает исходную информацию, а в качестве вывода возвращает закодированную информацию в определенном формате.
      • декодер – программа (или устройство), реализующая обратное преобразование закодированного сигнала в декодированный.
      • кодек (от англ. « codec » – « Coder / Decoder ») – программный или аппаратный блок, предназначенный для кодирования/декодирования данных.

      Наиболее распространённые кодеки [ править | править код ]

      • MP3 – MPEG-1 Layer 3
      • ОGG – Ogg Vorbis
      • WMA – Windows Media Audio
      • MPC – MusePack
      • AAC – MPEG-2/4 AAC (Advanced Audio Coding)
      • Стандарт MPEG-2 AAC
      • Стандарт MPEG-4 AAC

      Некоторые форматы оцифровки звука в сравнении [ править | править код ]

      12:1 с потерями

      3:1 с потерями

      11:1 с потерями

      Название формата Квантование, бит Частота дискретизации, кГц Число каналов Величина потока данных с диска, кбит/с Степень сжатия/упаковки
      CD 16 44,1 2 1411,2 1:1 без потерь
      Dolby Digital (AC3) 16-24 48 6 до 640
      DTS 20-24 48; 96 до 8 до 1536
      DVD-Audio 16; 20; 24 44,1; 48; 88,2; 96 6 6912 2:1 без потерь
      DVD-Audio 16; 20; 24 176,4; 192 2 4608 2:1 без потерь
      MP3 плавающий до 48 2 до 320
      AAC плавающий до 96 до 48 до 529 с потерями
      AAC+ (SBR) плавающий до 48 2 до 320 с потерями
      Ogg Vorbis до 32 до 192 до 255 до 1000 с потерями
      WMA до 24 до 96 до 8 до 768 2:1, есть версия без потерь

      Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя [ править | править код ]

      Помехоустойчивое и канальное кодирование [ править | править код ]

      Помехоустойчивое кодирование позволяет при воспроизведении сигнала выявить и устранить (или снизить частоту их появления) ошибки чтения с носителя. Для этого при записи к сигналу, полученному на выходе АЦП, добавляется искусственная избыточность (контрольный бит), которая впоследствии помогает восстановить поврежденный отсчет. В устройствах записи звука обычно используется комбинация из двух или трех помехоустойчивых кодов. Для лучшей защиты от пакетных ошибок также применяется перемежение. Канальное кодирование служит для согласования цифровых сигналов с параметрами канала передачи (записи/воспроизведения). К полезному сигналу добавляются вспомогательные данные, которые облегчают последующее декодирование. Это могут быть сигналы временного кода, служебные сигналы, сигналы синхронизации. В устройствах воспроизведения цифровых сигналов канальный декодер выделяет из общего потока данных тактовые сигналы и преобразует поступивший канальный сигнал в цифровой поток данных. После коррекции ошибок сигнал поступает в ЦАП.

      Принцип действия ЦАП [ править | править код ]

      Цифровой сигнал, полученный с декодера, преобразовывается в аналоговый. Это преобразование происходит следующим образом:

      1. Декодер ЦАП преобразует последовательность чисел в дискретный квантованный сигнал
      2. Путём сглаживания во временной области из дискретных отсчетов вырабатывается непрерывный во времени сигнал
      3. Окончательное восстановление сигнала производится путём подавления побочных спектров в аналоговом фильтре нижних частот

      Параметры, влияющие на качество звука при его прохождении по полному циклу [ править | править код ]

      Основными параметрами, влияющими на качество звука при этом являются:

      Также немаловажными остаются параметры аналогового тракта цифровых устройств кодирования и декодирования:

      В основе кодирования звука с использованием ПК лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Качество воспроизведения закодированного звука зависит от частоты дискретизации и её разрешения (глубины кодирования звука — количество уровней) [1] .

      Содержание

      Принципы оцифровки звука [ править | править код ]

      Цифровой звук — это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды [2] .

      Оцифровка звука — технология поделенным временным шагом и последующей записи полученных значений в численном виде [2] .
      Другое название оцифровки звука — аналогово-цифровое преобразование звука.

      Оцифровка звука включает в себя два процесса:

      • процесс дискретизации (осуществление выборки) сигнала по времени
      • процесс квантования по амплитуде.

      Дискретизация по времени [ править | править код ]

      Процесс дискретизации по времени — процесс получения значений сигнала, который преобразуется с определенным временным шагом — шагом дискретизации . Количество замеров величины сигнала, осуществляемых в единицу времени, называют частотой дискретизации или частотой выборки, или частотой семплирования (от англ. « sampling» — «выборка»). Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале нами будет получено.
      Это подтверждается теоремой Котельникова (в зарубежной литературе встречается как теорема Шеннона, Shannon). Согласно ей, аналоговый сигнал с ограниченным спектром точно описуем дискретной последовательностью значений его амплитуды, если эти значения берутся с частотой, как минимум вдвое превышающей наивысшую частоту спектра сигнала. То есть, аналоговый сигнал, в котором находится частота спектра равная Fm, может быть точно представлен последовательностью дискретных значений амплитуды, если для частоты дискретизации Fd выполняется: Fd>2Fm.
      На практике это означает, что для того, чтобы оцифрованный сигнал содержал информацию о всем диапазоне слышимых частот исходного аналогового сигнала (20 Гц — 20 кГц) необходимо, чтобы выбранное значение частоты дискретизации составляло не менее 40 кГц. Количество замеров амплитуды в секунду называют частотой дискретизации (в случае, если шаг дискретизации постоянен).
      Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью (хотя исходя из теоремы Шенона и Котельникова это возможно)

      Линейное (однородное) квантование амплитуды [ править | править код ]

      Отведём для записи одного значения амплитуды сигнала в памяти компьютера N бит. Значит, с помощью одного N -битного слова можно описать 2 N разных положений. Пусть амплитуда оцифровываемого сигнала колеблется в пределах от −1 до 1 некоторых условных единиц. Представим этот диапазон изменения амплитуды — динамический диапазон сигнала — в виде 2 N −1 равных промежутков, разделив его на 2 N уровней — квантов. Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс носит название квантования по амплитуде. Квантование по амплитуде — процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Если амплитудная шкала разбита на уровни линейно, квантование называют линейным (однородным).
      Точность округления зависит от выбранного количества (2 N ) уровней квантования, которое, в свою очередь, зависит от количества бит (N), отведенных для записи значения амплитуды. Число N называют разрядностью квантования (подразумевая количество разрядов, то есть бит, в каждом слове), а полученные в результате округления значений амплитуды числа — отсчетами или семплами (от англ. « sample» — «замер»). Принимается, что погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными. Этот способ оцифровки сигнала — дискретизация сигнала во времени в совокупности с методом однородного квантования — называется импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation — PCM).
      Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM (Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.

      Читайте также:  Является ли велосипед источником повышенной опасности

      Другие способы оцифровки [ править | править код ]

      • Способ неоднородного квантования предусматривает разбиение амплитудной шкалы на уровни по логарифмическому закону. Такой способ квантования называют логарифмическим квантованием. При использовании логарифмической амплитудной шкалы, в области слабой амплитуды оказывается большее число уровней квантования, чем в области сильной амплитуды (при этом, общее число уровней квантования остается таким же, как и в случае однородного квантования). Аналогово-цифровое преобразование, основанное на применении метода неоднородного квантования, называется неоднородной импульсно-кодовой модуляцией — неоднородной ИКМ (Nonuniform PCM).
      • Альтернативным способом аналогово-цифрового преобразования является разностная импульсно-кодовая модуляция — разностная ИКМ (англ. « Differential PCM») — в случае разностной ИКМ квантованию подвергают не саму амплитуду, а относительные значения величины амплитуды. В полной аналогии с ИКМ, разностная ИКМ может сочетаться с использованием как однородного, так и неоднородного методов квантования. Разностное кодирование имеет много разных вариантов [3] .

      Аналогово-цифровые преобразователи (АЦП) [ править | править код ]

      Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП).
      Это преобразование включает в себя следующие операции:

      1. Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
      2. Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени — отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения.
      3. Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин — уровней квантования.
      4. Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.

      Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для записи звука в полосе частот 20-20 000 Гц, требуется частота дискретизации от 44,1 и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192 и даже 384 кГц). Для получения качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.

      Кодирование оцифрованного звука перед его записью на носитель [ править | править код ]

      Для хранения цифрового звука существует много различных способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.

      • Блок оцифрованной аудио информации можно записать в файл без изменений, то есть последовательностью чисел – значений амплитуды. В этом случае существуют два способа хранения информации.
      • Первый – PCM (Pulse Code Modulation – импульсно-кодовая модуляция) – способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. (В таком виде записаны данные на всех аудио CD.)
      • Второй – ADPCM (Adaptive Delta PCM – адаптивная относительная импульсно-кодовая модуляция) – запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).
    • Можно сжать данные так, чтобы они занимали меньший объем памяти, нежели в исходном состоянии. Тут тоже есть два способа.
      • Кодирование данных без потерь (lossless coding) – способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К нему прибегают в тех случаях, когда сохранение оригинального качества данных особо значимо. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия.
      • Кодирование данных с потерями (lossy coding). Здесь цель – добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем размере сжатого файла. Это достигается путём использования алгоритмов, «упрощающих» оригинальный сигнал (удаляющих из него «несущественные», неразличимые на слух детали). Это приводит к тому, что декодированный сигнал перестает быть идентичным оригиналу, а является лишь «похоже звучащим». Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). В основе всех lossy-кодеров лежит использование так называемой психоакустической модели. Она занимается этим самым «упрощением» оригинального сигнала. Степень сжатия оригинального сигнала зависит от степени его «упрощения» – сильное сжатие достигается путём «воинственного упрощения» (когда кодером игнорируются множественные нюансы). Такое сжатие приводит к сильной потере качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания [4] .
      • Терминология [ править | править код ]

        • кодер – программа (или устройство), реализующая определенный алгоритм кодирования данных (например, архиватор, или кодер MP 3), которая в качестве ввода принимает исходную информацию, а в качестве вывода возвращает закодированную информацию в определенном формате.
        • декодер – программа (или устройство), реализующая обратное преобразование закодированного сигнала в декодированный.
        • кодек (от англ. « codec » – « Coder / Decoder ») – программный или аппаратный блок, предназначенный для кодирования/декодирования данных.

        Наиболее распространённые кодеки [ править | править код ]

        • MP3 – MPEG-1 Layer 3
        • ОGG – Ogg Vorbis
        • WMA – Windows Media Audio
        • MPC – MusePack
        • AAC – MPEG-2/4 AAC (Advanced Audio Coding)
        • Стандарт MPEG-2 AAC
        • Стандарт MPEG-4 AAC

        Некоторые форматы оцифровки звука в сравнении [ править | править код ]

        12:1 с потерями

        3:1 с потерями

        11:1 с потерями

        Название формата Квантование, бит Частота дискретизации, кГц Число каналов Величина потока данных с диска, кбит/с Степень сжатия/упаковки
        CD 16 44,1 2 1411,2 1:1 без потерь
        Dolby Digital (AC3) 16-24 48 6 до 640
        DTS 20-24 48; 96 до 8 до 1536
        DVD-Audio 16; 20; 24 44,1; 48; 88,2; 96 6 6912 2:1 без потерь
        DVD-Audio 16; 20; 24 176,4; 192 2 4608 2:1 без потерь
        MP3 плавающий до 48 2 до 320
        AAC плавающий до 96 до 48 до 529 с потерями
        AAC+ (SBR) плавающий до 48 2 до 320 с потерями
        Ogg Vorbis до 32 до 192 до 255 до 1000 с потерями
        WMA до 24 до 96 до 8 до 768 2:1, есть версия без потерь

        Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя [ править | править код ]

        Помехоустойчивое и канальное кодирование [ править | править код ]

        Помехоустойчивое кодирование позволяет при воспроизведении сигнала выявить и устранить (или снизить частоту их появления) ошибки чтения с носителя. Для этого при записи к сигналу, полученному на выходе АЦП, добавляется искусственная избыточность (контрольный бит), которая впоследствии помогает восстановить поврежденный отсчет. В устройствах записи звука обычно используется комбинация из двух или трех помехоустойчивых кодов. Для лучшей защиты от пакетных ошибок также применяется перемежение. Канальное кодирование служит для согласования цифровых сигналов с параметрами канала передачи (записи/воспроизведения). К полезному сигналу добавляются вспомогательные данные, которые облегчают последующее декодирование. Это могут быть сигналы временного кода, служебные сигналы, сигналы синхронизации. В устройствах воспроизведения цифровых сигналов канальный декодер выделяет из общего потока данных тактовые сигналы и преобразует поступивший канальный сигнал в цифровой поток данных. После коррекции ошибок сигнал поступает в ЦАП.

        Принцип действия ЦАП [ править | править код ]

        Цифровой сигнал, полученный с декодера, преобразовывается в аналоговый. Это преобразование происходит следующим образом:

        1. Декодер ЦАП преобразует последовательность чисел в дискретный квантованный сигнал
        2. Путём сглаживания во временной области из дискретных отсчетов вырабатывается непрерывный во времени сигнал
        3. Окончательное восстановление сигнала производится путём подавления побочных спектров в аналоговом фильтре нижних частот

        Параметры, влияющие на качество звука при его прохождении по полному циклу [ править | править код ]

        Основными параметрами, влияющими на качество звука при этом являются:

        Также немаловажными остаются параметры аналогового тракта цифровых устройств кодирования и декодирования:

        Комментировать
        0 просмотров
        Комментариев нет, будьте первым кто его оставит

        Это интересно
        Adblock detector