No Image

Что такое звуковые данные

СОДЕРЖАНИЕ
0 просмотров
22 января 2020

С начала 90-х годов персональные компьютеры получили возможность работать со звуком. Каждый компьютер, имеющий звуковую плату (аудиоадаптер), микрофон и колонки, может записывать, сохранять и воспроизводить звуковые данные с помощью специальных программных средств (редакторов аудиофайлов).

Метод FM (Frequency Modulation). Звуковой сигнал – это непрерывная волна с изменяющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. В процессе кодирования фонограммы, непрерывная звуковая волна разбивается по времени на отдельные маленькие временные участки (элементарные звуки). Для каждого участка устанавливается определенная величина амплитуды, каждому значению амплитуды присваивается двоичный код. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени.

Аудиоадаптер (звуковая плата) – специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера: частотой дискретизации и разрядностью.

Частота дискретизации – это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц).

Разрядность регистра – число бит в регистре аудиоадаптера. Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 = 65536) различных значений.

При таких преобразованиях неизбежны потери информации, связанные с кодированием, вместе с тем этот метод обеспечивает весьма компактный код.

Метод таблично-волнового синтеза (Wave-Table) лучше соответствует современному уровню развития техники. В заранее подготовленных таблицах хранятся образцы звуков для множества различных музыкальных инструментов. Такие образцы называются сэмплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры среды, в которой происходит звучание, а также и другие параметры, характеризующие особенности звучания. Так как в качестве образцов используются реальные звуки, качество звука получается высоким близким к звучанию реальных музыкальных инструментов.

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: Только сон приблежает студента к концу лекции. А чужой храп его отдаляет. 8959 – | 7624 – или читать все.

В основе кодирования звука с использованием ПК лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Качество воспроизведения закодированного звука зависит от частоты дискретизации и её разрешения (глубины кодирования звука — количество уровней) [1] .

Содержание

Принципы оцифровки звука [ править | править код ]

Цифровой звук — это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды [2] .

Оцифровка звука — технология поделенным временным шагом и последующей записи полученных значений в численном виде [2] .
Другое название оцифровки звука — аналогово-цифровое преобразование звука.

Оцифровка звука включает в себя два процесса:

  • процесс дискретизации (осуществление выборки) сигнала по времени
  • процесс квантования по амплитуде.

Дискретизация по времени [ править | править код ]

Процесс дискретизации по времени — процесс получения значений сигнала, который преобразуется с определенным временным шагом — шагом дискретизации . Количество замеров величины сигнала, осуществляемых в единицу времени, называют частотой дискретизации или частотой выборки, или частотой семплирования (от англ. « sampling» — «выборка»). Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале нами будет получено.
Это подтверждается теоремой Котельникова (в зарубежной литературе встречается как теорема Шеннона, Shannon). Согласно ей, аналоговый сигнал с ограниченным спектром точно описуем дискретной последовательностью значений его амплитуды, если эти значения берутся с частотой, как минимум вдвое превышающей наивысшую частоту спектра сигнала. То есть, аналоговый сигнал, в котором находится частота спектра равная Fm, может быть точно представлен последовательностью дискретных значений амплитуды, если для частоты дискретизации Fd выполняется: Fd>2Fm.
На практике это означает, что для того, чтобы оцифрованный сигнал содержал информацию о всем диапазоне слышимых частот исходного аналогового сигнала (20 Гц — 20 кГц) необходимо, чтобы выбранное значение частоты дискретизации составляло не менее 40 кГц. Количество замеров амплитуды в секунду называют частотой дискретизации (в случае, если шаг дискретизации постоянен).
Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью (хотя исходя из теоремы Шенона и Котельникова это возможно)

Линейное (однородное) квантование амплитуды [ править | править код ]

Отведём для записи одного значения амплитуды сигнала в памяти компьютера N бит. Значит, с помощью одного N -битного слова можно описать 2 N разных положений. Пусть амплитуда оцифровываемого сигнала колеблется в пределах от −1 до 1 некоторых условных единиц. Представим этот диапазон изменения амплитуды — динамический диапазон сигнала — в виде 2 N −1 равных промежутков, разделив его на 2 N уровней — квантов. Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс носит название квантования по амплитуде. Квантование по амплитуде — процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Если амплитудная шкала разбита на уровни линейно, квантование называют линейным (однородным).
Точность округления зависит от выбранного количества (2 N ) уровней квантования, которое, в свою очередь, зависит от количества бит (N), отведенных для записи значения амплитуды. Число N называют разрядностью квантования (подразумевая количество разрядов, то есть бит, в каждом слове), а полученные в результате округления значений амплитуды числа — отсчетами или семплами (от англ. « sample» — «замер»). Принимается, что погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными. Этот способ оцифровки сигнала — дискретизация сигнала во времени в совокупности с методом однородного квантования — называется импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation — PCM).
Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM (Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.

Другие способы оцифровки [ править | править код ]

  • Способ неоднородного квантования предусматривает разбиение амплитудной шкалы на уровни по логарифмическому закону. Такой способ квантования называют логарифмическим квантованием. При использовании логарифмической амплитудной шкалы, в области слабой амплитуды оказывается большее число уровней квантования, чем в области сильной амплитуды (при этом, общее число уровней квантования остается таким же, как и в случае однородного квантования). Аналогово-цифровое преобразование, основанное на применении метода неоднородного квантования, называется неоднородной импульсно-кодовой модуляцией — неоднородной ИКМ (Nonuniform PCM).
  • Альтернативным способом аналогово-цифрового преобразования является разностная импульсно-кодовая модуляция — разностная ИКМ (англ. « Differential PCM») — в случае разностной ИКМ квантованию подвергают не саму амплитуду, а относительные значения величины амплитуды. В полной аналогии с ИКМ, разностная ИКМ может сочетаться с использованием как однородного, так и неоднородного методов квантования. Разностное кодирование имеет много разных вариантов [3] .

Аналогово-цифровые преобразователи (АЦП) [ править | править код ]

Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП).
Это преобразование включает в себя следующие операции:

  1. Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
  2. Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени — отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения.
  3. Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин — уровней квантования.
  4. Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.
Читайте также:  Списание компьютеров с баланса

Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для записи звука в полосе частот 20-20 000 Гц, требуется частота дискретизации от 44,1 и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192 и даже 384 кГц). Для получения качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.

Кодирование оцифрованного звука перед его записью на носитель [ править | править код ]

Для хранения цифрового звука существует много различных способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.

  • Блок оцифрованной аудио информации можно записать в файл без изменений, то есть последовательностью чисел – значений амплитуды. В этом случае существуют два способа хранения информации.
  • Первый – PCM (Pulse Code Modulation – импульсно-кодовая модуляция) – способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. (В таком виде записаны данные на всех аудио CD.)
  • Второй – ADPCM (Adaptive Delta PCM – адаптивная относительная импульсно-кодовая модуляция) – запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).
  • Можно сжать данные так, чтобы они занимали меньший объем памяти, нежели в исходном состоянии. Тут тоже есть два способа.
    • Кодирование данных без потерь (lossless coding) – способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К нему прибегают в тех случаях, когда сохранение оригинального качества данных особо значимо. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия.
    • Кодирование данных с потерями (lossy coding). Здесь цель – добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем размере сжатого файла. Это достигается путём использования алгоритмов, «упрощающих» оригинальный сигнал (удаляющих из него «несущественные», неразличимые на слух детали). Это приводит к тому, что декодированный сигнал перестает быть идентичным оригиналу, а является лишь «похоже звучащим». Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). В основе всех lossy-кодеров лежит использование так называемой психоакустической модели. Она занимается этим самым «упрощением» оригинального сигнала. Степень сжатия оригинального сигнала зависит от степени его «упрощения» – сильное сжатие достигается путём «воинственного упрощения» (когда кодером игнорируются множественные нюансы). Такое сжатие приводит к сильной потере качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания [4] .
    • Терминология [ править | править код ]

      • кодер – программа (или устройство), реализующая определенный алгоритм кодирования данных (например, архиватор, или кодер MP 3), которая в качестве ввода принимает исходную информацию, а в качестве вывода возвращает закодированную информацию в определенном формате.
      • декодер – программа (или устройство), реализующая обратное преобразование закодированного сигнала в декодированный.
      • кодек (от англ. « codec » – « Coder / Decoder ») – программный или аппаратный блок, предназначенный для кодирования/декодирования данных.

      Наиболее распространённые кодеки [ править | править код ]

      • MP3 – MPEG-1 Layer 3
      • ОGG – Ogg Vorbis
      • WMA – Windows Media Audio
      • MPC – MusePack
      • AAC – MPEG-2/4 AAC (Advanced Audio Coding)
      • Стандарт MPEG-2 AAC
      • Стандарт MPEG-4 AAC

      Некоторые форматы оцифровки звука в сравнении [ править | править код ]

      12:1 с потерями

      3:1 с потерями

      11:1 с потерями

      Название формата Квантование, бит Частота дискретизации, кГц Число каналов Величина потока данных с диска, кбит/с Степень сжатия/упаковки
      CD 16 44,1 2 1411,2 1:1 без потерь
      Dolby Digital (AC3) 16-24 48 6 до 640
      DTS 20-24 48; 96 до 8 до 1536
      DVD-Audio 16; 20; 24 44,1; 48; 88,2; 96 6 6912 2:1 без потерь
      DVD-Audio 16; 20; 24 176,4; 192 2 4608 2:1 без потерь
      MP3 плавающий до 48 2 до 320
      AAC плавающий до 96 до 48 до 529 с потерями
      AAC+ (SBR) плавающий до 48 2 до 320 с потерями
      Ogg Vorbis до 32 до 192 до 255 до 1000 с потерями
      WMA до 24 до 96 до 8 до 768 2:1, есть версия без потерь

      Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя [ править | править код ]

      Помехоустойчивое и канальное кодирование [ править | править код ]

      Помехоустойчивое кодирование позволяет при воспроизведении сигнала выявить и устранить (или снизить частоту их появления) ошибки чтения с носителя. Для этого при записи к сигналу, полученному на выходе АЦП, добавляется искусственная избыточность (контрольный бит), которая впоследствии помогает восстановить поврежденный отсчет. В устройствах записи звука обычно используется комбинация из двух или трех помехоустойчивых кодов. Для лучшей защиты от пакетных ошибок также применяется перемежение. Канальное кодирование служит для согласования цифровых сигналов с параметрами канала передачи (записи/воспроизведения). К полезному сигналу добавляются вспомогательные данные, которые облегчают последующее декодирование. Это могут быть сигналы временного кода, служебные сигналы, сигналы синхронизации. В устройствах воспроизведения цифровых сигналов канальный декодер выделяет из общего потока данных тактовые сигналы и преобразует поступивший канальный сигнал в цифровой поток данных. После коррекции ошибок сигнал поступает в ЦАП.

      Принцип действия ЦАП [ править | править код ]

      Цифровой сигнал, полученный с декодера, преобразовывается в аналоговый. Это преобразование происходит следующим образом:

      1. Декодер ЦАП преобразует последовательность чисел в дискретный квантованный сигнал
      2. Путём сглаживания во временной области из дискретных отсчетов вырабатывается непрерывный во времени сигнал
      3. Окончательное восстановление сигнала производится путём подавления побочных спектров в аналоговом фильтре нижних частот

      Параметры, влияющие на качество звука при его прохождении по полному циклу [ править | править код ]

      Основными параметрами, влияющими на качество звука при этом являются:

      Также немаловажными остаются параметры аналогового тракта цифровых устройств кодирования и декодирования:

      Кодирование звуковой информации

      Компьютер работает с цифровой информацией, которую можно представить в виде серии электрических импульсов – логических нулей и единиц. Но тот звук, который мы слышим,непрерывен. Эта звуковая волна с меняющейся амплитудой и частотой является аналоговым сигналом. Чтобы записать такой звук на диск компьютера его надо преобразовать в цифровую форму. Этим занимается аналого-цифровой преобразователь (АЦП). Для воспроизведения звука, записанного в цифровом виде, цифроаналоговый преобразователь преобразовывает его в аналоговый сигнал.

      Дискретизация звука

      Непрерывная звуковая волна разбивается на отдельные участки по времени, для каждого устанавливается своя величина амплитуды. Каждой ступеньке присваивается свой уровень громкости звука, который можно рассматривать как набор возможных состояний

      Характеристики качества звука:

      1. "Глубина" кодирования звука – количество бит на один звуковой сигнал
      Современные звуковые карты обеспечивают 16-битную "глубину" кодирования звука. Количество уровней (градаций амплитуды) можно рассчитать по формуле

      N = 2I = 216 = 65 536 уровней сигнала
      (градаций амплитуды)

      2. Частота дискретизации – это количество измерений уровней сигнала за 1 секунду

      Одно измерение в 1 секунду соответствует частоте 1 Гц

      1000 измерений в 1 секунду – 1 кГц

      Количество измерений может лежать в диапазоне от 8000 до 48 000
      (8 кГц – 48 кГц)

      8 кГц соответствует частоте радиотрансляции,

      48 кГц – качеству звучания аудио- CD.

      Ухо человека воспринимает звук в диапазоне от

      20 Гц до 20 кГц.

      Опыт показывает, что точное соответствие цифрового сигнала аналоговому достигается, если частота дискретизации будет вдвое выше максимальной звуковой частоты, то есть составит не менее 40 кГц.

      На практике значения частоты дискретизации, применяемые в звуковых системах, равны 44,1 кГц или 48 кГц. Чем больше частота дискретизации, тем качественнее звук.

      Читайте также:  Способ преобразования звука в цифровую форму

      При двоичном кодировании непрерывного звукового сигнала он заменяется серией его отдельных выборок — отсчетов.

      Современные звуковые карты могут обеспечить кодирование 65536 различных уровней сигнала или состояний.

      Таким образом, современные звуковые карты обеспечивают 16-битное кодирование звука. При каждой выборке значению амплитуды звукового сигнала присваивается 16-битный код.

      Звук – это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.

      Такая запись называется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.

      РСМ
      РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко. Но РСМ является основополагающей для всех звуковых файлов.

      WAV
      Самое простое хранилище дискретных данных. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости, в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали – это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

      RIFF
      Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

      IFF
      Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga – одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

      MOD
      Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента.

      AIFили AIFF
      Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

      MID
      Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.

      МР3
      Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для "обычных немузыкальных" людей потери не ощутимы явно.

      VQF
      Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF – процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

      RA
      Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

      Ввод музыки в компьютер.

      Существует несколько способов ввода музыки в компьютер. Выбор будет зависеть от того, в каком виде она находится. Если источником музыки является цифровой музыкальный файл (формата wav или mp3), то он, как правило, вводится в компьютер штатными средствами — например, загружается из Интернета или копируется с компакт-диска (файл mp3 представляет собой сжатый примерно в 10 раз файл формата wav). Файлы формата wav являются «родными» для музыкальных компакт-дисков, они записываются с 16-разрядным сэмплированием с частотой 44 кГц; файл с одной песней обычно имеет размер от 30 до 60 МБ.

      Если источником музыки является виниловая пластинка или музыкальный инструмент/другое устройство со стереофоническим линейным выходом, то такая музыка, как правило, вводится с помощью установленной в компьютер звуковой карты. К современной звуковой карте через гнездо линейного входа можно напрямую подключить любой музыкальный инструмент (синтезатор, гитару и т.д.) или устройство воспроизведения (проигрыватель грампластинок, магнитофон и т.п.), после чего ПК может начать запись. Здесь исключительно важную роль играет размер и форма соединительных разъемов — многие современные звуковые карты высшего класса имеют входные разъемы, позволяющие подключать оптические, раздельные кабели и кабели с миништекерами. Существует множество вариантов соединений, каждый из которых обеспечивает определенный уровень качества и соответствует определенному стандарту.

      Еще одно средство ввода музыки в персональный компьютер — интерфейс MIDI. Это стандарт электронной музыки, согласно которому звуковая информация представляется в виде единиц и нулей. Обычно через интерфейс MIDI подключаются синтезаторы или отдельные клавиатуры — и тогда ПК «воспринимает» каждую сыгранную ноту как элемент цифровой информации и воспроизводит ее в виде музыки в реальном времени.

      Что такое MIDI-синтезатор? Термин «синтезатор» обычно используется применительно к электронному музыкальному инструменту, в котором звук создается и обрабатывается, меняя свою окраску и характеристики. Естественно, название этого устройства пошло от его основного предназначения – синтеза звука. Основных методов синтеза звука существует всего два: FM (Frequency modulation – частотная модуляция) и WT (Wave Table – таблично-волновой). Опишем лишь основную идею методов. В основе FM-синтеза лежит идея, что любое даже самое сложное колебание является, по сути, суммой простейших синусоидальных. Таким образом, можно наложить друг на друга сигналы от конечного числа генераторов синусоид и путем изменения частот синусоид получать звуки, похожие на настоящие. Таблично-волновой синтез основывается на другом принципе. Синтез звука при использовании такого метода достигается за счет манипуляций над заранее записанными (оцифрованными) звуками реальных музыкальных инструментов. Эти звуки (они называются сэмплами) хранятся в постоянной памяти синтезатора.

      MIDI – это общепринятая спецификация, связанная с организацией цифрового интерфейса для музыкальных устройств, включающая в себя стандарт на аппаратную и программную части.

      Эта спецификация предназначена для организации локальной сети электронных инструментов (рис. 2). К MIDI-устройствам относятся различные аппаратные и музыкальные инструменты, отвечающие требованиям MIDI. Таким образом, MIDI-синтезатор – это музыкальный инструмент, предназначенный обычно для синтеза звука и музыки, а также удовлетворяющий спецификации MIDI. Давайте разберемся кратко, почему выделен отдельный класс устройств, названный MIDI.

      Дело в том, что осуществление программной обработки звука часто сопряжено с неудобствами, обусловленными различными техническими особенностями этого процесса. Даже возложив операции по обработке звука на звуковую карту или любую другую аппаратуру, остается множество различных проблем. Во-первых, зачастую желательно пользоваться аппаратным синтезом звучания музыкальных инструментов (как минимум потому, что компьютер – это общий инструмент, часто необходим просто аппаратный синтезатор звуков и музыки, не более). Во-вторых, программная обработка звука часто сопровождается временными задержками, в то время как при концертной работе необходимо мгновенное получение обработанного сигнала. По этим и другим причинам и прибегают к использованию специальной аппаратуры для обработки, а не компьютеров со специальными программами. Однако при использовании аппаратуры возникает необходимость в едином стандарте, который позволил бы соединять устройства друг с другом и комбинировать их. Эти предпосылки и заставили в 1982 году несколько ведущих в области музыкального оборудования компаний утвердить первый MIDI-стандарт, который впоследствии получил продолжение и развивается по сей день. Что же, в конечном счете, представляет собой MIDI-интерфейс и устройства в него входящие с точки зрения персонального компьютера?

      • Аппаратно – это установленные на звуковой карте: синтезатор различных звуков и музыкальных инструментов, микропроцессор, контролирующий и управляющий работу MIDI-устройств, а также различные стандартизованные разъемы и шнуры для подключения дополнительных устройств.
      • Программно – это протокол MIDI, представляющий собой набор сообщений (команд), которые описывают различные функции системы MIDI и с помощью которых осуществляется связь (обмен информацией) между устройствами MIDI. Сообщения можно рассматривать как средство удаленного управления.
      Читайте также:  Тихий звук в играх windows 10

      Следует отметить, что в отношении синтезаторов звука MIDI устанавливает строгие требования к их возможностям, примененным в них способам синтеза звука, а также к управляющим параметрам синтеза. Кроме того, для того, чтобы музыка созданная на одном синтезаторе могла бы быть легко перенесена и успешно воспроизведена на другом, были установлены несколько стандартов на соответствие инструментов (голосов) и их параметров в различных синтезаторах: стандарт General MIDI (GM), General Synth (GS) и eXtended General (XG). Базисным стандартом является GM, остальные два являются его логическими продолжениями и расширениями.

      В качестве практического примера устройства MIDI, можно рассмотреть обычную MIDI-клавиатуру. Упрощенно, MIDI-клавиатура представляет собой укороченную клавиатуру рояля, в корпусе с которой находится MIDI-интерфейс, позволяющий подключать ее к другим MIDI-устройствам, например, к MIDI-синтезатору, который установлен в звуковой карте компьютера. Используя специальное программное обеспечение (например, MIDI-секвенсор) можно включить MIDI-синтезатор в режим игры, например, на рояле, и нажимая на клавиши MIDI-клавиатуры слышать звуки рояля. Естественно, что роялем дело не ограничивается – в стандарте GM имеются 128 мелодических инструментов и 46 ударных. Кроме того, используя MIDI-секвенсор можно записывать исполняемые на MIDI-клавиатуре ноты в компьютер, для последующего редактирования и аранжировки, либо просто для элементарной распечатки нот.

      Надо отметить, что поскольку MIDI-данные – это набор команд, то музыка, которая написана с помощью MIDI, также записывается с помощью команд синтезатора. Иными словами, MIDI-партитура – это последовательность команд: какую ноту играть, какой инструмент использовать, какова продолжительность и тональность ее звучания и так далее. Знакомые многим MIDI-файлы (.MID) есть нечто иное, как набор таких команд. Естественно, что поскольку имеется великое множество производителей MIDI-синтезаторов, то и звучать один и тот же файл может на разных синтезаторах по-разному (потому что в файле сами инструменты не хранятся, а есть лишь только указания синтезатору какими инструментами играть, в то время как разные синтезаторы могут звучать по-разному).

      Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:

      1. Амплитудные преобразования.Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

      2. Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное «сворачивание» сигнала из спектра в волну.

      3. Фазовые преобразования. Сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или «объёмности» звука.

      4. Временные преобразования.Реализуются путем наложения, растягивания/сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.

      Приведу несколько практических примеров использования указанных видов преобразований при создании реальных звуковых эффектов:

      • Echo (эхо)Реализуется с помощью временных преобразований. Фактически для получения эха необходимо на оригинальный входной сигнал наложить его задержанную во времени копию. Для того чтобы человеческое ухо воспринимало вторую копию сигнала как повторение, а не как отзвук основного сигнала, необходимо время задержки установить равным примерно 50 мс. На основной сигнал можно наложить не одну его копию, а несколько, что позволит на выходе получить эффект многократного повторения звука (многоголосного эха). Чтобы эхо казалось затухающим, необходимо на исходный сигнал накладывать не просто задержанные копии сигнала, а приглушенные по амплитуде.
      • Reverberation (повторение, отражение).Эффект заключается в придании звучанию объемности, характерной для большого зала, где каждый звук порождает соответствующий, медленно угасающий отзвук. Практически, с помощью реверберации можно «оживить», например, фонограмму, сделанную в заглушенном помещении. От эффекта «эхо» реверберация отличается тем, что на входной сигнал накладывается задержанный во времени выходной сигнал, а не задержанная копия входного.
      • Chorus (хор).В результате его применения звучание сигнала превращается как бы в звучание хора или в одновременное звучание нескольких инструментов. Схема получения такого эффекта аналогична схеме создания эффекта эха с той лишь разницей, что задержанные копии входного сигнала подвергаются слабой частотной модуляции (в среднем от 0.1 до 5 Гц) перед смешиванием с входным сигналом. Увеличение количества голосов в хоре достигается путем добавления копий сигнала с различными временами задержки.

      Практическую обработку сигналов можно разделить на два типа: обработка «на лету» и пост-обработка. Обработка «на лету» подразумевает мгновенное преобразование сигнала (то есть с возможностью осуществлять вывод обработанного сигнала почти одновременно с его вводом). Простой пример – гитарные «примочки» или реверберация во время живого исполнения на сцене. Такая обработка происходит мгновенно, то есть, скажем, исполнитель поет в микрофон, а эффект-процессор преобразует его голос и слушатель слышит уже обработанный вариант голоса. Пост-обработка – это обработка уже записанного сигнала. Скорость такой обработки может быть сильно ниже скорости воспроизведения. Такая обработка преследует те же цели, то есть придание звуку определенного характера, либо изменение характеристик, однако применяется на стадии мастеринга или подготовки звука к тиражированию, когда не требуется спешка, а важнее качество и скрупулезная проработка всех нюансов звучания. Существует множество различных операций над звуком, которые вследствие недостаточной производительности сегодняшних процессоров нельзя реализовать «на лету», поэтому такие преобразования проводят лишь в пост-режиме.

      Наиболее важный класс программ – редакторы цифрового аудио. Основные возможности таких программ это, как минимум, обеспечение возможности записи (оцифровки) аудио и сохранение на диск. Развитые представители такого рода программ позволяют намного больше: запись, многоканальное сведение аудио на нескольких виртуальных дорожках, обработка специальными эффектами очистка от шумов. Они имеют развитую навигацию и инструментарий в виде спектроскопа и прочих виртуальных приборов, управление/управляемость внешними устройствами, преобразование аудио из формата в формат, генерация сигналов, запись на компакт диски и многое другое. Некоторыеизтакихпрограмм: Cool Edit Pro
      рис.8

      Специализированные реставраторы аудио играют также немаловажную роль в обработке звука. Такие программы позволяют восстановить утерянное качество звучания аудио материала, удалить нежелательные щелчки, шумы, треск, специфические помехи записей с аудиокассет, и провести другую корректировку аудио. Программыподобногорода: Dart, Clean (отSteinberg Inc.), Audio Cleaning Lab. (от Magix Ent.), Wave Corrector.

      Основные возможности реставратора Clean 3.0 (см. рис.9 – рабочее окно программы): устранение всевозможных потрескиваний и шумов, режим автокоррекции, набор эффектов для обработки скорректированного звука, включая функцию «surround sound» с наглядным акустическим моделированием эффекта, запись CD с подготовленными данными, «интеллигентная» система подсказок, поддержка внешних VST плаг-инов и другие возможности.

      Напоследок следует упомянуть о существовании огромного количества другого аудио ПО: проигрыватели аудио (наиболее выдающиеся: WinAMP, Sonique, Apollo, XMPlay, Cubic Player), подключаемые модули для проигрывателей (из «улучшателей» звучания аудио – DFX, Enhancer, iZotop Ozone), утилиты для копирования информации с аудио CD (ExactAudioCopy, CDex, AudioGrabber), перехватчики аудио потоков (Total Recorder, AudioTools), кодеры аудио (кодеры MP3: Lame encoder, Blade Encoder Go-Go и другие; кодеры VQF: TwinVQ encoder, Yamaha SoundVQ, NTT TwinVQ; кодеры AAC: FAAC, PsyTel AAC, Quartex AAC), конвертеры аудио (для перевода аудио информации из одного формата в другой), генераторы речи и множество других специфических и общих утилит. Безусловно, все перечисленное – только малая толика из того, что может пригодиться при работе со звуком.

      Комментировать
      0 просмотров
      Комментариев нет, будьте первым кто его оставит

      Это интересно
      Adblock detector