Кодирование звуковой информации
Компьютер работает с цифровой информацией, которую можно представить в виде серии электрических импульсов - логических нулей и единиц. Но тот звук, который мы слышим,непрерывен. Эта звуковая волна с меняющейся амплитудой и частотой является аналоговым сигналом. Чтобы записать такой звук на диск компьютера его надо преобразовать в цифровую форму. Этим занимается аналого-цифровой преобразователь (АЦП). Для воспроизведения звука, записанного в цифровом виде, цифроаналоговый преобразователь преобразовывает его в аналоговый сигнал.
Непрерывная звуковая волна разбивается на отдельные участки по времени, для каждого устанавливается своя величина амплитуды. Каждой ступеньке присваивается свой уровень громкости звука, который можно рассматривать как набор возможных состояний
1. "Глубина" кодирования звука - количество бит на один звуковой сигнал
Современные звуковые карты обеспечивают 16-битную "глубину" кодирования звука. Количество уровней (градаций амплитуды) можно рассчитать по формуле
N = 2I = 216 = 65 536 уровней сигнала
(градаций амплитуды)
2. Частота дискретизации – это количество измерений уровней сигнала за 1 секунду
Одно измерение в 1 секунду соответствует частоте 1 Гц
1000 измерений в 1 секунду - 1 кГц
Количество измерений может лежать в диапазоне от 8000 до 48 000
(8 кГц – 48 кГц)
8 кГц соответствует частоте радиотрансляции,
48 кГц – качеству звучания аудио- CD.
Ухо человека воспринимает звук в диапазоне от ~20 Гц до 20 кГц.
Опыт показывает, что точное соответствие цифрового сигнала аналоговому достигается, если частота дискретизации будет вдвое выше максимальной звуковой частоты, то есть составит не менее 40 кГц.
На практике значения частоты дискретизации, применяемые в звуковых системах, равны 44,1 кГц или 48 кГц. Чем больше частота дискретизации, тем качественнее звук.
При двоичном кодировании непрерывного звукового сигнала он заменяется серией его отдельных выборок — отсчетов.
Современные звуковые карты могут обеспечить кодирование 65536 различных уровней сигнала или состояний.
Таким образом, современные звуковые карты обеспечивают 16-битное кодирование звука. При каждой выборке значению амплитуды звукового сигнала присваивается 16-битный код.
Звук - это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.
Такая запись называется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.
РСМ
РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко. Но РСМ является основополагающей для всех звуковых файлов.
WAV
Самое простое хранилище дискретных данных. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости, в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали - это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.
RIFF
Resource Interchange File Format. Уникальная система хранения любых структурированных данных.
IFF
Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga - одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.
MOD
Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента.
AIFили AIFF
Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.
MID
Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.
МР3
Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для "обычных немузыкальных" людей потери не ощутимы явно.
VQF
Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF - процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.
RA
Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.
Ввод музыки в компьютер.
Существует несколько способов ввода музыки в компьютер. Выбор будет зависеть от того, в каком виде она находится. Если источником музыки является цифровой музыкальный файл (формата wav или mp3), то он, как правило, вводится в компьютер штатными средствами — например, загружается из Интернета или копируется с компакт-диска (файл mp3 представляет собой сжатый примерно в 10 раз файл формата wav). Файлы формата wav являются «родными» для музыкальных компакт-дисков, они записываются с 16-разрядным сэмплированием с частотой 44 кГц; файл с одной песней обычно имеет размер от 30 до 60 МБ.
Если источником музыки является виниловая пластинка или музыкальный инструмент/другое устройство со стереофоническим линейным выходом, то такая музыка, как правило, вводится с помощью установленной в компьютер звуковой карты. К современной звуковой карте через гнездо линейного входа можно напрямую подключить любой музыкальный инструмент (синтезатор, гитару и т.д.) или устройство воспроизведения (проигрыватель грампластинок, магнитофон и т.п.), после чего ПК может начать запись. Здесь исключительно важную роль играет размер и форма соединительных разъемов — многие современные звуковые карты высшего класса имеют входные разъемы, позволяющие подключать оптические, раздельные кабели и кабели с миништекерами. Существует множество вариантов соединений, каждый из которых обеспечивает определенный уровень качества и соответствует определенному стандарту.
Еще одно средство ввода музыки в персональный компьютер — интерфейс MIDI. Это стандарт электронной музыки, согласно которому звуковая информация представляется в виде единиц и нулей. Обычно через интерфейс MIDI подключаются синтезаторы или отдельные клавиатуры — и тогда ПК «воспринимает» каждую сыгранную ноту как элемент цифровой информации и воспроизводит ее в виде музыки в реальном времени.
Что такое MIDI-синтезатор? Термин «синтезатор» обычно используется применительно к электронному музыкальному инструменту, в котором звук создается и обрабатывается, меняя свою окраску и характеристики. Естественно, название этого устройства пошло от его основного предназначения – синтеза звука. Основных методов синтеза звука существует всего два: FM (Frequency modulation – частотная модуляция) и WT (Wave Table – таблично-волновой). Опишем лишь основную идею методов. В основе FM-синтеза лежит идея, что любое даже самое сложное колебание является, по сути, суммой простейших синусоидальных. Таким образом, можно наложить друг на друга сигналы от конечного числа генераторов синусоид и путем изменения частот синусоид получать звуки, похожие на настоящие. Таблично-волновой синтез основывается на другом принципе. Синтез звука при использовании такого метода достигается за счет манипуляций над заранее записанными (оцифрованными) звуками реальных музыкальных инструментов. Эти звуки (они называются сэмплами) хранятся в постоянной памяти синтезатора.
MIDI – это общепринятая спецификация, связанная с организацией цифрового интерфейса для музыкальных устройств, включающая в себя стандарт на аппаратную и программную части.
Эта спецификация предназначена для организации локальной сети электронных инструментов (рис. 2). К MIDI-устройствам относятся различные аппаратные и музыкальные инструменты, отвечающие требованиям MIDI. Таким образом, MIDI-синтезатор – это музыкальный инструмент, предназначенный обычно для синтеза звука и музыки, а также удовлетворяющий спецификации MIDI. Давайте разберемся кратко, почему выделен отдельный класс устройств, названный MIDI.
Дело в том, что осуществление программной обработки звука часто сопряжено с неудобствами, обусловленными различными техническими особенностями этого процесса. Даже возложив операции по обработке звука на звуковую карту или любую другую аппаратуру, остается множество различных проблем. Во-первых, зачастую желательно пользоваться аппаратным синтезом звучания музыкальных инструментов (как минимум потому, что компьютер – это общий инструмент, часто необходим просто аппаратный синтезатор звуков и музыки, не более). Во-вторых, программная обработка звука часто сопровождается временными задержками, в то время как при концертной работе необходимо мгновенное получение обработанного сигнала. По этим и другим причинам и прибегают к использованию специальной аппаратуры для обработки, а не компьютеров со специальными программами. Однако при использовании аппаратуры возникает необходимость в едином стандарте, который позволил бы соединять устройства друг с другом и комбинировать их. Эти предпосылки и заставили в 1982 году несколько ведущих в области музыкального оборудования компаний утвердить первый MIDI-стандарт, который впоследствии получил продолжение и развивается по сей день. Что же, в конечном счете, представляет собой MIDI-интерфейс и устройства в него входящие с точки зрения персонального компьютера?
Следует отметить, что в отношении синтезаторов звука MIDI устанавливает строгие требования к их возможностям, примененным в них способам синтеза звука, а также к управляющим параметрам синтеза. Кроме того, для того, чтобы музыка созданная на одном синтезаторе могла бы быть легко перенесена и успешно воспроизведена на другом, были установлены несколько стандартов на соответствие инструментов (голосов) и их параметров в различных синтезаторах: стандарт General MIDI (GM), General Synth (GS) и eXtended General (XG). Базисным стандартом является GM, остальные два являются его логическими продолжениями и расширениями.
В качестве практического примера устройства MIDI, можно рассмотреть обычную MIDI-клавиатуру. Упрощенно, MIDI-клавиатура представляет собой укороченную клавиатуру рояля, в корпусе с которой находится MIDI-интерфейс, позволяющий подключать ее к другим MIDI-устройствам, например, к MIDI-синтезатору, который установлен в звуковой карте компьютера. Используя специальное программное обеспечение (например, MIDI-секвенсор) можно включить MIDI-синтезатор в режим игры, например, на рояле, и нажимая на клавиши MIDI-клавиатуры слышать звуки рояля. Естественно, что роялем дело не ограничивается – в стандарте GM имеются 128 мелодических инструментов и 46 ударных. Кроме того, используя MIDI-секвенсор можно записывать исполняемые на MIDI-клавиатуре ноты в компьютер, для последующего редактирования и аранжировки, либо просто для элементарной распечатки нот.
Надо отметить, что поскольку MIDI-данные – это набор команд, то музыка, которая написана с помощью MIDI, также записывается с помощью команд синтезатора. Иными словами, MIDI-партитура – это последовательность команд: какую ноту играть, какой инструмент использовать, какова продолжительность и тональность ее звучания и так далее. Знакомые многим MIDI-файлы (.MID) есть нечто иное, как набор таких команд. Естественно, что поскольку имеется великое множество производителей MIDI-синтезаторов, то и звучать один и тот же файл может на разных синтезаторах по-разному (потому что в файле сами инструменты не хранятся, а есть лишь только указания синтезатору какими инструментами играть, в то время как разные синтезаторы могут звучать по-разному).
Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:
1. Амплитудные преобразования.Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.
2. Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное «сворачивание» сигнала из спектра в волну.
3. Фазовые преобразования. Сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или «объёмности» звука.
4. Временные преобразования.Реализуются путем наложения, растягивания/сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.
Приведу несколько практических примеров использования указанных видов преобразований при создании реальных звуковых эффектов:
Практическую обработку сигналов можно разделить на два типа: обработка «на лету» и пост-обработка. Обработка «на лету» подразумевает мгновенное преобразование сигнала (то есть с возможностью осуществлять вывод обработанного сигнала почти одновременно с его вводом). Простой пример – гитарные «примочки» или реверберация во время живого исполнения на сцене. Такая обработка происходит мгновенно, то есть, скажем, исполнитель поет в микрофон, а эффект-процессор преобразует его голос и слушатель слышит уже обработанный вариант голоса. Пост-обработка – это обработка уже записанного сигнала. Скорость такой обработки может быть сильно ниже скорости воспроизведения. Такая обработка преследует те же цели, то есть придание звуку определенного характера, либо изменение характеристик, однако применяется на стадии мастеринга или подготовки звука к тиражированию, когда не требуется спешка, а важнее качество и скрупулезная проработка всех нюансов звучания. Существует множество различных операций над звуком, которые вследствие недостаточной производительности сегодняшних процессоров нельзя реализовать «на лету», поэтому такие преобразования проводят лишь в пост-режиме.
Наиболее важный класс программ – редакторы цифрового аудио. Основные возможности таких программ это, как минимум, обеспечение возможности записи (оцифровки) аудио и сохранение на диск. Развитые представители такого рода программ позволяют намного больше: запись, многоканальное сведение аудио на нескольких виртуальных дорожках, обработка специальными эффектами очистка от шумов. Они имеют развитую навигацию и инструментарий в виде спектроскопа и прочих виртуальных приборов, управление/управляемость внешними устройствами, преобразование аудио из формата в формат, генерация сигналов, запись на компакт диски и многое другое. Некоторыеизтакихпрограмм: Cool Edit Pro
рис.8
Специализированные реставраторы аудио играют также немаловажную роль в обработке звука. Такие программы позволяют восстановить утерянное качество звучания аудио материала, удалить нежелательные щелчки, шумы, треск, специфические помехи записей с аудиокассет, и провести другую корректировку аудио. Программыподобногорода: Dart, Clean (отSteinberg Inc.), Audio Cleaning Lab. (от Magix Ent.), Wave Corrector.
Основные возможности реставратора Clean 3.0 (см. рис.9 – рабочее окно программы): устранение всевозможных потрескиваний и шумов, режим автокоррекции, набор эффектов для обработки скорректированного звука, включая функцию «surround sound» с наглядным акустическим моделированием эффекта, запись CD с подготовленными данными, «интеллигентная» система подсказок, поддержка внешних VST плаг-инов и другие возможности.
Напоследок следует упомянуть о существовании огромного количества другого аудио ПО: проигрыватели аудио (наиболее выдающиеся: WinAMP, Sonique, Apollo, XMPlay, Cubic Player), подключаемые модули для проигрывателей (из «улучшателей» звучания аудио - DFX, Enhancer, iZotop Ozone), утилиты для копирования информации с аудио CD (ExactAudioCopy, CDex, AudioGrabber), перехватчики аудио потоков (Total Recorder, AudioTools), кодеры аудио (кодеры MP3: Lame encoder, Blade Encoder Go-Go и другие; кодеры VQF: TwinVQ encoder, Yamaha SoundVQ, NTT TwinVQ; кодеры AAC: FAAC, PsyTel AAC, Quartex AAC), конвертеры аудио (для перевода аудио информации из одного формата в другой), генераторы речи и множество других специфических и общих утилит. Безусловно, все перечисленное – только малая толика из того, что может пригодиться при работе со звуком.
1.http://websound.ru/ «Цифровой звук – обо всём по порядку»
2.http://edu.internet-academy.org.ge/courses/introduction_to_speciality_2/mm-audio/audio/ «Цифровой звук»
3.http://www.music4sale.ru/id_52/ «Форматы звуковых файлов»
4. http://circ.mgpu.ru/works/65/KrasnovaOA/COD/SOUND/Sound.HTM «Кодирование звуковой информации»
[1] DSP – Digital Signal Processor(цифровой сигнальный процессор). Устройство (или программный механизм) предназначенное для цифровой обработки сигналов.
Вложение | Размер |
---|---|
presentation.ppt | 761.5 КБ |
Слайд 1
Звуковая информация: кодирование, ввод, обработка Горохова Анастасия, 9а класс МБОУ «СОШ №2»Слайд 2
Звук, который мы слышим,- это звуковая волна (аналоговый сигнал). Чтобы записать такой звук на компьютер, нужно преобразовать его в цифровую форму, что и делает аналого-цифровой преобразователь (АЦП). Для воспроизведения используется цифроаналоговый преобразователь
Слайд 3
Преобразование звука из цифрового вида в аналоговый
Слайд 4
Дискретизация звука Непрерывная звуковая волна разбивается на отдельные участки по времени, для каждого устанавливается своя величина амплитуды. Каждой ступеньке присваивается свой уровень громкости звука, который можно рассматривать как набор возможных состояний
Слайд 5
Характеристики качества звука: "Глубина" кодирования звука - количество бит на один звуковой сигнал. Частота дискретизации – это количество измерений уровней сигнала за 1 секунду. Чем больше частота дискретизации, тем качественнее звук.
Слайд 6
Основные форматы звуковых файлов WAV Простое хранилище дискретных данных. Состоит из последовательности отсчётов (дискретных выборок амплитуды сигнала). MID Файл, хранящий в себе последовательность MIDI-сообщений. МР3 Формат,позволяющий сжимать звуковые файлы без заметной потери качества
Слайд 7
Ввод музыки в компьютер. Способы ввода звука в компьютер: Оцифровка аналогового сигнала(виниловая пластинка или музыкальный инструмент) аналого-цифровым преобразователем . Через MIDI-интерфейс звуковой карты.
Слайд 8
Обработка звука Амплитудные преобразования. Частотные преобразования. Фазовые преобразования. Временные преобразования.
Слайд 9
Типы программного обеспечения для работы со звуком. Редакторы цифрового звука. Секвенсоры. Трекеры.
Слайд 10
Редакторы цифрового звука. Они обеспечивают запись(оцифровку) звука и сохранение на диск. Другие возможности: многоканальное сведение аудио; обработка специальными эффектами; очистка от шумов.
Слайд 11
Секвенсоры. Это программы для написания музыки, использующие MIDI-синтезатор. Основные возможности: создание и редактирование музыки; совмещение MIDI-дорожек с цифровыми сигналами; осуществление мастеринга.
Слайд 12
Трекеры. Это программы, похожие на секвенсоры, но отличающиеся от них тем, что проигрываемые в трекерных модулях инструменты(сэмплы) хранятся внутри файлов.
Рисуем пшеничное поле гуашью
Золотая хохлома
Шелковая горка
Рисуем ананас акварелью
Три загадки Солнца