Компьютерная обработка звука
Шрифт:
Когда вы перемещаете курсор по спектрограмме, в поле рядом с ним отображаются значения частоты и амплитуды текущей позиции курсора на графике частотного спектра, как показано на рис. 1.85.
Если изображена сонограмма, выберите опцию Normal Display из меню Display, чтобы увидеть спектрограмму.
При открытом окне анализатора спектра можно выделять часть звуковой волны, перемещая курсор или любым другим способом, какой допустим в Sound Forge. Выбрав команду Update! (Обновить) из меню анализатора спектра, вы тем самым отобразите спектр текущего выделения в звуковом файле. Если часть звуковой волны не выделена, анализу подвергаются выборки, непосредственно следующие за позицией курсора.
Чтобы видеть несколько спектров одновременно, из меню Options откройте диалоговое окно Spectrum Settings (Установки спектра), которое показано на рис. 1.86, и увеличивайте значение в поле Slices displayed (Число отображаемых секторов) от 1 до 64. Каждый сектор представляет FFT-число выборок.
Выбрав число спектров, которые вы хотите увидеть, нажмите кнопку OK. Каждый график будет представлять собой спектрограмму, начинающуюся с различных отсчетов времени в звуковом файле, как изображено на рис. 1.87.
Для перемещения по графикам секторов используется маленький горизонтальный регулятор (внизу слева). При движении ручки регулятора слева направо графики последовательно убираются с экрана, а восстанавливаются при обратном движении.
Диалоговое окно Spectrum Settings содержит расширенные параметры, используемые при анализе и построении графика спектра. Для лучшего отображения типа анализируемых аудиоданных установки могут быть сохранены (надо нажать кнопку Save As, и будет предложено ввести название типа анализа). Сохраненные установки выбираются затем в раскрывающемся поле Name. Программа поставляется с шестью предустановками для анализа:
• Audible range (от 20 до 20000 Гц – весь воспринимаемый на слух диапазон);
• Lower frequencies (от 50 до 1000 Гц – низкие частоты);
• Multiple slices (от 50 до 5000 Гц);
• Sonogram 1 (от 100 до 5000 Гц);
• Sonogram 2 (от 50 до 1000 Гц);
• Voice, low freq. (от 50 до 1500 Гц).
Следующее поле в окне установок – FFT size (Размер FFT). О нем уже говорилось выше в разделе «Что такое быстрое преобразование Фурье».
FFT Overlap (от 0 до 99 %). Эта опция управляет величиной перекрытия между выборками для FFT-анализа. Меньшие значения сокращают число отдельных выполненных функций анализа, что уменьшает общее время обработки. Большие значения приводят к более подробному анализу и соответственно к крайне медленной обработке. Незначительное перекрытие может придать графику слишком сжатый вид, зависящий от длины выбранного фрагмента записи.
Smoothing window (Окно сглаживания). Опция определяет функцию, примененную к данным перед анализом. Эта функция имеет мощный эффект для придания резкости пикам FFT-графика и плавности переходам (крутизне волны) между смежными частотами. Эффекты от применения этих функций могут быть легко оценены анализом простой синусоидальной волны. Доступны следующие шесть функций:
• Rectangle window (Прямоугольное окно). К данным перед анализом не применяется дополнительных функций. Дает очень резкие пики и крутую волну;
• Triangular window (Треугольное окно) дает несколько меньшую крутизну волны, чем Rectangle window. Это окно называют также выборкой Бартлетта или Парзена;
• Hamming, Hanning и Blackman обычно используются в аудиоприложениях;
• Blackman-Harris состоит из шести функций, включенных в число округляющих пики графика, и дает наименьшую крутизну соседней полосы.
Forward/Backward. Когда в спектрограмме отображается несколько секторов, можно укладывать их на графике во времени либо в прямом, либо в обратном порядке в зависимости от нажатой кнопки.
Set sonogram resolution (Установить разрешение сонограммы) от 1 до 10000 выборок. Эта опция определяет количество FFT-выборок, используемых в сонограмме и удерживающих время обработки и разрешение графика постоянными. Увеличение количества выборок увеличивает горизонтальное разрешение графика, но и удлиняет время обработки. Если флажок не включен, число выборок определяется длиной выделенного фрагмента в звуковой волне и перекрытием (Overlap). Использование этой опции может привести к довольно долгому времени обработки.
Logarithmic graphing размечает горизонтальную координату не в линейном, а в логарифмическом масштабе. В таком случае большая область графика отводится низким частотам. Опция доступна только в режиме Normal display.
Freq. Min. определяет низшую частоту (от 0 до 47,9 кГц), отображаемую на графике, когда выбрано масштабирование Zoom to Range (Масштаб по интервалу).
Freq. Max. определяет высшую частоту (от 0,001 до 48 кГц), отображаемую на графике, когда выбрано масштабирование Zoom to Range.
Ceiling (Верхний предел) от -149 до 0 дБ. Опция определяет самый верхний уровень амплитуды сигнала, изображаемый на графике, если выбрано масштабирование Zoom to Range.
Floor (Нижний предел) от -150 до -1 дБ. Опция определяет самый нижний уровень амплитуды сигнала, изображаемый на графике, если выбрано масштабирование Zoom to Range.
Hold peaks during monitoring (Сохранять пики во время текущего контроля). Если включена эта опция, наивысшее значение каждого пика частоты будет отмечено на спектрограмме маленькой линией.
Maintain last monitored view (Сохранять последний контролируемый просмотр). Если этот флажок установлен, состояние спектрограммы при остановке воспроизведения сохраняется. В противном случае график спектрограммы соответствует звуковой волне в точке позиции курсора.
Рассмотрим дальнейшие настройки, доступные из меню Options.
Auto Update (Автоматическое обновление). Если отмечена эта опция, спектрограмма обновляется при любых изменениях позиции курсора или выделенных фрагментов в текущем файле.
Monitor Playback (Контроль при воспроизведении). Спектрограмма изменяется в режиме реального времени при воспроизведении текущего файла. Разрешение графика будет зависеть от текущего размера выборки FFT и быстродействия вашего компьютера.
Monitor Input (Контроль при вводе). Спектрограмма изменяется в режиме реального времени при подаче входного сигнала в вашу звуковую карту. Эта опция дает возможность анализа акустических характеристик помещения для записи в реальном времени.
Show Position (Показывать позицию). Если данная опция включена, рядом с позицией курсора отображаются значения частоты и амплитуды текущей позиции курсора на графике спектра (как уже отмечалось выше). В противном случае позиции не отображаются.
Show notes (Показывать ноты). Одновременно с отмеченной опцией Show Position можно вместо частоты в герцах получить буквенное обозначение ноты, соответствующей частоте в текущей позиции курсора (то есть ноты, ближайшей к данной частоте), как показано на рис. 1.88.
Print Display (Распечатать график). По этой команде содержимое окна спектрального анализа выводится на печать.
Close (Закрыть). Эта команда закрывает окно спектрального анализа.
Спектрограмма снабжена мощными инструментами, позволяющими масштабировать ее как в интервале частот, так и в интервале амплитуд. Частотный и амплитудный интервалы определяют максимум и минимум частот и амплитуд, отображаемых не только в спектрограмме, но и в сонограмме.
Для выбора интервала частот в Sound Forge выполните следующие операции:
1. Щелкните левой кнопкой мыши по спектрограмме в конце частотного интервала, который вы хотите увеличить, и удерживайте кнопку.
2. Перемещайте мышь влево или вправо, пока не выберете тот диапазон частот, который вас интересует, а затем отпустите кнопку мыши.
3. Координата частоты спектрограммы теперь начинается и заканчивается теми частотами, которые вы выбрали. Чтобы сдвинуть выбранный диапазон вдоль частотного спектра, пользуйтесь длинным горизонтальным регулятором, расположенным под графиком, или клавишами управления курсором (влево/вправо) на клавиатуре.
4. Чтобы вернуть графику прежний вид, выберите опцию Zoom Out Full (Полный вид) из меню Display или из контекстного меню. Для максимального увеличения масштаба дважды щелкните по графику переднего сектора спектрограммы или выполните команду Zoom to Range (Масштаб по интервалу) из меню Display. Команда устанавливает масштаб по значениям, указанным в полях Display Range диалогового окна установок спектра Spectrum Settings.
Контекстное меню появляется при щелчке правой кнопки мыши по изображению спектра или при одновременном нажатии клавиш Ctrl + Shift + F10 на клавиатуре. Для выбора интервала амплитуд в Sound Forge надо сделать следующее:
1. Щелкните левой кнопкой мыши по спектрограмме в конце интервала амплитуд, который вы хотите увеличить.
2. Удерживая левую кнопку, нажмите и удерживайте правую кнопку мыши. Увеличивающийся прямоугольник диапазона изменяется как в сторону вертикального, так и в сторону горизонтального выделения.
3. Перемещайте мышь вверх или вниз, пока не выберете диапазон амплитуды, который вам необходим, и затем отпустите кнопку. Теперь в окне будет отображаться только выбранный диапазон амплитуды.
Интервалы частоты и амплитуды можно выбрать также, настраивая параметры Display Range в окне настроек спектра (Spectrum Settings) в меню Display.
В Sound Forge можно выполнить одновременный выбор интервала амплитуды и интервала частоты. Это делается таким образом:
1. Щелкните левой кнопкой мыши по изображению спектра.
2. Удерживая левую кнопку мыши, дважды щелкните правой. Увеличивающийся прямоугольник диапазона изменяется как в сторону вертикального, так и в сторону горизонтального выделения.
3. Отпустите
Можно менять также интервалы частоты и амплитуды при помощи диалогового окна Spectrum Settings.
Дополнительные команды меню Display в Sound ForgeNormalize dB. Эта команда устанавливает интервал амплитуд спектрограммы равным максимальному и минимальному значениям графика.
Logarithmic. Опция размечает горизонтальную координату не в линейном, а в логарифмическом масштабе. В таком случае большая область графика отводится низким частотам. Команда работает только в режиме Normal display и недоступна при изображении спектра в виде сонограммы.
Grab/Pan (Захват). Как только вы изменили масштаб, включение данного режима позволит передвигать спектрограмму вертикально и горизонтально. Чтобы включить или выключить этот режим, выбирайте его из меню Display или из контекстного меню. Для выключения можно также воспользоваться клавишей Escape. В режиме захвата, перемещая мышь (щелкнув по левой кнопке мыши и удерживая ее), вы двигаете измененный в масштабе график спектра, перенося временно скрытые разделы спектра в видимую область. Для перемещения графика допускается и использование клавиш управления курсором.
Sync Graphs (Синхронизация). Синхронизируются оба изображения в стереофайле, чтобы имелась возможность наблюдать одну и ту же FFT-область в обоих каналах.
Line Graph – для изображения спектрограммы применяется линия.
Bar Graph – для изображения спектрограммы используются серии прямоугольных полос, соответствующие FFT-выборкам (см. рис. 1.89).
Filled Graph изображается в виде графика с заливкой цветом, как показано на рис. 1.90.
В этом режиме возможны проблемы с некоторыми драйверами видеоадаптеров. Если вы сталкиваетесь с такими проблемами, как неверное оттенение или чересчур замедленная прорисовка, обновите версию драйвера или воспользуйтесь режимами Line Graph и Bar Graph.
Окно полного обзора, размещенное в нижней левой области окна анализатора спектра, указывает, где вы находитесь в файле относительно всего FFT. Прямоугольник с пунктирными линиями представляет область, которую вы видите в большем графике.
Стереофайлы в Sound ForgeПри просмотре спектра стереофайла спектрограмма изображается для каждого канала. Установки для отдельных каналов производятся независимо. Например, если вы щелкнете кнопкой мыши по верхнему графику (при этом высвечивается его рамка, что и означает выделение) и затем выполните команду Normalize dB из меню Display, изменится вертикальный масштаб только верхнего графика. Это справедливо и для большинства других установок: вам следует всегда выбирать для изменений тот график, который вы хотите редактировать.
Позиции курсора отмечаются только для выделенного графика. Чтобы переключиться между графиками, щелкните кнопкой мыши по нужному графику или воспользуйтесь клавишей Tab .
Однако если помечена опция Sync Graphs (в меню Display), изменения масштаба и другие установки синхронизируются между двумя графиками.
Получение сонограммы в Sound Forge1. Откройте звуковой файл и выделите часть звуковой волны для анализа. Анализ очень длинных частей аудиозаписи может занять продолжительное время и понизить временное разрешение, поэтому выделяйте относительно короткие фрагменты. Кроме того, если аудиосигнал имеет низкий уровень амплитуды, вы можете увеличить его, используя в Sound Forge функции Volume (Громкость) или Normalize (Нормализация).
2. Если окно спектрального анализа еще не открыто, выберите из меню Tools команду Spectrum Analysis.
3. В самой спектрограмме или в окне установок спектра Spectrum Settings
выберите диапазон частоты и амплитуды, который хотите просмотреть (см. раздел выше). В большинстве случаев вы захотите увидеть полный диапазон, но если файл, например, речевой, можно установить частотный интервал от 100 до 5000 Гц, чтобы видеть только важные детали.
4. Из меню Display или контекстного меню выберите либо Sonogram (Color), либо Sonogram (B&W). Пока окно индикации обрабатываемого материала активно, вычисляется сонограмма, а затем отображается на экране.
Sonogram (Color) изображает сонограмму в цвете (частота – по вертикали, время – по горизонтали, амплитуда представлена цветом). Sonogram (B&W) дает изображение в черно-белом режиме (частота – по вертикали, время – по горизонтали, амплитуда представлена градациями серого), как показано на рис. 1.91.
Если на графике часть звуковой волны не отмечалась, сонограмма будет анализировать звуковые данные от позиции курсора до конца файла.
Вам потребуется часто экспериментировать с различными параметрами в окне Spectrum Settings, чтобы получить наилучший из возможных графиков. Пробуйте сузить диапазоны частоты и амплитуды в максимально возможной степени, чтобы достигнуть больших контрастов. Если график слишком короткий, поднимите разрешающую способность сонограммы (sonogram resolution) до 200 выборок. Для большей разрешающей способности по частоте увеличьте FFT-размер. Чтобы снизить время обработки, понижайте число выборок (samplings) или FFT-размер.
Интенсивность цвета можно корректировать, двигая регулятор внизу сонограммы. В правой нижней части окна изображена цветовая масштабная линейка (в децибелах). Выполнение этой функции может занять много времени, если у вас нет драйвера обработки цветовой палитры и не установлена программа Video for Windows.
Если вы выделяете другой фрагмент в звуковом файле, выберите в меню команду Update! которая сгенерирует новую сонограмму на основании вновь выбранных звуковых данных. Чтобы переключиться в спектрограмму, выберите команду Normal Display из меню Display.
Если поле Set sonogram resolution (Установка разрешающей способности сонограммы) в окне Spectrum Settings отключено, используйте функцию FFT overlap (Установка перекрытия FFT), чтобы определить, сколько сделать выборок. Для длинных файлов их число может быть значительным, поэтому на обработку потребуется много времени.Синтез звука и создание семплов
Все программы обработки звука предполагают, что имеется некий звуковой источник, который можно подвергнуть дальнейшей обработке.
Существует три различных способа получения такого источника. Во-первых, можно записать с микрофона живое звучание какого-либо инструмента, голоса или любой другой звук. Этот способ часто используется, если нужно воспроизвести на MIDI-инструменте звучание реальных инструментов. Другой способ заключается в рисовании волновой формы – программы обработки часто позволяют это делать после переключения в соответствующий режим. Этот способ подходит для звуков ударного характера, в то время как периодический сигнал, соответствующий мелодическому звучанию музыкальных инструментов, создать таким способом практически невозможно. Но наиболее эффективным методом создания звука является его синтез.
При синтезе звука программа использует математические функции, генерирующие простейшие периодические сигналы, а также шумы. Эти простейшие сигналы могут тем или иным образом трансформироваться в процессе синтеза. Синусоидальные сигналы (чистые тоны) имеют особое значение, поскольку спектр такого сигнала содержит только одну частоту.
В профессиональных программах обработки звука обычно имеются модули для синтеза звука. В Sound Forge, например, предусмотрена возможность синтеза основных периодических сигналов, а также FM-синтеза. Но существуют и программы, специально созданные для синтеза звука.
Звук, преобразованный в программах обработки, может представлять собой как самостоятельное явление (например, электронная композиция или «очищенная» фонограмма музыкальной пьесы), так и материал для дальнейшего использования (например, набор семплов для исполнения той или иной партии в партитуре). В последнем случае готовые звуки могут быть переданы в цифровом виде во внешний или внутренний семплер, который будет использоваться как одно из MIDI-устройств, управляемых секвенсором.
Внешний семплер
Внешний семплер – это устройство, которое может воспроизводить семплы, изменяя их высоту. Большинство внешних семплеров позволяют записывать или загружать в память семплы, записанные заранее и сгруппированные в библиотеки. Имеются два метода пересылки семплов внешним семплерам: MIDI Sample Dump Standard (SDS – типовой стандарт передачи семпла) и SCSI MIDI Device Interface (SMDI – интерфейс SCSI MIDI-устройства).
Протокол MIDI Sample Dump Standard (SDS)
MIDI SDS используется для передачи и получения цифровых семплов при помощи обычной MIDI-аппаратуры и ее кабельных подключений. Из-за ограниченной ширины полосы частот MIDI-протокола и большого объема данных, необходимых для цифровых семплов, передача данных с использованием обычного протокола MIDI SDS может быть медленной (несколько минут для коротких семплов). SDS также ограничен возможностью пересылки только моносемплов, хотя некоторые семплеры позволяют объединять два моносемпла, чтобы создать стереосемпл.