Child pages
  • Opracowanie materiałów audio
Skip to end of metadata
Go to start of metadata

Przygotowanie materiałów dźwiękowych do prezentacji w sieci

Materiały dźwiękowe mogą wymagać edycji polegającej na wycięciu fragmentów, np. ciszy na początku lub na końcu nagrania. Oprócz tego mogą wymagać dodatkowych działań, takich jak normalizacja czy odszumianie. W niniejszej instrukcji będzie można zobaczyć, jak usuwa się ciszę na początku i na końcu nagrania. Użyty zostanie najbardziej popularny program do edycji plików dźwiękowych – Audacity (http://audacity.sourceforge.net/). Jest to program darmowy dostępny w wersjach dla Microsoft Windows, GNU/Linux, Mac OS X i innych systemów operacyjnych. Można go pobrać z tego miejscaW tym przykładzie użyty będzie plik dźwiękowy w formacie WAV, o 24-bitowej głębi i częstotliwości próbkowania 96 kHz. Rezultaty obróbki zostaną zapisane z użyciem tych samych parametrów, jak w pliku oryginalnym.

Ilustracja 1. Główne okno programu Audacity z otwartym plikiem.

Należy uruchomić program Audacity, następnie otworzyć plik przeciągając go na okno programu, lub używając polecenia menu File-> Open... Cienka linia na początku i na końcu wykresu przedstawiającego dźwięk oznacza ciszę. Można się jej pozbyć na kilka sposobów. W tym przykładzie najpierw zaznaczono ciszę na początku materiału dźwiękowego i usunięto ją, następnie postąpiono tak samo z ciszą na końcu. 

Ilustracja 2. Zaznaczanie.

Najpierw należy się upewnić, że w pasku narzędzi jest wybrane narzędzie zaznaczania . Jeśli tak nie jest, należy kliknąć na odpowiednią ikonę. Następnie należy wcisnąć i przytrzymać lewy przycisk myszy oraz przeciągnąć kursor, aby zaznaczyć obszar ciszy. Obszar zaznaczenia można poszerzać lub zmniejszać przez wciśnięcie klawisza Shift i klikanie w odpowiednie miejsce.

Uwaga: Do powiększania i zmniejszania skali czasu można użyć przycisków  i . Po zaznaczeniu obszaru ciszy należy go usunąć używając polecenia menu Edit-> Delete lub kombinacji klawiszy Ctrl+K. Aby zobaczyć cały plik, należy kliknąć przycisk  (dopasuj widok projektu do okna). W podobny sposób można usunąć ciszę na końcu materiały dźwiękowego.

Ilustracja 3. Ustawienia Audacity.

Dokonano obróbki dźwięku, ale przed jego zapisaniem należy zmienić ustawienia formatu WAV. Aby to zrobić należy otworzyć okno ustawień Audacity za pomocą polecenia menu Edit-> Preferences... lub kombinacji klawiszy Ctrl+P. Należy wybrać zakładkę File Formats, a następnie opcję Other... z listy Uncompressed Export Format. Aby zachować plik w formacie WAV z 24-bitową głębią należy wybrać WAV (Microsoft) w polu Header i Signed 24 bit PCM w polu Encoding.

Na koniec należy zapisać plik używając polecenia menu File-> Export as WAV...

Konwertowanie plików dźwiękowych

W poprzednim paragrafie dokonano obróbki pliku dźwiękowego przez usunięcie fragmentów na jego początku i końcu. Otrzymana wersja do archiwizacji będzie użyta do przygotowania wersji do prezentacji w sieci w formacie mp3 z użyciem enkodera LAME.

Jak można przeczytać na stronie domowej programu: „LAME jest wysokiej jakości enkoderem MPEG Audio Layer III (MP3), dostępnym na licencji LGPL.” Program jest rozpowszechniany jako narzędzie do pracy w wierszu poleceń. Oprócz narzędzia konsoli, enkoder LAME jest obsługiwany przez wiele innych programów, zwykle zaopatrzonych w graficzny interfejs użytkownika. Kompletną listę oprogramowania, które wspiera lub używa enkodera LAME można znaleźć w tym miejscu. Należy odnaleźć i zainstalować wersję odpowiednią dla posiadanego systemu operacyjnego. Na potrzeby niniejszego opisu została użyta wersja binarna Windows o numerze 3.98.4 pobrana z RareWares.

Przed rozpoczęciem konwersji na format mp3 należy zapoznać się z podstawowymi informacjami na temat trybów kodowania plików mp3:

  • Stała wielkość strumienia danych (ang. Constant Bitrate, CBR) – jest to domyślny tryb kodowania; prędkość transmisji będzie taka sama dla całego pliku. Opcja użyteczna w przypadku przesyłania strumieniowego, ale mało wydajna pod względem wielkości pliku
  • Średnia wielkość strumienia danych (ang. Average Bitrate, ABR) – średnia ilość danych na sekundę jest stała. Parametr ten jest stosowany do fragmentów wymagających przesłania większej ilości bitów; jakość jest lepsza, niż w przypadku CBR.
  • Zmienna wielkość strumienia danych (ang. Variable Bitrate, VBR) – wielkość strumienia danych jest dostosowywana do wymagań; tryb zalecany do magazynowania danych.

Aby skorzystać z programu LAME należy otworzyć wiersz poleceń (w Windows CTRL+R i następnie polecenie cmd) i w celu wyświetlenia pomocy wykonać polecenie lame --help. Jeśli otrzymana zostanie informacja, że polecenie to jest niedostępne, należy przejść do folderu zawierającego program. Tak wygląda składnia programu LAME:

lame [options] <infile> [outfile]

[options] - opcje kodowania, nie są wymagane

<infile> - nazwa pliku, który ma być poddany konwersji, wraz ze ścieżką dostępu; ten parametr jest obowiązkowy

[outfile] - nazwa pliku wyjściowego. Jeśli nazwa ta nie zostanie określona, program utworzy plik wyjściowy o tej samej nazwie, co plik do konwersji, przy czym do nazwy pliku zostanie dodane rozszerzenie .mp3.

W poniższych przykładach użyto pliku WAV (o nazwie przyklad.wav) o 24-bitowej głębi i częstotliwości próbkowania 96 KHz.

Należy zacząć od uruchomienia komendy lame, podając jako parametr tylko nazwę pliku wejściowego. Tu: lame przyklad.wav

Poniżej przedstawiono rezultat wykonania tego polecenia, z wyjaśnieniem ważnych komunikatów.

D:\lame-3.98.4>lame przyklad.wav
LAME 3.98.4 32bits (http://www.mp3dev.org/) <- nazwa i wersja kodeka  
CPU features: MMX (ASM used), SSE (ASM used), SSE2 
Resampling: input 96 kHz output 48 kHz <- atrybuty pliku wynikowego  
Using polyphase lowpass filter, transition band: 16452 Hz - 17032 Hz
Encoding I-iv-011.wav to przyklad.wav.mp3 <- nazwy plików wejściowego i wyjściowego 
Encoding as 48 kHz j-stereo MPEG-1 Layer III (12x) 128 kbps qval=3 <- opcje kompresji 
Frame | CPU time/estim | REAL time/estim | play/CPU | ETA <- statystyka czasu przetwarzania 
7008/7008 (100%)| 0:08/ 0:08| 0:08/ 0:08| 19.935x| 0:00
-------------------------------------------------------------------------------
kbps LR MS % long switch short %
128.0 1.7 98.3 99.8 0.1 0.1
Writing LAME Tag...done
ReplayGain: -2.4dB

Jak widać z powyższego przykładu, program LAME używa domyślnie stałej wielkości strumienia danych na poziomie 128 kbps z częstotliwością próbkowania 48 kHz. Dla danej prędkości transmisji bitów można wybrać wewnętrzny algorytm jakości za pomocą parametru -q n, gdzie n przyjmuje wartości od 0 do 9:

 

  • 0 - oznacza najwolniejszy algorytm, ale potencjalnie najwyższą jakość,
  • 9 - szybkie algorytmy, ale bardzo słabą jakość.

 

Dodatkowy parametr -h ma to samo znaczenie co -q2, a -f znaczy to samo co -q7. Zaleca się stosowanie parametru -h. Jak widać w domyślnym ustawieniu kodowania stosowana jest wartość 3. Aby konwertować w wyższej jakości, ale nieco wolniej, należy wykonać następujące polecenie:

lame -h przyklad.wav

Aby użyć trybu szybkiego, ale o niższej jakości, należy wykonać następujące polecenie:

lame -f przyklad.wav

W przypadku stosowania stałej prędkości transmisji bitów należy użyć opcji -b n aby ustawić wielkość strumienia danych (ang. bitrate), gdzie n może przyjmować wartości 8, 16, 24, ..., 320.

Aby kodować plik ze zmienną prędkością transmisji bitów należy użyć parametru -Vn, ustalającego ustawienia jakości konwersji, gdzie n przybiera wartości od 0 do 9 (0=najwyższa jakość, 9=najniższa, domyślnie=4). 
Aby utworzyć plik dźwiękowy mp3 o zmiennej prędkości transmisji bitów należy uruchomić następujące polecenie:

lame -h -V 6 przyklad.wav

  • No labels