Edytowanie pogłosu

Typowy cyfrowy procesor pogłosowy symuluje przestrzeń akustyczną wykorzystując dwa niezależne algorytmy. Dla uzyskania efektu pojedynczych odbić sygnału od sąsiednich ścian stosuje się tzw. early reflections (pierwsze odbicia). W momencie gdy dźwięk rozprzestrzenia się po wyimaginowanej sali odsłuchowej liczba odbić gwałtownie rośnie, aż do momentu gdy przestajemy słyszeć pojedyncze odbicia – zlewają się one w jeden strumień pogłosu, który stopniowo zanika. Owo rozproszenie jest symulowane na odcinku zanikania efektu pogłosu.

Wszyscy doskonale wiemy, że emulowany elektronicznie pogłos nigdy nie będzie brzmiał tak dobrze, jak pogłos naturalny; zdolność obliczeń matematycznych niezbędnych do wytworzenia pogłosu na drodze cyfrowej jest ciągle zbyt mała. Ale nawet wtedy, jeśli masz dostęp do pomieszczenia, w którym możesz uzyskać naturalny pogłos, zawsze znajdziesz się w sytuacji, gdy będziesz musiał skorzystać z odpowiedniego rozwiązania sprzętowego lub programowego.

Każdy wysokiej klasy procesor pogłosowy ma możliwość regulacji wielu parametrów, ale tak naprawdę tylko niewielu ludzi korzysta z nich dla uzyskania określonego efektu brzmieniowego podczas nagrań i zgrania materiału. W tym artykule zajmiemy się wpływem poszczególnych parametrów programu pogłosowego na brzmienie samego pogłosu.

Elementy składowe pogłosu
Efekt pogłosu (emulowany sprzętowo lub programowo) stara się odtworzyć bliską nieskończoności liczbę fal dźwiękowych odbijających się od elementów fizycznej przestrzeni. Zazwyczaj efekt pogłosu uzyskiwany jest z wykorzystaniem dwóch głównych jego elementów – grupy pierwszych odbić dźwięku od ścian, podłogi, sufitu itd. oraz zanikania odbijających się fal, stopniowo pochłanianych przez otoczenie.
Opisane niżej parametry znaleźć można w procesorach pogłosowych wysokiej klasy. Z ich pomocą można kształtować oba elementy symulacji przestrzeni.
Damping (tłumienie). Jeśli dźwięk odbija się w pomieszczeniu z twardymi płaszczyznami, “ogon” pogłosu będzie brzmiał jasno i dość twardo. Miękkie elementy pomieszczenia (np. drewno, dywany, kotary) lub sala wypełniona słuchaczami sprawią, że poszczególne odbicia będą tracić swe wyższe częstotliwości i w efekcie uzyskamy cieplejsze, ciemniejsze brzmienie pogłosu. W wielu przypadkach ziarnistość zanikania pogłosu można zamaskować zwiększając parametr tłumienia. Dzięki temu uwaga słuchaczy skupi się na jego środkowych i niskich częstotliwościach.
High/low frequency attenuation (tłumienie wysokich/niskich częstotliwości). Parametry te określają zakres częstotliwości przechodzących przez pogłos. Jeśli efekt brzmi zbyt metalicznie, warto spróbować zmniejszyć poziom wysokich tonów poczynając od 4-8kHz. Wiele znakomicie brzmiących pogłosów płytowych tłumi częstotliwości powyżej 5kHz, zatem nie przejmuj się brakiem najwyższych tonów – dla zachowania dobrego brzmienia nie są one niezbędne.
Tłumienie niskich częstotliwości pomaga w redukcji dudniącego, zamulonego brzmienia. Jeśli materiał źródłowy zawiera bas i bębny, które powodują powstawanie nieciekawych efektów brzmieniowych pogłosu w niskich rejestrach, zredukuj częstotliwości poniżej 100-200Hz.
Diffusion (rozproszenie pierwszych odbić). Zwiększanie tego parametru sprawia, że pierwsze odbicia przybliżają się do siebie, co wytłuszcza brzmienie pogłosu. Redukcja dyfuzji powoduje, że pierwsze odbicia stają się bardziej zbiorem luźnych powtórzeń niż jednolitym strumieniem dźwięku. W przypadku wokalu lub padów klawiszowych zmniejszenie tego parametru może dać świetny efekt odbić, który nie wpływa negatywnie na brzmienie sygnału źródłowego. Z drugiej strony instrumenty perkusyjne brzmią lepiej, gdy wobec nich zastosuje się wyższe ustawienia Diffusion – z gęstszymi, bardziej zwartymi pierwszymi odbiciami. W niektórych urządzeniach/programach możemy znaleźć oddzielną regulację dyfuzji dla “ogona” pogłosu, niezależną od tego samego parametru odnoszącego się do pierwszych odbić. Zasada ustawiania jest w tym wypadku taka sama jak opisano wyżej. Czasem też jednym regulatorem ustawia się dyfuzję dla obu elementów składowych pogłosu.
Room size (wielkość pomieszczenia). Wielkością tego parametru ustawiamy długość wirtualnego pomieszczenia, w którym przemieszcza się odbijająca od ścian fala dźwiękowa. Jeśli brzmienie pogłosu staje się rezonujące w odniesieniu do niektórych częstotliwości, zmiana tego parametru może znacząco poprawić sytuację. Bardzo małe pomieszczenia mają tendencję do generowania brzmienia przypominającego dźwięk rozchodzący się w zbiorniku na ropę, większe natomiast charakteryzują się sporą zawartością efektu predelay. Ma to sens, ponieważ w dużych pomieszczeniach (obiektach) dźwięk potrzebuje nieco czasu by odbić się od najdalej znajdującej się ściany i wrócić do naszych uszu.
Decay time (czas zanikania). Parametr ten określa jak długo trwają odbicia, dopóki całkowicie nie wytracą swej energii. Długo brzmiące pogłosy są ciekawe, gdy zostaną zastosowane do pojedynczego instrumentu, ale w całej aranżacji raczej się nie sprawdzają (chyba, że mamy do czynienia z niezbyt gęstym aranżem).
Predelay (opóźnienie wstępne). Pomiędzy wystąpieniem zdarzenia dźwiękowego, a dotarciem fali dźwiękowej do pierwszego obiektu powodującego odbicia zawsze musi minąć kilka milisekund. Aby zasymulować ten efekt ustawiamy odpowiednio parametr predelay. Niektóre procesory mają niezależną kontrolę nad opóźnieniem wstępnym pierwszego odbicia i “ogona” pogłosu. W przypadku symulacji rzeczywistych obiektów ten pierwszy powinien być krótszy niż drugi. Zwiększanie opóźnienia wstępnego da wrażenie większej przestrzeni.
Reverb density (nasycenie pogłosu). Mniejsze nasycenie sprawia, że zanikanie pogłosu przebiega w sposób rozproszony, delikatny. Wyższe ustawienie parametru nasycenia powoduje powstanie wrażenia, że poszczególne odbicia przybliżają się do siebie, zagęszczając efekt pogłosu. Zazwyczaj mniejsze nasycenie stosuje się do wokalu i instrumentów solowych, a większe do instrumentów o charakterze perkusyjnym.
Early reflections level (poziom pierwszych odbić). Regulacja tego parametru pozwala dobrać proporcję między ogólną głośnością pogłosu, a głośnością pierwszych odbić. Należy ją ustawić tak, by nie były one słyszalne jako pojedyncze odbicia i nie maskowały zanikania. Zmniejszanie poziomu pierwszych odbić, podobnie jak większa zawartość efektu w miksie, odsuwa słuchacza wgłąb wyimaginowanej przestrzeni odsłuchowej.
High-frequency/Low-frequency decay (zanikanie wysokich/niskich częstotliwości). Niektóre pogłosy dysponują oddzielną regulacją czasów zanikania dla wysokich i niskich częstotliwości. Częstotliwości te mogą być ustawione na stałe lub wybierane z wykorzystaniem dodatkowego parametru częstotliwości podziału między niskimi a wysokimi tonami. Możliwość regulacji tych parametrów ma olbrzymie znaczenie dla ogólnego charakteru pogłosu. Wydłużanie zanikania niskich częstotliwości kreuje bardziej masywne brzmienie. Zwiększanie czasu wybrzmiewania wysokich tonów nie ma swojego odpowiednika wśród naturalnie uzyskiwanych pogłosów, ale brzmi bardzo dobrze w przypadku wokali, ponieważ zwiększa nośność zgłosek odpowiedzialnych za czytelność, z jednoczesną minimalizacją pogłosu w przypadku zgłosek wybuchowych.

Różne ścieżki – różne pogłosy?
Zazwyczaj stosuję pogłos do symulacji przestrzeni akustycznej, a nie w charakterze efektu. Z tego względu unikam używania oddzielnych typów pogłosu na różne ślady miksu, preferując korzystanie z wysyłek pomocniczych na jeden procesor, z uwzględnieniem różnych poziomów pogłosu dla różnych źródeł sygnału by zachować ich odpowiednią pozycję względem słuchacza. Czym większy poziom wysyłki, tym dźwięk bardziej oddalony; mniejszy poziom przybliża źródło dźwięku. Procesor pogłosowy ustawiony jest zazwyczaj na wysoki poziom dyfuzji (diffusion) i dość duże tłumienie (damping).
Jedyny wyjątek robię w przypadku wokalu, dla którego stosuję jaśniejsze brzmienie pogłosu o charakterze plate, z mniejszą dyfuzją i tłumieniem. Najczęściej wysyłam wokal na oba procesory – ten jaśniej i ten ciemniej brzmiący, co daje mi możliwość ustawienia odpowiednich proporcji efektu i pozwala na lepsze wtopienie wokalu w całość miksu.

Wtyczki kontra sprzęt
Ponieważ dobre procesory pogłosowe od zawsze są skomplikowane i kosztowne, znacząco wzrosło zainteresowanie ich programowymi odpowiednikami. Dobry programista bez kłopotu jest w stanie napisać świetny algorytm pogłosowy, jeśli ma wystarczający zasób mocy obliczeniowej procesora, i algorytm bardzo oszczędny w stosunku do jednostki centralnej, jeśli tylko nikt nie zwróci uwagi na kiepskie brzmienie. Prawdziwym wyzwaniem jest takie napisanie programu, by zachować doskonałe brzmienie przy jak najmniejszym apetycie na moc obliczeniową. Z tego powodu często najlepszym rozwiązaniem jest wyjście poza komputer: wyprowadzenie sygnału do obróbki za pomocą sprzętowych pogłosów i wprowadzenie go z powrotem do cyfrowego systemu audio. Jeśli procesor ma analogowe wejścia i wyjścia należy wziąć pod uwagę niewielkie opóźnienie wprowadzane przez jego przetworniki, ale nie jest to wielkim problemem. Najlepiej potraktować je jako bezpłatny predelay o czasie w granicach 1,5ms…

Oszczędzaj moc
Jeśli zdecydowałeś się stosować zużywające sporo mocy obliczeniowej wtyczki, może się okazać, że braknie “pary” dla korekcji, dynamiki i innych efektów, których potrzebujesz w czasie miksowania. Jednym z rozwiązań jest stworzenie tzw. wirtualnej szyny aux.
Zgraj ścieżki, które chcesz okrasić pogłosem, do postaci jednego śladu z uwzględnieniem poziomów, z jakimi chcesz usłyszeć w nich pogłos. Do tak stworzonej ścieżki (będącej wirtualnym odbiciem klasycznego toru aux) dodaj pogłos z wyłączeniem sygnału podstawowego (100% wet) i zapisz pod postacią nowego śladu.
Wycisz wcześniej zgraną ścieżkę (ale jej nie kasuj) oraz wyłącz wtyczkę pogłosową dla zmniejszenia obciążenia procesora. W odpowiednich proporcjach zmiksuj wszystkie ślady ze ścieżką zawierającą sam pogłos. Jeśli stwierdzisz, że coś tu jeszcze nie pasuje, zawsze możesz ponownie nagrać ścieżkę z pogłosem korzystając z wyciszonej ścieżki wirtualnej szyny aux lub wręcz zacząć cały proces od początku.

Ku nowym, lepszym pogłosom!
Na zakończenie jeszcze jedna przydatna sztuczka. Do tej pory nie udało mi się znaleźć sposobu na to, by kiepska wtyczka pogłosowa zabrzmiała dobrze, ale jest sposób na to, by dobra wtyczka zabrzmiała jeszcze lepiej.
Należy dwukrotnie wywołać dwa takie same pogłosy (każdy na własnej szynie aux), ustawić nieco inaczej ich parametry, a dla stworzenia bardziej przestrzennego obrazu rozstawić je w panoramie – jeden bardziej na lewo, a drugi bardziej na prawo. Różnica między pojedynczym a podwójnym pogłosem jest subtelna, ale dająca się wyraźnie usłyszeć. Miłego eksperymentowania!

dzwiek cyfrowy

Niniejszy artykuł przeznaczony jest przede wszystkim dla osób początkujących. Zajmiemy się w nim funkcjonowaniem cyfrowego dźwięku i dokonamy krótkiego omówienia zagadnień związanych z pracą zegara.

Mówiąc najprościej, rejestracja i odtwarzanie cyfrowego dźwięku (mam tu na myśli użycie cyfrowych rejestratorów, samplerów, keyboardów działających z wykorzystaniem sampli oraz modułów brzmieniowych), składa się z dwóch zasadniczych etapów. Chodzi tu o przechwytywanie dźwięku (podczas zapisywania lub samplowania) i jego reprodukcję. Etap przechwytywania wykonywany jest za pomocą przetworników analogowo-cyfrowych (A/D, zwanych również A-to-D lub ADC). Odtwarzanie zaś możliwe jest dzięki przetwornikom cyfrowo-analogowym (D/A, D-to-A lub DAC).

Działanie przetwornika A/D polega na chwytaniu serii migawek (próbek) napięcia przechodzącego przezeń sygnału audio, mierzeniu ich i zapisywaniu w postaci liczbowej. Liczby te mogą być ciągami ośmiu bitów (cyfr binarnych czyli jedynek lub zer), szesnastu lub dwudziestu czterech. Każda liczba jest fragmentem danych zwanym słowem (określanym także jako słowo próbki, słowo cyfrowe lub po prostu próbka). Za każdym razem, gdy przetwornik A/D przechwytuje próbkę, tworzy słowo. Pojęcia długość słowa oraz rozdzielczość bitowa są równoważne i odwołują się do liczby bitów zawartych w jednym słowie (8, 16 lub 24 itd.).
Częstotliwość z jaką pobierane są próbki zwana jest częstotliwością próbkowania, a wyraża się ją w kilohercach (kHz – tysiąc próbek na sekundę) lub w megahercach (MHz – milion razy na sekundę). Mówiąc ogólnie, długość słowa decyduje o stosunku sygnału użytecznego do szumu, podczas gdy częstotliwość próbkowania determinuje szerokość rejestrowanego pasma częstotliwości akustycznych.
Żelazną regułą jest to, że najwyższa konwertowana częstotliwość akustyczna nie może być wyższa niż połowa częstotliwości próbkowania. A zatem, częstotliwość próbkowania 44,1kHz (44100 próbek w ciągu sekundy) pozwala zarejestrować częstotliwości w paśmie do 22.050kHz. Przy częstotliwości próbkowania równej 96kHz zarejestrować możemy częstotliwości do 48kHz i tak dalej. W jednym z przyszłych artykułów zajmiemy się teorią leżącą u podstaw tej techniki.
Liczba bitów w słowie cyfrowym wpływa na dynamikę sygnału (stosunek sygnału użytecznego do szumu). Decyduje o tym liczba “stopni” umożliwiających odtworzenie obwiedni sygnału. Koncepcja ta jest zilustrowana na rys. 1. Każdy bit dołożony do słowa cyfrowego podwaja liczbę tychże stopni, które służą do pomiaru i reprezentacji przebiegu sygnału analogowego, a co za tym idzie, podwaja dokładność cyfrowego zapisu. W efekcie każdy dodatkowy bit podnosi dynamikę sygnału o 6dB. Należy przy tym zauważyć, że dokładając kolejne bity nie powodujemy podniesienia poziomu (głośności) przechwyconego sygnału. W ten sposób zmieniamy jedynie wartość najniższego (czyli najcichszego) poziomu, przy którym sygnał daje się wykorzystać, nie znikając w szumie. Z uwagi na to, że każdy dodatkowy bit podwaja liczbę stopni umożliwiających odtworzenie obwiedni sygnału audio, powiększanie liczby bitów powoduje zwiększenie rozdzielczości sygnału podczas przechwytywania, w szczególności zaś przy niższych poziomach (patrz tabela, w której znajdziemy zestawienie zakresów dynamiki i liczb stopni, przy poszczególnych długościach słów cyfrowych).
Te same zasady dotyczące rozdzielczości częstotliwości próbkowania, odnoszą się do procesu konwersji cyfrowo-analogowej, podczas której następuje zamiana cyfrowego zapisu na przebieg audio o zmiennym napięciu, przy czym istnieją pewne dwie różnice. Po pierwsze, dodawanie bitów czy podnoszenie częstotliwości próbkowania nie powoduje polepszenia jakości dźwięku: pasmo częstotliwości nie ulegnie poszerzeniu, a poziom szumu obniżeniu. Niemniej jednak, dodanie bitów na etapie wyjściowym może być zabiegiem użytecznym, o ile miksowanie dźwięku odbywa się w domenie cyfrowej.
Konwersji cyfrowo-analogowej towarzyszą często inne zagadnienia, takie jak nadpróbkowanie (ang. oversampling) i stosowane są różnorodne filtry oraz obwody. Jednak w chwili obecnej ten zakres wiedzy nam wystarczy i możemy kontynuować nasze rozważania.

Tik-Tak
Głównym elementem zarządzającym zapisem i odtwarzaniem cyfrowym jest zegar. Jest to zegar słowa (ang. wordclock). Każdy komponent sprzętowy posługuje się własnym zegarem – zegar ów wyznacza częstotliwość próbkowania i daje pewność regularności pobierania próbek. Wziąwszy pod uwagę dużą częstotliwość próbkowania, należy sobie zdać sprawę, jak ważna dla jakości dźwięku jest jakość zegara zainstalowanego w sprzęcie cyfrowym. Jeśli częstotliwość jego pracy nie jest stabilna (powoduje to zjawisko zwane jitterem), sygnał audio ulega degradacji. Jeśli korzystamy tylko z jednego urządzenia cyfrowego, problem zegara właściwie nie istnieje. Urządzenie odwołuje się do wbudowanego (wewnętrznego) zegara i wszystko gra. Jeśli jednak spróbujemy sprząc cyfrowo dwa lub więcej urządzeń, sprawy mogą nieco się skomplikować.
Jeśli proces ten będziemy wykonywać krok po kroku, łatwo nam będzie określić sposób sprzęgnięcia zegarów sprzętowych – jeżeli coś się nam nie uda, sprzęt poinformuje nas o tym odmawiając pracy, mrugając różnymi kontrolkami lub też emitując dziwne dźwięki. Najprostsze jest połączenie dwóch urządzeń cyfrowych. Powiedzmy, że na stacji roboczej przygotowaliśmy aranż, który chcemy teraz przenieść cyfrowo do komputera, poprzez kartę dźwiękową. Łączymy zatem wyjście cyfrowe instrumentu z wejściem cyfrowym karty, uruchamiamy oprogramowanie muzyczne w trybie nagrywania, odtwarzamy aranż na keyboardzie… a program informuje o pojawieniu się błędu i odmawia nagrywania. Może też zdarzyć się, że zarejestrowane zostanie coś, co przypomina muzykę, ale albo jest zamazane i zniekształcone albo podczas odtwarzania słychać kliki i przerwy.
Oto natura problemu: aby sygnał cyfrowy został przeniesiony z jednego urządzenia do innego, słowa cyfrowe muszą wędrować z właściwą szybkością oraz taktowaniem. Innymi słowy, taktowanie słów cyfrowych w obu urządzeniach musi być zsynchronizowane. Jeśli słychać zakłócenia, takie jak kliki czy przerwy albo – co gorsza – nie słychać nic, świadczy to o braku wspomnianej synchronizacji.
Na szczęście, rozwiązanie tego kłopotu jest bardzo proste. Nasza stacja robocza, która jest urządzeniem wysyłającym sygnał audio, działa tak jak zazwyczaj, odwołując się do wewnętrznego zegara. Karta dźwiękowa, odbierająca transmitowany sygnał dźwiękowy, powinna zostać ustawiona w tryb podrzędny (ang. slave), korzystając z zegara zewnętrznego. Jako to uczynić, należy sprawdzić w instrukcji obsługi karty albo przyjrzeć się oknu dialogowemu preferencji dźwiękowych (Audio Preferences) programu rejestrującego.W opisanym przypadku, to wystarczy – we wszystkich formatach połączeń cyfrowych, z którymi przyjdzie nam zetknąć się (AES/EBU, S/PDIF, ADAT, TDIF itd.), sygnał zegara jest wpisywany w strumień danych i przesyłany wraz z cyfrowymi danymi audio. To nam znacznie upraszcza działanie, eliminując konieczność stosowania oddzielnych przewodów przesyłających sygnały zegarowe itd.

obudowy zestawów głośnikowych

Wygląd zewnętrzny obudowy zestawu głośnikowego (bryła) oraz jej konstrukcja wnętrza nie są nigdy dziełem przypadku lub jedynie odzwierciedleniem fantazji lub poczucia estetyki projektantów. Konstrukcje obudów są pieczołowicie przeliczane w odniesieniu do parametrów głośników, które mają być w nich zamontowane, a celem tych wszystkich operacji jest stworzenie głośnikom optymalnych warunków pracy.

Głośnik dynamiczny, znajdujący się w ośrodku jakim jest powietrze, nie emituje wcale – lub emituje bardzo słabo – tony niskie. Jest to spowodowane wyrównywaniem się ciśnień akustycznych, wytworzonych działaniem przedniej i tylnej płaszczyzny membrany. Dzieje się tak dlatego, że ruch membrany do przodu powoduje zagęszczenie powietrza przed membraną (+), a jednocześnie rozrzedzenie powietrza za membraną (-). Te dwa działania wzajemnie się znoszą, a zjawisko to zachodzi tym skuteczniej, im wolniejsze są ruchy membrany (czyli mniejsza częstotliwość drgań) oraz im mniejsza jest różnica dróg między przednią i tylną ścianą membrany.
Umieszczenie głośnika w obudowie ma zapewnić jak największą różnicę drogi fal dźwiękowych pomiędzy tylną i przednią stroną membrany oraz stworzyć dobre warunki do promieniowania energii akustycznej przez głośnik. Trzeba w tym miejscu powiedzieć o jeszcze jednej, ważnej rzeczy. Jeden głośnik jest w stanie przenieść (przy małych zniekształceniach) tylko wąskie pasmo częstotliwości. Aby więc zapewnić dobrą jakość i szerokie pasmo przenoszenia zaczęto stosować dwa, trzy a czasem cztery rodzaje głośników o różnych własnościach – dobranych tak, by ich najlepsze zakresy przenoszenia wzajemnie się uzupełniały. Żeby każdy rodzaj głośników przetwarzał tylko te prądy, do których przetwarzania jest najlepiej przystosowany, zaczęto stosować filtr elektryczny – zwany też zwrotnicą prądowa – który rozdzielał składowe przebiegu elektrycznego, doprowadzonego do zespołu głośników.
Opisana koncepcja tworzenia zestawów głośnikowych narodziła się dość dawno. Oczywiście musiała powstać potrzeba konstruowania takich zestawów i taką właśnie potrzebą był film udźwiękowiony. Pierwsze zestawy głośnikowe konstruowano do nagłośnienia sal tzw. kinoteatrów. Znacznie później – w miarę jak zaczęły powstawać grupy grające muzykę określaną wówczas mianem “big beatu”, rosło zapotrzebowanie na budowę systemów o dużej sprawności, pozwalających na nagłośnienie koncertów dla dużej liczby widzów – organizowanych często na otwartych przestrzeniach. Zaczęto wtedy stosować baterie zestawów głośnikowych, najczęściej łącząc po kilka zestawów niskotonowych i ustawiając je obok siebie, co znacznie polepszało skuteczność promieniowania basów.
Systemy PA – w wersji dzisiejszej – miały szansę powstania dzięki ścisłej współpracy ludzi, którzy je projektowali i tych którzy z nich korzystali. Trzeba bowiem wiedzieć, że producenci sprzętu, posiadający markę od lat uznaną w świecie, bardzo cenią sobie opinie i sugestie firm takich jak np. Clair Brothers, dB Sound, Capitol Sound Hire czy Wigwam Acoustics, które na co dzień zajmują się nagłaśnianiem dużych estradowych produkcji.

Wróćmy jednak do omawiania obudów zestawów głośnikowych.
Na wstępie powiedzieliśmy sobie, że zawieszony w powietrzu głośnik dynamiczny słabo emituje niskie częstotliwości lub też nie emituje ich wcale. Rozpoczęto więc liczne próby mające na celu polepszenie przenoszenia niskich częstotliwości. Jednym z eksperymentów było zamontowanie głośnika w jednej ze ścian szczelnie zamkniętej skrzyni, o wnętrzu wypełnionym materiałem dźwiękochłonnym, którego zadaniem było pochłanianie energii emitowanej przez tylną ścianę membrany głośnika. Takie posunięcie miało umożliwić zrealizowanie w praktyce idei nieskończenie wielkiej odgrody oddzielającej obie strony membrany głośnika, co ma za zadanie chronić je przed wzajemnym, niepożądanym oddziaływaniem. Tak powstała obudowa zamknięta. Praktyka pokazała, że nie było to spodziewanym rozwiązaniem wszystkich problemów, a wręcz przeciwnie – pojawiły się nowe. Szybko bowiem zorientowano się, że istnieją ścisłe zależności pomiędzy wielkością obudowy, częstotliwością rezonansową i średnicą membrany głośnika. Aby zbytnio nie zagmatwać tematu powiem tylko tyle, że do obudowy zamkniętej potrzebny był głośnik o bardzo miękko zawieszonym układzie drgającym, przystosowanym do wykonywania ruchów o dużej amplitudzie. Wymagania takie wynikają z tego powodu, że obudowa zamknięta zwiększa częstotliwość rezonansową głośnika i to tym bardziej, im mniejsza jest jej objętość i im większa jest średnica membrany głośnika. Zależność ta jest wynikiem tego, że membrana głośnika pracującego w obudowie zamkniętej spręża i rozpręża powietrze znajdujące się we wnętrzu obudowy. Można więc zaryzykować stwierdzenie, że jest ona dodatkowo zawieszona pneumatycznie na poduszce powietrznej. Był to bez wątpienia postęp na drodze poszukiwania “dołu” jednak to jeszcze nie był pełen sukces.
O ile stosując specjalnej konstrukcji głośniki udało się poszerzyć pasmo przenoszenia ku wyższym częstotliwościom, o tyle w zakresie najniższych częstotliwości napotykano ciągle na duże przeszkody. Projektanci i konstruktorzy nie dawali jednak za wygraną i wykorzystując wszystkie zdobyte wcześniej doświadczenia, konstruowali obudowy oparte o coraz ciekawsze pomysły. Jednak stawiane im przez użytkowników zadania były coraz trudniejsze, bo oprócz spełnienia warunków związanych z jakością reprodukowanego dźwięku, coraz częściej zaczęto przykładać wagę do ciężaru iwielkości zestawów głośnikowych. Dochodziły tu do głosu względy czysto ekonomiczne, takie jak ilość środków transportu potrzebnych do przemieszczania sprzętu podczas tras koncertowych.
Obudowa z otworem rezonansowym jest produkowana do dzisiaj przez różne firmy – zarówno w zestawach domowych, jak też i profesjonalnych systemach PA. Czym szczególnym się ona charakteryzuje? Rysunek 1 przedstawia przekrój obudowy z otworem, gdzie 1 i 2 to głośniki, a 3 jest otworem rezonansowym – tu akurat posiadającym kształt tunelu, charakteryzującym się takimi cechami jak: powierzchnia, masa akustyczna i długość. Głośniki 1 i 2 są identyczne.
Jeżeli teraz zasilimy głośniki sygnałem z generatora akustycznego i stopniowo będziemy jego częstotliwość zwiększać, to w pewnym momencie (przy określonej, konkretnej częstotliwości) pojawi się dość ciekawe zjawisko. Otóż, powietrze w otworze zacznie silnie drgać i otwór stanie się źródłem promieniowania fali dźwiękowej. Dzieje się tak dlatego, że pojawia się rezonans akustyczny układu składającego się z podatności akustycznej wnętrza obudowy i masy akustycznej otworu.

tonalność dziwęku

Spośród cech wrażenia dźwiękowego wyróżniano do niedawna jedynie trzy podstawowe: wysokość, głośność i barwę dźwięku. Barwę traktowano przy tym jako swoisty “koszyczek”, do którego wrzucano wszystkie, nie będące wysokością i głośnością, cechy dźwięku.

Andrzej Miśkiewicz (Solfeż barwy; 1991), wskazując również i na inne prace, prezentuje barwę jako zwyczajny “śmietnik” – “wastebasket” (W. D. Ward; 1970), “dustbin” (R. Plomp; 1970) lub “catchall” (A. W. Slawson; 1975). Tymczasem najnowsze tendencje w psychoakustyce pozwalają różnicować składowe barwy i coraz to precyzyjniej je opisywać. Swojej fizycznej reprezentacji doczekały się nawet ostrość (acum), chropowatość (asper), subiektywny czas trwania (dura) oraz fluktuacja (vasil). W dalszym ciągu jednak nie jest zdefiniowana procedura mierzenia tonalności.
W poniższym artykule spróbujemy zastanowić się nad czynnikami, które decydują o szmerowym, bądź też tonalnym charakterze barwy. Zaproponujemy pewien – na razie roboczy – model matematyczny, opisujący wrażenia tonalności. Zastanowimy się także nad sensem i możliwością rzetelnego definiowania wspomnianych jednostek.
Autor artykułu, będący nie tylko miłośnikiem psychoakustyki, ale również – a może przede wszystkim – miłośnikiem muzyki i posiadający tytuł zawodowego muzyka (w zakresie kompozycji), przeprowadził na sobie samym szereg eksperymentów, związanych z próbą wyodrębnienia czynników decydujących o tonalności. A czynnikami tymi są: ilość i rozmieszczenie składowych (spektralnych) dźwięku, proporcje natężeń (a raczej głośności) i częstotliwości (jakie istnieją między nimi), oraz zakres i szybkość zmienności wszystkich powyższych elementów. Należy przy tym pamiętać, iż termin tonalność wiąże się z utrwaloną historycznie tercjową zasadą budowy akordów w muzyce (podręcznik harmonii Kazimierza Sikorskigo), a tym samym z pojęciem konsonansowości i dysonansowości interwałów muzycznych (oraz z pojęciem dysonansu sensorycznego Andrzeja Rakowskigo). Wobec tego należy przede wszystkim brać pod uwagę wzajemną relację pomiędzy alikwotami oraz relację między alikwotami a tonem podstawowym.
Jako definicję tonalności autor przyjmuje zdanie Urszuli Jorasz: “Tonalność jest to cecha wrażenia, która pozwala odróżnić szum od tonu”. Jest to definicja “konstytutywna”, czyli taka, która mówi, co za tonalność należy uważać. Nas natomiast interesuje definicja “operacyjna”, która proponuje algorytm wyznaczania tonalności. Zaproponujmy więc pewien wzór (na razie jednak bez odpowiedniego ważenia czynników).
Chodzi przede wszystkim o współzależność parametrów, które nie są wstanie tworzyć przestrzeni ortogonalnej. Już sama tonalność jest sprzężona z ostrością i chropowatością dźwięku w sposób komplementarny, tzn. gdy jednej cechy przybywa, to drugiej akurat ubywa. Zależność ta jest doskonale widoczna w przypadku modulacji (np. amplitudy). Podobnie rzecz się ma ze współzależnością wrażenia jasności i ostrością. Obie te cechy posiadają wspólny fizyczny korelat w postaci dużej zawartości wysokich tonów. Dla tonalności takim fizycznym korelatem jest dominacja jednej składowej nad pozostałymi.
Aby nie mnożyć “bytów ponad potrzebę”, warto chyba i do akustyki zastosować słynną “brzytwę Ockhama”.
Idealnym przykładem absurdalnie złożonych i nierozerwalnie powiązanych ze sobą wielkości wrażeniowych, jest grubość (jak również tłustość), głębia, długość, szerokość, wysokość oraz liczność. Ilość czynników wpływających na te wrażenia jest ogromna. Jak stworzyć wzór na liczność (kiedy np. jest czegoś dużo a kiedy mało)? Czy jest to tylko iloraz ilości szacowanej przez ilość, której się obserwator w danym momencie akurat spodziewa? Czy jest to również zależność ilości i jakość “rzutów zmysłu” na dany obiekt? A może – w końcu – jest to zależność pola widzenia, odległości i położenia od bodźca, oraz stosunku wzajemnej wielkości obserwatora i obiektu lub obiektów obserwowanych? Problemem jest również kontekst stosowania powyższych określeń i ich wzajemna wymienność (kiedy grubość staje się szerokością, a dal głębią?). Oto podstawowe paradoksy psychofizyki i argumenty przeciwko nowym jednostkom w psychofizyce.
Z drugiej jednak strony, należy uznać potrzebę definiowania i skalowania nowych cech wrażenia, zwłaszcza dla celów poznawczych (eksperymenty porównawcze).
W ten sposób, bazując na wzajemnej korelacji niektórych cech, można zaproponować model matematyczny wrażenia tonalności, na razie jednak bez odpowiedniego ważenia czynników.
Kolejne oznaczenia wykorzystane we wzorze to:
i - nr kolejnego tonu składowego począwszy od najniższej częstotliwości,
k – nr kolejnego pomiaru, nr kolejnej “stopklatki”,
T [tonus] – wartość wyrażająca tonalność; przyjmuje wartość minimalną dla tonu prostego,
V – współczynnik strefowej czytelności wysokości tonu,
D – dysonans sensoryczny pomiędzy danym tonem a tonem sąsiednim; D zależny od częstotliwości i natężenia dwóch współbrzmiących tonów,
N - ilość wszystkich pomiarów.

Zmienna D zawiera w sobie zależność aż pięciu wielkości. Wielkościami tymi są: natężenie tonu niższego, natężenia tonu wyższego, amplituda tonu niższego, amplituda tonu wyższego, a także dysonans zależny od powyższych czynników. Mamy więc przestrzeń pięciowymiarową, z której odczytujemy potrzebne nam akurat wartości. Oczywiście należałoby dokonać “mrówczej pracy” pomiarowej dla “nowego” znaczenia dysonansu sensorycznego, aby wypełniona wartościami liczbowymi przestrzeń, pokazywała jednocześnie zależność dysonansu od amplitudy dwóch tonów oraz ich poziomów natężeń. W ten sposób oddzielne traktowanie czynników natężenia oraz amplitudy we wzorze przestałoby mieć jakikolwiek sens. Czynniki te są bowiem pośrednio obecne w “nowej” wersji zmiennej D (klasyczny dysonans sensoryczny opisują prace prof. A. Rakowskiego). Natomiast za zmienność rozkładu wysokości i głośności w czasie odpowiada wyrażenie w postaci wartości bezwzględnej. Wyrażenie to pokazuje stan zmienności – zakres i rodzaj zmian. Niestety wzór nie uwzględnia zjawiska maskowania w przypadku współbrzmienia trzech i więcej tonów (w przypadku dwóch tonów brzmiących jednocześnie, problem zdaje się rozwiązywać już sama obecność czynnika D).

Proponowany algorytm posługiwania się wzorem
• Ustalamy przedział czasu pomiarów oraz stałe odstępy czasu, w których będziemy rejestrować rozkład energii akustycznej.
• Rejestrujemy zależność amplitudy i częstotliwości w każdej “stopklatce” pomiaru.
• Ustalamy wszystkie tony składowe konkretnego dźwięku, jakie kiedykolwiek pojawiły się w przeciągu trwania całego pomiaru. Jeśli któraś składowa pojawiła się choćby tylko przez chwilę (pojawiła się tylko w pojedynczej “stopklatce”), należy ją również wziąć pod uwagę.
• Wszystkie tony składowe dźwięku (pojawiające się nie tylko w danej chwili, lecz w ogóle w każdym momencie pomiaru) numerujemy w kolejności wzrostu ich częstotliwości, zgodnie z następującym przykładem: niech i=1 dla A=20, oraz niech i=2 dla A=40 itd. wzwyż.
• Wypełniamy wzór konkretnymi wartościami liczbowymi. I tu najważniejsza uwaga. Przy wypełnianiu wzoru, uwzględnia się każdy pomiar po kolei i każdy składnik po kolei (składnik, który jest w dźwięku obecny; składnik, który pojawił się już wcześniej; a także składnik, który dopiero co się pojawi). Składniki dźwięku w danym momencie nie aktywne (nie obecne) mają zerową wartość D i V oraz zarezerwowaną i – jednocześnie – niezerową wartość indeksu i. Zakładamy też oczywiście, że dla k=1 wyrażenie (k-1) = k.
Dik jest tak naprawdę sumą dysonansów zachodzących pomiędzy i-tym tonem a wszystkimi tonami z najbliższego otoczenia. Suma ta zresztą pośrednio uwzględnia znaczenie wysokości rezydualnej w kształtowaniu czytelności tonalnej dźwięku. Im suma Dik jest większa, tym mniejsze szanse na wydzielenie z kontinuum częstotliwości “wirtualnej”, czyli “tonalnie czytelnej” częstotliwości rezydualnej. Wspomniane otoczenie tonu w całej swej rozciągłości dochodzi do interwału decymy (sekunda w dół i nona w górę od danego i-tego tonu). Zatem Dik można zapisać jako S (Dik otoczenia _ tonu).
I jeszcze jedna uwaga. Proszę zauważyć, iż dla tej samej wartości dysonansu powstają jednak pomiędzy tonami najwyższymi i pomiędzy tonami średnimi różne wrażenia tonalności. Tony najwyższe są (niezależnie od wartości D) mniej czytelne, bardziej szmerowe, w porównaniu z tonami średnicy skali częstości. Podobnie zresztą tony najniższe są tonalnie mniej czytelne. Dlatego też został wprowadzony współczynnik strefowej czytelności wysokości (V), niezależny od samego dysonansu sensorycznego, a zależny od amplitudy i częstotliwości tonu.
W ten sposób ujęliśmy matematycznie niemalże wszystkie najważniejsze czynniki. Oczywiście brak jest we wzorze odpowiedniego wyważenia poszczególnych elementów, można by rzec – brak jest właściwej “kalibracji”. Jednakże wyizolowanie każdego z tych elementów w przyszłych badaniach eksperymentalnych pozwoli niewątpliwie uzupełnić ten niedostatek. Wyizolowanie każdego z elementów nie do końca będzie jednak możliwe, bowiem należy pamiętać, że te same parametry fizykalne niejednokrotnie są uwzględniane “podwójnie”.
Weźmy dla przykładu czynnik D oraz V. Dla obu tych wielkości parametr częstotliwości jest jednakowoż ważny. Można zatem powiedzieć, że czynniki te niejako “współdzielą” częstotliwość i są – na nasze nieszczęście – zintegrowane w sposób nierozłączny.
Takich i podobnych wątpliwości jest więcej. W dalszym ciągu nie wiadomo np. jak zachowałby się wzór na T w przypadku większej ilości tonów składowych o podobnej głośności, jak zachowałby się nasz wzór w przypadku szumu. Wartość szumu w szumie (lub – jak ktoś woli – “cukru w cukrze”) wzrosłaby wówczas do nieskończoności.
Warto chyba na zakończenie podkreślić, że tonalność nie jest zjawiskiem zamkniętym w samym sobie, nie jest w żadnym wypadku “samotnikiem” lub “samolubem” na tle innych cech barwy. Od tonalności zależy bowiem zjawisko znaczeniowo nadrzędne. Od tonalności zależy wrażenie przyjemności obcowania z dźwiękiem, a co za tym idzie – przyjemności obcowania z samą muzyką.

wzmacniacze mocy

W artykule tym przyjrzymy się klasom pracy wzmacniacza mocy.
Z założenia nie wnikamy w bardziej zaawansowane problemy techniczne, skupiając się tylko na ogólnych informacjach mających znaczenie dla muzyków i realizatorów.

Każdy wzmacniacz mocy składa się ze stopnia wejściowego, stopnia wzmocnienia napięciowego, stopnia sterowania, stopnia wykonawczego i zasilacza. Wzajemna konfiguracja trzech ostatnich bloków wyznacza klasę pracy wzmacniacza i ma bardzo duży wpływ na wiele czynników – począwszy od brzmienia na poborze mocy skończywszy. Informacja o klasie pracy wzmacniacza jest jedną z najważniejszych informacji, którą należy brać pod uwagę – na równi z mocą wyjściową i dopuszczalnymi parametrami obciążenia.

Klasa A.
Z taką konfiguracją stopni mocy spotykamy się od pierwszych lat istnienia elektroniki. Paradoksalnie – właśnie ta najprostsza i najmniej efektywna klasa pracy pozwala na uzyskanie najlepszej jakości dźwięku, choć jest to okupione bardzo dużym poborem prądu i – co zawsze się z tym wiąże – dużą masą urządzenia. Wzmacniacze pracujące w klasie A znajdują zastosowanie głównie w studiach jako wzmacniacze odsłuchowe, choć jest kilka wyjątków. Jednym z nich jest niemiecka firma Glockenklang, znana z produkcji najwyższej jakości sprzętu nagłośnieniowego dla basistów. Ma ona w swej ofercie między innymi wzmacniacze pracujące w czystej klasie A, często wykorzystywane jako wzorcowe przez wielu najważniejszych producentów gitar basowych.
W przypadku klasy A elementy wykonawcze (tranzystory lub lampy mocy) zawsze pobierają prąd, nawet wtedy, gdy nie są wysterowane żadnym sygnałem. Wartość tego prądu jest dobierana w ten sposób, by elementy te pracowały w liniowym odcinku swej charakterystyki. Dzięki temu znacząco spada poziom zniekształceń nieliniowych. Inną zaletą tych wzmacniaczy jest stabilizacja cieplna – układy wykonawcze są cały czas podgrzewane prądem przez nie płynącym i zachowują mniej więcej stałą temperaturę roboczą, co ma duży wpływ na liniowość przetwarzania sygnału. Układy w klasie A są stosunkowo proste do zbudowania, składają się z niewielkiej liczby elementów i przy prawidłowym doborze podzespołów wykazują się dużą niezawodnością. Wadą tej konstrukcji jest niska sprawność (stosunek mocy oddawanej do pobieranej) nie przekraczająca na ogół 20%. Ich moc wyjściowa też jest niewielka – najpotężniejsze konstrukcje oferują w porywach 300 watów. Pomijając aspekty ekologiczne, wzmacniacze w klasie A najwięcej mocy zużywają na grzanie się, co zwiększa wymagania w odniesieniu do jakości zastosowanych podzespołów. Pomimo faktu, że wzmacniacze mocy pracujące w tej klasie oferują zdecydowanie najlepsze brzmienie, ich wysoka cena, duża waga i bardzo niska sprawność energetyczna sprawiają, że chyba pozostaną urządzeniami ekskluzywnymi, raczej z niewielkimi perspektywami na ich bardziej powszechne wykorzystanie w typowych systemach nagłośnieniowych.

Klasa B.
Wzmacniacze pracujące w klasie B pozwalają na uzyskanie większej mocy wyjściowej, mają mniejszą zawartość parzystych harmonicznych (zjawisko mniej korzystne z muzycznego punktu widzenia – brzmienie tych wzmacniaczy odbieramy jako bardziej metaliczne i surowe) i charakteryzują się małym poborem prądu w stanie spoczynku (bez sygnału wejściowego). Podstawową wadą tego rozwiązania jest stosunkowo duży poziom zniekształceń nieliniowych i konieczność stosowania dość głębokiego ujemnego sprzężenia zwrotnego, najczęściej przez dwa stopnie. To powoduje występowanie znaczących przesunięć fazowych na krańcach pasma. Czysta klasa B to konstrukcja ekonomiczna, ale z uwagi na wysoki poziom zniekształceń bardzo rzadko stosowana w praktyce.

W dziedzinie wzmacniaczy pracujących w klasie H dużą popularnością cieszą się konstrukcje firmy Carver. Przed transformatorem zasilającym zastosowano w nich specjalny układ z triakiem sterowanym poziomem sygnału wejściowego. Układ ten pozwala na wydłużenie czasu pracy w ramach jednego okresu (rysunek po prawo), co pozwala na zwiększenie sprawności wzmacniacza podczas przenoszenia silnych sygnałów impulsowych i znacząco redukuje zakłócenia wywołane kluczowaniem zasilania.

Klasa AB.
Konstrukcja w klasie AB jest naturalnym rozwinięciem klasy B i podobnie jak ona zbudowana jest w oparciu o układ przeciwsobny. Każda połówka sygnału przetwarzana jest przez oddzielną gałąź stopnia wyjściowego, co w sumie daje pełne odwzorowanie sygnału przemiennego na wyjściu wzmacniacza. O ile w przypadku klasy B największe problemy występują właśnie przy przechodzeniu przebiegu przez oś 0, o tyle w klasie AB zastosowano wstępną polaryzację (wymuszenie stałego przepływu prądu o niewielkiej wartości przez stopnie wykonawcze), co poprawiło sytuację dzięki wyeliminowaniu zjawiska tzw. zniekształceń skrośnych i znacznie zbliżyło brzmienie klasy AB do brzmienia wzmacniaczy pracujących w klasie A. Sprawność wzrosła do ok. 50%, więc konstrukcja stała się uzasadniona ekonomicznie. A zatem same zalety? Nie do końca. Wzmacniacze pracujące w klasie AB są dość skomplikowane konstrukcyjnie i wymagają starannych zabezpieczeń przed przeciążeniami. Wynika to z faktu, że zastosowane w nich ujemne sprzężenie zwrotne (część sygnału z wyjścia podawana jest na wejście, co ma na celu wymuszenie bardziej liniowej pracy wzmacniacza) w sytuacjach ekstremalnych (przeciążenie wyjścia, gwałtowne zmniejszenie impedancji obciążenia) może spowodować eskalację niekorzystnych zjawisk. Należy zadbać również o stabilność termiczną całego układu i precyzyjne dopasowanie pod względem parametrów elementów pracujących w obu gałęziach przeciwsobnego stopnia wyjściowego. Dobrze zaprojektowany wzmacniacz w klasie AB potrafi jednak zabrzmieć znakomicie, a prawidłowy dobór elementów i skuteczność zabezpieczeń pozwolą mu na długą i efektywną pracę nawet w najbardziej ekstremalnych warunkach.

Klasa G i H.
Wzmacniacze pracujące w tych klasach znane są od połowy lat 80. i wykorzystywane są we wzmacniaczach o najwyższej mocy – do 5000 watów (5kW) na kanał. Idea klas G i H sprowadza się do założenia, że wzmacniacz mocy nie potrzebuje dużego napięcia zasilania przez cały czas, a jedynie podczas przetwarzania sygnałów o dużej amplitudzie. Z analizy typowych przebiegów audio wynika, że sygnały takie stanowią 50% całości sygnałów przetwarzanych przez aparaturę nagłaśniającą. Stąd już prosta droga do opracowania układu, który będzie załączał większe napięcie zasilania tylko wtedy, gdy sygnał wejściowy wzrośnie powyżej pewnej wartości. Wzmacniacze pracujące w klasach G i H pozwalają na zwiększenie sprawności (a zatem zmniejszenie wydzielanego ciepła) i redukcję kosztów (mniejsze wymagania odnośnie radiatorów chłodzących i tranzystorów mocy).
Od strony praktycznej wzmacniacz w klasie G to w zasadzie dwa oddzielne stopnie wyjściowe. Jeden ma mniejszą moc i cały czas pracuje, niezależnie od poziomu sygnału. Drugi stopień podłączony jest do większego zasilania i “dokłada” się do stopnia o mniejszej mocy tylko w momentach większego zapotrzebowania na energię. W przypadku klasy H mamy do czynienia z jednym wzmacniaczem, z którym współpracuje zasilacz o stopniowanym napięciu wyjściowym, przełączanym w zależności od potrzeb. Współczesne wzmacniacze pracujące w klasach G i H pozbawione są już przypadłości pierwszych konstrukcji tego typu, polegających na słyszalnym szumie przełączania i sporych zniekształceniach sygnału w wyższych częstotliwościach. Mimo tego lepszym pomysłem jest wykorzystanie tych wzmacniaczy w zakresie niskich i średnich częstotliwości (bronią się dużą mocą, sprawnością i stosunkowo niewielką wagą) i pozostawienie sterowania driverów wysokotonowych lepszym pod tym względem wzmacniaczom pracującym w klasie AB.

Klasa D.
Wzmacniacze pracujące w tej klasie znane są pod nazwą wzmacniaczy impulsowych. Punktem wyjścia do zrozumienia zasady ich działania jest zjawisko znane w elektronice pod nazwą modulacji szerokości impulsu (PWM). Sygnał wejściowy jest zamieniany na impulsy, których szerokość jest wprost proporcjonalna do wyniku pomiaru próbki sygnału, dokonywanego z częstotliwością ponadakustyczną (od 200 do 500kHz). Impulsy te są wzmacniane przez stopień mocy, a następnie wygładzane i filtrowane za pomocą filtrów o dużym nachyleniu charakterystyki. Z pewnością wielu z Was obruszy się na myśl, że starannie wypielęgnowany w przedwzmacniaczach, korektorach i kompresorach sygnał trafia do swego rodzaju “szatkownicy dźwięku”. Ale nie ma powodu do niepokoju. Współczesne konstrukcje wzmacniaczy pracujących w klasie D to zaawansowane i starannie przemyślane układy, które nie mają wiele wspólnego z pierwszymi urządzeniami tego typu – bardzo zawodnymi i kiepsko brzmiącymi. Powodami, dla którego je kiedyś tolerowano, była ich rewelacyjna sprawność sięgająca 95%, znikoma waga wynikająca z braku dużego transformatora zasilającego i małe wymiary. Dzisiejsze wzmacniacze PWM często brzmią bardzo dobrze w całym zakresie audio, a ich dość wysoka cena szybko zostanie zrekompensowana przez redukcję kosztów transportu z uwagi na mniejsze wymiary i niemal pomijalną wagę.

Co dalej?
Na horyzoncie co rusz pojawiają się nowe opracowania wzmacniaczy mocy. Poszukiwania konstruktorów idą w kierunku dalszego zmniejszenia wymagań odnośnie chłodzenia i zasilania. Jedną z najbardziej znaczących nowości ostatnich lat jest opracowana przez firmę TriPath technologia znana pod nazwą klasy T. Firma jest producentem układów scalonych będących kompletnym, zintegrowanym stopniem mocy wymagającym niewielkiego chłodzenia. W przeciwieństwie do klasy D zastosowano tu cyfrowy układ inteligentnie dostosowujący sposób próbkowania do charakteru sygnału, parametrów stopnia wyjściowego i wielu innych czynników. To sprawia, że od wzmacniaczy w klasie T możemy oczekiwać lepszej jakości dźwięku niż w przypadku wzmacniaczy pracujących w klasie D, gdzie proces próbkowania pozostawał bez zmian.
Doświadczenie uczy, że wzmacniacze mocy nie są li tylko przezroczystym brzmieniowo urządzeniem, którego zadaniem jest wzmocnienie sygnału podawanego na głośniki. Każdy z nich, nawet w ramach tej samej klasy, charakteryzuje się innym brzmieniem wynikającym z zastosowanych elementów, doboru punktów pracy czy wyboru określonych rozwiązań układowych.
Z pewnością najpopularniejsza i najczęściej stosowana klasa AB długo jeszcze będzie wykorzystywana w estradowych wzmacniaczach mocy. Jednak stale rosnąca świadomość ekologiczna i – dla wielu użytkowników bardziej istotna – oszczędność wynikająca z małej wagi i wymiarów wzmacniaczy klasy G, H i D spowoduje zapewne dalszy wzrost popularności tychże konstrukcji.
Techniki cyfrowe nieśmiało wkraczają do tej dziedziny przemysłu audio, ale przełom w postaci klasy T może zmienić nastawienie wielu producentów i użytkowników.

muzyka elektroniczna

Komputer to narzędzie tak wszechobecne we wszystkich dziedzinach życia, że dziś jego brak w jakimkolwiek miejscu jest dla wielu cyberpunków większym zaskoczeniem niż jego obecność. Naporowi komputeryzacji nie oparła się również muzyka. Z tego narzędzia korzysta wielu muzyków i realizatorów dźwięku.

Jeszcze kilkanaście lat temu komputer był uważany przez ortodoksów za fanaberię “idących na łatwiznę” elektroników – bądź co bądź to ci twórcy jako pierwsi wprowadzili go na salony Polihymnii. W tej chwili po ekranach monitorów jeżdżą myszką nawet ci artyści, którzy – gardząc syntetycznymi brzmieniami i muzyką pospolicie nazywaną komputerową – tworzą swoje dzieła w oparciu o tradycyjne brzmienia i struktury formalne.
Wielu miłośników muzyki elektronicznej pamięta na pewno album “Dig It” Klausa Schulze – i właśnie z tą płytą i z tym artystą kojarzą premierę komputera w muzyce. Tymczasem pierwsze pomyślne próby sprzęgnięcia tego narzędzia ze sztuką sonoryczną miały miejsce już w latach pięćdziesiątych XX wieku – co z jednej strony wydawać się może i tak mocno spóźnionym podejściem muzyków do informatyki zważywszy, iż pierwsze maszyny “cyfrowe” powstawały już w pierwszej połowie. XIX wieku. W latach 1833-34 angielski naukowiec Charles Babbage zbudował olbrzymi komputer. mechaniczny, któremu nadał nazwę Difference Engineer. Kilka miesięcy później opracował plan techniczny urządzenia nazwanego Analytical Engine, ale ta maszyna nigdy nie doczekała się swoich materialnych narodzin. Nie pomogło w tym nawet wsparcie samego Lorda Byrona, którego córka – Ada Lovelace – asystowała przy opracowywaniu dokumentacji obu wymienionych urządzeń. Te i wiele innych konstrukcji powstałych w ciągu następnych ok. 120 lat miały jednak tak olbrzymie rozmiary, a ponadto z ich wybudowaniem i zainstalowaniem wiązały się tak duże koszty, że te dwa czynniki bardzo długo nie sprzyjały rozmyślaniom nad ewentualnym zastosowaniem pierwszych komputerów w sztuce.
Pierwszymi artystami, którzy z powodzeniem użyli komputera w swojej twórczości, byli Lejaren Hiller i Leonard Isaacson działający na University of Illinois. W 1955 roku skomponowali oni “Illiac String Quartet”, o którym można powiedzieć, że była to pierwsza kompozycja komputerowa – ten utwór przynajmniej jest powszechnie uznawany za pierwsze dzieło wygenerowane z użyciem komputera. Jego tytuł jest mocno związany z miejscem, w którym powstało i instrumentem, jaki posłużył do jego stworzenia – szczególnie chodzi tu o pierwszy człon tytułu będący nazwą urządzenia – komputera Illiac I (ILLInois Automated Computer). Użycie Illiaca do komponowania muzyki stało się impulsem, który zapoczątkował intensywne prace nad stworzeniem Studia Muzyki Eksperymentalnej przy Uniwersytecie Stanu Illinois – o czym pisaliśmy w jednym z poprzednich odcinków cyklu. Studio powstało w 1957 roku. Kilka lat później – w 1963 roku – Lejaren Hiller skomponował kolejne wiekopomne dzieło odnotowane w “przegródce” poświęconej muzyce komputerowej, a noszące wszystko mówiący tytuł “Computer Cantata”. Tym razem w działaniach z maszyną cyfrową wspomagał go Robert Baker.
Już w następnym roku po powstaniu “Illiac String Quartet” dwaj inni programiści o informatyczno-artystycznych zainteresowaniach – Martin Klein i Douglas Bolitho – zaczęli używać komputera Datatron do komponowania muzyki popularnej. Maszyna została “ochrzczona” przez nich pieszczotliwie Push-button Bertha. Nazwa ta pochodzi od tytułu “piosenki”, do której tekst napisał Jack Owens, a melodię skomponował rzeczony komputer. Na marginesie dodajmy, że swego czasu wynikły w związku z tym spore trudności z zarejestrowaniem praw autorskich do tego utworu, ponieważ firma zajmująca się ochroną tychże nigdy wcześniej nie miała do czynienia z kompozycją napisaną przez maszynę.
Podstawowe zasady działania komputera były oparte na metodach, według których powstało około stu – wybranych przez Kleina jako najbardziej reprezentatywne – ówczesnych największych przebojów. “Rozszyfrowane” przez informatyka zasady zostały zapisane w pamięci urządzenia w formie odpowiednio przystosowanej do jego możliwości. Wyjściowym źródłem, z jakiego uzyskiwano efekty końcowe, były zbiory losowo wybieranych informacji cyfrowych, które następnie komputer dopasowywał do zasad, według jakich został zaprogramowany i układał z nich określone struktury i schematy tonalne w tempie do 4.000 tonów na godzinę, co groziło “pójściem z torbami” nawet najpłodniejszym twórcom piosenek – tym bardziej, że na tym nie kończyły się możliwości maszyny.
W celu złagodzenia obaw artystów, którzy ewentualnie mogliby poczuć zagrożenie ze strony komputera, Martin Klein wyjaśniał (m.in. na łamach prasy), że “geniusz to połączenie 10% inspiracji i 90% ciężkiej pracy”, a jego urządzenie na dobrą sprawę potrafi “tylko” ciężko pracować, natomiast nie posiada owych ogromnie ważnych 10%.
To co “potrafiła” Push-Button Bertha, sprowadzało się w zasadzie do błyskawicznego przetwarzania zapisanych w jej pamięci motywów, co polegało na powtarzaniu ich w różnych tempach, przy odmiennych poziomach dźwięku i na dowolnych wysokościach, a nawet w kontrapunkcie względem innych wersji wyjściowych melodyjek. Działo się tak, albowiem twórcy programu wyszli z założenia, że powtarzalność motywów jest podstawową techniką komponowania muzyki. Oczywiście ograniczało to “umiejętności” kompozytorskie Datatronu i sprowadzało je w zasadzie do tworzenia muzyki rozrywkowej – jakkolwiek “pracowity” kompozytor, potrafiący w miarę wszechstronnie obsługiwać urządzenie byłby w stanie wykreować kompozycję odpowiadającą wymogom ekspertów i koneserów muzyki współczesnej; równocześnie z odsłuchiwaniem kompozycji Berthy istniała bowiem możliwość zarejestrowania utworu. Z tak powstałego zapisu można było wybrać dowolne fragmenty – kasując te uznane za niepotrzebne – i za pomocą klawiatury komputera wprowadzić odpowiednie kody, które tworzyły harmonię, a nawet aranżację tak powstałych kawałków.
W 1958 roku komputer do generowania muzyki pojawił się w laboratoriach amerykańskiej firmy Bell. Jego operatorem był Max Mathews, który w następnym roku – po kilku miesiącach eksperymentowania z wydobywaniem z urządzenia samych dźwięków – zaczął pracować nad stworzeniem programu do tworzenia bardziej obszernych materiałów muzycznych. Wspomagała go w tych działaniach Joan Miller – również pracująca w Bell Laboratories. Razem napisali pierwszy dysponujący szeroką gamą możliwości program komputerowy służący do dokonywania syntezy dźwięku. Nazwali go Music IV.

Uziemienie systemów nagłośnieniowych

Czym jest uziemienie? Dla wielu realizatorów i techników jest to zagadnienie leżące w sferze „czarnej magii” – nie mówiąc już o przypadkowych użytkownikach systemów nagłośnienia. Wszyscy wiedzą, że ma to coś wspólnego z bezpieczeństwem. Niektórzy wiedzą, że ma to również coś wspólnego ze zmniejszeniem poziomu zakłóceń, ale zaledwie nieliczni wiedzą w jaki sposób zaprojektować dystrybucję zasilania poszczególnych urządzeń i jak poprowadzić sygnały audio pomiędzy nimi, aby uniknąć pętli masowych i zredukować do minimum poziom zakłóceń.

Po przeczytaniu tego artykułu nikt nie stanie się ekspertem w tej dziedzinie, ale być może materiał ten pozwoli zaznajomić się z pewnymi zasadami oraz środkami bezpieczeństwa, które pomogą uniknąć wielu stresujących sytuacji podczas pracy z systemami PA. Warto je również (a może przede wszystkim) poznać i z drugiego powodu – w trosce o własne zdrowie, a nawet życie.

Zanim podłączymy główny kabel zasilający nasz system PA do jakiegoś lokalnego przyłącza w miejscu, gdzie przyszło nam go używać, powinniśmy bacznie prześledzić oznaczenia przewodów (głównie zerowego i uziemiającego). Uwaga ta ma szczególne znaczenie podczas różnych imprez plenerowych. Zdarza się, że na potrzeby takich imprez wykonywana jest prowizoryczna instalacja. Niestety bywa tak, że nie zawsze przyłącze to jest wykonane przez uprawnionych elektryków i często z wykorzystaniem będących właśnie pod ręką lub okazyjnie załatwionych materiałów – nie bacząc na obowiązujące normy i oznaczenia. W takich sytuacjach posiadanie nawet bardzo prostego przyrządu pozwalającego na zmierzenie napięć w odpowiednim zakresie może okazać się bardzo przydatne.
Należy też pamiętać, że żaden producent ani żaden dystrybutor nie obejmuje gwarancją sprzętu, który zostaje uszkodzony w wyniku podłączenia go do źródła zasilania o parametrach niezgodnych z wymogami. Ani producent, ani dystrybutor nie ponosi też odpowiedzialności, gdy z powodu nieprawidłowego zasilania sprzęt stwarza sytuację niebezpieczną dla zdrowia lub życia użytkowników. Mówiąc najprościej – jeżeli odpinasz masę lub przewód uziemiający, bierzesz na siebie odpowiedzialność za stworzenie sytuacji, w wyniku której może dojść do porażenia prądem elektrycznym.

Nie ufaj urządzeniom, instalacjom i przyłączom mogącym stanowić potencjalne zagrożenie porażeniem prądem (czyli wszystkiemu, co jest zasilane napięciem przemiennym 220V). Nawet jeśli ktoś nas zapewnia, że wszystko jest O.K., dla pewności lepiej jest wszystko sprawdzić osobiście. Znane są przypadki porażenia prądem muzyków w wyniku niewłaściwie okablowanego i źle zasilonego systemu PA.

Ziemia – w rozważaniach elektrotechnicznych jest punktem odniesienia, względem którego wyrażone są określone potencjały (napięcia). W praktyce okaże się, że podczas konfigurowania systemu elektroakustycznego napotkamy kilka niezależnych punktów odniesienia, występujących w jego częściach składowych. Wszystkie one mogą posiadać ten sam elektryczny potencjał lub nie (zazwyczaj okazuje się, że nie mają one tego samego potencjału…).
W każdym systemie PA – zarówno tym bardzo prostym jak i bardzo rozbudowanym, możemy wyróżnić trzy główne punkty odniesienia mające w swojej nazwie słowo GROUND (w skrócie GND):
• SIGNAL GND (masa sygnału) – punkt odniesienia, względem którego wyraża się potencjały sygnałów w poszczególnych częściach urządzeń lub grupach urządzeń w naszym systemie.
• CHASSIS GND (masa obudowy) – połączenie obudowy urządzenia z określonym miejscem systemu. W urządzeniach posiadających 3-żyłowy kabel zasilający, czyli taki z zielono-żółtym przewodem ochronnym, obudowa jest połączona właśnie poprzez ten przewód i gniazdo zasilające z uziemieniem. Masa sygnału jest także połączona z uziemieniem. Urządzenia zasilane poprzez kabel posiadający tylko dwa przewody będą miały obudowę podłączoną do masy sygnału.
• EARTH GND (uziemienie) – punkt odniesienia, względem którego lokalny potencjał źródła zasilania wyraża się określoną wartością. Np. w USA jest to 120V, w naszym kraju 220V itd.
Jak będziemy się mogli niebawem przekonać, połączenia pomiędzy opisanymi powyżej punktami odniesienia mają kolosalne znaczenie dla prawidłowego funkcjonowania naszego systemu PA.

Dlaczego właściwe uziemienie jest rzeczą ważną? Każdy przewodnik jest wrażliwy i podatny na indukcję elektromagnetyczną wywołaną przez różne zewnętrzne czynniki. Może to być oddziaływanie fal elektromagnetycznych o częstotliwościach radiowych, sąsiedztwo kabli elektrycznych obciążonych dużym poborem, praca przekaźników, silników elektrycznych itp. Oto właśnie odpowiedź na postawione pytanie. Aby uchronić przesyłane sygnały audio przed zakłóceniami przenikającymi z otoczenia, przewody prowadzące te sygnały ekranuje się na całej ich długości. Zadaniem ekranu jest przechwytywanie zakłóceń emitowanych przez rozmaite źródła zewnętrzne i odprowadzanie ich najkrótszą drogą do ziemi. To tylko jedno z zadań. Oprócz minimalizowania poziomu zakłóceń, równie ważna jest druga rola uziemienia. Jest to bezpieczeństwo.
Połączenie chassis urządzenia z ziemią nie bez powodu nazywane jest uziemieniem ochronnym. Wyobraźmy sobie sytuację, że z jakiegoś powodu napięcie zasilające np. wzmacniacz gitarowy przedostaje się na jego metalowe chassis. Powodów powstania takiej sytuacji może być kilka, np. uszkodzenie izolacji przewodów wewnątrz wzmacniacza, nagromadzenia się wilgoci itp. Wyglądający do tej pory niegroźnie i zachowujący się bardzo przyjaźnie w stosunku do swojego użytkownika wzmacniacz staje się natychmiast czymś, co niektórzy zwykli nazywać „widow maker” (twórcą wdów).
Wystarczy teraz, żeby muzyk trzymający gitarę połączoną z takim właśnie nie uziemionym wzmacniaczem (struny gitary połączone są z masą wzmacniacza) złapał za mikrofon, który jest połączony z masą konsolety lub dotknął jakiegokolwiek uziemionego urządzenia i natychmiast staje się on elementem zamykającym obwód i skupia na sobie całe uderzenie napięcia, które występowało na chassis. Jeżeli chassis wzmacniacza połączone jest z ziemią, to w przypadku opisanym powyżej nastąpi zadziałanie bezpiecznika we wzmacniaczu lub w obwodzie zasilającym wzmacniacz (mówimy o prawidłowo wykonanej instalacji z właściwie dobranymi zabezpieczeniami).
Może jednak zdarzyć się i tak, że przyczyną „kopnięcia” nie musi być żaden z przykładów opisanych powyżej. Załóżmy sytuację, w której ów przykładowy wzmacniacz gitarzysty jest podłączony do najbliższego gniazda na scenie (z uziemieniem oczywiście), natomiast mikrofon połączony jest z masą konsolety, a ta wpięta jest do najbliższego jej gniazdka (też z uziemieniem) ale… na drugim końcu sali. Teoretycznie rozważając – przewody ochronne w tym samym budynku powinny posiadać ten sam potencjał (0V). Praktyka udowodniła już wielokrotnie, że wcale tak nie jest, bo różnica potencjałów pomiędzy tymi przewodami w różnych częściach budynku wynosi często od kilku do kilkunastu woltów, a zdarzało się i tak, że przekraczała nawet 100V. W takiej sytuacji dotykając dwóch różnych urządzeń, zasilanych z różnych faz i różnych części instalacji, powodujemy zwarcie tzw. pasożytniczego źródła prądu, a to może być nie tylko nieprzyjemne, ale też i niebezpieczne dla życia. Pomijam tu takie drobiazgi jak głośny sieciowy brum, będący skutkiem napięcia odłożonego na linii łączącej oba urządzenia oraz – jeśli napięcie to będzie odpowiednio wysokie – możliwość uszkodzenia konsolety.

Łańcuchy

Chainmaster – niemiecki producent wciągarek łańcuchowych zaprezentował niedawno najmniejszy i najlżejszy 1-tonowy model w swej ofercie: Rigging Lift Pro II. Dzięki zastosowaniu technologii Jam-Free, specjalnej konstrukcji 5-elementowe ogniwa łańcucha nie zakleszczają się między sobą w trakcie układania i wyciągania z torby. Waga wciągarki bez łańcuchów wynosi 28kg.
Inny produkt – Vario Lift 1000 – to szybka i precyzyjna wciągarka z możliwością regulacji szybkości wciągania – od 1 do 19 metrów na minutę. Programowalny czas rozruchu i spowalniania pozwala na znaczące zmniejszenie obciążeń dynamicznych. Wyciągarka wyposażona jest w dwa niezależne od siebie hamulce zabezpieczające. Precyzyjny mechanizm umożliwia ustawienie pozycji zatrzymania z dokładnością do 1 milimetra. Zgodnie z niemieckimi normami VBG-70/BGV-C1 Vario Lift 1000 pracuje z obciążeniami do 500kg i współczynnikiem bezpieczeństwa 12.
Vario Trolley jest używany do zapewnienia ruchu poziomego elementom znajdującym się na scenie. Zdolny do przenoszenia obciążeń od 1000 do 5000kg pozwala na ich przesuwanie z szybkością do 40 metrów na minutę. Moduł sterujący Vario Trolley współpracuje z sygnałem analogowym jak również ma wyjście cyfrowe do wyciągarek łańcuchowych. Urządzenie współpracuje z różnego typu protokołami sterowania, takimi jak: CAN, Profibus, Interbus, Device Net, Ethernet, RS-485, Light-Bus itp.

Wholehog

Na rynku europejskim pojawił się nowy model najpopularniejszej chyba konsolety oświetleniowej – Wholehog w wersji III. Od samego początku konsoleta była budowana z myślą o pracy w środowisku sieciowym, może więc działać w ethernecie bazując na protokole kompatybilnym z protokołem stosowanym w internecie. W miejsce dwóch monochromatycznych monitorów stosowanych we wcześniejszej wersji, wbudowano dwa dotykowe, kolorowe monitory LCD (12,1″) z możliwością regulacji kąta nachylenia, jasności i kontrastu. Główną atrakcją nowego produktu jest to, że pozwala skupić się na programowaniu, nie zajmując realizatora tak przyziemnymi sprawami jak ustawianie ruchomych świateł. Od kiedy te ostanie zaczęły różnie reagować na te same polecenia DMX, systematyczne aktualizowanie pozycji w bibliotekach konsolet stało się koniecznością.
W związku z tym Hog III ma dwa pokładowe napędy: CD-RW i ZIP. Użytkownik może swobodnie aplikować programy napisane na jeden model światła do innych. Do dyspozycji programisty jest też w pełni kalibrowany wskaźnik koloru (color picker) uwzględniający wszystkie marki świateł i stosowane filtry.
Głównymi elementami sterującymi nowej konsolety są jednostki zwane DMX Processor Units (DPUs). Każda z nich ma cztery bloki DMX i samodzielnie przelicza wszystkie dane potrzebne do wykonywania przejść i efektów. Dzięki takiej strukturze system Wholehog III jest w stanie kierować pracą ponad 8000 wieloparametrowych urządzeń. Oprócz tego można ze sobą połączyć kilka konsolet, co daje olbrzymie możliwości, np. pracy kilku programistów sterujących tym samym zestawem świateł. Zaawansowany system bezpieczeństwa chroni przed utratą danych i umożliwia podzielenie dużych instalacji na samodzielne strefy bezpieczeństwa z zachowaniem możliwości kontroli z jednego miejsca.
Nowa konsoleta została zaprojektowana tak, by użytkownicy modelu Wholehog II niemal natychmiast mogli rozpocząć na niej pracę. Programy przygotowane dla Hog II mogą być uruchomione na nowszym urządzeniu. Konsoleta umożliwia obsługę w kilku językach i ma zaawansowany system pomocy online.

Technologie dzwiekowe

Dobrze zaprojektowana i poprawnie zaimplementowana oprawa dźwiękowa może stać się magnesem przyciągającym gości na naszą stronę internetową. Zmuszanie odwiedzających do wysłuchiwania kiepskiej jakości dźwięków jest oznaką nonszalancji i braku profesjonalizmu. Dlatego – jeśli już zdecydujesz się na zamieszczenie muzyki w sieci – warto zadbać o jej odpowiednie przygotowanie.

Są dwie główne metody stosowane w przypadku udźwiękowienia witryn: strumieniowe przesyłanie plików lub ich załadunek. Oba sposoby polegają na transmisji plików audio z serwera do komputera klienta. Każdy ma swoje zalety i wady, a przebieg przetwarzania danych jest w obu przypadkach inny.
Z pierwszego sposobu – przesyłania strumieniowego – korzystasz wówczas, gdy prezentujesz określone fragmenty muzyczne w formacie MP3 lub RealAudio z ich natychmiastowym odtwarzaniem, po żądaniu przesłanym przez odwiedzającego. Mówiąc najprościej, metoda ta działa następująco: wyobraź sobie, że twój plik audio to 10-litrowy kanister z wodą, zaś połączenie z Internetem jest bardzo wąską rurką. Oczywiście przelanie całej zawartości kanistra przez tę rurkę trwałoby bardzo długo. Ponieważ muzyka odtwarzana jest w sposób sekwencyjny, nie trzeba ładować całości pliku, by móc rozpocząć jego odtwarzanie. Jednakże transmisja plików w Internecie to nie rozmowa telefoniczna – twój komputer nie ma bezpośredniego i stabilnego połączenia z serwerem. W związku z tym, komputer przechowujący pliki wysyła dane do sieci w niewielkich pakietach, w których oprócz samych danych znajdują się informacje o trasowaniu pakietu oraz suma kontrolna, zapobiegająca powstawaniu błędów w czasie przesyłania. Posługując się dalej wodną analogią wyobraź sobie, że każda kropla wody jest takim właśnie pakietem, a wiaderko u wylotu rurki buforem, w którym zbierają się spływające krople. Jeśli uda się utrzymać w wiaderku dostatecznie wysoki poziom wody, wówczas przesyłanie będzie przebiegało bez zakłóceń. Wysokość słupa wody w wiaderku może rosnąć lub obniżać się, ale dopóki przykryte jest dno, dopóty odbiorca może słuchać ciągłego przekazu, z minimalnym jedynie opóźnieniem.
Pliki ładowalne (WAV, MIDI, RMF) nie są odtwarzane aż do momentu ich całkowitego pobrania i zapisania na dysku. Wykorzystanie takich plików sprawdza się przede wszystkim w przypadku krótkich dźwięków, na przykład efektów specjalnych lub na witrynach interaktywnych, na których wszystkie elementy muszą być zaimplementowane zanim zajmiesz się ich interaktywnością. Ładowanie plików okazuje się często stabilniejszym rozwiązaniem, gdyż ruch w sieci i zróżnicowane prędkości przesyłania danych, mogą powodować przerwy lub zatrzymanie odtwarzania strumieniowego, a nawet zawieszenie komputera.

Najprostsze metody umieszczania na witrynach muzyki i efektów dźwiękowych polegają na wykorzystaniu plików MIDI oraz WAV. Choć do wyboru masz wiele znacznie bardziej zaawansowanych rozwiązań, wspomniane formaty są bez trudu odtwarzane przez przeglądarki, a niewielkie rozmiary plików ułatwiają ich pobieranie. Użycie plików w tych formatach nie wymaga skomplikowanego zapisu HTML, a odbiorca nie musi ściągać i instalować żadnych pluginów.
Formatem MIDI rządzą zasady znacznie wydajniejsze, gdyż ograniczają one rolę komputera jedynie do przesyłania informacji o muzyce, a nie samego zapisu dźwiękowego. Jednominutowy aranż na fortepian, bas i bębny w formacie MIDI może mieć około 10kB, podczas gdy fragment cyfrowego zapisu dźwięku w standardzie CD zawiera się w pliku o wielkości około 10MB. Nawet po zredukowaniu parametrów zapisu do 8 bitów, 11kHz i w mono, rozmiar pliku wyniesie około 650kB.
Dużą wadą plików MIDI jest niewielki wpływ autora na to, jak zabrzmią one na komputerze odbiorcy. Choć standard General MIDI gwarantuje, że partia fortepianu zawsze będzie odtwarzana u odbiorcy barwą fortepianową, różnorodność brzmień w zależności od wytwórcy syntezatorów sprzętowych czy software’owych, czyni końcowy efekt całkowicie nieprzewidywalnym. Ten sam aranż MIDI zabrzmi zupełnie inaczej po zmianie parametrów i poziomów miksu podczas odtwarzania przez syntezator FM karty Sound Blaster niż po odtworzeniu go na karcie z własną syntezą wavetable, odsłuchaniu przez zestaw instrumentów QuickTime Musical Instrument Set, wewnętrzny syntezator Windows czy też pluginy Beatnik, Yamaha lub Koan.
Pliki WAV i AIFF zawsze brzmią jednakowo, na każdym komputerze, jednak ich duże rozmiary, a co za tym idzie długi czas pobierania, prowokują często do obniżania jakości zapisu. Pliki te można z powodzeniem stosować do reprodukcji efektów dźwiękowych lub krótkich fragmentów muzycznych. Przy redukcji próbkowania plików do 8 bitów warto zastosować kompresor, który spowoduje podniesienie ogólnego poziomu dźwięku, dzięki czemu uzyskasz lepsze brzmienie i zmniejszysz słyszalność szumów kwantyzacji.