Non possiamo parlare di Digital Audio (o Audio Digitale) senza affrontare l’argomento Frequenza di Campionamento e Profondità dei Bit.
Queste sono due parole che incontriamo spessissimo nel nostro lavoro di Producers e che spesso sono oggetto di discussione nei vari forum. Cerchiamo di fare un breve excursus e capire cosa sono, a cosa servono e quali scegliere per impostare al meglio il nostro progetto di recording.
Iniziamo dal SampleRate o più semplicemente dal Sampling, ossia il campionamento del segnale analogico che verrà convertito in informazioni digitali dalla nostra scheda audio.
Questa fase viene anche chiamata fase di AD, ossia Analog to Digital, e viene eseguita dal convertitore interno alla scheda audio.
Sampling vuol dire l’atto di catturare “fotografare” o rappresentare un segnale in base al tempo quindi in base alla durata del campionamento espresso appunto in unità temporali come ms, secondi ecc.
Potremmo anche pensare al campionamento come ad una fotografia della forma d’onda analogica e quindi in base alla quantità delle fotografie che faremo alla nostra forma d’onda, riusciremo a rappresentarla al meglio delle nostre possibilità.
La quantità di fotografie viene chiamata SampleRate, quindi, come più fotografie ho più avrò dettaglio, più alto è il samplerate più dettagliato sarà il campionamento del nostro segnale.
Quando leggiamo quindi che un samplerate è a 20kHz vuol dire che il nostro segnale viene campionato 20mila volte al secondo. Normalmente la forma d’onda è rappresentata come un ciclo dove il segnale segue un andamento positivo e uno negativo, quindi per rappresentare al meglio tutto il ciclo, non solo il segnale positivo, dovremo raddoppiare la frequenza di campionamento fino a 40mila cicli al secondo o foto al secondo.
In parole povere per campionare un suono a 20kHz dovremo utilizzare una frequenza di campionamento di 40kHz.
Questa è la base del teorema di Nyquist, dove appunto la Frequenza di Nyquist viene moltiplicata x 2.
Durante il processo di campionamento però accadono delle anomalie che vengono chiamate Errori di Aliasing, per cui il nostro convertitore interno applicherà degli algoritmi o filtri di anti-aliasing per tagliare via le frequenze vicine alle frequenze di Nyqvist.
In parole povere viene applicato un filtro passa basso, tagliando le frequenze alte sopra i 20khz facendo finire il taglio a 22khz. In questo modo usciamo leggermente al di fuori dello spettro udibile dei 20Khz e la nostra forma d’onda è pressoché integra e senza problemi.
La profondità dei Bit, ossia quanti bit utilizzare per poter registrare al meglio il mio segnale audio?
Il nostro segnale audio non è composto soltanto da frequenze udibili ma anche da un volume dinamico non sempre costante. Quello che generalmente viene chiamato piano e forte.
Per rappresentare digitalmente questo fenomeno dinamico il nostro convertitore utilizza una certa quantità di Bit, più alto sarà il numero di Bit utilizzati più alta sarà la qualità e l’accuratezza impiegata per rappresentarla.
Questo fa capire molto rapidamente come sia più dinamicamente preciso un campionamento a 24bit anziché uno a 16bit. Con 16bit possiamo teoricamente registrare suoni che arrivino ad un range dinamico di 96db senza andare in distorsione, mentre utilizzando 24bit possiamo arrivare a registrare anche suoni con dinamica fino a 144db. Questo ci fa capire quanto potrà essere piacevole e più dinamico un mix fatto a 24bit anziché uno fatto a 16bit!
Perchè allora lo standard di SampleRate fu deciso a 44.1Khz?
Per capire meglio questa decisione bisogna fare un salto negli anni ’80 e più precisamente all’introduzione delle videocassette, nonostante fosse sufficiente utilizzare un sample rate di 40Khz per rendere l’audio delle vhs estremamente compatibile con il sistema Pal e Ntsc (che possedevano diversi frame rate, in questo caso fotografie nel vero senso della parola).
Fu quindi adottato anche per i successivi CD che come standard possiedono 44.1kHz e 16bit.
Negli anni sono migliorati i supporti, i formati di registrazione, di ascolto e di distribuzione ed è quindi naturale pensare ad un utilizzo di frequenze di campionamento più alte e bit più alti per rappresentare al meglio le forme d’onda analogiche. Ecco che ora sta diventando uno standard registrare a 96kHz a 24bit se non superiori in base alla potenza e capacità delle schede audio che raggiungono tranquillamente 192kHz a 32bit fino ad arrivare a 768kHz.
Ovviamente la qualità di costruzione dei convertitori incide notevolmente sul campionamento, rispettando la regola aurea della tecnologia: chi più spende meno spende.
La velocità di playback incide poi sulla velocità e pitch del campione. Se noi forzassimo un progetto impostato a 44.1kHz a suonare un file audio 48kHz, risulterà più lento e con quasi mezzo tono più basso di differenza. Verrà comunque suonato ma non nella corretta velocità di registrazione.
Studio One come altre Daw applicano di default una operazione chiamata Downsampling che processa in tempo reale il problema facendoci sentire correttamente il file anche se in un progetto impostata in maniera differente. In altre Daw è necessario specificare di convertire il file audio al momento dell’importazione nel progetto per evitare questo problema.
Registrare però con sample rate più alti e con più bit ci porta sì più qualità di registrazione, ma anche alla creazione di files più grandi che occupano più spazio sul nostro Hard Disk e più pensanti da gestire per il processore.
Facciamo una tabella comparativa per capire quanto spazio occupano.
4minutia 44100hz/16bit = 20.1Mb
Moltiplichiamo per 2 il tutto per un file stereo ed avremo uno spazio complessivo di 40.2Mb.
Consideriamo quindi:
- 1minuto a 16bit-44kHz = 5.04Mb
- 1minuto a 24bit-48kHz= 8.28Mb
- 1minuto a 24bit-96kHz= 15.79Mb
- 1minuto a 24bit-192kHz = 33.64Mb
Quali sono quindi le ragioni per cui bisognerebbe scegliere una frequenza di campionamento più alta con più bit?
1 – La qualità di lavoro con frequenze più alta e più dinamica associata ai bit
2 – Il processing sarà anche esso più accurato con materiale contenente più informazioni, quindi lavoreranno meglio gli EQ, i Reverberi, i Filtri ecc. Alcuni plugin infatti applicano addirittura un upsampling interno per lavorare il file a frequenze più alte anche quando non lo è lui stesso, ovviamente con maggiore stress della CPU.
3 – Stesso discorso quando applichiamo gli algoritmi di TimeStretching o Pitch Correction, con frequenze di campionamento più alto avremo più informazioni da processare e quindi più dettaglio negli interventi.
4 – Normalmente chi produce anche video dovrà necessariamente fornire materiale a 96kHz o 192kHz per la produzione dei DVD, BluRay ecc.
Controndicazioni
Ovviamente lavorare a sample rate più alti, sacrificherà di più il processore, ci sarà più stress nel processing, sono quindi compromessi da tenere in considerazione quando produciamo la nostra musica. Lavorando tutto a 44.1kHz il nostro computer sarà più facilitato nel processing mentre lavorando a 96kHz avremo più dettaglio e qualità ma dovremo usare alcune tecniche conservative, come bounce delle tracce, spegnimento di alcuni plugs quando non utilizzati ecc. per cercare di far funzionare tutto nella fase di composizione e mix.
Ovviamente sarà più facilitato chi possiede la macchina più potente al momento sul mercato.
Non conviene lavorare tutto a 44kHz se poi il mio materiale deve finire su CD?
In realtà no, lavorando in fase di recording a 48khz o meglio a 96kHz o 88kHz si riesce ad acquisire meglio il segnale, e i plugin in fase di mix avranno tracce più dettagliate su cui intervenire, come anche il processing del time stretch o pitch shift nel momento in cui dovremo usarli.
Anche lavorare a 24bit ci permette di avere materiale più dinamico e meno rumoroso.
In definitiva, più informazioni e più qualità. Potremo comunque in futuro riprendere questo materiale per rimixarlo o rimasterizzarlo sempre meglio per future release.
Riguardo poi il downsampling a 44kHz, Studio One possiede un eccellente algoritmo di conversione o in alternativa possiamo utilizzare quelli super professionali di izotope o Weiss.
Riguardo gli Instruments invece ed in particolare modo i sintetizzatori virtuali, lavorando a 96kHz hanno spesso un processing migliore e una certa quantità di armoniche più dettagliate e performanti di quando li facciamo lavorare a 44kHz o 48kHz, provare per credere.
Aggiungi Commento