File Digitali - Parte 5: L'evoluzione dei formati

File Digitali - Parte 5: L'evoluzione dei formati
di Giancarlo Valletta

E’ da quasi 40 anni che viene usato il digitale nel mondo della musica. Molti sono stati i formati che si sono avvicendati, per questioni di spazio e di qualità. Subendo le influenze delle capacità di storage, dalla velocità dei mezzi di trasmissione, fino ai giorni nostri, dove sono disponibili servizi di streaming ad alta definizione di livello assoluto che si basano sull’utilizzo dei più moderni formati.

MP3, a tutt’oggi utilizzatissimo, aveva un suo senso di esistere all’inizio della diffusione dei formati audio digitali. Eravamo infatti in un momento storico nel quale le memorie di massa costavano tanto ed avevano scarse capacità. Ricordiamo, uno per tutti, la prima versione dell’ipod, con hard disk meccanico da 5gb, seguito da modelli con 10 o 20 gb, grandezze che oggi fanno sorridere, ma che erano il limite del tempo, mentre le connettività di rete erano ancora delegate a modem dalle modeste velocità.

Era quindi necessario un formato di file compresso che permettesse una buona qualità senza mettere in crisi le unità di storage, o i collegamenti dati. Sono poi cresciute le esigenze di pari passo con le capacità da parte dei produttori di musica di generare file ad alta risoluzione e man mano si sono fatti strada formati audio sempre più capaci e meno compressi, ed è in questo quadro che bisogna considerare l’evoluzione dei vari formati, fino ad arrivare ai giorni nostri, nei quali la velocità di connessione e le capacità di storage non sono più un problema, mentre il collo di bottiglia sono diventati gli strumenti di riproduzione. E’ curioso notare come nei primi 2000 l’attenzione all’Hi Fi era ancora piuttosto alta, e i mezzi di fruizione buoni se non ottimi ma i file erano di modesta qualità, e la massima aspirazione digitale era il CD, in questi ultimi anni, abbiamo invece a disposizione una tecnologia che ci permetterebbe ascolti da brivido, ma usiamo gli smartphone con il loro altoparlante per sentire la musica.

Il formato .wav (firmato da Microsoft e IBM) è stato il primo e più noto a garantire ottima qualità. Anche se ha una sua versione compressa, quella più utilizzata e conosciuta è quella non compressa. Wav colleziona tutti i campioni della digitalizzazione senza nessuna post-elaborazione, ma con l’avvento dell’alta definizione, e allo stesso tempo di file che non superassero certe dimensioni, si è fatto sempre più strada il .flac che ha reso possibile la compressione del formato .wav ma senza alcuna perdita di informazione -una sorta di .zip del wav. Di questi ultimi anni, con una sempre maggiore affermazione che si sta concretizzando in questi mesi, è il formato MQA, sul quale ci soffermeremo di più, proprio perché sembra essere la quadratura del cerchio tra alta definizione e spazio dei file.

Master Quality Authenticated

MQA è un sistema ibrido, in alta risoluzione 192 KHz / 24 bit, con due obiettivi primari:

− risparmio di spazio dati

− miglioramento delle tracce attraverso una messa a fuoco temporale, non solo su nuove registrazioni, ma anche su tutto il catalogo a disposizione degli studi di registrazione.

Lavora sulla banda di frequenze 0–96 KHz ed è lossless, senza perdita, su 12/13 della banda, e lossy, con perdita, sul restante 1/13, coincidente con l’intervallo 48 –96 KHz. Ma allora perché non continuare ad utilizzare il .flac, che è il lossless per eccellenza ?

MQA può essere considerato a tutti gli effetti losless per l’impiego in banda audio, perchè utilizza un algoritmo di incapsulamento (ovvero utilizzando una porzione di segnale non sfruttata) e non di compressione; in più, con il filtro di de-blurring (focalizzazione) che implementa, migliora la messa a fuoco temporale delle tracce audio.

Abbiamo visto nella sezione dedicata al funzionamento dell’orecchio come esso sia sensibile alle frequenze comprese tra 20 Hz e 20 kHz, ai segnali impulsivi e alla dinamica.

Per catturare i twig snaps, ossia segnali brevissimi ed impulsivi (che distano massimo 6 μs) è indispensabile campionare a 192 kHz, mentre per coprire la gamma dinamica di 120 dB si devono usare almeno 20 bit che, approssimati al primo multiplo disponibile, diventano 24.

I segnali campionati a 192 KHz / 24 bit soddisfano quindi questi 3 requisiti, ma occupano uno spazio quintuplicato rispetto a quello necessario per un normale audio CD, ossia 44.1 KHz / 16 bit (vedere la tabella). Il formato .flac comprime il file audio ed è un formato lossless ossia privo di perdite (un .zip in informatica) ed è impossibile a priori stimare lo spazio che occupa un file .flac rispetto, ad un .wav o .aiff, perché la compressione -in termini informatici- dipende da numerose variabili (dinamica del brano, formato di partenza e strumento di conversione) ma a grandi linee possiamo affermare che lo spazio si dimezza. Un altro aspetto da considerare è il tempo di trasferimento.

Per le reti cablate non è un problema, in buona parte dello stivale italico sono disponibili connessioni in grado di supportare streaming video 4K, ma c’è comunque l’esigenza di trasmettere su reti radio 3G/ 4G/5G senza consumare troppa banda, per esempio uno smartphone equipaggiato con cuffie HiFi. In questi casi, la banda è una risorsa costosa e non infinita, e perciò la differenza è fatta dagli algoritmi di compressione.

La ricerca per la messa a punto dell’MQA è partita analizzando il contenuto spettrale di tutte le forme di musica nella banda 0–96 KHz con 144 dB di dinamica, ovvero qualsiasi file in alta risoluzione, ovvero 192 KHz di campionamento e 24 bit di risoluzione. Gli studi hanno dimostrato che il risultato è sostanzialmente lo stesso indipendentemente dal brano e dal genere musicale, ossia una preponderanza di informazioni fino ai 48 KHz e molto poco oltre i 60 KHz.

L’idea è quella del “ripiegamento” dei campioni considerando solo i bit utili e scartando tutte le parti di spettro che non conterranno mai informazioni provenienti da registrazioni audio.

Una sorta di origami contenente le informazioni audio ma in un modo tale da poterle estrarre e ricostruire in un secondo momento, all’interno del DAC. MQA, in poche parole, non comprime tutti i dati, ma solo quelli che contengono la minoranza dei contenuti audio.

Con MQA_tutti gli apparati di registrazione, produzione e distribuzione saranno gli stessi del normale CD e su un 1TB si potranno memorizzare 2000 album 192 KHz / 24 bit MQA, mentre con il formato .flac gli album sarebbero mediamente 160.

Due tipi di MQA

Si chiamano MQA e MQA Studio e la differenza tra i due è solo relativa alla provenienza del file master. Un file MQA normale è ottenuto da un master audio esistente e sottoposto a Master Quality Authenticated; il DAC indica in VERDE la correttezza del file in riproduzione.

Un file MQA Studio è ottenuto da una registrazione sottoposta a Master Quality Authenticated e approvata dall’artista o dal produttore e verificata dal titolare del copyright; il decoder indica in BLU la correttezza del file in riproduzione.

Mentre quindi il formato .flac, considera i file audio come se contenessero dati, l’MQA invece, li tratta per quello che sono, ponderandone il contenuto, consentendo una molto minore occupazione della banda pur conservando, se non incrementando, la qualità audio di riproduzione.

Riguardo la risposta all’impulso, in generale le registrazioni digitali manifestano una certa inerzia che tende a rendere “sfuocato” il segnale audio.

La tecnica MQA permette di trattare questo problema, applicando al mondo audio tecniche di apodizzazione (filtraggio ottico) simili a quelle che si usano nei radiotelescopi. Nel caso del segnale audio si effettua attenuando alcuni segnali spuri che si generano insieme all’impulso stesso.