File Digitali - Parte 3: i formati digitali

File Digitali - Parte 3: i formati digitali
di Giancarlo Valletta

Per trasportare il segnale digitale è necessario un “treno”, uno snowpiercer in grado di caricare tutti i bit, sempre nella giusta sequenza e senza nessun errore o clandestino.

Una volta ottenuto il segnale digitale che rappresenta la musica dal banco, va “impacchettato” in uno flusso dati, uno “stream” standard e leggibile da qualsiasi riproduttore. Esistono due formati diversi di segnale digitale con il quale si può campionare la musica. Pulse-code Modulation (PCM), e il più recente Direct Stream Digital (DSD); su quale di questi due formati sia in grado di garantire la migliore registrazione si sono scontrati il marketing e diversi ricercatori scientifici con risultati contrastanti, il mercato degli apparecchi di registrazione appare, in questo momento, indirizzato verso apparecchi in grado di registrare in DSD mantenendo una retrocompatibilità con il PCM.

Il PCM, utilizzato nei CD, può anche veicolare file in alta risoluzione, mentre il DSD è nato già come formato HD ed è utilizzato per la realizzazione dei Super Audio CD (SACD) e dei DSD-CD (CD audio derivati da un master DSD). Il passaggio da un formato all'altro è possibile, ma non consigliabile, mediante appositi software. Chiariamo un punto di grande importanza: se una registrazione è stata effettuata in alta o altissima risoluzione, quindi da un DSD, la qualità finale potrà essere decrementata per produrre un CD Audio di ottima resa.

Non è possibile invece il processo inverso, infatti da un PCM standard a qualità CD non si potrà produrre un SACD che abbia ragione di essere chiamato in questo modo e che risponda ai requisiti necessari. Nel mondo moderno dei convertitori DA, quindi digitale/analogico, esistono prodotti compatibili sia con PCM che con DSD nativo ovvero esattamente per quello che è bit a bit, e altri che invece riconoscono il DSD solo se “impacchettato” nel PCM, ovvero in formato DOP. Quando arriva lo strem PCM DOP, ne estraggono il formato DSD e lo decodificano 

La musica come una caramella

I file contenenti musica digitale possono essere immaginati come delle caramelle, hanno un contenitore rappresentato dalla carta che le avvolge -e quindi PCM o DSD visti sopra- e sulla quale sono scritti gli ingredienti, e un contenuto. Poiché il mondo della musica digitale è più complicato e soprattutto fuorviante rispetto a quello delle caramelle, può accadere che a parità di contenitore il contenuto sia molto diverso, creando nei fatti la situazione, impossibile nel mondo reale, di trovare un torroncino incartato nella confezione di un gianduiotto o una mentina con zucchero incartata nella confezione di una senza. Il file contenitore, la carta di cui sopra, viene utilizzato per identificare e separare, secondo regole precise, diversi tipi di dati. I contenitori più semplici possono includere contenuti audio codificati secondo algoritmi diversi, quelli più complessi possono includere oltre all'audio anche i metadati quali per esempio titolo, autore e copertina del brano o il video codificato secondo un algoritmo diverso da quello audio.

I software di codifica (codec) includono al loro interno un algoritmo che codifica e decodifica, rispettando delle regole, un file in suono e viceversa, durante questo processo di conversione, un secondo algoritmo, si occupa di comprimere e decomprimere il file finale per ridurne le dimensioni e facilitarne sia la trasmissione via Internet che la memorizzazione sul computer, sul riproduttore portatile o sul media center.

Tra i diversi possibili algoritmi di compressione esistono quelli che determinano una perdita di qualità rispetto all'originale (lossy) e quelli senza perdita (loseless), quelli ottimizzati per l'ascolto durante il download (progressive download) e infine quelli dotati dei sistemi di protezione dei diritti d'autore digitali atti a limitarne la diffusione incontrollata (Digital Right Management - DRM).

Dopo questa prima classificazione, vediamo di entrare nel merito dei singoli formati e di capire la loro appartenenza ad un gruppo o ad un altro oltre ai vantaggi/svantaggi di ognuno di essi. La tabella sotto riportata sintetizza i dati relativi ai formati di maggior interesse

Formato

Estensioni

Descrizione

Campionamento

Loseless / Compresso / DRM 

Tipo Dati 

AAC 

.m4a

.3gp

.mp4

.aac 

Advanced Audio Codec, è un formato standard di codifica livello ISO e IEC che deve il suo successo alla scelta di Apple di utilizzarlo come formato di riferimento per la piattaforma iTunes e per gli iPod e di Sony per le PS3. Il formato è interoperabile, multipiattaforma e offre un miglior spettro di campionamento rispetto al diretto rivale MP3. 

da 8 kHz a 96 kHz 

Disponibile solo come formato lossy compresso, supporta DRM (Fairplay) anche se oramai questa caratteristica non viene più utilizzata attivamente.

Audio e metadati 

ALAC 

.m4a

Apple Lossless Audio Codec, è un formato di codifica audio sviluppato dalla Apple per la compressione senza perdita di qualità della musica digitale. I dati sono memorizzati all'interno di un formato contenitore MP4 che ha la stessa estensione di una delle possibili del AAC ma di cui non rappresenta una variante in quanto utilizza un metodo di compressione loseless simile a quello del FLAC che riduce le dimensioni del file originale del 40 - 60 %. 

Non sono disponibili documenti pubblici. 

Loseless a compressione lineare 

Audio e metadati 

FLAC 

.flac

Free Lossless Audio Codec, è un formato di codifica open source, gratuito, multipiattaforma e libero da brevetti per la compressione senza perdita di qualità della musica digitale.

da 8 khz a 192 khz - da 8 a 24 bit per campione.

Loseless a compressione lineare 

 

Audio e metadati 

MP3 

.mp3

MPEG-1 Audio Layer 3, è un formato di codifica audio brevettato con perdita di qualità della musica digitale. Il fattore di compressione raggiungibile è pari a circa a 1:11 e viene raggiunto attraverso tecniche di psicoacustica che tagliano le frequenze meno percepibili in presenza di altre predominanti e modificano la precisione a seconda della complessità del contenuto da codificare.

da 16 kHz a 48 kHz - bitrate da 30 a 320 kbit/s 

Lossy a bit rate fisso e variabile 

 

Audio  e metadati 

Ogg (Vorbis) 

.ogg 

Vorbis è un formato di codifica open source, gratuito, multipiattaforma e libero da brevetti per la compressione senza perdita di qualità della musica digitale.

da 8 khz a 192 khz - bitrate da 45 a 500 kbit/s

Lossy a bit rate variabile.

Audio  e metadati 

Wav 

.wav 

Wave  è un formato di codifica audio sviluppato dalla IBM e dalla Microsoft, benché ne esista sia una versione compressa che una non compressa, quest'ultima è quella largamente più diffusa.

da 8 kHz a 44 kHz - da 8 a 16 bit per campione.

Loseless non compresso o  raramente Lossy a bit rate fisso.

 

Solo audio e in alcune implementazioni Audio e metadati 

WMA 

.wma 

Wave  è un formato di codifica audio sviluppato dalla Microsoft, benché ne esista sia una versione compressa che una non compressa, la prima è quella largamente più diffusa. 

fino a 48 Khz.

Lossy a bit rate fisso e variabile e raramente Loseless.

Supporta DRM. 

 

Audio e metadati 

MQA

.flac

MQA è un formato sviluppato da Meridian, ed offre la stessa qualità di un file .flac ma con una dimensione del file decisamente minore

Fino a 192/24

Lossi per i 12/13 e incapsulato il restante 1/13, supporta DRM

Audio e metadati

Quindi, dietro a un brano musicale che vogliamo ascoltare e al semplice tap che facciamo sullo smartphone o click del mouse, si nasconde un mondo davvero ampio.

Riguardo la compressione, sulla tabella che vedete sopra potete tutti facilmente rendervi conto di quali formati sono lossy o losless e all’interno di questi un parametro di grande importanza è il bitrate, ovvero quanti bit di informazione ci sono all’interno del file. Questo dato è spesso fornito al posto della frequenza di campionamento/bit di risoluzione perché i formati compressi giostrano dinamicamente su entrambe i dati, per ottenere file il più possibile vicino all’originale, occupando meno spazio possibile.

Fermiamoci sull’MP3, spazzatura della musica, per fare due conti. Se un file formato CD ha risoluzione 44.100/16, vuol dire che ha un bit rate di 705.6 kbit al secondo, il migliore MP3 ne ha 320 di kbit/s, quindi, e se l’MP3 NON fosse un formato lossy, e tenendo fede ai 16 bit, otterremo 20 khz di frequenza di campionamento. Ma un formato compresso ha degli algoritmi che lavorano modulando bit e frequenza di campionamento in modo da ottenere “teoricamente” lo stesso risultato di un bit-rate di un 44.100/16 ma con meno della metà della banda. In realtà questo non è vero, la perdita si avverte e in modo inappellabile.

C’è poi un altro grosso pericolo, una insidia che si può nascondere dietro qualsiasi contenuto, anche a risoluzione altissima. Ci sono infatti software (come XLD per MAC) in grado di convertire da e verso ogni tipo di file, posso quindi ricavare dal file mp3 a 320 kb/sec dell’esempio, un FLAC 24/96 con un semplice click. Ma cosa c’è dentro quel file ? Per quanto sia buono il software che realizza la conversione, buona parte del contenuto sono bit “vuoti”, che riempiono solo gli spazi. Tornando all’esempio della caramella, un grande contenitore, una splendida Rossana da 1 kg, ma con dentro una infinita serie di scatole cinesi “quasi” vuote. Immaginate un fiume molto grande con un rivolo di acqua che ci scorre dentro.

Vediamo adesso quali sono i principali formati audio usati dalle piattaforme e dai servizi di streaming più in voga.

Youtube usa indifferentemente AAC, Vorbis, AVI, WMV ed MP3, dipende da cosa ha caricato il cliente, Istagram usa AAC 128 kb/sec, mentre facebook usa WMA, AC3, MP3, OGG, AIFF, M4A, WAV, APE, M4P, AAC, FLAC.

Ci sono poi i servizi di streaming, primo tra tutti Spotify, utilizzatissimo dai giovani. Il formato è Vorbis a 160 kb/sec o 320 con abbonamento premium. Deezer offre da MP3 128kbs del free a 320kbs per Premium e FLAC 16 bit o FLAC 16 bit 1411 kbs, Amazon Music con formati dal CD 44.1/16 fino a 44.1/24 e infine Apple, che offre file AAC a 256 kbs.

Molto più performanti Tidal che offre AAC almeno qualità CD da 44/16 e fino a 96/24 o Qobuz con FLAC da 44/16 fino a 24/192.