RICERCA DRIVERS |
|
|
 |
|
 |
|
I formati audio più diffusi
L'esigenza di ridurre sempre di più le dimensioni dei file, correlata all'enorme crescita di Internet, ha contribuito notevolmente alla creazione di nuovi e sempre più sofisticati formati audio/video compressi che soddisfano la duplice esigenza di una buona qualità in dimensioni sempre più ridotte. Il formato audio non compresso più diffuso è senza dubbio il WAVE (estensione .wav) ma più frequentemente ci imbattiamo in altri formati come MP3, OGG VORBIS, MPC o WMA. I file con standard MPEG (Motion Picture Experts Group) hanno un elevato livello di compressione mantenedo una resa qualitativa eccellente, i file MP3 (MPEG 1 Layer III) ne sono l' esempio più famoso ma ne parleremo più avanti.
WAVE
Wave significa onda, ovviamente in questo caso il riferimento è all'onda sonora. I suoni di Windows sono in formato WAVE, per esempio il suono che ci accoglie all'avvio è The Microsoft Sound.wav, un suono prodotto con una tastiera da Brian Eno.
Il suono scaturisce dall'insieme delle vibrazioni provocate da una fonte (strumento musicale, voce, pioggia ecc.) e arriva, attraverso l'aria, al nostro timpano il quale vibrando genera degli impulsi che attraverso il nervo acustico giungono al cervello.
I suoni possono essere registrati "analogicamente" (su nastro magnetico, su vinile) oppure digitalmente (su DAT, HD, CD, DVD). La registrazione digitale è detta "campionamento". Campionare significa scomporre l'informazione sonora in tante parti dette appunto campioni. E' chiaro che più campioni al secondo registro più elevata sarà la qualità della registrazione. Ma oltre alla qualità cresce anche lo spazio necessario a memorizzare l'informazione. Quando diciamo che un suono è stato campionato a 44.100 Hz 16 bit (qualità cd) intendiamo dire che sono stati registrati 44.100 campioni al secondo e che ogni campione è "profondo" 16 bit (2 byte) cioè contiene 16 informazioni che possono assumere valore 0 o 1 ovvero 65.536 combinazioni diverse. I bit ci danno dunque la risoluzione o definizione del campione. Per cui un suono di 1 secondo a 44.100 Hz 16 bit equivale a 1 x 44.100 x 16 = 705.600 bit ovvero 88,2 byte. E' evidente dunque che la qualità di un suono dipende dalla frequenza (numero di campioni al secondo) e dalla risoluzione (numero di informazioni contenute in un campione). Le dimensioni invece dipendono da frequenza, risoluzione, durata e dal numero di canali. L'insieme di questi fattori definiscono il bitrate ovvero il numero di bit per secondo. Da tutto ciò si evince chiaramente che i file WAVE necessitano di una considerevole disponibilità di risorse, controindicata per la diffusione su internet.
MIDI.
Abbiamo visto che un file WAVE non è altro che la registrazione digitale di un suono esterno al PC, possiamo dunque registrare tanto un suono di tromba quanto il rombo di un aereo o qualsiasi altra fonte sonora. Un file MIDI invece è una sequenza di comandi capace di controllare (e di far suonare) uno strumento (scheda audio, sintetizzatore, campionatore e anche i telefonini!!). Trattandosi semplicemente di una serie di comandi ne consegue che i file MIDI sono molto più piccoli dei wave ma è chiaro che i due fomati sono di natura completamente diversa. Volendo fare un paragone il MIDI è equiparabile al rullo di un carillon che contiene le informazioni necessarie al'esecuzione di una melodia mentre il WAVE è la registrazione fisica del suono emesso. Una qualunque scheda audio contiene una serie di strumenti che possono essere suonati da una sequenza MIDI, esistono diversi parametri che il MIDI può controllare ad es. il volume, la velocity, la durata, la modulazione ecc., ognuno di questi parametri può assumere un valore compreso tra 0 e 127 dove 0 indica ASSENZA DI CARATTERISTICA e 127 indica PRESENZA MASSIMA DI CARATTERISTICA. I valori sono discreti ovvero del tipo "tutto o niente", non esistono dunque valori intermedi del tipo 28,7.
MP3.
Mp3 sta per MPEG Layer III, come ho già detto MPEG sta per Motion Picture Experts Gruop ovvero un gruppo di ingegneri del suono che ha sviluppato questo rivoluzionario formato audio compresso. Bisogna però precisare che la compressione di cui parliamo è ben diversa da quella utilizzata comunemente per i files. Mi riferisco a quei software che consentono di ridurre le dimensioni dei file per poi ripristinarli soltanto quando servono, parlo dei vari WinZip WinRar ecc. Il principio su cui si basa la compressione dei dati con i suddetti software è molto semplice: si tratta semplicemente di ridurre le sequenze dei dati scrivendoli in maniera più compatta, posso scrivere per esempio "10+10+10+10+10" in una forma più compatta che è "10x5". Tale processo è reversibile. La compressione Mp3 invece è irreversibile e si basa su principi diversi da quelli appena descritti. La compressione in questo caso riguarda quei suoni che non vengono percepiti, quelli ridondanti, quelli mascherati. Gli studi di psicoacustica ci dicono che l'intervallo di udibilità nell'uomo è compreso tra i 20 e i 20000 Hz, ciò significa che tutti i suoni sotto i 20 Hz e quelli sopra i 20000 Hz non possono essere uditi dall'orecchio umano, inoltre sappiamo che talune frequenze tendono a "mascherarne" delle altre. Da ciò è facile capire che gran parte di quei 44.100 campioni al secondo risultano in qualche modo "superflui". La codifica Mp3 è dunque in grado di riconoscere le frequenze non udibili e a eliminarle riducendo drasticamente il fabbisogno di risorse in termini di MegaBytes. Ma veniamo alla dimensione di tale compressione: un file WAVE di 5 minuti in qualità CD pesa 50 Mb, lo stesso file compresso in Mp3 pesa 10 volte meno, intorno ai 5 Mb. In termini di bitrate, come abbiamo visto, i file WAVE producono un flusso di dati pari a 1411,2 kbps, gli Mp3 invece soltanto 128 kbps. Ma esistono diversi livelli di compressione, 128 kbps è il bitrate relativo alla qualità CD ma tale valore può scendere o può anche salire a seconda delle esigenze. L'importante è capire che un file WAVE una volta compresso in formato Mp3 non può più ritornare al suo stato originale, si parla infatti di compressione "lossy" ovvero con perdita di dati e conseguente degrado in termini di qualità anche se tale dagrado non viene percepito.
Ogg Vorbis.
Da molti è definito lo standard anti-mp3, molti addirittura pensano che questo formato sia destinato a soppiantare l'Mp3. A nostro parere ciò è molto probabile per diversi motivi. Procediamo con ordine. Il formato OGG VORBIS è, come l'Mp3, un formato lossy ovvero con perdita di dati e qualità. La differenza però tra i due formati è notevole: a parità di qualità sonora il formato OGG pesa il 25% in meno. Questo è possibile grazie a un nuovo potente algoritmo che consente di variare il bitrate lungo tutto il flusso di dati. Per esempio è possibile ridurre il bitrate li dove non è necessaria una eccessiva qualità (per es. parti di silenzio) ciò rende questo formato particolarmente adatto ai filmati compressi (DivX), in tal modo si può migliorare la qualità dell'immagine potendo risparmiare risorse sull'audio. Questa nuova tecnica si chiama VBR ovvero Variable Bit Rate. Altra differenza sta nel numero di canali: l'Mp3 supporta solo due canali (left & right), l'OGG invece è multicanale e può supportare le tecnologie surraund di ultima generazione. Altra differenza consistente sta nel fatto che il formato OGG è open-source, cioè può essere utilizzato, studiato, sviluppato, modificato anche a fini commerciali e senza alcun limite. In tal modo la bontà del formato non può che migliorare e inoltre è facile immaginare con quale facilità potrà diffondersi e diventare lo standard per eccellenza dell'audio compresso.
MPC (Musepack).
Musepack è un formato di compressione audio che da grande importanza alla qualità. E' anch' esso lossy, ma è progettato in modo da rendere minima la differenza tra il file wave originale e il più piccolo file MPC. E' basato sugli algoritmi MPEG-1 Layer-2 / MP2, ma si è sviluppato rapidamente migliorando parecchio ed ora è ad uno stadio avanzato che contiene codice libero ed è molto ottimizzato. E' il formato per chi vuole la qualità senza ricorrere ai formati non compressi, troppo grandi. E' supportato d WinAmp e sono disponibili plugin per molti altri lettori multimediali.
WMA (Windows Media Audio).
Il WMA è il formato di compressione della Microsoft per l'utilizzo nel suo sistema operativo. Il WMA integra due codec (uno lossy e uno lossless) e un sistema per i diritti d'autore. E ancora un file WMA può essere contenuto in un file ASF (Advanced Systems Format) che è una sorta di contenitore di file multimediali (WMA e WMV) realizzato dalla Microsoft, e pensato specificatamente per lo streaming. E' un formato pessimo dal punto di vista delle licenze. Infatti le licenze contenute in ogni singolo file sono controllate e gestite interamente da Microsoft, per cui potrebbe capitare che se acquistate un brano WMA con una licenza che vi permette di ascoltarlo su altri computer e di masterizzarlo, improvvisamete vi potreste trovare nella condizione di doverlo riaquistare semplicemente perchè Microsoft ha modificato lelicenze.
REAL MEDIA (.rm, .ra, .ram).
Formato nato inizialmente per la gestione di file audio, convertito successivamente anche per l’elaborazione di file video; è diventato un punto di riferimento per la trasmissione di filmati in Internet (Streaming). Lo streaming è la trasmissione in rete dei dati audiovisivi in tempo reale; il file non viene scaricato per intero ma a blocchi per cui mentre un blocco viene riprodotto il successivo è in download e così via fino alla fine del file. Real Technologies ha iniziato a promuovere tecnologie di streaming audio (e successivamente video), per mezzo di piccoli files con estensione ram o rm con banda di trasmissione che arriva fino a 56Kbit/sec. Lo streaming ha consentito a molte stazioni radio di essere presenti sul web.
|
 |