English (UK)

Il formato MP3 PART1

Tratto da programmazione.it scritto da Leonida Castaldo

Lo standard di compressione audio MP3 è oggi uno dei più usati in assoluto in quanto offre un rapporto di compressione altissimo, che limita notevolmente lo spazio occupato da un brano su un calcolatore, pur conservando un’ottima qualità del sonoro. MP3 è l’acronimo di MPEG1 Layer3, si tratta quindi di un formato audio digitale interno al noto standard di compressione audio/video MPEG. MPEG è uno standard ISO sviluppato a livelli: in altri termini ogni livello successivo al precedente offre un rapporto di compressione migliore e ogni livello di codifica non è altro che un’evoluzione del precedente.

La compressione MP3 fa uso, per il processo di codifica, di algoritmi con perdita di informazione; esso infatti si basa non sulla riproduzione fedele di un’onda sonora, ma piuttosto sulla parte di essa che effettivamente può essere percepita dall’orecchio umano, trascurando il resto.

Gli algoritmi di codifica audio si basano sul modello psicoacustico. Gli studi di psicoacustica sono incentrati sull’analisi della percezione delle onde sonore dall’apparato uditivo umano e sulla loro conversione in pensieri. Da tali studi, come anticipato negli articoli introduttivi alla compressione audio, due elementi sono considerati di particolare rilievo e sono usati per definire processi di codifica efficienti.

Il primo elemento è il valore di frequenza percepibile dall’orecchio umano, stimato in un range che varia tra i 20 Hz e i 20 KHz . Il secondo elemento è il fenomeno di mascheramento, cioè la copertura di un suono relativamente debole da un suono più forte immediatamente precedente o contemporaneo. Il mascheramento può essere inteso nel dominio del tempo o nel dominio della frequenza.

Nel dominio del tempo esso implica che un suono debole che segue immediatamente un suono forte, sia udito parzialmente o non sia udito del tutto. Il mascheramento nel dominio della frequenza implica invece che un suono con frequenza maggiore, prodotto simultaneamente a un suono con frequenza minore, sia dominante e offuschi il suono più debole.

La riduzione del suono in funzione del modello psicoacustico è fondata su due concetti essenziali. Il primo di essi implica l’eliminazione delle onde sonore al di sopra della soglia percepibile (ridondanza), in quanto sarebbe inutile conservare suoni non percepibili dall’orecchio umano. Il secondo concetto è l’irrilevanza di parte dell’informazione che a causa del mascheramento non sarà comunque completamente percepibile.

Il processo di codifica percettiva, o meglio il processo di compressione audio, si basa fondamentalmente sul concetto di irrilevanza a sua volta incentrato sul fenomeno di mascheramento, sia temporale che nel dominio della frequenza, dal prossimo articolo introdurrò il processo di codifica chiarendo come sfruttare tali elementi a vantaggio di un rapporto di compressione considerevole.