Audio van CD kwaliteit heeft bij een bandbreedte van 20 - 20.000 Hz een bemonsteringsfrequentie van 44,1 kHz en een 16 bit codering. Dit levert een digitaal signaal op van 705,6 kbit/s per mono-kanaal. Bij DVD-Audio wordt zelfs gewerkt met een 24 bit codering met een bemonsteringsfrequentie van 96 kHz1. De resulterende hoeveelheden bits per seconde zijn veel te hoog voor verzending over het Internet of over mobiele communicatienetwerken.
In principe kan audio net als spraak worden gereduceerd door uit te gaan van niet lineaire PCM. Het door SUN Microsystems ontwikkelde .au formaat maakt hiervan gebruik. De kwaliteit van deze op G.711 gebaseerde audiocodering is echter niet erg goed, omdat de audio teveel in bandbreedte wordt beperkt en de monsters met te weinig bits (8) worden beschreven. Bij alle belangrijke vormen van audiocodering wordt gebruik gemaakt van bepaalde eigenschappen van het menselijk gehoor. Het menselijk gehoor is niet voor alle frequenties even gevoelig en bovendien kan een sterke toon een andere toon die los wel hoorbaar is onhoorbaar maken (maskeren). Deze technieken bewerken het signaal dan ook in het frequentiedomein. De frequentiecomponenten die toch niet worden waargenomen (omdat ze beneden de gehoordrempel vallen of worden gemaskeerd) worden uit het signaal verwijderd. De overige frequentiecomponenten worden met meer bits beschreven naar mate de frequentiecomponent beter te horen is.
De resulterende bitsnelheid is sterk afhankelijk van de bandbreedte van het auodiosignaal. De reductiefactor ligt in de orde grootte van een factor 12. Ook voor audiocodering worden geen spectaculaire verbeteringen meer verwacht.
In bovenstaande figuur is een typische gehoorcurve (de gestippelde lijn) gegeven. Hieruit blijkt dat ons oor het gevoeligst is voor tonen tussen ruwweg 1 en 5 kHz, erboven en eronder hebben we een hoger volume nodig om geluid te kunnen horen. In de figuur is ook aangegeven hoe maskering werkt. Door een toon van 1 kHz te laten horen, wordt het gehoor niet alleen voor een andere toon van 1 kHz minder gevoelig, maar ook voor tonen in de omgeving daarvan, vooral voor tonen met een hogere frequentie. Dit effect wordt groter naarmate de toon van 1 kHz luider wordt. De toon van 1 kHz kan op deze wijze een toon van bijvoorbeeld 2 kHz maskeren die los (zonder de toon van 1 kHz) wel te horen zou zijn geweest.
Het algoritme voor een typische audiocoder is dan als volgt. Het audiosignaal wordt alvorens het aan de audiocoder wordt toegevoerd eerst gedigitaliseerd. Na digitalisatie wordt het spectrum van het inkomende signaal bepaald. In de regel wordt het signaal eerst naar een filterbank geleid en wordt per subband het spectrum bepaald. Per subband wordt daarna bepaald in welke mate het spectrum boven de gehoordrempel uitkomt, of eronder valt. Vervolgens wordt het signaal beschreven. Voor de beschrijving zijn verschillende compressiemethoden in gebruik. Zeker in het geval er wordt gewerkt met een vaste uitgaande bitstroom, wordt er gebruik gemaakt van een adaptieve allocatie waarbij eerst de sterke signalen die ver boven de gehoordrempel uitkomen worden beschreven, waarna de zwakker hoorbare subbanden met minder bits worden beschreven.
« Terug naar de specials | Audiocodering 2: Uitvoeringsvormen » |
1Alhoewel DVD-Audio bemonsteringsfrequenties toelaat van 44.1, 96 en 192 kHz en 16, 20 of 24 bit per sample, lijkt een 24 bits codering bij 96 kHz de standaard te worden.