Letnik: 2005 | Številka: 3/4 | Avtor/ica: Janez Golič

Spopad formatov (4)

MP3

V seriji o različnih oblikah zvočnih zapisov in ustreznih nosilcih zanje smo prišli do famoznega formata MP3, stisnjene oblike zvočnega zapisa, ki je dodobra razburkala duhove, vzpostavila povsem nove načine razpečevanja, prodaje in končno poslušanja glasbe. In nenazadnje, dodobra spremenila odnos do glasbe, ki jo sedaj tako preprosto pretakamo, kopiramo in brišemo.

Najprej opomba: če smo se v preteklih nadaljevanjih spopadli z oblikami zapisa, ki so bile vse po vrsti prilagojene nosilcu zvoka, je ravno MP3 pretrgal to tradicijo. In še marsikatero drugo. MP3 nima določenega domicila. Ni bil izumljen, da bi bil zapisan zgolj in samo na računalniškem trdem disku ali na zapisljivi CD-plošči, da bi čakal na strežniku ponudnika internetnih storitev. MP3 lahko ždi povsod tam, kamor je možno shraniti katerikoli drug računalniški podatek oziroma datoteko.

Zametek digitalnega zapisa MP3 sega v leto 1987, ko je Evropska skupnost kot del projekta Eureka naročila raziskovalni program znan kot EU-147. Načrt je bil razviti stisnjen avdio format, primeren za prenos prek različnih medijev, v prvi vrsti za digitalni prenos radijskih signalov. Za nas bo tokrat bolj zanimiv stranski produkt te raziskave, izsledek delovne skupine pod vodstvom Karlheinza Brandenburga in Jurgena Heera, ki je leta 1994 dokončno izoblikovala format MP3 (natančneje MPEG Audio Layer-3). Kajti zapis, standardiziran za glasbeno CD-ploščo, je relativno potraten s prostorom. Za shranjevanje večjih količin zvočnih zapisov so potrebni veliki trdi diski, konec osemdesetih let, ko se je CD-plošča dokončno uveljavila, so le največji diski zmogli kapaciteto ene CD-plošče. Ko so radijski studii prešli na snemanje in shranjevanje zvočnega gradiva na računalniške diske (predvsem reklam, jinglov, napovedi), se je kmalu pojavila potreba po stisnjenih oblikah zapisa. Tudi ob uveljavljanju digitalnega radia se je pojavila podobna težava – zapis kvalitete glasbene CD-plošče je bil podatkovno preobsežen. Kaj šele prenos takih datotek prek običajnih modemskih povezav.

Mnogi so bili že ob pojavu CD-plošče nezadovoljni s kvaliteto zapisa, saj je ta še vedno “le” približek analognega signala, torej takšnega, kakor je izvorno ustvarjen z akustičnimi glasbili, na primer, in ga le takšnega dojemamo kot glasbo (če bi poslušali digitalni zapis, bi bil ta za nas le brezobličen šum). Kmalu so se pojavili zapisi, ki so po podatkovnem obsegu manjši, po zvočni kvaliteti pa komaj opazno slabši. V splošnem lahko digitalne zapise delimo na nestisnjene in stisnjene, slednje naprej na take, kjer se informacije stiskajo z izgubo (lossy formats), in take brez izgub (lossless). Praktično to pomeni, da zapisi, ki jih stiskamo z izgubo, po odkodiranju niso več enaki izvorni obliki, v nasprotju s stiskanjem brez izgub, kjer gre običajno le za drugačno obliko zapisa, ki pa po ponovni pretvorbi ohrani vse informacije.

MP3 je stisnjen digitalni zvočni zapisi z izgubo, se pravi, da je po številu informacij manjši od zapisa na CD-plošči in da po pretvorbi izgubimo del zvočne vsebine. Razmerje med številom informacij, potrebnih za zapis na CD-plošči, ki je standardizirano, in obsegom podatkovnih informacij istega zapisa v obliki MP3, označujemo s kompresijskim razmerjem. MP3 nima standardiziranih vseh parametrov, temveč lahko izbiramo med različnimi stopnjami stisnjenosti, določenimi s t. i. bitnim obsegom.

Bitni obseg 128 kb/s (pomeni, da se uporabi 128 tisoč bitov na sekundo) se je uveljavil kot mejni, dovolj kvaliteten za večino uporabnikov, in ta prinese približno kompresijsko razmerje 1:11. Različne stopnje bitnega obsega pomenijo načeloma različne stopnje kvalitete, višja je stopnja, višja naj bi bila kvaliteta. Ni pa nujno. Kajti stiskanje formata MP3 poteka po ključu, ki ga določa psihoakustični model oziroma se ravna po fizični dojemljivosti naših ušes za zvok, torej kako naši možgani te zvoke interpretirajo. Pri stiskanju torej odstranijo manj pomembne sestavine zvoka ali jim dodelijo manjši pomen, to so sestavine, ki jih komaj ali sploh ne zaznavamo. Pri pretvorbi analognega signala v digitalnega po standardu, določenem za glasbeno CD-ploščo, se enakovredno upošteva ves slišni obseg po frekvenci in jakosti, medtem ko za MP3 natančni parametri izločanja manj pomembnih informacij sploh niso določeni! To pomeni, da vsak snovatelj kodirnika za MP3 sam določi, kaj bo odstranil iz izvornega signala oziroma do kakšne mere bo upošteval določen vpliv določenega parametra zvoka in končno glasbe. Torej kodirniki različnih proizvajalcev isti zapis oblikujejo drugače in obenem višja stopnja bitnega obsega še ne pomeni absolutne višje kvalitete zapisa. Ti parametri so tako raztegljivi, da bi bilo možno pri višjih stopnjah bitnega obsega in s pretiravanjem pri upoštevanju psihoakustičnega modela narediti MP3, ki bi bil teoretično in praktično kvalitetnejši od zapisa na standardni glasbeni CD plošči. Le da bi za to porabil vsaj toliko podatkovne kapacitete. Če so torej parametri pri pretvorbi v MP3 prepuščeni posameznim prozvajalcem, je vsaj reprodukcija (odkodiranje) točno določena, torej bo vsak predvajalnik odkodiral isti digitalni zapis MP3 povsem identično.

Algoritem, ki naj opiše naše psihoakustično dojemanje glasbe, je precej zapleten. Upoštevati mora množico parametrov, ki se spet razlikujejo od človeka do človeka in še od zvrsti glasbe. Najprej je tu frekvenčni obseg, ki je pri človeku nekje od 20 Hz do 20.000 Hz. Višje frekvence, na primer, že niso več tako zelo pomembne, saj ne zajemajo uporabnih osnovnih tonov, ampak so zajete le v višjih harmonijah. To praktično pomeni, da pri rezanju frekvenc nad 15.000 Hz pri večini glasbe ne bomo opazili nobene razlike, saj tam ležijo le najvišji zveni. Brez opazne razlike se pri kodiranju MP3 odstranjujejo tisti tišji deli zvoka, ki so istočasno zakriti z glasnimi pasažami. Primer tega je lahko pogovor dveh ljudi z oddaljenih koncev stadiona. Če je stadion prazen, bo pogovor mogoč, če bo poln ljudi, se ne bosta mogla več slišati. Zatorej se lahko v tem primeru njun delež iz končnega seštevka zvokov brez škode odstrani. In tako naprej …

Stopnja bitnega obsega 128 kb/s in kodirnik z nam prilagojenim psihoakustičnim modelom že ponuja kvaliteto zapisa, ki jo je težko ločiti od kvalitete CD-plošče, še posebej, če se tak MP3 predvaja v avtu, z diskmanom, na računalniku, na slabših domačih sistemih … Na boljših sistemih za reprodukcijo glasbe pa bo zahtevnejši poslušalec le zaznal razliko v kvaliteti predvajane glasbe – MP3 ima manjši frekvenčni obseg, manjšo “globino”, skratka, manj detajlov, to je predvsem opazno pri bolj zahtevnem in dinamičnem glasbenem zapisu. Ta razlika je očitnejša pri MP3-jih, kodiranih z manjšim bitnim obsegom (pod 128 kbit/s).

MP3 na račun manjše kvalitete zapisa ponuja številne prednosti: zavzame približno 10-krat manj prostora na CD-plošči, na računalniškem trdem disku, na strežniku ponudnika internetnih storitev, in najpomembneje, zahteva tolikokrat manj časa za prenos prek interneta, kot če bi bila ista glasba zabeležena v kvaliteti CD-plošče.

Napredek prinaša vse bolj prefinjene načine kodiranja, take, ki bi z enakim obsegom informacij zagotovili čim višjo kvaliteto zvočnega zapisa. Eden teh načinov je t. i. VBR (spremenljiv bitni obseg – variable bit rate). Pri pretvorbi izvornega signala kodirnik vnaprej po posameznih delih zapisa določi, kolikšen bitni obseg je potreben in se temu sproti prilagaja. Za manj zahtevne dele torej porabi manj podatkov, na primer, tišino kodira le z 32 kb/s. Na enakem principu deluje vse bolj razširjen kodek Ogg, saj za enako kvaliteto zavzame približno tretjino manj prostora kot MP3, obenem pa je odprt za javno uporabo …

MP3 si je pred konkurenco pridobil precejšno prednost, čeprav kar po vrsti formati in kodeki, kot so WMA (Windows Media Audio), AAC (Advance Audio Coding) in Ogg Vorbis ponujajo boljše razmerje med kvaliteto in obsegom informacij. Je bil pač prvi razširjen format, ki ga znajo predvajati DVD-predvajalniki, nekateri avtoradii, prenosniki … Iz enakih razlogov se ni širše prijel z VBR kodiran MP3 niti njegov izboljšani naslednik MP3pro. Na reprodukcijskih napravah vseh vrst in široma po svetu je zapisano neskončno število MP3-jev, pretvorba teh v druge stisnjene oblike glasbenih datotek pa bi prinesla le še slabšo kvaliteto zvoka.

Če pesem s CD-plošče presnamemo (ali natančneje prenesemo) na računalniški trdi disk, se zapiše v obliko .wav in zavzame prav toliko podatkovnega prostora kot na CD-plošči. Če jo sedaj pretvorimo v MP3, bo pri izbranem bitnem obsegu 128 kb/s zavzela približno 10x manj prostora in se “obnašala” kot vsaka druga oblika računalniškega podatka. Zatorej jo lahko zapišemo na zapisljivo CD-ploščo po standardu ISO, in sicer bomo lahko tako zapisali glasbe z najmanj desetih originalnih CD-plošč. Če bi ta MP3 pretvorili nazaj v .wav in ga zapisali na CD v načinu za avdio CD, bi spet lahko zapisali samo za en CD glasbe, kvaliteta pa bi bila zgolj na ravni MP3-ja. To je posledica izgub pri pretvorbi, in vsaka pretvorba iz MP3 v kako drugo obliko zapisa bi še bolj poslabšala kvaliteto zvoka.

Zato pa zaradi svoje digitalne oblike MP3 pri presnemavanju oziroma kopiranju do potankosti ohranja obliko, tudi stotič brez napak prekopiran MP3 bo še vedno povsem enak prvotnemu MP3-ju. Kako primerno za pošiljanje po internetu in kopiranje z računalnika na zapisljive CD-plošče …

MP3 se je uveljavil predvsem po zaslugi programa Napster, ki je omogočal P2P (peer to peer) izmenjavo tovrstnih datotek. To pomeni, da datoteke niso bile naložene na centralnem strežniku, ampak je program le skrbel za neposredno izmenjavo med uporabniki.

Naprednejši programi za izmenjavo MP3 datotek nimajo centraliziranega nadzora, temveč uporabniki sami iščejo in izmenjujejo datoteke in tako otežujejo delo nasprotnikom ilegalne izmenjave avtorsko zaščitenih MP3-jev.

Uporaba programov za predvajanje MP3 ni bila patentirana vse do leta 1998, ko je firma Thompson Consumer Electronics zaščitila te pravice. Velike računalniške firme so bile prisiljene v iznajdbo drugih oblik stisnjenih avdio datotek, sicer bi moral, na primer, Microsoft plačevati pravice do vključevanju predvajalnika MP3 v operacijski sistem Windows. Pojavili so se druge oblike stisnjenih formatov, od Real Audia, Ogg Vogris, AAC, ki sicer uporabljajo različne načine kodiranja, a se podobno ravnajo po psihoakustičnem modelu. Torej so vsi po vrsti kodirani z izgubo kvalitete.

Obstajajo tudi stisnjene oblike zvočnih zapisov brez izgub (podobno kot zipanje), torej pri stiskanju ohranijo vse izvorne informacije in so po odkodiranju povsem identične izvorni obliki. Ravnajo se po samem glasbenem materialu, zahtevnejši zapis stisnejo na 80%, manj zahtevnega nekje do 50%. V najboljšem primeru se torej prihrani polovica kapacitete na trdem disku ali na strežniku, kar je v primerjavi z MP3 precej potratno. Stisnjene oblike brez izgub se za prenos po internetu praktično ne uporabljajo, namenjene so predvsem zahtevnejšim uporabnikom prenosnih predvajalnikov, na primer popularnega iPoda, in za nadaljnjo obdelavo posnetkov na računalniku.

Ko je svobodna izmenjava avtorsko zaščitenih MP3-jev presegla vsa pričakovanja, je to porodilo številna vprašanja glede lastništva avtorskih pravic. Končno se je zganila tudi RIAA (Record Industry Asociation of America) in začela bitko s ponudniki tovrstnih storitev. Najprej je bil na udaru Napster, centraliziran sistem P2P izmenjave MP3-jev. Kasneje se je pojavilo več decentraliziranih ponudnikov, to pomeni, da program, ki omogoča avtorizacijo uporabnikov, ni določen, ampak je naložen na samem uporabnikovem računalniku in išče ponudnike stisnjenih avdio formatov po celotnem internetu. Roka pravice se je zatorej morala stegniti po samem uporabniku, in nekatere so zares oglobili z majhnimi denarnimi kaznimi. Toliko za ustrahovanje.

Kar nekaj MP3-jev se je moralo pretočiti, da je v tem načinu prenosa glasbe našla tržno nišo tudi industrija popularne glasbe. Sedaj se MP3 in izpeljane oblike zvočnega zapisa veliko uporabljajo v promocijske namene. Na spletnih straneh se pojavljajo vzorci pesmi, za kaj več je praviloma treba plačati. Najdlje se je razvila oblika AAC, saj (za zdaj) omogoča zanesljivo zaščito pred nepooblaščenim predvajanjem, pravzaprav kupec tovrstnega zapisa sam določi, na katerih napravah bo tako stisnjeno glasbo poslušal. Glede na vse večjo priljubljenost formata AAC in rekordno prodajo prenosnega predvajalnika iPod, morda ni več daleč dan, ko se glasba ne bo več prodajala na nosilcih zvoka.

Prihodnjič: Zaščita in prihodnost.

Janez Golič