A hangok némileg kisebb jelentõséggel bírnak a képeknél a multimédiában, de a hangulat tökéletes megteremtéséhez elengedhetetlen.
A legegyszerûbb formájában a hangot a multimédiás programot tartalmazó CD lemez egy audio sávjában vagy sávjaiban tárolják - ekkor pl. egy háttérzene folyamatosan szólhat a CD meghajtón keresztül. A CD meghajtón kívül itt más erõforrásra nincs is szükség, de arra sajnos folyamatosan - így más adatokat párhuzamosan sajnos nem tudunk olvasni a CD-rõl. Ez az alkalmazási mód tehát csak úgy alkalmazható, ha közben a többi adatot pl. kimásoljuk a winchesterre, vagy egész egyszerûen máshogy oldjuk meg a hangkeltést.
A CD-n tárolt zenék - a mi szempontunkból - nem számítanak adatnak, mivel a számítógéppel nem kerül kapcsolatba, a CD meghajtóból egyenesen az erõsítõ vagy a hangszórók felé csatlakozik.
A második lehetõség, hogy a számítógépek hangkártyáiba beépítünk egy mini hanggeneráló chipet, aminek meg kell mondanunk, hogy milyen jellegû hangot szeretnénk hallani (hangmagasság, hangerõ, stb.), és õ már küldi is ki a hangszórók felé. Ezzel annyi a probléma, hogy a megfizethetõ árú hangchipek, amiket hangkártyára is érdemes szerelni, elég gyenge minõségûek. Ilyen jellegû hangkártyák voltak az AdLib-ek, 9 dallam- és 5 dobcsatornával (egy csatornán egyszerre egy hangszer szólalhat meg). Ez csak egy szintetizátorhangzás, és egyáltalán nem élethû, bár kétségkívül olcsó megoldás volt korábban.
Ha viszont igazi hangokat szeretnénk rögzíteni, akkor egy kicsit nehezebb dolgunk van. Minden hang, hangeffekt vagy zene ugyanis analóg, vagyis folyamatos adatnak számít, amit nem tudunk számítógépen ábrázolni, mivel az csak digitális adatábrázolásra képes.
Ha hasonlítani akarnánk,
akkor például egy négyzetre emelés függvényt
vehetnénk elõ.
Már ezt az igen egyszerû
függvényt sem tudnánk számítógépen
"dokumentálni", hiszen akármilyen tizedestörtet vizsgálnánk,
azután még mindig írhatunk egy újabb tizedest
(pl. 4.03 négyzetét tudjuk, de ott jön még 4.031
aztán 4.032, késõbb 4.0311, és így tovább).
Az egyetlen mód, ahogyan számítógépen hangot rögzíthetünk, az ún. mintavételezés vagy angol nevén sampling. Ennek során a számítógép a kapott analóg jelbõl egy ún. ADC (analog - digital converter) segítségével digitális adatot gyárt (az ADC a hangkártyán helyezkedik el). Ennek a digitális hangadatnak a megszólaltatása a DAC (digital - analog converter, szintén a hangkártyán) feladata lesz, ami valamivel egyszerûbb mûvelet.
A hangoknál is megjelenik a minõség kérdése - hiszen minél jobb minõségre van szükségünk, ez annál több helyet fog foglalni.
Az elsõ minõségi paraméter a mintavételezési frekvencia vagy mintavételezési gyakoriság (sampling frequency). Ez adja meg azt, hogy az ADC-nk másodpercenként hány mintát vegyen a hangból. Ha a mintavételezési frekvencia pl. 22100Hz, akkor másodpercenként 22100 alkalommal vesz mintát az ADC. Viszonyításképpen a telefonvonalak 8kHz-nek, a CD minõség pedig 44100kHz-nek felel meg.
A másik tulajdonság,
ami meghatározza a minõséget, a bitmélység
(bit
depth), vagy hangfelbontás.
A bitmélységtõl
függ az, hogy a hallható tartományból (kb. 20hz-tõl
kb. 18000 - 20000hz - ig) milyen széles tartományt tudunk
rögzíteni a számítógéppel.
Speciális eseteket
leszámítva a hangfelbontás minimum 8 bites lehet;
16 biten már kiváló minõséget lehet
produkálni, míg a 24 bit pedig csak a stúdiókban
használatos, profi szint.
(A 24 bitet azért alkalmazzák, hogy a nem hallható tartományt is rögzíthessék 20000Hz-tõl nagyjából 60-70000Hz-ig. Ennek célja, hogy az itt levõ ún. hang felharmonikusok se vesszenek kárba, amely a hang telítettségét és spektrumát befolyásolja).
A különbség 8 és 16 bites hangzás között körülbelül ugyanolyan, mint 8 illetve 16 bit különbsége egy képen: a képen 256 színnel épphogycsak ábrázolható egy fotó, 65535 szín felhasználásakor viszont már majdnem teljesen élethû (24 bit a képfeldolgozásban is a teljes élethûséget jelenti, "truecolor" - ez igaz a hangokra is).
Vigyázat! Ne keverjük össze a mintavételezési gyakoriságot és a hangfrekvenciát az azonos mértékegység miatt.
Multimédia - a hangformátumok
Természetesen a hangok
számítógépes tárolásánál
is sok különbözõ formátum alakult ki.
A lényegesebbek:
Egyszerû hangformátumok:
RAW: a legalapvetõbb
formátum, ami tulajdonképpen nem is formátum, hiszen
nem tartalmaz információkat a file tartalmával kapcsolatban
(nem mondja meg, hogy hány bites, stb.). Csakis és kizárólag
a digitalizált hangot tartalmazza. Ha egy RAW filet le akarunk játszani,
akkor meg kell tudnunk mondani a lejátszóprogramnak, hogy
a hang vagy zene milyen minõségben lett bedigitalizálva,
mert egyébként nem azt kapjuk majd, amire számítottunk:
- rossz bitmélységben
való lejátszáskor hangos éles zajt,
- rossz mintavételezési
frekvencia felhasználásánál pedig az eredeti
hangot vagy zenét, de más sebességgel (pl. egy 32000Hz-es
mintavételi frekvenciájú hangminta 22100Hz-en lejátszva
lassabb, 44100Hz-en lejátszva gyorsabb lesz).
WAV: a Microsoft által
elterjesztett formátum, a Windows-zal együtt lett egyre népszerûbb.
A WAV-nak több fajtája is van, tömörített
WAV is létezik, mégis elsõsorban rugalmas felépítése
miatt lett népszerû (például rögzíthetjük
a WAV fileban az adott zene vagy hangminta készítõjének
vagy az összes közremûködõnek a nevét,
és még rengeteg más, esetenként nagyon fontos
adatot is).
Kivétel nélkül
minden program támogatja.
Mono WAV file-ok õsszehasonlítása:
8 bit,
11khz (22k);
16 bit,
11khz (44k);
8 bit,
44khz (89k);
16 bit,
44khz (176k)
minõségben.
Modul formátumok:
MOD, S3M, XM, IT:
számítógép segítségével
készíthetünk zenéket is. Ez azon alapul, hogy
egy hangmintát nem csak eredeti hangmagasságában,
hanem magasabban vagy mélyebben is megszólaltathatunk, ami
persze dallamot eredményez.
A modulok lényegében
egy vagy több hangmintát és egy speciális "kottát"
tartalmaznak.
MIDI: a MIDI formátum
a modulokhoz hasonlóan egy speciális kottát ír
le, de itt más nincs is letárolva, mert a MIDI egy szabványosított
hangszerkészletbõl építkezik. Ez a készlet
minden számítógépen közel ugyanúgy
kell, hogy megszólaljon - a hangkártyától függ,
hogy ez teljesül-e, vagy a végeredmény csak nyomokban
hasonlít a kívánt zenére.
Ezt a formátumot használják
a szintetizátorok is.
Itt
egy minta a MIDI fileokra, a Beatles "Real Love" címû
száma.
Hangszer formátumok:
A modulok hívták
életre a hangszerformátumokat. A hangszerfileok egy hangszerbõl
(pl. zongora) különbözõ hangmagasságokban
(pl. oktávonként egy hang) vett mintákat tartalmaznak.
Ezt a módszert alkalmazzák a profi szintetizátorok
is az "élõ" hangszerek utánzásánál.
Ez azért szükséges,
mert egy pl. 5. oktávbeli hangot lejátszva egy oktávval
lejjebb még esetleg, de két oktávval lejjebb már
egyáltalán nem hasonlít a zongora hangjára
(pláne nem minõségi hangzást kapunk).
Ilyen hangszerformátumok
pl.: XI, PAT, SBF.
Tömörített
formátumok:
Mivel egy CD minõségû,
4-5 perces zeneszám legalább 50MB-ot foglal el, és
egy multimédia alkalmazásban bizony sûrûn szükség
lehet zenére, ezért a készítõk legtöbbször
a minõségbõl adnak alább, hogy a CD lemezen
más adat is elférjen. A másik megoldás a hely
jobb kihasználására természetesen a tömörített
formátumok alkalmazása.
A mai legelterjedtebb tömörített
formátum az MP3, amely választható minõségben
képes a hanganyagot tárolni, és átlagosan tizedére
csökkenti a hangminta helyigényét. Hasonlóan
a képeknél említett JPG formátumhoz, ez a formátum
is adatvesztéssel dolgozik, de az emberi fül számára
legtöbbször nem, vagy csak alig hallható minõségromlást
idéz elõ (ha túlzottan feltûnõ lenne
a minõségromlás, akkor némi helyveszteség
árán jobb minõséget is elérhetünk).
Az MP3 fileok minõségét
a kbit/s, vagyis kilobit/másodperc érték megadásával
szabályozhatjuk.
Mono MP3 file-ok õsszehasonlítása:
Az eredeti WAV file - James Brown: "I feel good" címû számából vett hangminta - mérete 345kb volt, 16 bit 44 kHz formátumban.
Ezt a lehetõséget
legtöbbször rádiók alkalmazzák internetes
oldalaikon, mivel így lehetõség van arra, hogy maximum
pár másodperces késéssel a világ másik
végén is hallgathassák az adást - igaz, gyengébb
minõségben. Ekkor a rádiónál alkalmazott
számítógép menetközben tömöríti
az adatot és már küldi is az internetes oldalra, míg
a mi gépünk folyamatosan fogadja azt.
Példák:
Danubius Rádió,
Tilos Rádió,
Pararádió.
A legelterjedtebb ilyen streaming - formátum az RA (RealAudio), de ma már az MP3-at is alkalmazzák ilyen területen.