Digitaalisen äänenkäsittelyn Digitaalisen äänenkäsittelyn
perusteet perusteet
Jouni Smed Jouni Smed
jouni.smed@utu.fi jouni.smed@utu.fi
syksy 2006 syksy 2006
Yleistä Yleistä
laajuus: 5 op. (3 ov.)laajuus: 5 op. (3 ov.)
esitiedot: Javaesitiedot: Java--ohjelmoinnin perusteetohjelmoinnin perusteet
luennot:luennot:
keskiviikkoisin 10–keskiviikkoisin 10–12 salissa 12 salissa ββ
perjantaisin 10–perjantaisin 10–12 salissa 12 salissa ββ
kurssin kotisivu: kurssin kotisivu:
http://staff.cs.utu.fi/staff/jouni.smed/dap06/
http://staff.cs.utu.fi/staff/jouni.smed/dap06/
Kurssin hyväksytty suoritus = Kurssin hyväksytty suoritus =
1.1.
Ilmoittautuminen 13.11 menness Ilmoittautuminen 13.11 mennessä ä
https://www.it.utu.fi/kurssihttps://www.it.utu.fi/kurssi--ilmo/ilmo/
2.
2.
Hyv Hyvä äksytty harjoitusty ksytty harjoitustyö ö
3.3.
Hyv Hyvä äksytty tentti ksytty tentti
Tentit Tentit
tenttipäivättenttipäivät
1.1. 15.12, sali 15.12, sali ββ,,klo 12:00klo 12:00––14:00 14:00 (luentotentti)
(luentotentti)
2.2. tammikuussa 2007tammikuussa 2007
3.
3. helmikuussa 2007helmikuussa 2007
varmista tenttiaika ja -varmista tenttiaika ja -paikka paikka http://www.it.utu.fi/opetus/tentit/
http://www.it.utu.fi/opetus/tentit/
muista ilmoittautua ajoissa!muista ilmoittautua ajoissa!
Harjoitustyö 1(2) Harjoitustyö 1(2)
yksin tai 2yksin tai 2––3 ryhm3 ryhmäässssää
tehtävät julkaistaan viikolla 46tehtävät julkaistaan viikolla 46
palautettava 31.12.2006 mennessäpalautettava 31.12.2006 mennessä
arvosteluarvostelu
hylätty, 1–hylätty, 1–55
lineaarinen tenttibonus:lineaarinen tenttibonus:
1 1 →→ei korotustaei korotusta
……
5 5 →→yhden arvosanan korotusyhden arvosanan korotus
Harjoitustyö 2(2) Harjoitustyö 2(2)
tehtätehtävissvissääAudacity-Audacity-ohjelmistollaohjelmistolla
saatavana vapaasti saatavana vapaasti
http://audacity.sourceforge.net/
http://audacity.sourceforge.net/
alustana Windows, Mac OS X tai alustana Windows, Mac OS X tai Linux/Unix
Linux/Unix
tai muulla vastaavalla äätai muulla vastaavalla äänitynityöökalullakalulla
esim. SoundForgeesim. SoundForge, , AdobeAuditionAdobeAudition……
Kurssin luentoaikataulu Kurssin luentoaikataulu
Javan ääniohjelmointi 2(3) Javan ääniohjelmointi 2(3) 1.12 pe
1.12 pe 9.9.
Luentotentti Luentotentti 15.12 pe
15.12 pe 11.
11.
Javan ääniohjelmointi 3(3) Javan ääniohjelmointi 3(3) 8.12 pe
8.12 pe 10.10.
Javan ääniohjelmointi 1(3) Javan ääniohjelmointi 1(3) 29.11 ke
29.11 ke 8.
8.
Aaltomuotoon kohdistuvat operaatiot Aaltomuotoon kohdistuvat operaatiot 24.11 pe
24.11 pe 7.
7.
Aikaan kohdistuvat operaatiot Aikaan kohdistuvat operaatiot 22.11 ke
22.11 ke 6.6.
Taajuuteen kohdistuvat operaatiot Taajuuteen kohdistuvat operaatiot 17.11 pe
17.11 pe 5.5.
Voimakkuuteen kohdistuvat operaatiot 2(2) Voimakkuuteen kohdistuvat operaatiot 2(2) 15.11 ke
15.11 ke 4.
4.
Voimakkuuteen kohdistuvat operaatiot 1(2) Voimakkuuteen kohdistuvat operaatiot 1(2) 8.11 ke
8.11 ke 3.
3.
Johdanto 2(2) Johdanto 2(2) 3.11 pe
3.11 pe 2.
2.
Johdanto 1(2) Johdanto 1(2) 1.11 ke
1.11 ke 1.1.
Aihe Aihe Pvm.
Pvm.
Luento Luento
Tavoitteet Tavoitteet
teoreettinen: ymmärtää äänenkäsittelyyn teoreettinen: ymmärtää äänenkäsittelyyn liittyviä käsitteitä
liittyviä käsitteitä
→→mitä mitä voidaanvoidaantehdätehdä
käytännöllinen: ymmärtää operaatioiden käytännöllinen: ymmärtää operaatioiden vaikutus ääneen
vaikutus ääneen
→
→mitä mitä pitääpitäätehdä tehdä
Mitä
Mitä ei ei käsitellä — käsitellä — ainakaan ainakaan syvällisesti
syvällisesti
äänentoistoaäänentoistoa
akustiikkaaakustiikkaa
äänittämistääänittämistä
musiikintekoamusiikintekoa
MIDIäMIDIä
signaaliprosessointiasignaaliprosessointia
tiivistämistätiivistämistä
tiedostoformaattien esitysmuotoatiedostoformaattien esitysmuotoa
Kurssin rajapinnat Kurssin rajapinnat
DÄPDÄP
Sisällys 1(3) Sisällys 1(3)
1.
1. PerusteitaPerusteita
1.1. Äänen fysiikkaaÄänen fysiikkaa
2.2. PsykoakustiikkaPsykoakustiikka
3.
3. Äänen syntetisointiÄänen syntetisointi
4.
4. Samplaus ja kvantisointiSamplaus ja kvantisointi
5.5. TiedostoformaatitTiedostoformaatit
Sisällys 2(3) Sisällys 2(3)
2.
2. ÄänenkäsittelyoperaatiotÄänenkäsittelyoperaatiot
1.1. VoimakkuusVoimakkuus
2.2. TaajuusTaajuus
3.
3. AikaAika
4.
4. AaltomuotoAaltomuoto
5.5. Operaatioiden ketjuttaminenOperaatioiden ketjuttaminen
Sisällys 3(3) Sisällys 3(3)
3.3. Javan ääniohjelmointiJavan ääniohjelmointi
1.
1. java.appletjava.applet
2.2. javax.sound.sampledjavax.sound.sampled
Lähde
Lähde- - ja lisämateriaalia ja lisämateriaalia
Curtis Roads: The Computer Music Curtis Roads: The Computer Music Tutorial
Tutorial, The MIT Press, 2000, The MIT Press, 2000
Esa Blomberg & Ari Lepoluoto: AudiokirjaEsa Blomberg & Ari Lepoluoto: Audiokirja, , Tapiolan viestintäsuunnittelu, 1991
Tapiolan viestintäsuunnittelu, 1991
J. Pekka Mäkelä: KotistudioJ. Pekka Mäkelä: Kotistudio, 2. painos, , 2. painos, Like-Like-kustannus, 2003kustannus, 2003
1.1. Äänen fysiikkaa 1.1. Äänen fysiikkaa
ääniääni= väliaineessa etenevä mekaaninen = väliaineessa etenevä mekaaninen värähtely (aaltoliike), joka saa aikaan värähtely (aaltoliike), joka saa aikaan kuuloaistimuksen
kuuloaistimuksen
äänilähde
äänilähde väliaineväliaine havaitsijahavaitsija
Ääniaalto Ääniaalto
pp00
tihentymä tihentymä (ylipaine) (ylipaine)
harventuma harventuma (alipaine) (alipaine) p
p
Aaltomuoto Aaltomuoto
jaksollinen jaksollinen aaltomuoto
aaltomuoto kohinakohina
Taajuus (
Taajuus (frequency frequency) )
taajuus, taajuus, ff: aaltojen : aaltojen lukumäärä lukumäärä aikayksikköä kohti aikayksikköä kohti
yksikkö: hertsi, Hz = yksikkö: hertsi, Hz = 1/s
1/s
Aallonpituus ja amplitudi Aallonpituus ja amplitudi
aallonpituusaallonpituus, , λλ: : vastaavien pisteiden vastaavien pisteiden etäisyys peräkkäisissä etäisyys peräkkäisissä aalloissa
aalloissa
amplitudiamplitudi, , AA: : värähdysliikkeen värähdysliikkeen laajuus
laajuus
λλ
λλ A
A
Äänen spektri Äänen spektri
t t A
A AA
ff
AA
ff t
t AA
Vaihe (
Vaihe ( phase) phase ) Äänen nopeus Äänen nopeus
vv= f= fλλ
riippuu:riippuu:
väliaineestaväliaineesta
lämpötilastalämpötilasta
ilmassa:ilmassa:
−10−10ººC: 325 m/sC: 325 m/s
+10º+10ºC: 337 m/sC: 337 m/s
+20º+20ºC: 343 m/sC: 343 m/s
eri väliaineissa:eri väliaineissa:
vesi: 1480 m/svesi: 1480 m/s
lasi: 5200 m/slasi: 5200 m/s
teräs: 5000–teräs: 5000–5900 5900 m/sm/s
puu: 3000–puu: 3000–4000 4000 m/sm/s
COCO22: 259 m/s: 259 m/s
He: 965 m/sHe: 965 m/s
Äänen mittayksiköitä Äänen mittayksiköitä
ääniteho, ääniteho, PP
watti, Wwatti, W
mittaetäisyys 1 mmittaetäisyys 1 m
äänen intensiteetti, äänen intensiteetti, II= P= P//AA
teho pinta-teho pinta-alayksikköä kohtialayksikköä kohti
äänenpaine, äänenpaine, p p = = FF//AA: :
pascal, Pa = N/mpascal, Pa = N/m22
mittaetäisyys 1 mmittaetäisyys 1 m
Desibeli (dB) Desibeli (dB)
ilmaisee: ilmaisee:
kahden suureen keskinäistä suuruutta kahden suureen keskinäistä suuruutta
suureen arvoa suhteessa johonkin suureen arvoa suhteessa johonkin vertailutasoon
vertailutasoon
kahden äänitehon tai intensiteetin suhde:kahden äänitehon tai intensiteetin suhde:
L
L= 10 log= 10 log1010(I(I11/I/I00) dB) dB missä
missä II00on viitetasoon viitetaso
huom! mittahuom! mitta-- asteikko on logaritminenasteikko on logaritminen
Desibeli äänen mittana Desibeli äänen mittana
usein viitetasona käytetään ihmisen usein viitetasona käytetään ihmisen kuulokynnystä:
kuulokynnystä: II00= 10= 10−−1212W/mW/m22
ihmisen kuuloaistimus on logaritminenihmisen kuuloaistimus on logaritminen
3 dB:n muutos on havaittavissa3 dB:n muutos on havaittavissa
10 dB:n muutos kuulostaa 10 dB:n muutos kuulostaa äänenvoimakkuuden äänenvoimakkuuden
kaksinkertaistumiselta tai puolittumiselta kaksinkertaistumiselta tai puolittumiselta
1.2. Psykoakustiikka 1.2. Psykoakustiikka
äänihavaintoon vaikuttavatäänihavaintoon vaikuttavat
kuuloaistin fysiologiakuuloaistin fysiologia
aivojen tulkintaaivojen tulkinta
Äänenvoimakkuuden aistinta Äänenvoimakkuuden aistinta
riippuu:riippuu:
äänenpaineestaäänenpaineesta
taajuudestataajuudesta
kuuloalue: 20 Hzkuuloalue: 20 Hz––20 kHz20 kHz
herkimmillään 3–herkimmillään 3–4 kHz:ss4 kHz:ssää
äääänenvoimakkuus eli nenvoimakkuus eli äääänenpaineen taso (nenpaineen taso (sound sound pressure level
pressure level):):
dBSPL = 20 logdBSPL = 20 log1010((pp11/p/p00))
pp00= 20 µ= 20 µPaPa
Fletcher
Fletcher- -Munson Munson - -käyrästö käyrästö
taajuus (Hz)
äänenpainetaso(dB)
KUULO- KYNNYS
Dynamiikka Dynamiikka- -alue alue
- -2020
00 20 20 40 40 6060 8080 100 100 120 120 140140
tuntoaistimus kipurajakipuraja
kuulokynnys kuulokynnys epämiellyttävyyden epämiellyttävyyden kynnys
kynnys
äänenpainetaso (dB)äänenpainetaso (dB)
Äänenpainetasoja Äänenpainetasoja
150 150 140 140 130 130 120 120 110 110 100 100 90 90 8080 7070 60 60 50 50 40 40 30 30 20 20
dB dB
kuiskaus (3 m) kuiskaus (3 m) klassinen musiikki klassinen musiikki pppppp
keskustelu (3 m) keskustelu (3 m) luento (3 m) luento (3 m) paineilmapora (15 m) paineilmapora (15 m) klassinen musiikki
klassinen musiikki ffffff meluisa tehdasmeluisa tehdas meluisa katu meluisa katu henkilöauton sisällä henkilöauton sisällä televisio (3 m)
televisio (3 m) suihkukone (5 m) suihkukone (5 m)
hiljainen talo hiljainen talo myymälä myymälä asumalähiö yöllä asumalähiö yöllä kipuraja kipuraja
Aivojen äänihavainto Aivojen äänihavainto
tarkka äänimuisti on erittäin lyhyt: 1tarkka äänimuisti on erittäin lyhyt: 1––2 s2 s
on helppo kuulla siton helppo kuulla sitäämitmitäähaluaahaluaa
on helppo olla kuulematta epon helppo olla kuulematta epäättäärkeinrkeinääpidettyjäpidettyjä ää
ääniniää
Haasin ilmiö: useita yhtäläisiä äänilähteitä Haasin ilmiö: useita yhtäläisiä äänilähteitä kuunnellessa lähin määrää havaitun äänensuunnan kuunnellessa lähin määrää havaitun äänensuunnan
kriittiset taajuuskaistat: ei havaita yksittäisiä kriittiset taajuuskaistat: ei havaita yksittäisiä taajuuksia vaan taajuuskaistoja, joissa voimakas taajuuksia vaan taajuuskaistoja, joissa voimakas ääni voi peittää kaistan hiljaisemmat äänet ääni voi peittää kaistan hiljaisemmat äänet
Sävelkorkeus (
Sävelkorkeus (musical pitch musical pitch) )
nuotin sävelkorkeus:nuotin sävelkorkeus:
suhteessa taajuuteensuhteessa taajuuteen
voimakkuus voi vaikuttaa madaltavastivoimakkuus voi vaikuttaa madaltavasti
standardi sävelkorkeus: 440 Hz = Astandardi sävelkorkeus: 440 Hz = A
oktaavi (oktaavi (octave) = taajuuden kaksinkertaistusoctave) = taajuuden kaksinkertaistus
siis 220 Hz = A, 880 Hz = A jne.siis 220 Hz = A, 880 Hz = A jne.
puolisävelaskeleen (semitonepuolisävelaskeleen (semitone) taajuussuhde = ) taajuussuhde =
1212√2:1 √2:1 ≈≈1,06:11,06:1
Nuottien taajuudet Nuottien taajuudet
330 330 E
E
220 220 a
a
233 233 a#
a#
247 247 h
h
262262 C (keski
C (keski--C)C)
277 277 C#
C#
294 294 D
D
311311 D#D#
349 349 F
F
370 370 F#
F#
392392 GG
415 415 G#
G#
440440 AA
Taajuus (Hz) Taajuus (Hz) Nuotti
Nuotti
Äänilähteiden taajuusalueita Äänilähteiden taajuusalueita
700 700––40004000 ksylofoni
ksylofoni
1515––80008000 kirkkourut
kirkkourut
30 30––40004000 piano
piano
70–70–600600 sello
sello
200 200––35003500 viulu
viulu
200 200––10001000 trumpetti
trumpetti
125125––650650 alttosaksofoni
alttosaksofoni
60 60––600600 fagotti
fagotti
250250––25002500 huilu
huilu
100 100––350350 mieslaulaja
mieslaulaja
250 250––10001000 naislaulaja
naislaulaja
Taajuusalue (Hz) Taajuusalue (Hz) Äänilähde
Äänilähde
Sointiväri (
Sointiväri (timbre timbre) )
erottaa äänilähteet toisistaanerottaa äänilähteet toisistaan
syyt:syyt:
yläsävelet (harmonicsyläsävelet (harmonics) )
perustaajuuden harmonisia monikertojaperustaajuuden harmonisia monikertoja
aluke (starting transientsaluke (starting transients))
äänen alkaessa esiintyviä, eiäänen alkaessa esiintyviä, ei-- harmonisia taajuuksia harmonisia taajuuksia
kestävät 0,01kestävät 0,01––0,2 s0,2 s