• Ei tuloksia

OSA 1

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "OSA 1"

Copied!
24
0
0

Kokoteksti

(1)

Sisältö:

- Johdanto (ääniteknologian osa-alueet) - Ihmiskorvan toiminta ja rakenne

- Kuulokäyrä ja peittoilmiö

- Huffman ja LZW koodauksen periaate - MP3 kooderin toimintaperiaate

- Puheenkoodausmenetelmät

- Puheen malli ja ennustus puheenkoodauksessa

OSA 1

(2)

Ääniteknologian osa-alueet Laaja-alainen alue tämäkin...

Alan tutkimusta

Johdanto

(3)

Merkittävät audiosignaalinkäsittelyn alueet

1. High fidelity music reproduction 2. Voice telecommunications

3. Speech synthesis / recognition

Kaikkien edellisten ”tuomarina” toimii ihmiskorva.

Johdanto

(4)

The Scientist and Engineer's Guide to Digital Signal Processing, copyright ©1997-1998 by Steven W. Smith. For more information visit the book's website at:

www.DSPguide.com

• Tympanic membrane = tärykalvo

• Middle ear bones (hammer,anvil,stirrup) = Keskikorvan luut (vasara,alasin,jalustin)

• Cochlea = simpukka

Johdanto

(5)

The Scientist and Engineer's Guide to Digital Signal Processing, copyright ©1997-1998 by Steven W.

Smith. For more information visit the book's website at: www.DSPguide.com

Johdanto

(6)

Kotitehtävät

Onko ihmiskorva herkkä äänisignaalin voimakkuuden vai vaiheen vaihtelulle?

Selvitä, mitä seuraavat termit tarkoittavat

• Loudness

• Pitch

• Timbre

Mihin korvan simpukan taajuusselektiivisyys perustuu?

korvanrakenne Korvan toiminta Taajuuksien erottelu

Johdanto

(7)

Ihmisen kuulon ominaisuuksia

• Kuulon dynaaminen alue on noin 120 dB

• Ihminen tunnistaa noin 1dB äänenvoimakkuuden muutoksen.

• Äänen tehon kasvattaminen 10 kertaiseksi kuulostaa 2 kertaa kovemmalta ääneltä.

• Kuulo on herkimmillään 1-4 kHz taajuisille äänille.

• Kuuloaisti osaa mitata äänen suunnan.

• Kuuloaisti ei osaa arvioida hyvin etäisyyttä.

Johdanto

(8)

Kuulokäyrä

• Nolla decibeliä määritellään intensiteetiksi (sound pressure level) 10-12 W/m2 .

• Äänenpaineen arvo esimerkiksi 40 dB kohdalla voidaan laskea kaavasta 10log10(x / 10-12 W/m2 ) = 40 dB.

• Kuulokäyrän alapuolelle jääviä äänenpainearvoja ei kuulla.

Johdanto

(9)

Peittoilmiö

• Samanaikainen

• Ei samanaikainen

Johdanto

Maskikuvio

(10)

6.2 Peittoilmiön käyttö audion koodauksessa

• Johdatus signaalinkäsittelyyn,

luentomateriaalimoniste 2, kappale 6.2

Johdanto

(11)

Miten tämä toimikaan?

Johdanto

(12)

Tehtävä

Lue materiaali MP3 audiopakkauksesta ja vastaa seuraaviin kysymyksiin

• Mikä vaikuttaa (yleisesti) pakkausalgoritmin tehokkuuteen?

• LZW algoritmin toimintaperiaate?

• Mitä ovat MPEG-1 audiolayer I,II ja III? Mikä on niiden pakkaussuhde?

• Miten MP3 kooderi on määritelty speksissä?

• Mikä on psykoakustinen malli?

• Kuinka moneen taajuuskaistaan MP3 algoritmissa äänisignaali jaetaan?

• Kuinka pitkiä äänilohkoja kompressoidaan kerralla?

• Mikä on ratkaiseva osa MP3 kooderissa koodatun äänen laadun kannalta?

• Mihin MP3 kooderi käyttää Huffman koodausta?

• Mistä ns. ”ennakkokohina” johtuu?

(13)

LZW algoritmi

(14)

Miten tämä toimikaan?

Kompressointi

(15)

MP3 kooderi / dekooderi

(16)

Huffman koodaus

(17)

Tehtäviä

(18)

Laatu vs. bittinopeus

(19)

Laatu vs. bittinopeus

(20)

Puheenkoodaus menetelmät

• Aaltomuodon koodaus

– PCM ITU G.711

– Differentiaalinen modulaatio – Adaptiivinen kvantisointi

– Demo

• Lähteenkoodaus (vokooderit)

– materiaalia

(21)

Companding

6 . 87

/ 1 0

) , ln(

1

1 /

1 ) ,

ln(

1

) ln(

1

255 ) ,

1 ln(

) 1

ln(

 

 

 

 

 

A

A A x

y Ax

x A A

y Ax

missä y x

 

(22)

Companding

Tehtävä

• Oletetaan, että kompressoitavan signaalin vaihteluväli on [-4.096V,+4,096V].

• Käytä G.711 speksin taulukkoa 1a muuntamaan seuraavat signaaliarvot digitaalisiksi

kompressoiduiksi arvoiksi 1. 0.001 V

2. 0.002 V

3. 1.025 V

4. 1.035 V

5. 1.090 V

(23)

Tehtävä

Lue materiaali puheenkoodauksen toimintaperiaatteesta ja vastaa seuraaviin kysymyksiin:

1. Selvitä seuraavien aaltomuotokoodaustapojen periaate

1. Differentiaalinen koodaus 2. Adaptiivinen kvantisointi 3. Deltamodulaatio

4. Alikaistakoodaus

2. Selvitä seuraavien lähteenkoodausmenetelmien periaate

1. Lineaariprediktio 2. Kanvavokooderi 3. Formanttivokooderi

3. Selvitä MOS ja DMOS arvojen merkitys

4. Piirrä lineaaripreditioon perustuvan kooderin lohkokaavio kaavojen (2.1) ja (2.2) perusteella

(24)

Puheen malli

Viittaukset

LIITTYVÄT TIEDOSTOT

Citation statistics of biological oceanography at FIMR: s-slope, s-index, h-index, the number of citations to the most cited paper where the scientist is the first author and

In order to describe the idea of quadrature mirror filters, consider the setup in Figure 2.8, showing the decomposition and reconstruction of a signal using two subband

Plot a sequence (for example for n = 1000 · · · 1100) of the filtered signal {y f (nT s )}, the noise-corrupted signal {x(nT s )} and the original noise- free signal {s(nT s

For any breed taking part in the program, it is required that all dogs used for breeding must have a certificate that they have been tested for certain genetic defects and /

The WIPO Guide 2003 categorises the copyright- based industries into four main groups, namely the core copyright industries, the interdependent copy- right industries, the

In this paper, we analyze the effects of these radio impairments in multi-user SC-FDMA uplink system , and present digital signal processing (DSP)-based methods for the joint

The Gain parameter (boost/cut) amplifies or filters the selected frequencies in the band. The gain can cut or attenuate frequencies to -24dB and/or amplify or boost frequencies up

The reason we need the inverse is to transform that frequency representation back to continue processing a WCDMA signal with our next processing step we will need to signal