KANNANVAIHTO?

Kannanvaihto

V

X1

X2

Y1

Y2

Z1

Z2

• Vektori V voidaan esittää vaihtoehtoisten kantavektoreiden X1 ja X2, tai Y1 ja Y2, tai Z1 ja Z2 avulla. Kertoimet W ovat kunkin komponenttivektorin pituuksia (kun kantavektorit on normalisoitu pituuteen 1).

• Vastaavasti signaalikehys voidaan ajatella vektorina, joka alun perin esitetään kantavektoreiden δ(n-k) avulla, mutta joka voidaan esittää myös muiden kantavektoreiden avulla.

• Fourier-muunnos on kannanvaihto, jossa (reaalinen) signaali esitetään eritaajuisten kosini-aaltojen summana!

Fourier-muunnos kannanvaihtona

1

0

1

0

1

0

2

)2

cos()(2

)2

sin()2

cos()(

)()(

N

n

N

n

N

n

ntN

fi

ntN

fnS

ntN

fint

N

fnS

enSts

S

S

eee

eee

eee

s

NfNN

NfN

NfN

NfN

Nf

Nf

NfN

Nf

Nf

NNiNiNi

Niii

Niii

Nf

Nf

Nf

Nf

Nf

Nf

Nf

Nf

Nf

)cos()cos()cos(1

:::

)cos(...)cos()cos(1

)cos(...)cos()cos(1

1...111

1

:::

...1

...1

1...111

2)1)(1(22)1(2)1(

2)1(22422

2)1(222

)1)(1(2)1()1(

)1(242

)1(2

222

222

222

Jos S on symmetrinen ja reaalinen, kompleksiset termit häviävät!

Fourier-muunnoksen reaaliset kantavektorit

Ss

NfNN

NfN

NfN

NfN

Nf

Nf

NfN

Nf

Nf

)cos()cos()cos(1

:::

)cos(...)cos()cos(1

)cos(...)cos()cos(1

1...111

2)1)(1(22)1(2)1(

2)1(22422

2)1(222

Kepstrienglanniksi Cepstrum

Spektri on signaalin kannanvaihdos…

…niin on myös kepstri

Kepstri lasketaan spektrin logaritmista

• Äänen spektri S(w) muodostuu ääntöväylän siirtofunktion H(w) ja kurkunpää-äänen siirtofunktion G(w) tulona:

S(w) = H(w)G(w)

• Logaritmisena sama lauseke muuttuu yhteenlaskuksi:

Log(S(w)) = log(H(w)) + log(G(w))

• Nyt on periaatteessa helppoa erottaa kurkunpää-äänen ja ääntöväylän spektrit kokonaisspektristä, kun ne ovat vain summautuneet keskenään!

Spektrin jaksollisuusJaksollisen signaalin spektrissä näkyvät voimakkaina perustaajuuden monikerrat eli harmoniset.

Niinpä jaksollisen äänen spektrikin näyttäisi olevan jaksollinen.

Voisimmeko esittää spektrin vielä jonkin muiden kantavektoreiden avulla siten, että informaatio tulisi tallennettua tehokkaammin – ikään kuin pääkomponenttiensa avulla?

Fourier-muunnoksella on jaksolliset kantavektorit. Entäpä jos tekisimme spektrille vielä uuden Fourier-muunnoksen?

Spektristä kepstriin

• Kepstriä laskettaessa ajatellaan spektri ikään kuin aikatason signaaliksi.

• Kun spektri on taajuusesitys aikatason signaalista, niin kepstri on ’taajuusesitys’ spektristä. Tästä nimi: spektri->kepstri

• Kun spektrin yksikkö on (englanniksi) frequency, kepstrin yksiköksi on määrätty: ’quefrency’ joka tosiasiassa on (pseudo)aika: t -> 1/t=f -> 1/f=t .

Kepstrin määritelmä

• Reaalinen signaalikepstri määritellään logaritmisena itseisarvo- tai tehospektrin käänteisenä Fourier-muunnoksena.

• Koska reaalisen signaalin spektri S(n) on aina symmetrinen funktio, voidaan Fourier- muunnos korvata kosinimuunnoksella.

nN

kjN

nx enS

Nkc

21

0

)(log1

][

Kepstri kosinimuunnoksen avulla

)sin()cos()(log1

)(log1

][

221

0

21

0

ninnSN

enSN

kc

Nk

Nk

N

n

nN

kjN

ns

Koska S(n) on symmetrinen, kompleksiset sinitermit supistuvat pois:

Kosini II –muunnos lasketaan seuraavasti:

))(cos()(log1

][

))(cos()(1

][

21

1

0)(log

21

1

0

nnSN

k

nnxN

k

Nk

N

nnS

Nk

N

nx

c

c

)cos()(log1

][ 21

0

nnSN

kc Nk

N

ns

Nämä ovat melkein samat!

DFT vs. DCT• Fourier-muunnos voidaan korvata kosinimuunnoksella ja näin vähentää

laskentaa.• Kosinimuunnoksen kantavektorit ovat lisäksi optimaalisemmat reaalisen,

symmetrisen signaalin esittämiseen.

kosinimuunnoksen kantavektorit DFT-muunnoksen reaaliset kantavektorit

: :

Puheen spektri- ja kepstrikomponentit

• Puhesignaalin tapauksessa oletetaan, että ääntöväylä aiheuttaa spektriin laajoja resonanssialueita ja kurkunpää-ääni aiheuttaa harmonisen kampaspektrin.

• Jos siis spektrille tehdään taajuusanalyysi …

• …voidaan ajatella, että kepstrin pienen ajan quefrenssit (matalat taajuudet) vastaavat ääntöväylän spektriominaisuuksia

• ja pitkän ajan quefrenssit (korkeat taajuudet) vastaavat kurkunpää-ääntä.

Kepstrin lifterointi• Termi ’lifter’ on väännös sanasta ’filter’, ja tarkoittaa kepstrin

suodatusoperaatiota.

Short-Time Liftering• Puheenkäsittelyssä kepstristä otetaan vain noin 20 ensimmäistä komponenttia

mallintamaan spektrin verhokäyrää.

Long-Time Liftering• Kepstrin myöhemmän näytteet edustavat puheenkäsittelyssä äänenkorkeutta ja

sen harmonisia.

Middle-Time Liftering • Hyvin pienen ajan kepstrikertoimet ovat herkkiä mm. spektrin kaltevuudelle ja

kurkunpääpulssin muodolle. • Hyvin pitkän ajan kepstrikertoimet taas ovat herkkiä analyysikehyksen ajallisille

muutoksille. • Puhujariippumattomassa puheentunnistuksessa tällaisten henkilökohtaisten

ominaisuuksien vaikutusta pienennetään lifteroimalla kepstriä pehmeäreunaisella ikkunalla.

KANNANVAIHTO?

Documents

Transcript of KANNANVAIHTO?