KANNANVAIHTO?
description
Transcript of KANNANVAIHTO?
KANNANVAIHTO?
Kannanvaihto
V
X1
X2
Y1
Y2
Z1
Z2
• Vektori V voidaan esittää vaihtoehtoisten kantavektoreiden X1 ja X2, tai Y1 ja Y2, tai Z1 ja Z2 avulla. Kertoimet W ovat kunkin komponenttivektorin pituuksia (kun kantavektorit on normalisoitu pituuteen 1).
• Vastaavasti signaalikehys voidaan ajatella vektorina, joka alun perin esitetään kantavektoreiden δ(n-k) avulla, mutta joka voidaan esittää myös muiden kantavektoreiden avulla.
• Fourier-muunnos on kannanvaihto, jossa (reaalinen) signaali esitetään eritaajuisten kosini-aaltojen summana!
Fourier-muunnos kannanvaihtona
1
0
1
0
1
0
2
)2
cos()(2
)2
sin()2
cos()(
)()(
N
n
N
n
N
n
ntN
fi
ntN
fnS
ntN
fint
N
fnS
enSts
S
S
eee
eee
eee
s
NfNN
NfN
NfN
NfN
Nf
Nf
NfN
Nf
Nf
NNiNiNi
Niii
Niii
Nf
Nf
Nf
Nf
Nf
Nf
Nf
Nf
Nf
)cos()cos()cos(1
:::
)cos(...)cos()cos(1
)cos(...)cos()cos(1
1...111
1
:::
...1
...1
1...111
2)1)(1(22)1(2)1(
2)1(22422
2)1(222
)1)(1(2)1()1(
)1(242
)1(2
222
222
222
Jos S on symmetrinen ja reaalinen, kompleksiset termit häviävät!
Fourier-muunnoksen reaaliset kantavektorit
Ss
NfNN
NfN
NfN
NfN
Nf
Nf
NfN
Nf
Nf
)cos()cos()cos(1
:::
)cos(...)cos()cos(1
)cos(...)cos()cos(1
1...111
2)1)(1(22)1(2)1(
2)1(22422
2)1(222
Kepstrienglanniksi Cepstrum
Spektri on signaalin kannanvaihdos…
…niin on myös kepstri
Kepstri lasketaan spektrin logaritmista
• Äänen spektri S(w) muodostuu ääntöväylän siirtofunktion H(w) ja kurkunpää-äänen siirtofunktion G(w) tulona:
S(w) = H(w)G(w)
• Logaritmisena sama lauseke muuttuu yhteenlaskuksi:
Log(S(w)) = log(H(w)) + log(G(w))
• Nyt on periaatteessa helppoa erottaa kurkunpää-äänen ja ääntöväylän spektrit kokonaisspektristä, kun ne ovat vain summautuneet keskenään!
Spektrin jaksollisuusJaksollisen signaalin spektrissä näkyvät voimakkaina perustaajuuden monikerrat eli harmoniset.
Niinpä jaksollisen äänen spektrikin näyttäisi olevan jaksollinen.
Voisimmeko esittää spektrin vielä jonkin muiden kantavektoreiden avulla siten, että informaatio tulisi tallennettua tehokkaammin – ikään kuin pääkomponenttiensa avulla?
Fourier-muunnoksella on jaksolliset kantavektorit. Entäpä jos tekisimme spektrille vielä uuden Fourier-muunnoksen?
Spektristä kepstriin
• Kepstriä laskettaessa ajatellaan spektri ikään kuin aikatason signaaliksi.
• Kun spektri on taajuusesitys aikatason signaalista, niin kepstri on ’taajuusesitys’ spektristä. Tästä nimi: spektri->kepstri
• Kun spektrin yksikkö on (englanniksi) frequency, kepstrin yksiköksi on määrätty: ’quefrency’ joka tosiasiassa on (pseudo)aika: t -> 1/t=f -> 1/f=t .
Kepstrin määritelmä
• Reaalinen signaalikepstri määritellään logaritmisena itseisarvo- tai tehospektrin käänteisenä Fourier-muunnoksena.
• Koska reaalisen signaalin spektri S(n) on aina symmetrinen funktio, voidaan Fourier- muunnos korvata kosinimuunnoksella.
nN
kjN
nx enS
Nkc
21
0
)(log1
][
Kepstri kosinimuunnoksen avulla
)sin()cos()(log1
)(log1
][
221
0
21
0
ninnSN
enSN
kc
Nk
Nk
N
n
nN
kjN
ns
Koska S(n) on symmetrinen, kompleksiset sinitermit supistuvat pois:
Kosini II –muunnos lasketaan seuraavasti:
))(cos()(log1
][
))(cos()(1
][
21
1
0)(log
21
1
0
nnSN
k
nnxN
k
Nk
N
nnS
Nk
N
nx
c
c
)cos()(log1
][ 21
0
nnSN
kc Nk
N
ns
Nämä ovat melkein samat!
DFT vs. DCT• Fourier-muunnos voidaan korvata kosinimuunnoksella ja näin vähentää
laskentaa.• Kosinimuunnoksen kantavektorit ovat lisäksi optimaalisemmat reaalisen,
symmetrisen signaalin esittämiseen.
kosinimuunnoksen kantavektorit DFT-muunnoksen reaaliset kantavektorit
: :
Puheen spektri- ja kepstrikomponentit
• Puhesignaalin tapauksessa oletetaan, että ääntöväylä aiheuttaa spektriin laajoja resonanssialueita ja kurkunpää-ääni aiheuttaa harmonisen kampaspektrin.
• Jos siis spektrille tehdään taajuusanalyysi …
• …voidaan ajatella, että kepstrin pienen ajan quefrenssit (matalat taajuudet) vastaavat ääntöväylän spektriominaisuuksia
• ja pitkän ajan quefrenssit (korkeat taajuudet) vastaavat kurkunpää-ääntä.
Kepstrin lifterointi• Termi ’lifter’ on väännös sanasta ’filter’, ja tarkoittaa kepstrin
suodatusoperaatiota.
Short-Time Liftering• Puheenkäsittelyssä kepstristä otetaan vain noin 20 ensimmäistä komponenttia
mallintamaan spektrin verhokäyrää.
Long-Time Liftering• Kepstrin myöhemmän näytteet edustavat puheenkäsittelyssä äänenkorkeutta ja
sen harmonisia.
Middle-Time Liftering • Hyvin pienen ajan kepstrikertoimet ovat herkkiä mm. spektrin kaltevuudelle ja
kurkunpääpulssin muodolle. • Hyvin pitkän ajan kepstrikertoimet taas ovat herkkiä analyysikehyksen ajallisille
muutoksille. • Puhujariippumattomassa puheentunnistuksessa tällaisten henkilökohtaisten
ominaisuuksien vaikutusta pienennetään lifteroimalla kepstriä pehmeäreunaisella ikkunalla.