 |
FRÉTT

|
28.12.2006
Fyrirlestur
um raddþekkingu 9. janúar
Þriðjudaginn
9. janúar gengst Tungutæknisetur fyrir fyrirlestri
í samvinnu við IEEE á Íslandi.
Fyrirlesturinn verður í stofu 201
í Árnagarði og hefst kl. 12:00.
Fyrirlesari er Jón Guðnason
rafmagnsverkfræðingur og nefnist fyrirlestur hans Raddþekking
með cepstrum framsetningu á raddlind.
Greining á raddmyndun er mikilvægur
þáttur í talvinnslu og
lausnum. Línuleg spásíun sem
notuð er í talkóðun og
sú tíðnigreining og síubankar
sem notaðir eru við talgreiningu eru oft byggð
á líkönum af því
hvernig talmerkið verður til í
raddfærunum. Verkefnið sem kynnt er í
fyrirlestrinum fjallar um það hvernig hægt
er að meta raddlindina í rödduðu
tali og nota þær upplýsingar til
þess að auðkenna talandann.
Aðferðin byggir á línulegum
líkönum af raddholinu og
hljóðútbreiðslu við
varirnar. Við gerum ráð fyrir
því að raddlindin sé bara
núll á meðan raddböndin eru
lokuð (í lokuðum fasa) en hafi
ákveðið form þess á
milli (í opnum fasa). Cepstrum-framsetning raddlindarinnar
gerir okkur kleift að einkenna röddina.
Hönnunin notar Mel-síubanka sem líkir
eftir næmni venjulegrar heyrnar. Stuðlarnir sem
fást út úr
þessháttar greiningu eru notaðir sem
auðkenni til mynsturgreiningar og er hverjum einstaklingi
í tilrauninni lýst með
Gaussísku blöndulíkani. Tilraunir voru
gerðar á TIMIT gangabankanum sem inniheldur tal
frá 630 einstaklingum sem tala bandaríska
ensku. Niðurstöðurnar
sýna að þegar upplýsingum um
raddlindina er bætt við þá
stuðla sem venjulega eru notaðir til að
einkenna röddina lækkar villuhlutfallið
úr 5.83% í 2.98%.
Jón Guðnason hefur nýlokið
doktorsprófi í
rafmagnsverkfræði við Imperial College
háskólann í London. Fyrirlesturinn mun
fjalla um hluta af verkefninu sem er á sviði
talsvinnslu og merkjafræði. Jón
lauk meistaraprófi frá HÍ
árið 2000. Hann starfar sem
verkfræðingur hjá Fjarskipta- og
merkjafræðistofu Imperial College. |
|
|