Kétszintű algoritmus spontán beszéd prozódiaalapú szegmentálására
Cikkünkben egy kétlépcsős automatikus szupraszegmentális frázisszegmentálót mutatunk be spontán beszédre. Miután az olvasott beszédre kidolgozott eljárások spontán beszédre nem működnek megfelelően, illetve a felügyelet nélküli kontúrklaszterezés sem hozott kielégítő eredményt, részletesebben is átt...
Elmentve itt :
| Szerzők: | |
|---|---|
| Testületi szerző: | |
| Dokumentumtípus: | Könyv része |
| Megjelent: |
2015
|
| Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
11 |
| Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
| Online Access: | http://acta.bibl.u-szeged.hu/58929 |
| Tartalmi kivonat: | Cikkünkben egy kétlépcsős automatikus szupraszegmentális frázisszegmentálót mutatunk be spontán beszédre. Miután az olvasott beszédre kidolgozott eljárások spontán beszédre nem működnek megfelelően, illetve a felügyelet nélküli kontúrklaszterezés sem hozott kielégítő eredményt, részletesebben is áttekintjük a vonatkozó irodalmat, ami alapján a szünetekkel határolt intonációs frázist tekintjük modellezési alapegységnek. A második szinten beágyazott fonológiai frázisok detektálását vizsgáljuk alapfrekvencia, energiamenet és magánhangzóidőtartamok alapján. A fonológiai frázisok detektálása az akusztikai jellemzők időbeli változását megragadó, szimmetrikus Kullback–Leiblertávolság alapú metrikával képzett különbségjelére meghatározott adaptív küszöbértékkel történik. A fonológiai frázisok detektálási pontossága spontán beszédben 80% körül adódik, percepciós szempontú címkézéssel összevetve. A kétszintű detektálási feladatban az energiaszint és a szünetek az intonációs frázisokban, az alapfrekvencia pedig a fonológiai frázisokban tűnik meghatározónak. Az időtartamok hozzájárulása a frázishatárok észleléséhez – az olvasott beszédhez hasonlóan – spontán beszédben sem igazolható. |
|---|---|
| Terjedelem/Fizikai jellemzők: | 161-173 |
| ISBN: | 978-963-306-359-0 |