Az akusztikus szózsák eljárás korpuszfüggetlenségének vizsgálata
Cikkünkben egy jellemzőreprezentációs módszer, az akusztikus szózsák (Bag of Audio Words, BoAW) metódus szélesebb körű használhatóságát elemezzük. A BoAW eljárás lehetővé teszi a változó hosszúságú hangminták fix méretű jellemzővektorokként való kezelését. Ezáltal a különböző hangadatbázisok kezelhe...
Elmentve itt :
| Szerzők: | |
|---|---|
| Testületi szerző: | |
| Dokumentumtípus: | Könyv része |
| Megjelent: |
2020
|
| Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
16 |
| Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
| Online Access: | http://acta.bibl.u-szeged.hu/67668 |
| LEADER | 02398naa a2200217 i 4500 | ||
|---|---|---|---|
| 001 | acta67668 | ||
| 005 | 20260224081030.0 | ||
| 008 | 200505s2020 hu o 100 hun d | ||
| 020 | |a 978-963-306-719-2 | ||
| 040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
| 041 | |a hun | ||
| 100 | 1 | |a Vetráb Mercedes | |
| 245 | 1 | 3 | |a Az akusztikus szózsák eljárás korpuszfüggetlenségének vizsgálata |h [elektronikus dokumentum] / |c Vetráb Mercedes |
| 260 | |c 2020 | ||
| 300 | |a 219-231 | ||
| 490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 16 | |
| 520 | 3 | |a Cikkünkben egy jellemzőreprezentációs módszer, az akusztikus szózsák (Bag of Audio Words, BoAW) metódus szélesebb körű használhatóságát elemezzük. A BoAW eljárás lehetővé teszi a változó hosszúságú hangminták fix méretű jellemzővektorokként való kezelését. Ezáltal a különböző hangadatbázisok kezelhetővé és taníthatóvá válnak a hagyományos tanulóalgoritmusokkal is. A BoAW eljárás kezdeti lépésében klaszterközéppontokat (ún. kódszavakat) határozunk meg a keretszintű jellemzővektorok fölött valamilyen felügyelet nélküli módszerrel (pl. kmeans klaszterezéssel, vagy akár csak véletlenszerű kiválasztással). Ezt a lépést hagyományosan az adott akusztikus adatbázis tanító halmazán szokás elvégezni. Ez azonban amellett, hogy minden adatbázison új kódszavak kiválasztását teszi szükségessé, így megnyújtva a jellemzőreprezentációk előállításának idejét, akár túlillesztést is okozhat. Jelen tanulmányunkban megvizsgáljuk, hogy mennyire korpuszfüggő az előálló kódszóhalmaz. Kísérleteinkben egy magyar nyelvű érzelemadatbázison mérünk osztályozási eredményeket, miközben a kódszavak kiválasztása vagy egy német nyelvű érzelemadatbázison, vagy egy magyar nyelvű, általános beszédadatbázison történik. Eredményeink szerint mindkét új típusú megközelítéssel elérhető, a korábban említett hagyományos megközelítéssel elérhető osztályozási pontosság, ami megkönnyítheti a BoAW eljárás gyakorlati alkalmazását. | |
| 695 | |a Nyelvészet - számítógép alkalmazása | ||
| 700 | 0 | 1 | |a Gosztolya Gábor |e aut |
| 710 | |a Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged) | ||
| 856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/67668/1/msznykonf_016_219-231.pdf |z Dokumentum-elérés |