Gondolatok a gondola-tokról morfológiai annotációt javító módszerek tesztelése gold standard korpuszon /
Kutatásunk célja az volt, hogy csökkentsük az emberi annotációs munka mennyiségét a gold standard korpusz projektünkben. A cikkben (egy baseline mellett) három egyszerűen kivitelezhető módszert vizsgáltunk meg, amely alkalmas lehet az annotálási hibák megtalálására. A cél elsősorban a magas fedés: o...
Elmentve itt :
| Szerzők: | |
|---|---|
| Testületi szerző: | |
| Dokumentumtípus: | Könyv része |
| Megjelent: |
2023
|
| Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
19 |
| Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
| Tárgyszavak: | |
| Online Access: | http://acta.bibl.u-szeged.hu/78424 |
| Tartalmi kivonat: | Kutatásunk célja az volt, hogy csökkentsük az emberi annotációs munka mennyiségét a gold standard korpusz projektünkben. A cikkben (egy baseline mellett) három egyszerűen kivitelezhető módszert vizsgáltunk meg, amely alkalmas lehet az annotálási hibák megtalálására. A cél elsősorban a magas fedés: olyan módszert keresünk, amely úgy szűkíti le a második annotátor által áttekintendő tokenek körét, hogy a lehető legtöbb hibát lefedje. A három módszer eredményeit összegezve azt az eredményt kaptuk, hogy a tokenek 31,65%-át újraannotálva a szövegben előforduló annotálási hibák arányát 2%-ra csökkenthetjük, melynek közel fele csak a részletes (HuMor) elemzést érinti. Ez a munkaterhelésben lényeges csökkentést jelent, miközben magas minőséget is biztosít. |
|---|---|
| Terjedelem/Fizikai jellemzők: | 341-353 |
| ISBN: | 978-963-306-912-7 |