02157naa a2200217 i 4500 acta67671 20260224081030.0 200505s2020 hu o 100 hun d 978-963-306-719-2 SZTE Egyetemi Kiadványok Repozitórium hun hun Laki László János Automatikus ékezetvisszaállítás transzformer modellen alapuló neurális gépi fordítással [elektronikus dokumentum] / Laki László János 2020 181-190 Magyar Számítógépes Nyelvészeti Konferencia 16 Cikkünkben egy ékezetvisszaállító programot mutatunk be, amelyet a jelenkori „state-of-the-art” transzformer modellen alapuló neurális gépi fordító rendszerrel tanítottunk be. A mobil eszközökön történő üzenetírás elterjedésével és a minél gyorsabb szövegbevitelre való törekvéssel tömeges jelenséggé vált az ékezetes betűk elhagyása a gépelt írásban. Ennek egyik következménye, hogy a interneten elérhető – főleg a szociális médiából származó – korpuszok egy része ékezetmentes. Egy ékezetvisszaállító program segítségével vissza tudjuk állítani az ékezethiányos szavakat, valamint integrálva szövegbeviteli eszközökkel támogatni tudjuk a felhasználók számára a szövegbevitelt. Az általunk létrehozott rendszer, annak ellenére, hogy semmilyen morfológiai elemzőt nem használ, több mint 99,7%-os pontossággal tudja helyesen visszaállítani az ékezeteket magyar nyelv esetében. A hibaanalízis során kiderült, hogy a hibák több mint 50%-a a többértelműségből fakad, illetve, hogy a rendszerünk által ajánlott ékezetesítés utáni mondat is helyes. Készítettünk egy demó felületet is, amelyen ki lehet próbálni a különböző modellek működését. Ékezetvisszaállító program, Nyelvészet - számítógép alkalmazása Yang Zijian Győző aut Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged) http://acta.bibl.u-szeged.hu/67671/1/msznykonf_016_181-190.pdf Dokumentum-elérés