<?xml version="1.0" encoding="UTF-8"?>
<collection xmlns="http://www.loc.gov/MARC21/slim">
 <record>
  <leader>02157naa a2200217 i 4500</leader>
  <controlfield tag="001">acta67671</controlfield>
  <controlfield tag="005">20260224081030.0</controlfield>
  <controlfield tag="008">200505s2020    hu      o     100   hun d</controlfield>
  <datafield tag="020" ind1=" " ind2=" ">
   <subfield code="a">978-963-306-719-2</subfield>
  </datafield>
  <datafield tag="040" ind1=" " ind2=" ">
   <subfield code="a">SZTE Egyetemi Kiadványok Repozitórium</subfield>
   <subfield code="b">hun</subfield>
  </datafield>
  <datafield tag="041" ind1=" " ind2=" ">
   <subfield code="a">hun</subfield>
  </datafield>
  <datafield tag="100" ind1="1" ind2=" ">
   <subfield code="a">Laki László János</subfield>
  </datafield>
  <datafield tag="245" ind1="1" ind2="0">
   <subfield code="a">Automatikus ékezetvisszaállítás transzformer modellen alapuló neurális gépi fordítással</subfield>
   <subfield code="h">[elektronikus dokumentum] /</subfield>
   <subfield code="c"> Laki László János</subfield>
  </datafield>
  <datafield tag="260" ind1=" " ind2=" ">
   <subfield code="c">2020</subfield>
  </datafield>
  <datafield tag="300" ind1=" " ind2=" ">
   <subfield code="a">181-190</subfield>
  </datafield>
  <datafield tag="490" ind1="0" ind2=" ">
   <subfield code="a">Magyar Számítógépes Nyelvészeti Konferencia</subfield>
   <subfield code="v">16</subfield>
  </datafield>
  <datafield tag="520" ind1="3" ind2=" ">
   <subfield code="a">Cikkünkben egy ékezetvisszaállító programot mutatunk be, amelyet a jelenkori „state-of-the-art” transzformer modellen alapuló neurális gépi fordító rendszerrel tanítottunk be. A mobil eszközökön történő üzenetírás elterjedésével és a minél gyorsabb szövegbevitelre való törekvéssel tömeges jelenséggé vált az ékezetes betűk elhagyása a gépelt írásban. Ennek egyik következménye, hogy a interneten elérhető – főleg a szociális médiából származó – korpuszok egy része ékezetmentes. Egy ékezetvisszaállító program segítségével vissza tudjuk állítani az ékezethiányos szavakat, valamint integrálva szövegbeviteli eszközökkel támogatni tudjuk a felhasználók számára a szövegbevitelt. Az általunk létrehozott rendszer, annak ellenére, hogy semmilyen morfológiai elemzőt nem használ, több mint 99,7%-os pontossággal tudja helyesen visszaállítani az ékezeteket magyar nyelv esetében. A hibaanalízis során kiderült, hogy a hibák több mint 50%-a a többértelműségből fakad, illetve, hogy a rendszerünk által ajánlott ékezetesítés utáni mondat is helyes. Készítettünk egy demó felületet is, amelyen ki lehet próbálni a különböző modellek működését.</subfield>
  </datafield>
  <datafield tag="695" ind1=" " ind2=" ">
   <subfield code="a">Ékezetvisszaállító program, Nyelvészet - számítógép alkalmazása</subfield>
  </datafield>
  <datafield tag="700" ind1="0" ind2="2">
   <subfield code="a">Yang Zijian Győző</subfield>
   <subfield code="e">aut</subfield>
  </datafield>
  <datafield tag="710" ind1=" " ind2=" ">
   <subfield code="a">Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged)</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2="0">
   <subfield code="u">http://acta.bibl.u-szeged.hu/67671/1/msznykonf_016_181-190.pdf</subfield>
   <subfield code="z">Dokumentum-elérés </subfield>
  </datafield>
 </record>
</collection>
