"Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények
Bemutatjuk a BEA-Base adatbázist, mely az általános BEA (BEszélt nyelvi Adatbázis) 140 beszélős részhalmazának egyszerűsített és gépi beszédfelismerési kísérletekre előkészített kivonata. Definiáljuk a beszédfelismerési feladatot, melyben csak a BEA-Base adatbázis használható felügyelt adatként. Ism...
Elmentve itt :
| Szerzők: | |
|---|---|
| Testületi szerző: | |
| Dokumentumtípus: | Könyv része |
| Megjelent: |
2022
|
| Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
18 |
| Kulcsszavak: | Beszédtechnológia, Nyelvészet - számítógép alkalmazása, Mesterséges intelligencia, Gépi beszédfelismerés |
| Tárgyszavak: | |
| Online Access: | http://acta.bibl.u-szeged.hu/75875 |
| LEADER | 02384naa a2200313 i 4500 | ||
|---|---|---|---|
| 001 | acta75875 | ||
| 005 | 20221108114906.0 | ||
| 008 | 220525s2022 hu o 1|| hun d | ||
| 020 | |a 978-963-306-848-9 | ||
| 040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
| 041 | |a hun | ||
| 100 | 1 | |a Mihajlik Péter | |
| 245 | 1 | 0 | |a "Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények |h [elektronikus dokumentum] / |c Mihajlik Péter |
| 260 | |c 2022 | ||
| 300 | |a 199-210 | ||
| 490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 18 | |
| 520 | 3 | |a Bemutatjuk a BEA-Base adatbázist, mely az általános BEA (BEszélt nyelvi Adatbázis) 140 beszélős részhalmazának egyszerűsített és gépi beszédfelismerési kísérletekre előkészített kivonata. Definiáljuk a beszédfelismerési feladatot, melyben csak a BEA-Base adatbázis használható felügyelt adatként. Ismertetjük az alkalmazott, legkorszerűbb beszédfelismerési technikákra épülő beszédfelismerés megközelítéseket, úgymint hibrid rejtett Markov-modell/mély neuronhálós fonéma és graféma alapú rendszerek, konvolúciós és rekurrens hálókra épülő enkóder-dekóder end-to-end rendszerek figyelmi mechanizmussal vagy anélkül. Végül eljutunk a kontrasztív, önfelügyelt módon előtanított súlyokkal inicializált transzformer alapú megközelítésig, amit BEAST-nek (BEA Speech Transcriber) neveztünk el. Utóbbi rendszer – köszönhetően az 53 ezer órás hanganyagon történt előtanításnak – a klasszikus megoldáshoz képest 40%-kal csökkenti a legrelevánsabb szó- és betűhibaarányt, valamint a magyar Common Voice tesztadatokon is versenyképes leiratot szolgáltat. | |
| 650 | 4 | |a Természettudományok | |
| 650 | 4 | |a Számítás- és információtudomány | |
| 650 | 4 | |a Bölcsészettudományok | |
| 650 | 4 | |a Nyelvek és irodalom | |
| 695 | |a Beszédtechnológia, Nyelvészet - számítógép alkalmazása, Mesterséges intelligencia, Gépi beszédfelismerés | ||
| 700 | 0 | 1 | |a Balog András |e aut |
| 700 | 0 | 1 | |a Gráczi Tekla Etelka |e aut |
| 700 | 0 | 1 | |a Kohári Anna |e aut |
| 700 | 0 | 1 | |a Fegyó Tibor |e aut |
| 700 | 0 | 1 | |a Mády Katalin |e aut |
| 710 | |a Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged) | ||
| 856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/75875/1/msznykonf_018_199-210.pdf |z Dokumentum-elérés |