"Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények

Bemutatjuk a BEA-Base adatbázist, mely az általános BEA (BEszélt nyelvi Adatbázis) 140 beszélős részhalmazának egyszerűsített és gépi beszédfelismerési kísérletekre előkészített kivonata. Definiáljuk a beszédfelismerési feladatot, melyben csak a BEA-Base adatbázis használható felügyelt adatként. Ism...

Teljes leírás

Elmentve itt :

Bibliográfiai részletek
Szerzők:	Mihajlik Péter Balog András Gráczi Tekla Etelka Kohári Anna Fegyó Tibor Mády Katalin
Testületi szerző:	Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged)
Dokumentumtípus:	Könyv része
Megjelent:	2022
Sorozat:	Magyar Számítógépes Nyelvészeti Konferencia 18
Kulcsszavak:	Beszédtechnológia, Nyelvészet - számítógép alkalmazása, Mesterséges intelligencia, Gépi beszédfelismerés
Tárgyszavak:	Természettudományok Számítás- és információtudomány Bölcsészettudományok Nyelvek és irodalom
Online Access:	http://acta.bibl.u-szeged.hu/75875


LEADER	02384naa a2200313 i 4500
001	acta75875
005	20221108114906.0
008	220525s2022 hu o 1\|\| hun d
020			\|a 978-963-306-848-9
040			\|a SZTE Egyetemi Kiadványok Repozitórium \|b hun
041			\|a hun
100	1		\|a Mihajlik Péter
245	1	0	\|a "Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények \|h [elektronikus dokumentum] / \|c Mihajlik Péter
260			\|c 2022
300			\|a 199-210
490	0		\|a Magyar Számítógépes Nyelvészeti Konferencia \|v 18
520	3		\|a Bemutatjuk a BEA-Base adatbázist, mely az általános BEA (BEszélt nyelvi Adatbázis) 140 beszélős részhalmazának egyszerűsített és gépi beszédfelismerési kísérletekre előkészített kivonata. Definiáljuk a beszédfelismerési feladatot, melyben csak a BEA-Base adatbázis használható felügyelt adatként. Ismertetjük az alkalmazott, legkorszerűbb beszédfelismerési technikákra épülő beszédfelismerés megközelítéseket, úgymint hibrid rejtett Markov-modell/mély neuronhálós fonéma és graféma alapú rendszerek, konvolúciós és rekurrens hálókra épülő enkóder-dekóder end-to-end rendszerek figyelmi mechanizmussal vagy anélkül. Végül eljutunk a kontrasztív, önfelügyelt módon előtanított súlyokkal inicializált transzformer alapú megközelítésig, amit BEAST-nek (BEA Speech Transcriber) neveztünk el. Utóbbi rendszer – köszönhetően az 53 ezer órás hanganyagon történt előtanításnak – a klasszikus megoldáshoz képest 40%-kal csökkenti a legrelevánsabb szó- és betűhibaarányt, valamint a magyar Common Voice tesztadatokon is versenyképes leiratot szolgáltat.
650		4	\|a Természettudományok
650		4	\|a Számítás- és információtudomány
650		4	\|a Bölcsészettudományok
650		4	\|a Nyelvek és irodalom
695			\|a Beszédtechnológia, Nyelvészet - számítógép alkalmazása, Mesterséges intelligencia, Gépi beszédfelismerés
700	0	1	\|a Balog András \|e aut
700	0	1	\|a Gráczi Tekla Etelka \|e aut
700	0	1	\|a Kohári Anna \|e aut
700	0	1	\|a Fegyó Tibor \|e aut
700	0	1	\|a Mády Katalin \|e aut
710			\|a Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged)
856	4	0	\|u http://acta.bibl.u-szeged.hu/75875/1/msznykonf_018_199-210.pdf \|z Dokumentum-elérés

"Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények

Hasonló tételek