Vizuális kódok lokalizációja mély egyenirányított neurális háló használatával

A számítógéppel automatikusan olvasható vizuális kódok a mindennapjaink részévé váltak az ipari alkalmazásokban és a személyes felhasználási területeken is. A leolvasási folyamat két lépésből áll, a kód lokalizálásából és a hordozott adat dekódolásából. Ebben a munkában egy lokalizálási módszert...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Bodnár Péter
Nyúl László Gábor
Grósz Tamás
Tóth László
Testületi szerző: Képfeldolgozók és Alakfelismerők Társaságának 10. országos konferenciája
Dokumentumtípus: Könyv része
Megjelent: 2015
mtmt:2831846
Online Access:http://publicatio.bibl.u-szeged.hu/8493
Leíró adatok
Tartalmi kivonat:A számítógéppel automatikusan olvasható vizuális kódok a mindennapjaink részévé váltak az ipari alkalmazásokban és a személyes felhasználási területeken is. A leolvasási folyamat két lépésből áll, a kód lokalizálásából és a hordozott adat dekódolásából. Ebben a munkában egy lokalizálási módszert mutatunk be konvencionális és mély egyenirányított neurális hálók használatával. Ezeket a hálókat a DCT térben is kiértékeljük, ahol szintén hatékonynak bizonyultak. Ez azt jelenti, hogy a JPEG képeket használó alkalmazásokban a teljes dekompresszió nem szükséges. Ez a megközelítés hatékony a tárhely és számítási kapacitás tekintetében is, mivel a legtöbb kamera képes JPEG streamet adni outputként. A hálózatok szerkezete, a regularizáció, a különbözo tanítási paraméterek, mint az input vektor, az átfedés mértéke a mintákban, a különböző blokkméret mind kiértékelésre kerül. A GPU-n implementált neurális hálók használata lehetővé teszi a gyors, valós ideju, automatikus kód-lokalizációt. A javasolt módszert QR-kódokon mutatjuk be.
Terjedelem/Fizikai jellemzők:546-561