Hand Gestures Recognition and Tracking Within Virtual Reality using Hybrid Convolutional Neural Networks

Sineglazov, Victor; Синєглазов, Віктор Михайлович; Boryndo, Illia; Бориндо, Ілля Олександрович

doi:10.18372/1990-5548.72.16940

Please use this identifier to cite or link to this item: https://er.nau.edu.ua/handle/NAU/59839

Title:	Hand Gestures Recognition and Tracking Within Virtual Reality using Hybrid Convolutional Neural Networks
Other Titles:	Розпізнавання та відстеження жестів рук у віртуальній реальності за допомогою гібридних згорткових нейронних мереж
Authors:	Sineglazov, Victor Синєглазов, Віктор Михайлович Boryndo, Illia Бориндо, Ілля Олександрович
Keywords:	convolutional neural network virtual reality machine learning image classification аdvanced RISC machine згорткова нейронна мережа віртуальна реальність машинне навчання класифікація зображень удосконалена RISC-машина
Issue Date:	26-Sep-2022
Publisher:	National Aviation University
Citation:	Sineglazov V. M. Hand Gestures Recognition and Tracking Within Virtual Reality using Hybrid Convolutional Neural Networks / V. M. Sineglazov, I. O. Boryndo // Electronics and Control Systems. Kyiv: NAU, 2022. – No 2(72). – pp. 32–37.
Series/Report no.:	Electronics and Control Systems;№2(72) Електроніка та системи управління;№2(72)
Abstract:	In this paper analysis of modern virtual reality algorithms based on mobile devices was done. As a result, algorithmic shortcomings were identified and the usage of convolutional neural networks was proposed. Within the research the qualitative analysis of modern architectures of convolutional neural networks was carried out and their separate shortcomings at use in systems on the basis of processor architecture аdvanced RISC machine was shown. As a result of this research it was found that to achieve the target accuracy and speed of the system it is important to use a hybrid convolutional neural network, which significantly improves the quality criteria of the system. The optimal structure and parameters for initialization and training of a hybrid convolutional neural network system used for virtual reality are obtained. The optimal training sample was formed and the use of pre-trained hybrid convolutional neural network on another device of аdvanced RISC machine architecture was described. У даній роботі проведено аналіз сучасних алгоритмів віртуальної реальності на основі мобільних пристроїв. У результаті було виявлено недоліки розглянутих алгоритмів та запропоновано використання згорткових нейронних мереж для їх уникнення. У рамках дослідження проведено якісний аналіз сучасних архітектур згорткових нейронних мереж та показано їх окремі недоліки при використанні в системах на базі процесорної архітектури удосконаленої RISC-машини. У результаті цього дослідження встановлено, що для досягнення цільової точності та швидкодії систем, важливим є використання гібридних згорткових нейронних мереж, які значно покращують критерії якості системи. Отримано оптимальну структуру та параметри для ініціалізації та навчання гібридної згорткової нейронної мережі, яка оптимальна для використання в системах віртуальної реальності. Сформовано оптимальну навчальну вибірку та описано використання попередньо навченої гібридних згорткових нейронних мереж на іншому пристрої архітектури удосконаленої RISC-машини.
Description:	Науковий журнал «Електроніка та системи управління» президією Міністерства освіти і науки України віднесено до наукових фахових видань у галузі технічних наук категорії «Б». Рекомендовано до друку вченою радою Національного авіаційного університету (протокол № 5 від 21 вересня 2022 р.). Зареєстровано Міністерством юстиції України. Свідоцтво про державну реєстрацію друкованого засобу масової інформації. Серія КВ №16720-5292 ПР від 21 травня 2010 року. [1] Iveta Mrazova and Marek Kukacka, "Hybrid convolutional neural networks," IEEE International Conference on Industrial Informatics. https://doi.org/10.1109/INDIN.2008.4618146. [2] Chaitanya Nagpal and Shiv Ram Dubey. “A Performance Evaluation of Convolutional Neural Networks for Face Anti Spoofing,” https://doi.org/10.48550/arXiv.1805.04176 [3] Y. Jia, E. Shelhamer, J. Donahue, S. Karayev, J. Long, R. Girshick, S. Guadarrama, and T. Darrell, “Caffe: Convolutional architecture for fast feature embedding,” in Proceedings of the 22nd ACM international conference on Multimedia. ACM, 2014, pp. 675–678. https://doi.org/10.1145/2647868.2654889 [4] K. Simonyan and A. Zisserman, “Very deep convolutional networks for large-scale image recognition,” 2014. [5] J. Long, E. Shelhamer, and T. Darrell, “Fully convolutional networks for semantic segmentation,” in Proceedings of the IEEE conference on computer vision and pattern recognition, 2015, pp. 3431–3440. https://doi.org/10.1109/CVPR.2015.7298965 [6] Jie Hu, Li Shen, Samuel Albanie, Gang Sun, Enhua Wu. “Squeeze-and-Excitation Networks”. [7] C. Cao, X. Liu, Y. Yang, Y. Yu, J. Wang, Z. Wang, Y. Huang, L. Wang, C. Huang, W. Xu, D. Ramanan, and T. S. Huang, “Look and think twice: Capturing top-down visual attention with feedback convolutional neural networks,” in ICCV, 2015. https://doi.org/10.1109/ICCV.2015.338 [8] K. He, X. Zhang, S. Ren, and J. Sun, “Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification,” in ICCV, 2015. https://doi.org/10.1109/ICCV.2015.123 [9] A. Krizhevsky and G. Hinton, “Learning multiple layers of features from tiny images,” Citeseer, Tech. Rep., 2009. [10] B. Zhou, A. Lapedriza, A. Khosla, A. Oliva, and A. Torralba, “Places: A 10 million image database for scene recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017. https://doi.org/10.1167/17.10.296 [11] L. Shen, Z. Lin, and Q. Huang, “Relay backpropagation for effective learning of deep convolutional neural networks,” in ECCV, 2016. https://doi.org/10.1007/978-3-319-46478-7_29 [12] D. Mahajan, R. Girshick, V. Ramanathan, K. He, M. Paluri, Y. Li, A. Bharambe, and L. van der Maaten, “Exploring the limits of weakly supervised pretraining,” in ECCV, 2018. https://doi.org/10.1007/978-3-030-01216-8_12 [13] G. Mittal and S. Sasi, “Robust Preprocessing Algorithm for Face Recognition”, Proceedings of the 3rd Canadian conference on Computer and Robot vision, United States of America , 2006. [14] A. Krizhevsky, I. Sutskever, and G. E. Hinton, “Imagenet classification with deep convolutional neural networks,” In Advances in neural information processing systems, 25(2), pp. 1097–1105, 2012, https://doi.org/10.1145/3065386 [15] V. V. Kochergin, Servo Systems with motors of Direct Current, Leningrad: Energoatomidat, 1988, 68 p.
URI:	https://er.nau.edu.ua/handle/NAU/59839
ISSN:	1990-5548
DOI:	10.18372/1990-5548.72.16940
Appears in Collections:	Наукові публікації та матеріали кафедри авіаційних комп'ютерно-інтегрованих комплексів (НОВА)

Files in This Item:

File	Description	Size	Format
7.pdf	Наукова стаття	2.74 MB	Adobe PDF	View/Open

Show full item record