Please use this identifier to cite or link to this item: https://er.nau.edu.ua/handle/NAU/59856
Title: Generation of UAV-based Training Dataset using Semi-supervised Learning
Other Titles: Формування набору даних для навчання на базі БПЛА з використанням напівкерованого навчання
Authors: Sineglazov, Victor
Синєглазов, Віктор Михайлович
Kalmykov, Vadym
Калмиков, Вадим Віталійович
Keywords: dataset formation
semi-supervised learning
pseudo-labeling
unmanned aerial vehicle
YOLOv5
object detection
classification problem
формирование массива данных
полууправляемое обучение
псевдоразметка
беспилотный летательный аппарат
YOLOv5
обнаружение объектов
проблема классификации
Issue Date: 26-Sep-2022
Publisher: National Aviation University
Citation: Sineglazov V. M. Generation of UAV-based Training Dataset using Semi-supervised Learning / V. M. Sineglazov, V. V. Kalmykov // Electronics and Control Systems. Kyiv: NAU, 2022. – No 2(72). – pp. 14–19.
Series/Report no.: Electronics and Control Systems;№2(72)
Abstract: The paper considers the problem of constructing a training sample based on the use of semi-supervised learning a teacher. The problem statement related to the problem posed is substantiated. It is shown that obtaining a training sample in some cases is a difficult task that requires significant computational and financial costs. The use of semi-supervised learning made it possible to label unlabeled data and thus ensure the creation of a labeled sample of sufficient size. The paper gives examples of generating a training sample, as well as its use for training neural networks, which are used to solve the problem of multiclass classification. Using this approach, you can get a robust data set consisting of a small amount of manually labeled images and a huge amount of pseudo-labeled or augmented data. Using this approach, one can train a classifier to detect and classify any objects in images with bounding boxes and label them accordingly.
В работе рассмотрена задача построения обучающей выборки на основе использования обучения с частичным привлечением учителя. Обоснована постановка задачи, связанная с поставленной проблемой. Показано, что получение учебной выборки в ряде случаев является сложной задачей, которая требует значительных вычислительных и финансовых затрат. Использование машинного обучения с частичным привлечением учителя позволило разметить немаркированные данные и тем самым обеспечить создание маркированной выборки достаточного объема. В работе приведены примеры генерации обучающей выборки, а также ее использование для обучения нейронных сетей, которые применяются для решения задачи многоклассовой классификации. Используя этот подход, можно получить надежный набор данных, состоящий из небольшого количества размеченных вручную изображений и огромного количества псевдоразмеченных данных или дополненных данных. Используя этот подход, можно обучить классификатор обнаруживать и классифицировать любые объекты на изображениях с ограничительными рамками и маркировать их соответствующим образом.
Description: Науковий журнал «Електроніка та системи управління» президією Міністерства освіти і науки України віднесено до наукових фахових видань у галузі технічних наук категорії «Б». Рекомендовано до друку вченою радою Національного авіаційного університету (протокол № 5 від 21 вересня 2022 р.). Зареєстровано Міністерством юстиції України. Свідоцтво про державну реєстрацію друкованого засобу масової інформації. Серія КВ №16720-5292 ПР від 21 травня 2010 року. [1] V. M. Sineglazov and V. V. Kalmykov, “Image Processing from Unmanned Aerial Vehicle Using Modified YOLO Detector,” Electronics and control systems, NAU Kyiv: vol. 3, no. 69, pp.37–42, 2021. https://doi.org/10.18372/1990-5548.69.16425 [2] J. H. Kim, J. Kim, S. J. Oh, S. Yun, H. Song, J. Jeong, & H. O. Song, (2022). Dataset Condensation via Efficient Synthetic-Data Parameterization. arXiv preprint arXiv:2205.14959. [3] M. Maranghi, A. Anagnostopoulos, I. Cannistraci, I. Chatzigiannakis, F. Croce, G. Di Teodoro, & P. Velardi, (2022). AI-based Data Preparation and Data Analytics in Healthcare: The Case of Diabetes. arXiv preprint arXiv:2206.06182. [4] C. Shneider, A. Hu, A. K. Tiwari, M. G. Bobra, K. Battams, J. Teunissen, & E. Camporeale, (2021). A Machine-Learning-Ready Dataset Prepared from the Solar and Heliospheric Observatory Mission. arXiv preprint arXiv:2108.06394. [5] Semi-supervised learning, 2022, https://en.wikipedia.org/wiki/Semi-supervised_learning [6] Ross Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In CVPR 2014. https://doi.org/10.1109/CVPR.2014.81 [7] Kaiming He, Georgia Gkioxari, Piotr Doll´ar, and Ross Gir-shick. Mask r-cnn. In ICCV 2017. [8] Zhaowei Cai and Nuno Vasconcelos. Cascade r-cnn: Delving into high quality object detection. In CVPR 2018. [9] Joseph Redmon, Santosh Divvala, Ross Girshick, and Ali Farhadi. You only look once: Unified, real-time object detection. In CVPR 2016. https://doi.org/10.1109/CVPR.2016.91 [10] Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, and Alexander C Berg. Ssd: Single shot multibox detector. In ECCV 2016. https://doi.org/10.1007/978-3-319-46448-0_2 [11] Jisoo Jeong, Seungeui Lee, Jeesoo Kim, and Nojun Kwak. Consistency-based semi-supervised learning for object detection. In NeurIPS, 2019. [12] Antti Tarvainen and Harri Valpola. Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results. In NeurIPS, 2017. [13] Qizhe Xie, Zihang Dai, Eduard Hovy, Minh-Thang Luong, and Quoc V. Le. Unsupervised data augmentation for consistency training. arXiv preprint arXiv:1904.12848, 2019. [14] Daniel Ho, Eric Liang, Ion Stoica, Pieter Abbeel, and Xi Chen. Population based augmentation: Efficient learning of augmentation policy schedules. arXiv preprint arXiv:1905.05393, 2019. [15] Ekin D Cubuk, Barret Zoph, Dandelion Mane, Vijay Vasudevan, and Quoc V Le. Autoaugment: Learning augmentation strategies from data. In CVPR, 2019. https://doi.org/10.1109/CVPR.2019.00020 [16] Aerial dataset. Website, 2022. https://universe.roboflow.com/gdit/aerial-airport/dataset/1. [17] Wang, C. Y., Liao, H. Y. M., Wu, Y. H., Chen, P. Y., Hsieh, J. W., & Yeh, I. H. (2020). CSPNet: A new backbone that can enhance learning capability of CNN. In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops (pp. 390–391). [18] Li, Z., Peng, C., Yu, G., Zhang, X., Deng, Y., & Sun, J. (2017). Light-head r-cnn: In defense of two-stage object detector. arXiv preprint arXiv:1711.07264.
URI: https://er.nau.edu.ua/handle/NAU/59856
ISSN: 1990-5548
DOI: 10.18372/1990-5548.72.16935
Appears in Collections:Наукові публікації та матеріали кафедри авіаційних комп'ютерно-інтегрованих комплексів (НОВА)

Files in This Item:
File Description SizeFormat 
4.pdfНаукова стаття2.05 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.