Метод оптимізації алгоритмів сортування для великих наборів даних
Loading...
Date
2024-12-16
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Національний авіаційний університет
Abstract
Сучасна епоха характеризується стрімким зростанням обсягів даних, які потребують обробки та аналізу. Зокрема, у сфері обчислювальної техніки, великих даних та машинного навчання, сортування є фундаментальною задачею. Традиційні алгоритми сортування, такі як сортування бульбашкою чи швидке сортування, не завжди здатні ефективно справлятися з масивами даних, які перевищують доступні обчислювальні ресурси. Це створює потребу у дослідженні нових підходів до оптимізації алгоритмів, здатних обробляти великі набори даних швидко, точно та з мінімальними витратами ресурсів. Актуальність даної роботи зумовлена збільшенням ролі великих даних у сучасному суспільстві та бізнесі. Застосування великих даних у науці, економіці та технологіях вимагає ефективних способів обробки інформації. Проте традиційні методи часто не враховують обмеження пам’яті, значні витрати на введення/виведення даних та складність паралельних обчислень. Вивчення методів оптимізації алгоритмів сортування, таких як паралельні обчислення або використання інструментів MapReduce, дозволяє вирішити ці проблеми, надаючи нові підходи до обробки великих обсягів інформації. Метою роботи є розробка та аналіз методу оптимізації алгоритмів сортування для великих наборів даних, який забезпечить високу продуктивність, оптимальне використання обчислювальних ресурсів та мінімізацію часу обробки. Основну увагу зосереджено на адаптації алгоритмів до середовищ, що використовують розподілені обчислення, а також на впровадженні практичних рішень для підвищення їхньої ефективності. Об’єктом дослідження виступає процес сортування великих наборів даних, а предметом — методи і засоби оптимізації алгоритмів сортування, що спрямовані на підвищення їхньої продуктивності. Для досягнення мети використано такі методи дослідження: логічний і алгоритмічний аналіз, порівняння різних алгоритмів сортування, моделювання процесів оптимізації та симуляція роботи алгоритмів у середовищах великих даних. У роботі вперше запропоновано метод оптимізації сортування великих даних на основі адаптації традиційних алгоритмів до розподілених обчислень із використанням MapReduce. Запропоновані рішення допоможуть зменшити вплив I/O-операцій, оптимізувати процес обробки в паралельному середовищі та покращити балансування навантаження між вузлами кластеру, що має практичне значення для обробки великих даних у різних галузях — від аналізу фінансових потоків до розробки систем штучного інтелекту. Реалізація методу оптимізації алгоритмів сортування сприятиме зниженню витрат на обчислювальні ресурси та підвищенню швидкості обробки даних.
Description
Робота публікується згідно наказу Ректора НАУ від 27.05.2021 р. №311/од «Про розміщення кваліфікаційних робіт здобувачів вищої освіти в репозиторії університету» Керівник проекту: доцент, кандидат технічних наук, Вікторія Сидоренко.
Keywords
дипломна робота, Python, алгоритм, сортування, MapReduce, оптимізація, Hadoop, Sort, Merge, кеш, Checkpoints, дані
Citation
Грицак Б.Я. Метод оптимізації алгоритмів сортування для великих наборів даних. - Дипломна робота на здобуття ступеня магістра спеціальності «Комп’ютерні науки», “«Інформаційні технології проектування». - Київ, 2024. – 97 с.