Please use this identifier to cite or link to this item: https://er.nau.edu.ua/handle/NAU/53762
Title: Програмне забезпечення для збору та аналізу даних з веб сайтів
Authors: Петров, Андрій Васильович
Keywords: дипломна робота
технології проектування
програмне забезпечення
веб сайт
java
аналіз даних
Issue Date: 23-Dec-2021
Publisher: Національний авіаційнй унівкрситет
Abstract: Збір даних з метою подальшої аналітики або парсинг – це метод індексування даних з наступним перетворенням їх в інший тип даних або формат. Даний метод дозволяє інформацію або файл в одному форматі перетворити в форму простішу для сприйняття, яку після цього можна використовувати в певних цілях. Наприклад, за допомогою парсингу HTML-файл можна легко трансформувати в «чистий» текст і таким чином зробити його максимально зручним для читання. Або ж перетворити в JSON і зробити зручним для використання у програмах та скриптах. В даній роботі поняття парсинг розглядається в більш вузькій області, а саме збір даних з веб-сайтів. Тому йому можна дати точніше визначення. Отже, парсинг – це процес та метод обробки даних отриманих з веб-сторінок. Даний процес включає в себе аналіз тексту, екстракцію звідти необхідної інформації і її перетворення в заздалегідь зазначений формат, який можна використовувати відповідно до поставлених цілей. Завдяки парсингу можна знаходити на сторінках невеликі клаптики корисної інформації і в автоматичному режимі їх звідти витягувати, щоб потім перевикористати.
Description: Робота публікується згідно наказу Ректора НАУ від 27.05.2021 р. №311/од "Про розміщення кваліфікаційних робіт здобувачів вищої освіти в репозиторії університету". Керівник проекту: доцент, кандидидат технічних наук, Сінько Юрій Іванович.
URI: https://er.nau.edu.ua/handle/NAU/53762
Appears in Collections:Кваліфікаційні роботи здобувачів вищої освіти кафедри комп’ютерних інформаційних технологій

Files in This Item:
File Description SizeFormat 
ФККПІ_2021_122_ПетровАВ.docx3.9 MBMicrosoft Word XMLView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.