Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
https://er.nau.edu.ua/handle/NAU/61250
Повний запис метаданих
Поле DC | Значення | Мова |
---|---|---|
dc.contributor.author | Sineglazov, V. M. | - |
dc.contributor.author | Синєглазов, Віктор Михайлович | - |
dc.contributor.author | Savenko I. M., I. M. | - |
dc.contributor.author | Савенко, Ілля Михайлович | - |
dc.date.accessioned | 2023-10-19T12:18:54Z | - |
dc.date.available | 2023-10-19T12:18:54Z | - |
dc.date.issued | 2023-06-27 | - |
dc.identifier.citation | Sineglazov V. M. Comparative Analysis of Text Vectorization Methods / V. M. Sineglazov, I. M. Savenko // Electronics and Control Systems. Kyiv: NAU, 2023. – No 2(76). – pp. 21–27. | uk_UA |
dc.identifier.issn | 1990-5548 | - |
dc.identifier.uri | https://er.nau.edu.ua/handle/NAU/61250 | - |
dc.description | Науковий журнал «Електроніка та системи управління» президією Міністерства освіти і науки України віднесено до наукових фахових видань у галузі технічних наук категорії «Б». Рекомендовано до друку вченою радою Національного авіаційного університету (протокол № 6 від 15 червня 2023 р.). Зареєстровано Міністерством юстиції України. Свідоцтво про державну реєстрацію друкованого засобу масової інформації. Серія КВ №16720-5292 ПР від 21 травня 2010 року. | uk_UA |
dc.description.abstract | The paper considers methods of vectorization of textual properties of natural language in the context of the task of intellectual text analysis. The most common methods of statistical analysis of feature extraction and methods that taking into account the context are analyzed. The work describes the above types of text embeddings and their most common variations and implementations. Their comparative analysis was performed, which showed the relationship between the type of task of intellectual text analysis and the method showing the best metrics. The topology of the neural network, which is the basis for solving the problem and obtaining metrics, is described, and implemented. The comparative analysis was carried out using the relative time analysis of the theory of algorithms and classification metrics: accuracy, f1-score, precision, recall. The classification metrics are taken from the results of building a neural network model using the described framing methods. As a result, in the task of analyzing the tonality of the text, the statistical method of framing based on n-grams of character sequences turned out to be the best. | uk_UA |
dc.description.abstract | В роботі розглянуто способи векторизації текстових властивостей природної мови в контексті задачі інтелектуального аналізу тексту. Проаналізовано найпоширеніші способи статистичного аналізу вилучення ознак та методи з урахуванням контексту. В роботі проведено опис вищезазначених типів обрамлення тексту та їх найпоширеніші реалізації. Виконано їх порівняльний аналіз, який показав зв’язок між типом задачі інтелектуального аналізу тексту та методом, що показує найкращі метрики. Описано та реалізовано топологію нейронної мережі, яка стоїть в основі вирішення задачі та отримання метрик. Порівняльний аналіз проведено за допомогою відносного аналізу часу теорії алгоритмів та метрик класифікації: accuracy, f1-score, precision, recall. Метрики класифікації узято з результатів побудови моделі нейронної мережі з використанням описаних методів обрамлення. В результаті в задачі аналізу тональності тексту найкращим виявився статистичний метод обрамлення на основі n-грамів символьних послідовностей. | uk_UA |
dc.language.iso | uk | uk_UA |
dc.publisher | National Aviation University | uk_UA |
dc.relation.ispartofseries | Electronics and Control Systems;№2(76) | - |
dc.relation.ispartofseries | Електроніка та системи управління;№2(76) | - |
dc.subject | intellectual text analysis | uk_UA |
dc.subject | natural language processing | uk_UA |
dc.subject | text embeddings | uk_UA |
dc.subject | opinion mining | uk_UA |
dc.subject | machine learning | uk_UA |
dc.subject | Word2Vec | uk_UA |
dc.subject | TF-IDF | uk_UA |
dc.subject | statistical embeddings | uk_UA |
dc.subject | context-based embeddings | uk_UA |
dc.subject | інтелектуальний аналіз тексту | uk_UA |
dc.subject | обробка тексту природної мови | uk_UA |
dc.subject | вставлення тексту | uk_UA |
dc.subject | аналіз думок | uk_UA |
dc.subject | машинне навчання | uk_UA |
dc.subject | Word2Vec | uk_UA |
dc.subject | TF-IDF | uk_UA |
dc.subject | статистичні вкладення | uk_UA |
dc.subject | контекстні вбудовування | uk_UA |
dc.title | Comparative Analysis of Text Vectorization Methods | uk_UA |
dc.title.alternative | Порівняльний аналіз методів векторизації тексту | uk_UA |
dc.type | Article | uk_UA |
dc.subject.udc | 004.855.5(045) | uk_UA |
dc.subject.udc | DOI:10.18372/1990-5548.76.17663 | uk_UA |
Розташовується у зібраннях: | Наукові публікації та матеріали кафедри авіаційних комп'ютерно-інтегрованих комплексів (НОВА) |
Файли цього матеріалу:
Файл | Опис | Розмір | Формат | |
---|---|---|---|---|
5.pdf | Наукова стаття | 884.13 kB | Adobe PDF | Переглянути/Відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.