Please use this identifier to cite or link to this item: https://er.nau.edu.ua/handle/NAU/61254
Full metadata record
DC FieldValueLanguage
dc.contributor.authorSineglazov, V. M.-
dc.contributor.authorСинєглазов, Віктор Михайлович-
dc.contributor.authorSheruda, A. V.-
dc.contributor.authorШеруда, Андрій Володимирович-
dc.date.accessioned2023-10-19T12:22:18Z-
dc.date.available2023-10-19T12:22:18Z-
dc.date.issued2023-06-27-
dc.identifier.citationSineglazov V. M. Recommender Systems Based on Reinforced Learning / V. M. Sineglazov, A. V. Sheruda // Electronics and Control Systems. Kyiv: NAU, 2023. – No 2(76). – pp. 46–55.uk_UA
dc.identifier.issn1990-5548-
dc.identifier.urihttps://er.nau.edu.ua/handle/NAU/61254-
dc.descriptionНауковий журнал «Електроніка та системи управління» президією Міністерства освіти і науки України віднесено до наукових фахових видань у галузі технічних наук категорії «Б». Рекомендовано до друку вченою радою Національного авіаційного університету (протокол № 6 від 15 червня 2023 р.). Зареєстровано Міністерством юстиції України. Свідоцтво про державну реєстрацію друкованого засобу масової інформації. Серія КВ №16720-5292 ПР від 21 травня 2010 року.uk_UA
dc.description.abstractThis article is devoted to the problem of building recommender systems based on the use of artificial intelligence methods. The paper analyzes the algorithms of recommender systems. Analyzes the Markov decision-making process in the context of recommender systems. Approaches to the adaptation of reinforcement learning algorithms to the task of recommendations (transition from the task of supervised learning to the task of reinforcement learning) are considered. Reinforcement learning algorithms Deep Deterministic Policy Gradient and Twin Delayed DDPG were implemented with their own environment simulating the user's reaction, and the results were compared. The structure of a recommender system has been developed, in which the recommender agent generates a list of offers for an individual user, using his previous history of ratings. In the system itself, the user has the ability to interact only with the space of recommended films. This can be compared to the main YouTube page, which is a feed with suggestions, but we have a user interacting only with this feed and his reaction to objects in the recommendation space falls into recommender agent, which regulates the parameters of the model in the learning process.uk_UA
dc.description.abstractСтаттю присвячено проблемі побудови рекомендаційних систем на основі використання методів штучного інтелекту. У роботі проведено аналіз алгоритмів рекомендаційних систем, проаналізовано марківський процес прийняття рішень у контексті рекомендаційних систем. Розглянуто підходи до адаптації алгоритмів навчання з підкріпленням до завдання рекомендацій (перехід від задачі контрольованого навчання до завдання навчання з підкріпленням). Реалізовано алгоритми навчання з підкріпленням Deep Deterministic Policy Gradient та Twin Delayed DDPG із власним середовищем-імітацією реакції користувача та виконано порівняння результатів. Розроблено структуру рекомендаційної системи, у якій рекомендаційний агент генерує список пропозицій окремому користувачеві, використовуючи його попередню історію оцінок. У самій системі користувач має можливість взаємодії тільки з простором фільмів, що рекомендуються. Це можна порівняти з головною сторінкою YouTube, що є стрічкою з пропозиціями, у нас же користувач взаємодія тільки з цією стрічкою і його реакція на об'єкти в просторі рекомендацій потрапляє до рекомендаційного агента, який регулює параметри моделі в процесі навчання.uk_UA
dc.language.isoukuk_UA
dc.publisherNational Aviation Universityuk_UA
dc.relation.ispartofseriesElectronics and Control Systems;№2(76)-
dc.relation.ispartofseriesЕлектроніка та системи управління;№2(76)-
dc.subjectmachine learninguk_UA
dc.subjectreinforcement learninguk_UA
dc.subjectrecommendation systemsuk_UA
dc.subjectrecommender agentuk_UA
dc.subjectcollaborative filteringuk_UA
dc.subjectActor-Criticuk_UA
dc.subjectexplicit feedbackuk_UA
dc.subjectмашинне навчанняuk_UA
dc.subjectнавчання з підкріпленнямuk_UA
dc.subjectсистеми рекомендаційuk_UA
dc.subjectрекомендаційний агентuk_UA
dc.subjectколаборативна фільтраціяuk_UA
dc.subjectАктор-Критикuk_UA
dc.subjectявний зворотній зв’язокuk_UA
dc.titleRecommender Systems Based on Reinforced Learninguk_UA
dc.title.alternativeСистеми рекомендацій на основі посиленого навчанняuk_UA
dc.typeArticleuk_UA
dc.subject.udc004.855.5(045)uk_UA
dc.subject.udcDOI:10.18372/1990-5548.76.17668uk_UA
Appears in Collections:Наукові публікації та матеріали кафедри авіаційних комп'ютерно-інтегрованих комплексів (НОВА)

Files in This Item:
File Description SizeFormat 
9.pdfНаукова стаття893.22 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.