Recommender Systems Based on Reinforced Learning

Sineglazov, V. M.; Синєглазов, Віктор Михайлович; Sheruda, A. V.; Шеруда, Андрій Володимирович

Please use this identifier to cite or link to this item: https://er.nau.edu.ua/handle/NAU/61254

Title:	Recommender Systems Based on Reinforced Learning
Other Titles:	Системи рекомендацій на основі посиленого навчання
Authors:	Sineglazov, V. M. Синєглазов, Віктор Михайлович Sheruda, A. V. Шеруда, Андрій Володимирович
Keywords:	machine learning reinforcement learning recommendation systems recommender agent collaborative filtering Actor-Critic explicit feedback машинне навчання навчання з підкріпленням системи рекомендацій рекомендаційний агент колаборативна фільтрація Актор-Критик явний зворотній зв’язок
Issue Date:	27-Jun-2023
Publisher:	National Aviation University
Citation:	Sineglazov V. M. Recommender Systems Based on Reinforced Learning / V. M. Sineglazov, A. V. Sheruda // Electronics and Control Systems. Kyiv: NAU, 2023. – No 2(76). – pp. 46–55.
Series/Report no.:	Electronics and Control Systems;№2(76) Електроніка та системи управління;№2(76)
Abstract:	This article is devoted to the problem of building recommender systems based on the use of artificial intelligence methods. The paper analyzes the algorithms of recommender systems. Analyzes the Markov decision-making process in the context of recommender systems. Approaches to the adaptation of reinforcement learning algorithms to the task of recommendations (transition from the task of supervised learning to the task of reinforcement learning) are considered. Reinforcement learning algorithms Deep Deterministic Policy Gradient and Twin Delayed DDPG were implemented with their own environment simulating the user's reaction, and the results were compared. The structure of a recommender system has been developed, in which the recommender agent generates a list of offers for an individual user, using his previous history of ratings. In the system itself, the user has the ability to interact only with the space of recommended films. This can be compared to the main YouTube page, which is a feed with suggestions, but we have a user interacting only with this feed and his reaction to objects in the recommendation space falls into recommender agent, which regulates the parameters of the model in the learning process. Статтю присвячено проблемі побудови рекомендаційних систем на основі використання методів штучного інтелекту. У роботі проведено аналіз алгоритмів рекомендаційних систем, проаналізовано марківський процес прийняття рішень у контексті рекомендаційних систем. Розглянуто підходи до адаптації алгоритмів навчання з підкріпленням до завдання рекомендацій (перехід від задачі контрольованого навчання до завдання навчання з підкріпленням). Реалізовано алгоритми навчання з підкріпленням Deep Deterministic Policy Gradient та Twin Delayed DDPG із власним середовищем-імітацією реакції користувача та виконано порівняння результатів. Розроблено структуру рекомендаційної системи, у якій рекомендаційний агент генерує список пропозицій окремому користувачеві, використовуючи його попередню історію оцінок. У самій системі користувач має можливість взаємодії тільки з простором фільмів, що рекомендуються. Це можна порівняти з головною сторінкою YouTube, що є стрічкою з пропозиціями, у нас же користувач взаємодія тільки з цією стрічкою і його реакція на об'єкти в просторі рекомендацій потрапляє до рекомендаційного агента, який регулює параметри моделі в процесі навчання.
Description:	Науковий журнал «Електроніка та системи управління» президією Міністерства освіти і науки України віднесено до наукових фахових видань у галузі технічних наук категорії «Б». Рекомендовано до друку вченою радою Національного авіаційного університету (протокол № 6 від 15 червня 2023 р.). Зареєстровано Міністерством юстиції України. Свідоцтво про державну реєстрацію друкованого засобу масової інформації. Серія КВ №16720-5292 ПР від 21 травня 2010 року.
URI:	https://er.nau.edu.ua/handle/NAU/61254
ISSN:	1990-5548
Appears in Collections:	Наукові публікації та матеріали кафедри авіаційних комп'ютерно-інтегрованих комплексів (НОВА)

Files in This Item:

File	Description	Size	Format
9.pdf	Наукова стаття	893.22 kB	Adobe PDF	View/Open

Show full item record