Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: https://er.nau.edu.ua/handle/NAU/61254
Название: Recommender Systems Based on Reinforced Learning
Другие названия: Системи рекомендацій на основі посиленого навчання
Авторы: Sineglazov, V. M.
Синєглазов, Віктор Михайлович
Sheruda, A. V.
Шеруда, Андрій Володимирович
Ключевые слова: machine learning
reinforcement learning
recommendation systems
recommender agent
collaborative filtering
Actor-Critic
explicit feedback
машинне навчання
навчання з підкріпленням
системи рекомендацій
рекомендаційний агент
колаборативна фільтрація
Актор-Критик
явний зворотній зв’язок
Дата публикации: 27-июн-2023
Издательство: National Aviation University
Библиографическое описание: Sineglazov V. M. Recommender Systems Based on Reinforced Learning / V. M. Sineglazov, A. V. Sheruda // Electronics and Control Systems. Kyiv: NAU, 2023. – No 2(76). – pp. 46–55.
Серия/номер: Electronics and Control Systems;№2(76)
Електроніка та системи управління;№2(76)
Краткий осмотр (реферат): This article is devoted to the problem of building recommender systems based on the use of artificial intelligence methods. The paper analyzes the algorithms of recommender systems. Analyzes the Markov decision-making process in the context of recommender systems. Approaches to the adaptation of reinforcement learning algorithms to the task of recommendations (transition from the task of supervised learning to the task of reinforcement learning) are considered. Reinforcement learning algorithms Deep Deterministic Policy Gradient and Twin Delayed DDPG were implemented with their own environment simulating the user's reaction, and the results were compared. The structure of a recommender system has been developed, in which the recommender agent generates a list of offers for an individual user, using his previous history of ratings. In the system itself, the user has the ability to interact only with the space of recommended films. This can be compared to the main YouTube page, which is a feed with suggestions, but we have a user interacting only with this feed and his reaction to objects in the recommendation space falls into recommender agent, which regulates the parameters of the model in the learning process.
Статтю присвячено проблемі побудови рекомендаційних систем на основі використання методів штучного інтелекту. У роботі проведено аналіз алгоритмів рекомендаційних систем, проаналізовано марківський процес прийняття рішень у контексті рекомендаційних систем. Розглянуто підходи до адаптації алгоритмів навчання з підкріпленням до завдання рекомендацій (перехід від задачі контрольованого навчання до завдання навчання з підкріпленням). Реалізовано алгоритми навчання з підкріпленням Deep Deterministic Policy Gradient та Twin Delayed DDPG із власним середовищем-імітацією реакції користувача та виконано порівняння результатів. Розроблено структуру рекомендаційної системи, у якій рекомендаційний агент генерує список пропозицій окремому користувачеві, використовуючи його попередню історію оцінок. У самій системі користувач має можливість взаємодії тільки з простором фільмів, що рекомендуються. Це можна порівняти з головною сторінкою YouTube, що є стрічкою з пропозиціями, у нас же користувач взаємодія тільки з цією стрічкою і його реакція на об'єкти в просторі рекомендацій потрапляє до рекомендаційного агента, який регулює параметри моделі в процесі навчання.
Описание: Науковий журнал «Електроніка та системи управління» президією Міністерства освіти і науки України віднесено до наукових фахових видань у галузі технічних наук категорії «Б». Рекомендовано до друку вченою радою Національного авіаційного університету (протокол № 6 від 15 червня 2023 р.). Зареєстровано Міністерством юстиції України. Свідоцтво про державну реєстрацію друкованого засобу масової інформації. Серія КВ №16720-5292 ПР від 21 травня 2010 року.
URI (Унифицированный идентификатор ресурса): https://er.nau.edu.ua/handle/NAU/61254
ISSN: 1990-5548
Располагается в коллекциях:Наукові публікації та матеріали кафедри авіаційних комп'ютерно-інтегрованих комплексів (НОВА)

Файлы этого ресурса:
Файл Описание РазмерФормат 
9.pdfНаукова стаття893.22 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.