Journal of Iranian Association of Electrical and Electronics Engineers

fa مدل سازی بهینه تعاملات بین کاربران و آیتم ها در سیستم های توصیه گر با استفاده از یک روش یادگیری تقویتی عمیق بهبود یافته Optimal modeling of interactions between users and items in recommender systems using an improved deep reinforcement learning method الکترونیک Electronic پژوهشي Research سیستم‌های توصیه‌گر یکی از مباحث بسیار مهم هم در زمینه آکادمیک و هم در زمینه صنعت است. علت اهمیت سیستم‌های توصیه‌گر ناشی از این حقیقت است که با افزایش حجم اطلاعات و گسترش داده‌ها، دسترسی کاربران به خدمات و سرویس‌های مورد نیاز خودشان در میان انبوه اطلاعات، بدون استفاده از سیستم‌های توصیه‌گر به یک امر سر در گم کننده و گاها غیر ممکن تبدیل می‌شود. تاکنون روش‌های مختلفی از جمله فیلترینگ مشارکتی، فاکتورگیری ماتریسی، رگرسیون لجستیک و شبکه‌های عصبی در این زمینه ارائه شده‌اند که اکثر این روش‌ها دارای محدودیت‌های خاصی هستند. اولین محدودیت این سیستم‌ها ثابت بودن و عدم توجه به تعاملات کاربر با سیستم در گذر زمان و دومین محدودیت در این سیستم‌ها تمرکز کردن بر روی پاداش‌های آنی و عدم توجه به پاداش‌های بلند مدت است. در این تحقیق، مدل‌سازی تعاملات بین کاربران و آیتم‌ها با استفاده از یک الگوریتم یادگیری تقویتی عمیق بهبود یافته صورت می‌گیرد تا سیستم توصیه‌گر تصمیم‌های خود را بصورت یک فرآیند پویا با گذر زمان بهبود داده و علاوه بر امتیاز آنی حاصل از تصمیم‌های اخذ شده، تاثیرات آن تصمیم در بدست آوردن پاداش‌های بلند مدت را نیز در نظر بگیرد. نتایج حاصل از آزمایش‌ها نشان می‌دهد که الگوریتم پیشنهادی عملکرد بهتری نسبت به سایر روش‌ها داشته است. Recommender systems are one of the most important topics in academia and industry. With the increase in the volume of information and data, it has become confusing and sometimes impossible for users to access the required services without using recommender systems. So far, various techniques have been proposed for this purpose such as collaborative filtering, matrix factorization, logistic regression, neural networks, etc. However, most of these methods suffer from two limitations: (1) considering the recommendation as a static procedure and ignoring the dynamic interactive nature between users and the recommender systems; (2) focusing on the immediate feedback of recommended items and neglecting the long-term rewards. In this research, the modeling of interactions between users and items is done using an improved deep reinforcement learning method which can consider both the dynamic adaptation and long term rewards. The results of the experiments show that the proposed algorithm performs better than other methods.   سیستم های توصیه گر, یادگیری تقویتی عمیق, هوش مصنوعی, تعاملات کاربر و آیتم ها Recommender systems, Deep reinforcement learning, Artificial intelligence, User item interactions 121 131 http://jiaeee.com/browse.php?a_code=A-10-1842-2&slc_lang=fa&sid=1 Saber Alinejad صابر علی نژاد alinezhadsaber@gmail.com 100319475328460013022 100319475328460013022 No University of Tabriz دانشکده مهندسی برق و کامپیوتر- دانشگاه تبریز Behrooz Koohestani بهروز کوهستانی b.koohestani@tabrizu.ac.ir 100319475328460013023 100319475328460013023 Yes University of Tabriz دانشکده مهندسی برق و کامپیوتر- دانشگاه تبریز Mohammad Reza Feizi Derakhshi محمدرضا فیضی درخشی mfeizi@tabrizu.ac.ir 100319475328460013024 100319475328460013024 No University of Tabriz دانشکده مهندسی برق و کامپیوتر- دانشگاه تبریز