<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Iranian Association of Electrical and Electronics Engineers</title>
<title_fa>نشریه مهندسی برق و الکترونیک ایران</title_fa>
<short_title>Journal of Iranian Association of Electrical and Electronics Engineers</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://jiaeee.com</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2676-5810</journal_id_issn>
<journal_id_issn_online>2676-6086</journal_id_issn_online>
<journal_id_pii>8</journal_id_pii>
<journal_id_doi>10.61882/jiaeee</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>14</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science>13</journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1404</year>
	<month>1</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2025</year>
	<month>4</month>
	<day>1</day>
</pubdate>
<volume>22</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>مدل سازی بهینه تعاملات بین کاربران و آیتم ها در سیستم های توصیه گر با استفاده از یک روش یادگیری تقویتی عمیق بهبود یافته</title_fa>
	<title>Optimal modeling of interactions between users and items in recommender systems using an improved deep reinforcement learning method</title>
	<subject_fa>الکترونیک</subject_fa>
	<subject>Electronic</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;span style=&quot;font-size:13pt&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;font-weight:bold&quot;&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:11.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;سیستم&#8204;های توصیه&#8204;گر یکی از مباحث بسیار مهم هم در زمینه آکادمیک و هم در زمینه صنعت است. علت اهمیت سیستم&#8204;های توصیه&#8204;گر ناشی از این حقیقت است که با افزایش حجم اطلاعات و گسترش داده&#8204;ها، دسترسی کاربران به خدمات و سرویس&#8204;های مورد نیاز خودشان در میان انبوه اطلاعات، بدون استفاده از سیستم&#8204;های توصیه&#8204;گر به یک امر سر در گم کننده و گاها غیر ممکن تبدیل می&#8204;شود.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; &lt;span lang=&quot;FA&quot; style=&quot;font-size:11.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;تاکنون روش&#8204;های مختلفی از جمله فیلترینگ مشارکتی، فاکتورگیری ماتریسی، رگرسیون لجستیک و شبکه&#8204;های عصبی در این زمینه ارائه شده&#8204;اند که اکثر این روش&#8204;ها دارای محدودیت&#8204;های خاصی هستند. اولین محدودیت این سیستم&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:11.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:11.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;ها ثابت بودن و عدم توجه به تعاملات کاربر با سیستم در گذر زمان و دومین محدودیت در این سیستم&#8204;ها تمرکز کردن بر روی پاداش&#8204;های آنی و عدم توجه به پاداش&#8204;های بلند مدت است. در این تحقیق، مدل&#8204;سازی تعاملات بین کاربران و آیتم&#8204;ها با استفاده از یک الگوریتم یادگیری تقویتی عمیق بهبود یافته صورت می&#8204;گیرد تا سیستم توصیه&#8204;گر تصمیم&#8204;های خود را بصورت یک فرآیند پویا با گذر زمان بهبود داده و علاوه بر امتیاز آنی حاصل از تصمیم&#8204;های اخذ شده، تاثیرات آن تصمیم در بدست آوردن پاداش&#8204;های بلند مدت را نیز در نظر بگیرد. نتایج حاصل از آزمایش&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:11.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;&#8204;&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;FA&quot; style=&quot;font-size:11.0pt&quot;&gt;&lt;span b=&quot;&quot; nazanin=&quot;&quot; style=&quot;font-family:&quot;&gt;ها نشان می&#8204;دهد که الگوریتم پیشنهادی عملکرد بهتری نسبت به سایر روش&#8204;ها داشته است.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;</abstract_fa>
	<abstract>&lt;span style=&quot;font-size:13pt&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;font-weight:bold&quot;&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;Recommender systems are one of the most important topics in academia and industry. With the increase in the volume of information and data, it has become confusing and sometimes impossible for users to access the required services without using recommender systems. So far, various techniques have been proposed for this purpose such as collaborative filtering, matrix factorization, logistic regression, neural networks, etc. However, most of these methods suffer from two limitations: (1) considering the recommendation as a static procedure and ignoring the dynamic interactive nature between users and the recommender systems; (2) focusing on the immediate feedback of recommended items and neglecting the long-term rewards. In this research, the modeling of interactions between users and items is done using an improved deep reinforcement learning method which can consider both the dynamic adaptation and long term rewards. The results of the experiments show that the proposed algorithm performs better than other methods.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&amp;nbsp;</abstract>
	<keyword_fa>سیستم های توصیه گر, یادگیری تقویتی عمیق, هوش مصنوعی, تعاملات کاربر و آیتم ها</keyword_fa>
	<keyword>Recommender systems, Deep reinforcement learning, Artificial intelligence, User item interactions</keyword>
	<start_page>121</start_page>
	<end_page>131</end_page>
	<web_url>http://jiaeee.com/browse.php?a_code=A-10-1842-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Saber</first_name>
	<middle_name></middle_name>
	<last_name>Alinejad</last_name>
	<suffix></suffix>
	<first_name_fa>صابر</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>علی نژاد</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>alinezhadsaber@gmail.com</email>
	<code>100319475328460013022</code>
	<orcid>100319475328460013022</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>University of Tabriz</affiliation>
	<affiliation_fa>دانشکده مهندسی برق و کامپیوتر- دانشگاه تبریز</affiliation_fa>
	 </author>


	<author>
	<first_name>Behrooz</first_name>
	<middle_name></middle_name>
	<last_name>Koohestani</last_name>
	<suffix></suffix>
	<first_name_fa>بهروز</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>کوهستانی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>b.koohestani@tabrizu.ac.ir</email>
	<code>100319475328460013023</code>
	<orcid>100319475328460013023</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>University of Tabriz</affiliation>
	<affiliation_fa>دانشکده مهندسی برق و کامپیوتر- دانشگاه تبریز</affiliation_fa>
	 </author>


	<author>
	<first_name>Mohammad Reza</first_name>
	<middle_name></middle_name>
	<last_name>Feizi Derakhshi</last_name>
	<suffix></suffix>
	<first_name_fa>محمدرضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>فیضی درخشی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>mfeizi@tabrizu.ac.ir</email>
	<code>100319475328460013024</code>
	<orcid>100319475328460013024</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>University of Tabriz</affiliation>
	<affiliation_fa>دانشکده مهندسی برق و کامپیوتر- دانشگاه تبریز</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
