<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>The Journal of Shahid Sadoughi University of Medical Sciences</title>
<title_fa>مجله علمي پژوهشي دانشگاه علوم پزشكي شهید صدوقی يزد</title_fa>
<short_title>JSSU</short_title>
<subject>Medical Sciences</subject>
<web_url>http://jssu.ssu.ac.ir</web_url>
<journal_hbi_system_id>20</journal_hbi_system_id>
<journal_hbi_system_user>journal20</journal_hbi_system_user>
<journal_id_issn>2228-5741</journal_id_issn>
<journal_id_issn_online>2228-5733</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi></journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1396</year>
	<month>4</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2017</year>
	<month>7</month>
	<day>1</day>
</pubdate>
<volume>25</volume>
<number>4</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>مطالعات درخت تصمیم در برآورد ریسک ابتلا به سرطان سینه  با استفاده از چند شکلی‌های تک نوکلوئیدی
</title_fa>
	<title>The Studies of Decision Tree in Estimation of Breast  Cancer Risk by Using Polymorphism Nucleotide
</title>
	<subject_fa>خون و سرطان</subject_fa>
	<subject>Oncology</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Original article</content_type>
	<abstract_fa>&lt;p dir=&quot;RTL&quot;&gt;&lt;strong&gt;چکیده&lt;/strong&gt;&lt;/p&gt;

&lt;p dir=&quot;RTL&quot;&gt;مقدمه: درختان تصمیم از ابزارهای داده&amp;lrm;کاوی برای جمع&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;آوری ، پیش&#8204;بینی دقیق و غربال کردن اطلاعات از حجم عظیم داده&amp;lrm;هاست که کاربرد گسترده&amp;lrm;ای در زمینه زیست&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;شناسی محاسباتی و بیوانفورماتیک پیدا کرده&amp;lrm;اند. در بیوانفورماتیک می&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;توان پیش&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;بینی&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt; هایی بر روی بیماریها ازجمله سرطان سینه را داشت. استفاده از داده های &amp;zwj;ژنومی از جمله چند شکلی&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;های تک نوکلئوتیدی در پیش&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;بینی ریسک ابتلا به بیماریهای چند عامله از اهمیت خاصی برخوردار است. تعداد هفت &lt;span dir=&quot;LTR&quot;&gt;SNP&lt;/span&gt; مهم &amp;nbsp;از بین صدها هزار مارکر ژنتیکی به عنوان عوامل مرتبط با سرطان سینه شناسایی شدند. هدف ازاین تحقیق بررسی داده&amp;lrm;های آموزش روی خطای درخت تصمیم پیش&amp;lrm;بینی کننده ریسک ابتلا به سرطان سینه با استفاده از ژنوتیپ چند شکلی&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;های تک نوکلئوتیدی است.&lt;/p&gt;

&lt;p dir=&quot;RTL&quot;&gt;&lt;strong&gt;روش بررسی:&lt;/strong&gt;احتمال ابتلا به سرطان&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;سینه با استفاده از &lt;span dir=&quot;LTR&quot;&gt;SNP&lt;/span&gt; های مرتبط با فرمول &lt;span dir=&quot;LTR&quot;&gt;x&lt;sub&gt;j = &lt;/sub&gt;f&lt;sub&gt;o&lt;/sub&gt; *&lt;/span&gt; &amp;nbsp;&amp;nbsp;محاسبه گردید. برای پیش&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;بینی احتمال بیماری با استفاده از چندشکلی&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;های تک نوکلئوتیدی در انسان می&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;توان از درختان تصمیم استفاده کرد. هفت &lt;span dir=&quot;LTR&quot;&gt;SNP&lt;/span&gt; با نسبت&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;های مختلف بخت مرتبط با سرطان سینه درنظرگرفته و کد&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;نویسی و طراحی درخت تصمیم مدل &lt;span dir=&quot;LTR&quot;&gt;C4.5&lt;/span&gt;، با زبان برنامه نویسی &lt;span dir=&quot;LTR&quot;&gt;Csharp2013&lt;/span&gt; انجام&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;شد. در درخت تصمیم ایجادشده با کدنویسی، چهار &lt;span dir=&quot;LTR&quot;&gt;SNP&lt;/span&gt; مهم مرتبط لحاظ&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;شد. خطای درخت تصمیم دردو حالت کدنویسی و استفاده از نرم&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;افزار&lt;span dir=&quot;LTR&quot;&gt;WEKA&lt;/span&gt;ارزیابی و درصد دقت درخت تصمیم در پیش &lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;بینی بروز سرطان سینه محاسبه گردید. &amp;nbsp;تعداد نمونه آموزش داده شده با نمونه&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;گیری سیستماتیک استخراج گردید. باکدنویسی، دو سناریو و همچنین با نرم افزار &lt;span dir=&quot;LTR&quot;&gt;WEKA&lt;/span&gt; ، &amp;nbsp;سه سناریو با تعداد مجموعه داده&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;های مختلف، تعداد مجموعه آموزش و آزمایش مختلف، &amp;nbsp;مورد ارزیابی قرار گرفت.&lt;/p&gt;

&lt;p dir=&quot;RTL&quot;&gt;&lt;strong&gt;نتایج: &lt;/strong&gt;با روش کدنویسی در دو سناریو با افزایش درصد آموزش از 66/66 به 42/86 ، خطا از 56/55 به 09/9 کاهش یافت. همچنین با اجرای نرم افزار &lt;span dir=&quot;LTR&quot;&gt;WEKA&lt;/span&gt; در سه سناریو با تعداد مجموعه داده&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;های مختلف، تعداد مجموعه آموزش مختلف، و آزمایش مختلف با افزایش تعداد رکوردها از &amp;nbsp;81 به 2187، میزان خطا از 15/48 به 46/13 کاهش یافت. همچنین در اکثر سناریوها درصد شیوع بیماری در میزان خطا در کد و &lt;span dir=&quot;LTR&quot;&gt;WEKA&lt;/span&gt; تاثیری نداشت.&lt;/p&gt;

&lt;p dir=&quot;RTL&quot;&gt;&lt;strong&gt;نتیجه&amp;lrm;گیری:&lt;/strong&gt; نتایج نشان می&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;دهد با افزایش میزان آموزش، خطای درخت تصمیم کاهش و درنتیجه دقت پیش&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;بینی ریسک ابتلا به سرطان سینه با استفاده از درخت تصمیم افزایش می&amp;lrm;یابد. در داده&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;های بیولوژی به&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;دلیل حساسیت مدلهای پیش&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;بینی&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;کننده، خطای درخت تصمیم حتی با&amp;nbsp; 66/66% آموزش بالا است. از طرفی با افزایش تعداد &lt;span dir=&quot;LTR&quot;&gt;SNP&lt;/span&gt; درخت تصمیم از 4 به 7 مارکر، خطای درخت تصمیم با 1/70 % آموزش، &amp;nbsp;به&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;طور چشمگیری کاهش داشت. در مجموع می&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;توان گفت که با افزایش رکوردهای مجموعه آموزش و همچنین افزایش تعداد ویژگی &amp;nbsp;&amp;nbsp;&lt;span dir=&quot;LTR&quot;&gt;SNP&lt;/span&gt;در درخت تصمیم، دقت پیش بینی افزایش و خطا کاهش می&lt;span dir=&quot;LTR&quot;&gt;&amp;lrm;&lt;/span&gt;یابد&lt;span dir=&quot;LTR&quot;&gt;.&lt;/span&gt; همچنین درصد شیوع بیماری در میزان خطا به دلیل انتخاب مجموعه های آموزش و آزمایش به روش سیستماتیک، &amp;nbsp;در کد طراحی شده در این تحقیق&amp;nbsp; و نرم افزار موجود &lt;span dir=&quot;LTR&quot;&gt;WEKA &lt;/span&gt;&amp;nbsp;&amp;nbsp;تاثیری ندارد.&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p&gt;&lt;/p&gt;

&lt;p align=&quot;center&quot;&gt;&lt;strong&gt;Abstract&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Introduction:&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&amp;nbsp; Decision tree is the data mining tools to collect, accurate prediction and sift information from massive amounts of data that are used widely in the field of computational biology and bioinformatics. In bioinformatics can be predict on diseases, including breast cancer. The use of genomic data including single nucleotide polymorphisms is a very important factor in predicting the risk of diseases. The number of seven important SNP among hundreds of thousands genetic markers were identified as factors associated with breast cancer. The objective of this study is to evaluate the training data on decision tree predictor error of the risk of breast cancer by using single nucleotide polymorphism genotype.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Methods:&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;The risk of breast cancer were calculated associated with the use of SNP formula:x&lt;sub&gt;j = &lt;/sub&gt;f&lt;sub&gt;o&lt;/sub&gt; * In human,&amp;nbsp; The decision tree can be used To predict the probability of disease using single nucleotide polymorphisms .Seven SNP with different odds ratio associated with breast cancer considered and coding and design of decision tree model, C4.5, by&amp;nbsp; Csharp2013 programming language were done. In the decision tree created with the coding, the four important associated SNP was considered. The decision tree error in two case of coding and using WEKA were assessment and percentage of decision tree accuracy in prediction of breast cancer were calculated. The number of trained samples was obtained with systematic sampling. With coding, two scenarios as well as software WEKA, three scenarios with different sets of data and the number of different learning and testing, were evaluated.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Results:&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;In both scenarios of coding, by increasing the training percentage from 66/66 to 86/42, the error reduced from 55/56 to 9/09. Also by running of WEKA on three scenarios with different sets of data, the number of different education, and different tests by increasing records number from 81 to 2187, the error rate decreased from 48/15 to 13/46. Also in the majority of scenarios, prevalence of the disease, had no effect on errors in the WEKA and code.&lt;/p&gt;

&lt;p&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Conclusion:&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;The results suggest that with increased training, and thus the accuracy of prediction error decision tree to reduce the risk of breast cancer increases with the use of decision trees. In Biological data, decision trees error is high even with a 66/66% training. On the other hand by increasing the number of SNP from 4 to 7 decision tree, decision tree error dramatically decreased at 70/1% training. In general we can say that with increased training and increasing the number of SNP in the decision tree, the prediction accuracy increased and errors reduced. In the CODING and WEKA, percentage of disease prevalence had no significant effect on errors,&amp;rdquo; Because of selecting set of training and testing by systemic method &amp;ldquo;.&lt;/p&gt;
</abstract>
	<keyword_fa>درخت تصمیم, سرطان سینه, چندشکلی تک نوکلئوتیدی</keyword_fa>
	<keyword>Decision Tree, Breast Cancer, Single Nucleotide Polymorphisms</keyword>
	<start_page>300</start_page>
	<end_page>310</end_page>
	<web_url>http://jssu.ssu.ac.ir/browse.php?a_code=A-10-2576-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Frida</first_name>
	<middle_name></middle_name>
	<last_name>Seyedmir </last_name>
	<suffix></suffix>
	<first_name_fa>فریدا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>سیدمیر</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>fseyedmir@yahoo.com</email>
	<code></code>
	<orcid></orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Yazd Branch, Islamic Azad University, Yazd, Iran</affiliation>
	<affiliation_fa>دانشگاه آزاد یزد</affiliation_fa>
	 </author>


	<author>
	<first_name>Kamal</first_name>
	<middle_name></middle_name>
	<last_name>Mirzaie</last_name>
	<suffix></suffix>
	<first_name_fa>کمال</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>میرزایی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>mirzaie-kamal@yahoo.com</email>
	<code></code>
	<orcid></orcid>
	<coreauthor>No</coreauthor>
	<affiliation>, Meybod Branch, Islamic Azad University, Meybod, Iran</affiliation>
	<affiliation_fa>دانشگاه آزاد میبد</affiliation_fa>
	 </author>


	<author>
	<first_name>Morteza</first_name>
	<middle_name></middle_name>
	<last_name>Bitaraf Sani</last_name>
	<suffix></suffix>
	<first_name_fa>مرتضی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>بیطرف ثانی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>bitaraf@sau.ac.ir</email>
	<code></code>
	<orcid></orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>University of Applied Sciences &amp; Technology (Agriculture Research and Education Center), Yazd, Iran</affiliation>
	<affiliation_fa>دانشگاه علمی کاربردی یزد</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
