مطالعات درخت تصمیم در برآورد ریسک ابتلا به سرطان سینه  با استفاده از چند شکلی‌های تک نوکلوئیدی

سیدمیر, فریدا; میرزایی, کمال; بیطرف ثانی, مرتضی

ماهنامه علمی پ‍ژوهشی

دانشگاه علوم پزشکی شهید صدوقی یزد

دوشنبه 29 تیر 1405 | English [Archive]

دوره 25، شماره 4 - ( تیر 1396 ) جلد 25 شماره 4 صفحات 310-300 | برگشت به فهرست نسخه ها

Mendeley

Zotero

RefWorks

Seyedmir F, Mirzaie K, Bitaraf Sani M. The Studies of Decision Tree in Estimation of Breast Cancer Risk by Using Polymorphism Nucleotide . JSSU 2017; 25 (4) :300-310
URL: http://jssu.ssu.ac.ir/article-1-3547-fa.html

سیدمیر فریدا، میرزایی کمال، بیطرف ثانی مرتضی. مطالعات درخت تصمیم در برآورد ریسک ابتلا به سرطان سینه با استفاده از چند شکلی‌های تک نوکلوئیدی . مجله علمي پژوهشي دانشگاه علوم پزشكي شهید صدوقی يزد. 1396; 25 (4) :300-310

URL: http://jssu.ssu.ac.ir/article-1-3547-fa.html

مطالعات درخت تصمیم در برآورد ریسک ابتلا به سرطان سینه با استفاده از چند شکلی‌های تک نوکلوئیدی

فریدا سیدمیر

، کمال میرزایی

، مرتضی بیطرف ثانی^*

چکیده: (7144 مشاهده)

چکیده

مقدمه: درختان تصمیم از ابزارهای داده‎کاوی برای جمع‎آوری ، پیش‌بینی دقیق و غربال کردن اطلاعات از حجم عظیم داده‎هاست که کاربرد گسترده‎ای در زمینه زیست‎شناسی محاسباتی و بیوانفورماتیک پیدا کرده‎اند. در بیوانفورماتیک می‎توان پیش‎بینی‎ هایی بر روی بیماریها ازجمله سرطان سینه را داشت. استفاده از داده های ‍ژنومی از جمله چند شکلی‎های تک نوکلئوتیدی در پیش‎بینی ریسک ابتلا به بیماریهای چند عامله از اهمیت خاصی برخوردار است. تعداد هفت SNP مهم از بین صدها هزار مارکر ژنتیکی به عنوان عوامل مرتبط با سرطان سینه شناسایی شدند. هدف ازاین تحقیق بررسی داده‎های آموزش روی خطای درخت تصمیم پیش‎بینی کننده ریسک ابتلا به سرطان سینه با استفاده از ژنوتیپ چند شکلی‎های تک نوکلئوتیدی است.

روش بررسی:احتمال ابتلا به سرطان‎سینه با استفاده از SNP های مرتبط با فرمول x_{j =}f_o * محاسبه گردید. برای پیش‎بینی احتمال بیماری با استفاده از چندشکلی‎های تک نوکلئوتیدی در انسان می‎توان از درختان تصمیم استفاده کرد. هفت SNP با نسبت‎های مختلف بخت مرتبط با سرطان سینه درنظرگرفته و کد‎نویسی و طراحی درخت تصمیم مدل C4.5، با زبان برنامه نویسی Csharp2013 انجام‎شد. در درخت تصمیم ایجادشده با کدنویسی، چهار SNP مهم مرتبط لحاظ‎شد. خطای درخت تصمیم دردو حالت کدنویسی و استفاده از نرم‎افزارWEKAارزیابی و درصد دقت درخت تصمیم در پیش ‎بینی بروز سرطان سینه محاسبه گردید. تعداد نمونه آموزش داده شده با نمونه‎گیری سیستماتیک استخراج گردید. باکدنویسی، دو سناریو و همچنین با نرم افزار WEKA ، سه سناریو با تعداد مجموعه داده‎های مختلف، تعداد مجموعه آموزش و آزمایش مختلف، مورد ارزیابی قرار گرفت.

نتایج: با روش کدنویسی در دو سناریو با افزایش درصد آموزش از 66/66 به 42/86 ، خطا از 56/55 به 09/9 کاهش یافت. همچنین با اجرای نرم افزار WEKA در سه سناریو با تعداد مجموعه داده‎های مختلف، تعداد مجموعه آموزش مختلف، و آزمایش مختلف با افزایش تعداد رکوردها از 81 به 2187، میزان خطا از 15/48 به 46/13 کاهش یافت. همچنین در اکثر سناریوها درصد شیوع بیماری در میزان خطا در کد و WEKA تاثیری نداشت.

نتیجه‎گیری: نتایج نشان می‎دهد با افزایش میزان آموزش، خطای درخت تصمیم کاهش و درنتیجه دقت پیش‎بینی ریسک ابتلا به سرطان سینه با استفاده از درخت تصمیم افزایش می‎یابد. در داده‎های بیولوژی به‎دلیل حساسیت مدلهای پیش‎بینی‎کننده، خطای درخت تصمیم حتی با 66/66% آموزش بالا است. از طرفی با افزایش تعداد SNP درخت تصمیم از 4 به 7 مارکر، خطای درخت تصمیم با 1/70 % آموزش، به‎طور چشمگیری کاهش داشت. در مجموع می‎توان گفت که با افزایش رکوردهای مجموعه آموزش و همچنین افزایش تعداد ویژگی SNPدر درخت تصمیم، دقت پیش بینی افزایش و خطا کاهش می‎یابد. همچنین درصد شیوع بیماری در میزان خطا به دلیل انتخاب مجموعه های آموزش و آزمایش به روش سیستماتیک، در کد طراحی شده در این تحقیق و نرم افزار موجود WEKA تاثیری ندارد.

واژه‌های کلیدی: درخت تصمیم، سرطان سینه، چندشکلی تک نوکلئوتیدی

متن کامل [PDF 986 kb] (2502 دریافت)

نوع مطالعه: پژوهشي | موضوع مقاله: خون و سرطان
دریافت: 1394/10/8 | پذیرش: 1396/5/1 | انتشار: 1396/7/3

ارسال پیام به نویسنده مسئول

بازنشر اطلاعات
	این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

پایگاه های مرتبط

کلمات کلیدی

فیزیولوژی, فارماکولوژی, پاتولوژی, بیماریهای مغز و اعصاب, پریودانتیکس, زنان و زایمان

نظرسنجی

کلیه حقوق این وب سایت متعلق به ماهنامه علمی پ‍ژوهشی دانشگاه علوم پزشکی شهید صدوقی یزد می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

Designed & Developed by : Yektaweb

نظر شما در مورد طراحی گرافیک جدید پایگاه چیست؟
	بسیار عالی
	عالی
	خوب
	متوسط