مقدمه
سرطان یک مشکل بهداشت عمومی در سراسر جهان است. شیوع بالای مرگ و میر ناشی از سرطان، آن را به یکی از دلایل اصلی مرگ در جهان تبدیل کردهاست، در نتیجه نیاز مبرمی به گسترش داروهای موثر برای درمان سرطان وجود دارد. یکی از عوامل مهم در گسترش سرطانهایی که منجر به مرگ میگردد متاستاز است. در واقع در طی فرآیند متاستاز سلولهای سرطانی از طریق عروق خونی مهاجرت نموده و به سایر بافتها وارد میشوند و در نهایت باعث درگیر شدن بافتهای سالم بدن میشوند، از اینرو اگر از لحاظ تئوری بتوان رگزایی را مهار کنیم، تومورها در اندازه کوچک باقی میمانند و آسیبرسان نخواهند شد (1) فاکتور کلیدی و مؤثر در تکثیر و مهاجرت سلولهای اندوتلیال، که اساس تشکیل هر رگ جدیدی است، فاکتور رشد اندوتلیال عروقی (Vascular Endothelial Growth Factor) هست. این فاکتور بهعنوان یک محرک اولیه برای رگزایی عمل میکند. تولید VEGF و گیرندهاش بهطور مستقیم میزان رگزایی در تومور را کنترل میکنند، با توجه به اینکه VEGF نقطه استراتژیکی در تنظیم رگزایی در تومور است، هدف مهمی در وقایع درمانی محسوب میگردد (2). علاوهبراین، رگزایی لازمه رشد و تداوم تومورهای جامد و متاستازهای آنها است و بیماریهای التهابی شدید به مرحله بدخیم مرتبط با رگزایی، پیشرفت میکنند (3). VEGF که به دامنه گیرنده خارج سلولی متصل میشود، باعث فعالشدن آنزیم تیروزینکیناز در دامنه گیرنده داخلسلولی میشود که باقیماندههای تیروزین را فسفریله میکند و در نتیجه چندین مسیر سیگنالدهی داخلسلولی را فعال میکند (4). در سال 2018 در مطالعهای، به تأثیرگذاری نقش VEGF و گیرندههای آن در رگزایی فیزیولوژیک و پاتولوژیک در پیشرفت تومور و ایجاد متاستاز تأکید شد و به بررسی نقش آن در تشخیص و درمان سرطان سلول کلیوی که نوع متداول مرگهای ناشی از سرطان کلیه در سراسر جهان است پرداخته شد. در این مطالعه،310000 ترکیب پایگاه PDB(Protein Data Bank) با استفاده از روش غربالگری مجازی مبتنی بر ساختار مورد بررسی قرار گرفتند و سرانجام 23 بازدارنده بالقوه شناسایی شدند و در نهایت ترکیب SCHEMBL469307 که پتانسیل بالایی برای مهار پروتئین VEGFR2 داشت، معرفی شد (5). در سال2020، مطالعهای بر روی 2/4 میلیون مولکول پایگاه داده Zinc با استفاده از روش غربالگری مجازی مبتنی بر لیگاند باعث کشف چهارترکیب 3، 7، 10 و 13 شد که ترکیب 10 فعالیت بازدارندگی مطلوبی را با مقدار IC50 ، 19/3میکرومولار برای مهار VEGFR2 به نمایش گذاشت (6). در دسترس بودن ساختار سه بعدی پروتئینهای هدف درمانی و اکتشاف حفره محل اتصال، اساس طراحی دارویی مبتنی بر ساختار، را تشکیل میدهد. این رویکرد اختصاصی است و بهطور موثر، شناسایی مولکولهای پیشرو و بهینهسازی آنها را تسریع میکند که به درک بیماری در سطح مولکولی کمک کرده است. برخی از روشهای رایج مورد استفاده در طراحی دارو بر اساس ساختار، شامل شبیهسازیهای غربالگری مجازی مبتنی بر ساختار، داکینگ مولکولی و دینامیک مولکولی است (7). زمانیکه ساختار سه بعدی گیرنده هدف در دسترس نباشد از طراحی دارو مبتنی بر لیگاند استفاده میشود. اطلاعات بهدست آمده از مجموعهای از ترکیبات فعال در برابر یک گیرنده هدف خاص را میتوان در شناسایی ویژگیهای فیزیکوشیمیایی و ساختاری مسئول فعالیت بیولوژیکی معین استفاده کرد، که بر اساس این واقعیت است که شباهتهای ساختاری با عملکرد بیولوژیکی مشابه مطابقت دارد. برخی از تکنیکهای رایج مورد استفاده در رویکرد غربالگری مجازی مبتنی بر لیگاند شامل مدلسازی فارماکوفور، کمی سازی رابطه ساختار-فعالیت و هوش مصنوعی است (8). با توجه به موارد مطرح شده در بخش قبل، به نظر میرسد یافتن ترکیبات جدید جهت مهاررگزایی در سرطان با عوارض جانبی کمتر و اثربخشی بالاتر میتواند تاسیر بسزایی در درمان داشته باشد. بدین منظور، در این مطالعه از طراحی دارو مبتنی بر لیگاند استفاده شده است تا بتوان به بهترین ترکیبات مهارکننده گیرنده VEGF دست یافت. لازم به ذکر است که در بخش طراحی دارو مبتنی بر لیگاند از مدلسازیQuantitative structure-activity relationship QSAR)) بهره گرفته شده است و برخی از روشهای انتخاب ویژگی مبتنی بر فیلتر و تعبیه شده (Embedded) به منظور انتخاب بهترین ویژگیها اتخاذ شده است. همچنین از مدل طبقه بند ماشینبردار پشتیبان استفاده شده است زیرا روشهای یادگیری ماشین مانند SVM معمولاً دارای قابلیت تعمیم پذیری بالا هستند، بدان معنا که مدل با توجه به دادههای آموزشی، قادر است به درستی دادههای جدید و ناشناخته را تشخیص دهد، SVM به خوبی در مواردی که تعداد نمونهها نسبتاً کم است و ممکن است دادهها غیرخطی باشند، عملکرد خوبی دارد. با استفاده از توابع هستهای، SVM میتواند ترکیبات غیرخطی را نیز مدل کند. این امکان بسیار مهم است زیرا بسیاری از مسائل واقعی دارای روابط غیرخطی هستند. معمولاً SVM مقاومت بالایی در برابر دادههای نویزی دارد و قادر است با استفاده از همین امکان، دادههای نویزی را از دادههای واقعی تشخیص دهد. در برخی از حالات، مدلهای SVM به راحتی قابل تفسیر و توجیه هستند، به این معنا که میتوان فهمید که چه ویژگیهایی در تصمیمگیری مدل تاثیرگذار هستند همچنین امکان کنترل دقیقتری بر فضای ویژگیها را فراهم میکند که در مواردی که ویژگیهای انتخاب شده برای مسئله مهم هستند میتواند بسیار مهم باشد.
روشبررسی
داده مورد نیاز در این پژوهش متشکل از گیرنده دوم فاکتور رشد اندوتلیال عروق (VEGFR2) میباشد، که مشتمل بر 12020 ترکیب است. برای استخراج لیگاندهای مورد مطالعه در این پژوهش از پایگاه اینترنتی https://www.bindingdb.org استفاده شده است.
پیش پردازش دادهها: به منظور پیش پردازش دادهها در ابتدا ترکیبات مورد مطالعه که به فرمتsdf میباشند، به صورت منحصر به فرد، متمایز میشوند تا مولکولهایی با ساختار مشابه و یکسان حذف شوند. در این مرحله به 9271 ترکیب منحصر به فرد دست مییابیم. پس از اصلاح ساختاری از ترکیبات به صورت سه بعدی استفاده میگردد. برای انجام این پیش پردازشها از نرم افزار Openbabel بهرهبردهایم. استخراج ویژگیهای ترکیبات با نرم افزار Dragon: کلیه ویژگیهای پیشنهادی توسط نرم افزار Dragon و با استفاده از تمام 22 دسته انتخاب ویژگی آن صورت گرفته است. در این مطالعه با استفاده از نرمافزار 2007 5.5 Dragon تعداد 3224 ویژگی در اختیار قرار میگیرد. خروجی نرم افزار Dragon یک ماتریس عددی به فرم زیر است:
رابطه (1)
در اینجا m تعداد مولکولها و n تعداد ویژگیها است.
استخراج میزان فعالیت هر لیگاند (IC50)
هدف این مطالعه تخمین مقادیر IC50 میباشد. با استفاده از برنامهنویسی پایتون میانگین IC50 ها مورد بررسی قرار گرفت، بدین صورت که اگر میانگین IC50 ها بالای یک میکرومولار باشد به عنوان غیرمهارکننده (2573) و اگر پایینتر از این آستانه باشد به عنوان مهارکننده (5896) در نظر گرفته شده است که این آستانه با توجه به مطالعات گذشته و سعی و خطاهای مربوط به مطالعات پیشین بهدست آمده است. لازم به ذکر است که برخی از ترکیبات به علت نداشتن مقدار IC50 حذف گردیدند.
رابطه کمی ساختار - فعالیت: پیشپردازش داده¬ها یکی از مهمترین مراحل پردازشی در مدلسازی QSAR محسوب می¬شود. در واقع، هنگام اعمال توصیفگرهای مولکولی به مدل آماری، اغلب محققان با حجم وسیعی از دادهها مواجه می¬شوند که باتوجه به محدودیت زمانی، انتخاب بهینهترین توصیفگرها ضروری است. به عبارت دیگر، فرآیند تشخیص ویژگیهای مفید و حذف ویژگیهای تکراری بهمنظور بررسی مسئله با زیر مجموعه¬ای از ویژگی¬های مرتبط، در راستای عملکرد بهتر مدل، انتخاب ویژگی نامیده می¬شود. ضرورت انتخاب ویژگی را میتوان در کاهش پیچیدگی مدل، بهبود عملکرد روش، افزایش دقت پیشبینی و کاهش زمان محاسبه خلاصه نمود (9). هدف اصلی انتخاب ویژگی، انتخاب زیرمجموعهای از بیشترین ویژگیهای همبسته از مجموعه دادههای بزرگ است که بتواند ویژگی اصلی همه ویژگیهای مجموعه داده را توصیف و نشان دهد. فرآیند انتخاب ویژگی با استفاده از یک مجموعه داده اصلی شروع و انتخاب ویژگیهای ضروری به صورت مرحله به مرحله انجام میشود (10). در این پژوهش از روشهای انتخاب ویژگی مبتنی بر فیلتر شامل روشهای انتخاب ویژگی مبتنی بر همبستگی (CFS)، امتیاز فیشر (FS) و اطلاعات متقابل (MI) و همچنین از روشهای انتخاب ویژگی تعبیه شده شامل روشهایLASSO و Elastic Net استفاده شده است. برای ساخت مدل طبقهبند، روش ماشینبردار پشتیبان بکار گرفته شده است. ماشینبردار پشتیبانی یکی از الگوریتمهای یادگیری ماشینی تحت نظارت است.
نتایج
ارزیابی روش اجرا: به منظور ارزیابی مدل در ابتدا داده ها به دو گروه آموزش، 70% دادهها، و آزمون، 30% داده ها، تقسیم شدند. در ادامه به منظور بررسی عملکرد مدل در حین آموزش، از روش اعتبارسنجی متقابل k-fold که یک روش استاندارد برای تخمین عملکرد یک الگوریتم یا پیکربندی یادگیری ماشین بر روی یک مجموعه داده است، بر روی دادههای آموزش استفاده شده است. در واقعk-fold Cross-Validation ، ارزیابی مدلهای یادگیری ماشین بر روی یک مجموعه داده با استفاده از اعتبارسنجی متقابل k-fold معمول است. روش اعتبارسنجی متقابل k-fold یک مجموعه داده محدود را به kدسته یکتا تقسیم میکند. به هر یک از k دستهها فرصتی داده میشود که به عنوان یک مجموعه آزمایش عقب نگه داشته شده استفاده شود، در حالیکه همه دستههای دیگر مجموعاً بهعنوان یک مجموعه داده آموزشی استفاده میشوند. مجموع مدلهای k متناسب میشوند و در مجموعههای آزمون نگهدارنده k ارزیابی میشوند و میانگین عملکرد گزارش میشود. دو پارامتر n-spilit و n-repeat برابر 5 قرار داده شده است. هنگامیکه به بهترین مدلها از نظر دقت و سایر پارامترهای ارزیابی رسیدیم از 30 درصد دادههای باقیمانده، دادههای آزمون، به عنوان ارزیابی نهایی استفاده میشود.
برای بررسی عملکرد مدل از چهار شاخص ارزیابی: حساسیت (Sensitivity)، اختصاصی بودن (Specificity)، صحت (Accuracy) و ( Matthews Correlation Coefficient) MCC که با استفاده از معادلات (۱-4)، محاسبه شدهاند، استفاده گردیده است (11).
مثبت واقعی TP (True Positive) ، نشاندهنده تعداد ترکیبات بازدارنده مناسب است که به درستی به عنوان ترکیبات بازدارنده طبقهبندی شدهاند.
منفی واقعیTN (True Negative) ، نشاندهنده تعداد ترکیبات غیربازدارنده است که به درستی به عنوان ترکیبات غیربازدارنده طبقهبندی شدهاند.
مثبتکاذبFP(False Positive) ، نشاندهنده تعداد ترکیبات غیربازدارنده است که به اشتباه به عنوان ترکیبات بازدارنده طبقهبندی شدهاند.
منفیکاذب(False Negative) FN، نشاندهنده تعداد ترکیبات بازدارنده است که به اشتباه در ترکیبات غیر بازدارنده طبقهبندی شدهاند.
درحالیکه SE و SP به ترتیب نشاندهنده دقت پیشبینی بازدارندهها و غیربازدارندهها هستند،(Q) صحت پیشبینی کلی را برای همه ترکیبات موجود در مجموعه داده نشان میدهد. MCC ، با مقادیر بین 1- تا 1، مهمترین شاخص برای کیفیت طبقهبندی باینری است (11). لازم به ذکر است که در این پژوهش موارد مثبت به ترکیبات بازدارنده و موارد منفی به ترکیبات غیر بازدارنده اشاره دارد.
روش لیگاند بنیان: به منظور تنظیمات اولیه مدل ماشینبردارپشتیبان و نیز انتخاب کرنل مناسب جهت پیادهسازی مدل، ابتدا مدل ماشینبردارپشتیبان با چهار کرنل مختلف آن اجرا و معیارهای ارزیابی مدل گزارش شده است. با توجه به مقادیر جدول 1 که مدل ماشینبردار پشتیبان به همراه چهار کرنل مختلف آن بر روی تمامی ویژگیها آماده شده است مشخص گردید که کرنل RBF برای تمام معیارهای گزارش شده دارای بالاترین صحت است بنابراین از کرنل RBF ماشینبردار پشتیبان به عنوان کرنل پیشفرض برای انجام مدلسازی استفاده شده است. حالیکه کرنلRBF، جز بهترین کرنل مشخص شد از روشهای انتخاب ویژگی مبتنی بر فیلترشامل روشهای انتخاب ویژگی مبتنی بر همبستگی (CFS)، امتیاز فیشر، اطلاعات متقابل(MIFS)، بکار گرفته میشود. در روش انتخاب ویژگی مبتنی بر همبستگی(CFS)، ویژگیهای دارای همبستگی بیشتر از %95 به دلیل اثر یکسانی که بر روی مدل خواهند داشت حذف شده است. در سایر روشهای انتخاب ویژگی شامل، امتیاز فیشر (FS) و اطلاعات متقابل (MIFS)، به هر ویژگی امتیازی اختصاص داده شده است که ویژگیهایی با امتیازهای بزرگتر از صفر و مثبت انتخاب گردیدند. با توجه به معیارهای گزارش شده در جدول 2 مشخص میشود که ویژگیهایی که از روش انتخاب ویژگی مبتنی بر همبستگی (CFS) بهدست آمده، نسبت به سایر روشهای انتخاب ویژگی مبتنی بر فیلتر نتایج بهتری را دارا میباشد، لذا به نظر میرسد مدلسازی بر روی ویژگیهای به دست آمده از روش انتخاب ویژگی مبتنی بر همبستگی (CFS)، نتایج بهتری را به همراه خواهد داشت. در گام بعد برای ارتقا مدل روی CFS-RBF از روشهای مبتنی برتعبیهشده برای نهایی کردن مدل استفاده شده است. مدل ماشینبردار پشتیبان با کرنل RBF بر روی روشهای انتخاب ویژگی مبتنی بر تعبیه شده نشان داد که روشهای Elasctic Net و LASSO نتایج تقریبا مشابهی را دارا میباشند با اینحال همانطور که در جدول 3 ملاحظه میگردد روش Elasctic Net دارای مقدار حساسیت و صحت نسبتاً بالاتری میباشد.
جدول1: پیادهسازی مدل روی کلیه ویژگیها برای انتخاب بهترین کرنل ماشینبردار پشتیبان
جدول2: پیادهسازی مدل ماشینبردار پشتیبان با کرنل RBF بر روی برخی از روشهای انتخاب ویژگی مبتنی بر فیلتر
جدول3: پیادهسازی مدل ماشینبردار پشتیبان با کرنل RBF برروی روشهای انتخاب ویژگی مبتنی بر تعبیه شده
بحث
همانگونه که در بخشهای قبل به آن اشاره شد، هدف اصلی این مطالعه شناسایی ترکیبات جدید به عنوان مهارکننده رگزایی در سرطان میباشد. برای این منظور روش لیگاند بنیان بر مبنای روشهای یادگیری ماشین پیشنهاد شد. یکی از مشکلات مهم و رایج در این روشها، تعداد زیاد توصیفگر در مقابل تعداد کم ترکیب است که غالبا منجر به مشکل بیش برازش در هنگام آموزش مدل میشود. برای جلوگیری از این مشکل روش استخراج و کاهش ویژگی پیشنهاد میشود. از آنجاییکه روش طبقهبند ماشینبردار پشتیبان، SVM، یکی از روشهای موفق در حوزه طراحی دارو بوده است، لذا در این مطالعه بر آن شدیم تا با بهکارگیری روشهای کاهش و استخراج بهینه ترین ویژگیها به بهترین مدل برای شناسایی ترکیبات ضد رگزایی دست پیدا کنیم. برای رسیدن به این هدف، ابتدا، تلاش بر آن شد تا بهترین مدل SVM شناسایی شود. برای بهدست آوردن بهترین کرنل چهار هسته رایج به نامهای RBF، Linear، Polynomial و Sigmoid مورد مطالعه قرار گرفت. در این میان کرنل RBF بهترین نتایج را داشت. در ادامه به بررسی روشهای کاهش ویژگی مبتنی بر فیلترشامل روشهای انتخاب ویژگی مبتنی بر همبستگی (CFS)، امتیاز فیشر، اطلاعات متقابل (MIFS) پرداخته شد. که در میان آنها روش انتخاب ویژگی مبتنی بر همبستگی (CFS) بهترین نتیجه را به همراه داشت. در پایان برای ارتقا مدل، روشهای مبتنی برتعبیهشده برای نهایی کردن مدل استفاده شد. در پایان روش Elastic- Net با دقت 81/6% بهترین روش پیشنهاد شد.
نتیجهگیری
امروزه نیاز به درمانهای جدید برای بیماریهای ناشی از سرطان در یک بازه زمانی کوتاه تر ضروری است. کشف و توسعه داروی سنتی شامل چندین مرحله برای کشف یک داروی جدید و کسب تاییدیه بازاریابی است. بنابراین کشف راهکارهای جدید برای کاهش بازه زمانی کشف دارو ضروری است. طراحی محاسباتی دارو که بر دو روش مبتنی بر لیگاند و مبتنی بر ساختار استوار است در جهت کاهش هزینهها و زمان روشی موثر است. در این مطالعه گیرنده دوم فاکتور رشد اندوتلیال عروق که جزء گیرنده های مهم رگزایی است و در بسیاری از سرطانها نقش موثر ایفا میکند، به کمک مدلسازی QSAR که یکی از روشهای مبتنی بر لیگاند است مورد بررسی قرار گرفت با استفاده از مدل ماشینبردار پشتیبان و بهکارگیری روشهای انتخاب ویژگی مبتنی بر فیلتر، نظیر روش انتخاب ویژگی مبتنی بر همبستگی، اطلاعات متقابل، امتیاز فیشر و برخی از روشهای انتخاب ویژگی نظیر روشهای Lasso، Elastic Net معیار های ارزیابی مدل نظیر صحت، ضریب همبستگی متیو، حساسیت و اختصاصی بودن گزارش گردید که از این میان، روش انتخاب ویژگی مبتنی بر همبستگی بالاترین صحت را به خود اختصاص داد و برتری این روش نسبت به سایر روشهای بهکارگرفته شده نشان داده شد. صحت کارهای انجام شده را میتوان با روشهای آزمایشگاهی هم مورد ارزیابی قرار داد که متاسفانه به علت هزینه بالای روشهای آزمایشگاهی و زمان بر بودن فرایندها این مرحله صورت نپذیرفته است که از جمله محدودیتها و کاستیهای این پژوهش میباشد.
سپاسگزاری
این مقاله برگرفته از پایاننامه دوره کارشناسی ارشد به شماره 3400594 در دانشگاه علوم پزشکی اصفهان میباشد. بدین وسیله از معاونت پژوهشی این دانشگاه به دلیل حمایت مالی از این مطالعه سپاسگزاری میگردد.
حامی مالی: معاونت آموزشی/ دانشگاه علوم پزشکی اصفهان
تعارض در منافع: وجود ندارند.
کد اخلاق و ملاحظات اخلاقی
کارگروه/ کمیته اخلاق در پژوهش معاونت تحقیقات و فناوری-دانشگاه علوم پزشکی اصفهان مصوب 16/08/1400 (کد اخلاق IR.MUI.RESEARCH.REC.1400.322)
مشارکت نویسندگان
نوشین عربی: تحقیق و بررسی، روش شناسی، نوشتن - پیش نویس اصلی
محمدرضا ترابی: نظارت بر دادهها، استفاده از نرمافزار، اعتبار سنجی، ویرایش متن
افشین فصیحی: تحلیل، نوشتن-ویرایش متن
فهیمه قاسمی: مفهوم سازی، نظارت، مدیریت پروژه، نوشتن - بررسی و ویرایش، جذب بودجه و همه نویسندگان در تدوین، ویرایش اولیه و نهایی مقاله و پاسخگویی به سوالات مرتبط با مقاله سهیم هستند.
References:
1- Li WW, Li VW, Hutnik M, Chiou AS. Tumor Angiogenesis as a Target for Dietary Cancer Prevention. J Oncol 2021 2012: 879623.
2- Farzaneh Behelgardi M, Zahri S, Gholami Shahvir Z, Mashayekhi F, Mirzanejad L, Asghari SM. Targeting Signaling Pathways of VEGFR1 and VEGFR2 as a Potential Target in the Treatment of Breast Cancer. Mol Biol Rep 2020; 47(3): 2061-71.
3- Melincovici CS, Boşca AB, Şuşman S, Mărginean M, Mihu C, Istrate M, et al. Vascular Endothelial Growth Factor (VEGF)-Key Factor in Normal and Pathological Angiogenesis. Rom J Morphol Embryol 2018; 59(2): 455-67.
4- Koch S, Tugues S, Li X, Gualandi L, Claesson-Welsh L. Signal Transduction by Vascular Endothelial Growth Factor Receptors. Biochem J 2011; 437(2): 169-83.
5- Sharma K, Patidar K, Ali MA, Patil P, Goud H, Hussain T, et al. Structure-Based Virtual Screening for the Identification of High Affinity Compounds as Potent VEGFR2 Inhibitors for the Treatment of Renal Cell Carcinoma. Curr Top Med Chem 2018; 18(25): 2174-85.
6- Selvam C, Mock CD, Mathew OP, Ranganna K, Thilagavathi R. Discovery of Vascular Endothelial Growth Factor Receptor-2 (VEGFR-2) Inhibitors by Ligand-Based Virtual High Throughput Screening. Mol Inform 2020; 39(7): e1900150.
7- Yu W, MacKerell AD Jr. Computer-Aided drug Design Methods. Methods Mol Biol 2017; 1520: 85-106.
8- Gurung AB, Ali MA, Lee J, Farah MA, Al-Anazi KM. An Updated Review of Computer-Aided drug Design and its Application to COVID-19. Biomed Res Int 2021; 2021: 8853056.
9- Masoomi Sefiddashti F, Asadpour S, Haddadi H, Ghanavati Nasab S. QSAR Analysis of Pyrimidine Derivatives as VEGFR-2 Receptor Inhibitors to Inhibit Cancer Using Multiple Linear Regression and Artificial Neural Network. Res Pharm Sci 2021; 16(6): 596-611.
10- Sheikhi S, Kheirabadi MT, Author C, Bazzazi A, Prof A. A Novel Scheme for Improving Accuracy of KNN Classification Algorithm Based on the New Weighting Technique And Stepwise Feature Selection. J Inf Technol Manag 2020; 12(4): 90-104.
11- Kang D, Pang X, Lian W, Xu L, Wang J, Jia H, et al. Discovery of VEGFR2 Inhibitors by Integrating Naïve Bayesian Classification, Molecular Docking and drug Screening Approaches. RSC Adv 8(10): 5286-5297.