Two-stage classification of breast tumor biomarkers for Iraqi Women

الهدف: يعتبر سرطان الثدي سرطان مميت في النساء و يسبب الكثير من الوفيات. إن التشخيص المبكر لسرطان الثدي باستخدام العلامات الحيوية المناسبة للورم قد يسهل العلاج المبكر للمرض، مما يقلل من معدل الوفيات. الغرض من الدراسة الحالية هو تحسين التشخيص المبكر للثدي من خلال اقتراح تصنيف على مرحلتين للمؤشرات الحي...

Full description

Saved in:
Bibliographic Details
Published in:Ai-Khawarizmi engineering journal Vol. 16; no. 3; pp. 1 - 10
Main Authors: Muhammad, Iydin Kamil, al-Tamimi, Ali Husayn Ali, Escudero, Javier
Format: Journal Article
Language:Arabic
English
Published: Baghdad, Iraq University of Baghdad, al-Khwarizmi College of Engineering 01-09-2020
Al-Khwarizmi College of Engineering – University of Baghdad
Subjects:
Online Access:Get full text
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:الهدف: يعتبر سرطان الثدي سرطان مميت في النساء و يسبب الكثير من الوفيات. إن التشخيص المبكر لسرطان الثدي باستخدام العلامات الحيوية المناسبة للورم قد يسهل العلاج المبكر للمرض، مما يقلل من معدل الوفيات. الغرض من الدراسة الحالية هو تحسين التشخيص المبكر للثدي من خلال اقتراح تصنيف على مرحلتين للمؤشرات الحيوية لأورام الثدي لعينة من النساء العراقيات. الطرق: في هذه الدراسة، تم اقتراح نظام تصنيف على مرحلتين و اختباره مع أربعة مصنفات للتعلم الآلي. في المرحلة الأولى، تُصنَّف ملامح الثدي (الخصائص الديموغرافية و السمات ة من عينات الدموالخصائص الة من عينات اللعاب) لحالات طبيعية و اخرىمرضية، في حين يتم تصنيف حالات الثدي غير الطبيعية في المرحلة الثانية إما بشكل ورم خبيث أو حميد. يتم استخدام السمات العشرون لسرطان الثدي التي تم جمعها لاختبار أداء نظام التصنيف المقترح. علاوة على ذلك، تم استخدام اختيار الميزات المستندة إلى الارتباط (CFS) في تحليل استكشافي للعثور على أفضل الميزات لنظام التصنيف على مرحلتين. النتائج: تم تحقيق دقة التصنيف بنسبة 94٪ للمرحلة الأولى و 100٪ للمرحلة 2 مع مصنفNaïve Bayes الذي تفوق على الطرق الثلاثة الأخرى. بالإضافة إلى ذلك، حددت CFS مجموعة فرعية صغيرة من السمات باعتبارها أفضل خمسسمات من بين كل 20 سمة لكل من المرحلتين الأولى و الثانية. الخلاصة: لقد تم تحقيق دقة تصنيف عالية و التي تعد بالمساعدة في تحسين التشخيص المبكر لورم الثدي. تظهر نتائج هذه الدراسة أيضًا أهمية البروتين CA15-3 في اللعاب و الدم و كذلك مستوى المستضد السرطاني في الدم للتنبؤ بأورام الثدي. Objective: Breast cancer is regarded as a deadly disease in women causing lots of mortalities. Early diagnosis of breast cancer with appropriate tumor biomarkers may facilitate early treatment of the disease, thus reducing the mortality rate. The purpose of the current study is to improve early diagnosis of breast by proposing a two-stage classification of breast tumor biomarkers fora sample of Iraqi women. Methods: In this study, a two-stage classification system is proposed and tested with four machine learning classifiers. In the first stage, breast features (demographic, blood and salivary-based attributes) are classified into normal or abnormal cases, while in the second stage the abnormal breast cases are further classified into either malignant or benign. The collected 20 breast cancer features are utilized to test the performance of the proposed classification system with Leave-One-Out (LOO) cross validation and Synthetic Minority Over-Sampling Technique (SMOTE) to balance the classes. Furthermore, correlation-based feature selection (CFS) was employed in an exploratory analysis to find the best features for the 2-stage classification system. Results: Classification accuracy of 94% for stage-1 and 100% for stage-2was achieved with a Naïve Bayesclassifier which outperformed other three methods. In addition, CFS selected small subset of features as being the best five features out of the all 20 features for both stage-1 and stage-2. Conclusion: We achieved a high classification accuracy which is promising to help improve the early diagnosis of breast tumor. The outcome of this study also shows the importance of CA15-3protein in saliva and blood as well as carcinoembryonic antigen level and total protein in blood, and Estrogen hormone level in saliva, for predicting breast tumors.
ISSN:1818-1171
2312-0789
DOI:10.22153/kej.2020.04.003