Laporkan Masalah

SELEKSI FITUR BERBASIS KOMPUTER UNTUK DIAGNOSIS PENYAKIT JANTUNG KORONER

Dwi Wahyu Prabowo, Noor Akhmad Setiawan, S.T., M.T., Ph.D.

2014 | Tesis | S2 Teknik Elektro

Coronary artery disease (CAD) is a disease that causes many deaths in human. CAD occurs when there is atherosclerosis (fatty deposits) that blocks blood flow to the heart muscle in the coronary arteries. The gold standard method to diagnose CAD is Coronary Angiography. However, this method is invasive, risky and costly. The purpose of this study is to conduct a diagnosis of CAD based on computer method. The diagnosis of CAD based on computer method is provided by selecting features and perform classification on a Cleveland dataset. In this research, feature selection based on medical expert (MFS) is used. Correlationbased feature selection (CFS), wrapper-based feature selection (WFS), feature selection based on rough set theory (RST) and the combination of RST and CFS called as RSTCFS are used as computer based feature selection methods. The combination of feature selection based on medical expert and computer is conducted to avoid the elimination of features that is considered important by the medical experts. Naive Bayes, SMO, IBK, AdaBoostM1, PART and J48 are used as classifiers. Among several methods to compare, RSTCFS with Naïve Bayes as the classifier was the best scheme for diagnosing CAD. RSTCFS + Naïve Bayes had the best area under the curve of the ROC (AUC) when compared to the other schemes. The AUC of RSTCFS + Naïve Bayes 0.902. Furthermore, the combination of MFS with RSTCFS, CFS and WFS were able to improve the AUC of each scheme statistically significant in the range of 7% to 20%. Keywords: Coronary artery disease, Cleveland, feature selection, classification

Penyakit jantung koroner merupakan penyakit yang banyak menyebabkan kematian pada manusia. Penyakit ini terjadi ketika terdapat atherosclerosis (timbunan lemak) yang menghalangi aliran darah ke otot jantung pada arteri koronaria. Metode gold standard yang menjadi rujukan para dokter untuk mendiagnosis penyakit jantung koroner adalah coronary angiography. Namun metode ini invasive, mempunyai risiko, dan mahal. Tujuan dari penelitian ini adalah melakukan diagnosis penyakit jantung koroner berbasis komputer. Diagnosis penyakit jantung koroner berbasis komputer dilakukan dengan menyeleksi fitur dan melakukan klasifikasi pada dataset Cleveland. Pada penelitian ini, metode seleksi fitur berbasis pakar medis (MFS) juga digunakan. Metode seleksi fitur berbasis komputer yang digunakan adalah correlation based feature selection (CFS), seleksi fitur berbasis Wrapper (WFS), seleksi fitur berbasis teori rough set (RST), dan kombinasi RST dan CFS yang dinamakan dengan RSTCFS. Penggabungan metode seleksi fitur berbasis pakar medis dan komputer juga dilakukan untuk menghindari terhapusnya fitur-fitur yang dianggap penting oleh pakar medis. Classifier yang digunakan adalah Naïve Bayes, SMO, IBk, AdaBoostM1, PART, dan J48. Pada akhirnya RSTCFS dengan Naïve Bayes sebagai classifier menjadi skema yang terbaik untuk mendiagnosis penyakit jantung koroner. RSTCFS+Naïve Bayes memiliki area under curve of ROC (AUC) terbaik dibandingkan skema yang lainnya yaitu sebesar 0.902. Kemudian penggabungan MFS dengan RSTCFS, CFS, dan WFS mampu meningkatkan AUC masing-masing skema secara signifikan statistik dalam rentang 7% hingga 20%. Kata kunci – Penyakit jantung koroner, Cleveland, seleksi fitur, klasifikasi

Kata Kunci : Coronary artery disease, Cleveland, feature selection, classification


    Tidak tersedia file untuk ditampilkan ke publik.