Laporkan Masalah

REGRESI NONPARAMETRIK DENGAN MENGGUNAKAN METODE ROBUST CROSS-VALIDATION

RATNA YUNIARTI, Prof. Dr. Sri Haryatmi, M.Sc.

2014 | Tesis | S2 Matematika

Analisis regresi merupakan suatu alat statistika yang banyak digunakan untuk mengetahui hubungan antara sepasang variabel atau lebih. Apabila formulasi hubungan antara variabel prediktor X dan variabel respon Y tidak diketahui maka estimasi fungsi regresi m(:) dapat menggunakan pendekatan nonparametrik. Pada pendekatan regresi nonprametrik, umumnya fungsi regresi hanya diasumsikan termuat dalam suatu ruang fungsi yang berdimensi tak hingga. Salah satu pendekatan yang dikenal pada regresi nonparametrik adalah regresi kernel. Nadaraya- Watson merupakan suatu estimator pada regresi kernel yang dapat digunakan untuk mengestimasi fungsi regresi m(:). Namun, ketika data terdapat outlier estimator Nadaraya-Watson menghasilkan MSE yang besar. Pengaruh outlier diantaranya adalah menyebabkan residual yang besar dari model yang terbentuk, dan varians pada data tersebut menjadi lebih besar. Oleh karena itu, diperlukan suatu metode untuk mengatasi outlier. Salah metode yang dapat mengatasi outlier adalah metode robust. Huber memperkenalkan ide estimator-M yaitu suatu estimator yang robust terhadap outlier. Selain itu, diperlukan juga suatu metode untuk mengestimasi prediksi kesalahan model yaitu metode cross-validation. Cross-validation merupakan contoh metode yang dapat digunakan untuk mendapatkan model kurva regresi terbaik. Cross-validation dapat mengestimasi prediksi error dari sebuah model dan juga untuk membandingkan model-model yang ada kemudian dipilih model yang memiliki prediksi error lebih rendah.

Regression analysis is a statistical tool that is widely used to determine the relationship between a pair of variables or more. If the formulation relationship between the predictor variablesX and Y the response variable is not known,estimation of the regression function m(:) can use a nonparametric approach. In nonprametric regression approach, generally just assumed regression function contained in a function space of infinite dimension. One approach, known in the nonparametric regression is the kernel regression. Nadaraya-Watson regression estimator is a kernel that can be used to estimating the regression function m(:). However, when the data are outliers estimators Nadaraya-Watson produces a large MSE. The influence of such outliers is causing large residuals of the model is formed, and the variance the data becomes larger. Therefore, we need a method to cope with outliers. One method that can overcome the outliers is a robust method. Huber introduced estimator-M, the idea that a robust estimator against outliers. In addition, also required a method to estimate the error prediction error a model, it is cross-validation method. Cross validation is a methods that can be used to obtain the best regression curve models. Cross-validation can estimate the prediction error of a model and also compare existing models and then selected models which has a lower prediction error.

Kata Kunci : Regresi Nonparametrik, Estimator Nadaraya-watson, Cross-validation. outlier, Robust, Estimasi-M.


    Tidak tersedia file untuk ditampilkan ke publik.