Analisis diskriminan linear

Analisis diskriminan linear (Inggris: linear discriminant analysis, disingkat LDA) adalah generalisasi diskriminan linear Fisher, yaitu sebuah metode yang digunakan dalam ilmu statistika, pengenalan pola dan pembelajaran mesin untuk mencari kombinasi linear fitur yang menjadi ciri atau yang memisahkan dua atau beberapa objek atau peristiwa. Kombinasi yang diperoleh dapat dijadikan pengklasifikasi linear, atau biasanya digunakan untuk proses reduksi dimensionalitas sebelum pengklasifikasian.

Metode ini sangat terkait dengan analisis variansi (ANOVA) dan analisis regresi, yang juga mencoba untuk menyatakan suatu variabel dependen sebagai suatu kombinasi linear fitur-fitur atau pengukuran-pengukuran lainnya.[1][2] Namun, ANOVA menggunakan variabel independen kategoris dan variabel dependen yang kontinu, sementara analisis diskriminan memiliki variabel independen yang kontinu dan variabel dependen yang kategoris.[3] Regresi logistik dan regresi probit lebih mirip dengan LDA daripada ANOVA, karena keduanya juga mencoba menjelaskan variabel kategoris dari nilai variabel independen kontinu.

LDA juga terkait dengan analisis komponen utama dan analisis faktor karena sama-sama mencari kombinasi linear variabel-variabel yang terbaik dalam menjelaskan data.[4] LDA secara eksplisit mencoba memodelkan perbedaan antara kelas-kelas data. PCA di sisi lain tidak mempertimbangkan perbedaan kelas, dan analisis faktor membangun kombinasi fitur berdasarkan perbedaan daripada kesamaan. Analisis diskriminan juga berbeda dari analisis faktor karena analisis diskriminan bukan teknik yang interdependen: perbedaan antara variabel independen dan dependen harus ditetapkan.

LDA berfungsi jika pengukuran yang dilakukan terhadap variabel-variabel independen untuk setiap pengamatan merupakan kuantitas yang kontinu. Jika yang dihadapi adalah variabel independen kategoris, teknik yang serupa adalah analisis korespondensi diskriminan.[5][6]

Referensi sunting

  1. ^ Fisher, R. A. (1936). "The Use of Multiple Measurements in Taxonomic Problems". Annals of Eugenics. 7 (2): 179–188. doi:10.1111/j.1469-1809.1936.tb02137.x. hdl:2440/15227. 
  2. ^ McLachlan, G. J. (2004). Discriminant Analysis and Statistical Pattern Recognition. Wiley Interscience. ISBN 0-471-69115-1. MR 1190469. 
  3. ^ Analyzing Quantitative Data: An Introduction for Social Researchers, Debra Wetcher-Hendricks, hlm.288
  4. ^ Martinez, A. M.; Kak, A. C. (2001). "PCA versus LDA" (PDF). IEEE Transactions on Pattern Analysis and Machine Intelligence. 23 (=2): 228–233. doi:10.1109/34.908974. Diarsipkan dari versi asli (PDF) tanggal 2008-10-11. Diakses tanggal 2018-01-17. 
  5. ^ Abdi, H. (2007) "Discriminant correspondence analysis." In: N.J. Salkind (Ed.): Encyclopedia of Measurement and Statistic. Thousand Oaks (CA): Sage. pp. 270–275.
  6. ^ Perriere, G.; & Thioulouse, J. (2003). "Use of Correspondence Discriminant Analysis to predict the subcellular location of bacterial proteins", Computer Methods and Programs in Biomedicine, 70, 99–105.

Bacaan lanjutan sunting

Pranala luar sunting