Pengklasifikasi linear

Dalam pemelajaran mesin, pengklasifikasi linear adalah klasifikasi yang mengambil keputusan berdasarkan nilai kombinasi linear dari sifat-sifatnya. Sifat-sifat suatu objek disebut juga nilai fitur (ciri) dan biasa dinyatakan dalam vektor yang disebut vektor fitur. Pengklasifikasi ini bekerja dengan baik untuk permasalahan praktis seperti klasifikasi dokumen dan masalah-masalah yang memiliki banyak variabel (fitur) hingga mencapai tingkat akurasi yang sekelas dengan pengklasifikasi nonlinear dengan waktu pelatihan yang lebih sedikit.[1]

Definisi sunting

 
Pada kasus ini, bulatan isi dan bulatan kosong dapat diklasifikasikan dengan benar oleh banyak pengklasifikasi linear. H1 (biru) mengklasifikasikan dengan benar. Begitu juga H2 (merah). H2 dapat dianggap "lebih baik" dalam artian bahwa garisnya berada paling jauh dari kedua kelompok. H3 (hijau) gagal mengklasifikasikan bulatan-bulatan tersebut dengan benar.

Jika vektor fitur input pengklasifikasi adalah vektor riil  , nilai keluarannya adalah

 

dengan   adalah vektor riil bobotnya dan   adalah fungsi yang mengubah produk skalar dua vektor ke bentuk keluaran yang diinginkan. Vektor bobot   dipelajari dari himpunan sampel pelatihan yang telah dilabeli. Biasanya, fungsi   adalah fungsi ambang batas yang memetakan semua nilai   yang di atas batas tertentu ke dalam kelas pertama dan nilai-nilai lainnya ke dalam kelas kedua, misalnya

 

Fungsi   yang lebih kompleks mungkin dapat memberikan peluang suatu barang termasuk kelas tertentu.

Lihat pula sunting

Referensi sunting

  1. ^ Guo-Xun Yuan; Chia-Hua Ho; Chih-Jen Lin (2012). "Recent Advances of Large-Scale Linear Classification" (PDF). Proc. IEEE. 100 (9). 

Bacaan lebih lanjut sunting

  1. Y. Yang; X. Liu (1999). "A re-examination of text categorization". Proc. ACM SIGIR Conference: 42–49. 
  2. R. Herbrich (2001). Learning Kernel Classifiers: Theory and Algorithms. MIT Press. ISBN 0-262-08306-X.