Bootstrap aggregating: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
k ganti sintaks matematika yang sudah usang sesuai dengan mw:Extension:Math/Roadmap
Debenben (bicara | kontrib)
Membalikkan revisi 14729521 oleh Texvc2LaTeXBot (bicara)
Tag: Pembatalan
Baris 5:
 
== Deskripsi secara teknik ==
Diberikan sebuah standar ''training set'' <math /> yang berukuran ''n'', bagging menghasilkan ''m'' training set baru <math />, masing-masing berukuran ''n'<nowiki/>'', dengan [[Teknik sampling|sampling]] dari ''D'' secara [[Sebaran probabilitas|u]]<nowiki/>niform dan [[Teknik sampling|dengan penggantian]] (with replacement). Karena sampling dengan penggantian, maka beberapa observasi dapat diulang dalam setiap <math />. Jika ''n'''=''n'', maka besar ''n'' set <math /> diharapkan memiliki fraksi (1 - 1/''[[E (konstanta matematika)|e]]'') (≈63.2\%) dari contoh unik dari ''D'', sisanya menjadi duplikat.<ref>Aslam, Javed A.; Popa, Raluca A.; and Rivest, Ronald L. (2007); [http://people.csail.mit.edu/rivest/pubs/APR07.pdf ''On Estimating the Size and Confidence of a Statistical Audit''], Proceedings of the Electronic Voting Technology Workshop (EVT '07), Boston, MA, August 6, 2007. More generally, when drawing with replacement ''n′'' values out of a set of ''n'' (different and equally likely), the expected number of unique draws is <math>n(1 - e^{-n'/n})</math>.</ref> Jenis contoh/sampel ini dikenal sebagai bootstrap sampel. Model ''m'' dipasang menggunakan sampel bootstrap ''m'' di atas dan dikombinasikan dengan rata-rata output (untuk regresi) atau voting (untuk klasifikasi).
 
Bagging mengarah ke "perbaikan prosedur yang tidak stabil" (Breiman, 1996), yang meliputi [[Jaringan saraf tiruan|jaringan syaraf tiruan]], klasifikasi dan pohon regresi, dan seleksi subset dalam regresi linier (Breiman, 1994). Pengaplikasian yang menarik dari bagging yang menunjukkan perbaikan dalam operasi pembelajaran dapat dilihat di sini.<ref>Sahu, A., Runger, G., Apley, D., Image denoising with a multi-phase kernel principal component approach and an ensemble version, IEEE Applied Imagery Pattern Recognition Workshop, pp.1-7, 2011.</ref><ref>Shinde, Amit, Anshuman Sahu, Daniel Apley, and George Runger. "Preimages for Variation Patterns from Kernel PCA and Bagging." IIE Transactions, Vol.46, Iss.5, 2014</ref> Di sisi lain, hal ini dapat sedikit menurunkan kinerja metode yang stabil seperti K-NN (Breiman, 1996).