Analitik prediktif: Perbedaan antara revisi

Tidak ada perubahan ukuran ,  6 tahun yang lalu
k
hirarki > hierarki (menggunakan WP:JWB)
Konten dihapus Konten ditambahkan
HsfBot (bicara | kontrib)
k Bot: Penggantian teks otomatis (-Syaraf, +Saraf, -syaraf, +saraf)
k hirarki > hierarki (menggunakan WP:JWB)
Baris 73:
 
== Teknologi dan data besar pengaruh ==
[[Big data]] adalah koleksi dari data set yang sangat besar dan kompleks sehingga mereka menjadi canggung untuk bekerja dengan menggunakan tradisional [[Pangkalan data|database management]] tools. Volume, variety, dan velocity data besar telah memperkenalkan tantangan di seluruh papan untuk pengambilan, penyimpanan, pencarian, berbagi, analisis, dan visualisasi. Contoh-contoh sumber data yang besar seperti [[Blog|web log]], [[RFID]], sensor data, [[jejaring sosial]], Internet pencarian pengindeksan, call detail records, militer, pengawasan, dan data yang kompleks dalam astronomi, biogeokimia, genomik, dan ilmu atmosferapabila. Big Data merupakan inti dari sebagian besar predictive analytic jasa yang ditawarkan oleh organisasi.
Berkat kemajuan teknologi di perangkat keras komputer—Cpu lebih cepat, memori yang lebih murah, dan MPP arsitektur dan teknologi baru seperti Hadoop, MapReduce, dan di-database dan [[Penambangan teks|teks analytics]] untuk pengolahan data yang besar, sekarang layak untuk mengumpulkan, menganalisis, dan tambang dalam jumlah besar yang terstruktur dan yang tidak terstruktur data untuk wawasan baru. Hal ini juga mungkin untuk menjalankan algoritma prediktif pada data streaming. Hari ini, menjelajahi data besar dan menggunakan analisis prediktif adalah dalam jangkauan organisasi lebih dari sebelumnya dan metode-metode baru yang mampu untuk penanganan seperti dataset yang diusulkan.
 
Baris 137:
 
==== Classification and regression trees (CART) ====
Secara global optimal klasifikasi tree analysis (PERGI-CTA) (disebut juga hirarkihierarki optimal discriminant analysis) adalah generalisasi dari optimal analisis diskriminan yang dapat digunakan untuk mengidentifikasi model statistik yang memiliki akurasi maksimum untuk memprediksi nilai kategoris variabel dependen untuk dataset yang terdiri dari kategorik dan variabel kontinu. Output dari HODA adalah non-orthogonal pohon yang menggabungkan variabel kategori dan titik potong untuk variabel kontinu yang menghasilkan maksimum prediksi akurat, penilaian yang tepat Tipe I error rate, dan evaluasi potensi cross-generalisasi dari model statistik. Hirarkis optimal analisis diskriminan dapat dianggap sebagai generalisasi dari fisher's linear discriminant analysis. Optimal analisis diskriminan adalah sebuah alternatif untuk ANOVA (analisis of varians) dan analisis regresi, yang mencoba untuk mengekspresikan satu variabel dependen sebagai kombinasi linear dari fitur lain atau pengukuran. Namun, ANOVA dan analisis regresi memberikan sebuah variabel dependen yang merupakan variabel numerik, sementara hirarkis optimal analisis diskriminan memberikan sebuah variabel dependen yang merupakan variabel kelas.
 
Classification and regression trees (CART) adalah non-parametrik decision tree learning teknik yang menghasilkan baik klasifikasi maupun regresi pohon, tergantung pada apakah variabel dependen kategorik maupun numerik, masing-masing.