Indeks Jaccard

ukuran kemiripan dan keragaman antarhimpunan

Indeks Jaccard (disebut juga koefisien kemiripan Jaccard) adalah ukuran kemiripan dan keragaman himpunan sampel. Indeks ini dikembangkan oleh Paul Jaccard (awalnya bernama coefficient de communauté)[1] dan dirumuskan secara mandiri oleh T. Tanimoto.[2] Karenanya, istilah indeks Tanimoto atau koefisien Tanimoto juga dipakai dalam bidang-bidang tertentu. Namun, keduanya juga secara umum mengambil rasio Irisan per Gabungan (Inggris: Intersection over Union/IoU). Indeks ini bisa diukur sebagai berikut:

Irisan dan gabungan himpunan A dan B
Irisan per Gabungan sebagai ukuran kemiripan dalam deteksi objek pada citra—operasi penting dalam penglihatan komputer

Kemiripan atribut biner tak simetri sunting

Klasifikasi biner sunting

Lihat pula sunting

Referensi sunting

  1. ^ Jaccard, Paul (Februari 1912). "The Distribution of the Flora in the Alpine Zone". New Phytologist (dalam bahasa Inggris). 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x. ISSN 0028-646X. 
  2. ^ Tanimoto, T.T. (17 November 1958). "An Elementary Mathematical theory of Classification and Prediction". Internal IBM Technical Report. 1957 (8?). 

Bacaan lebih lanjut sunting

  • Tan, P.N., Steinbach, M., dan Kumar, V. (2005). Introduction to Data Mining. ISBN 0-321-32136-7. 
  • Jaccard, P. (1901). "Étude comparative de la distribution florale dans une portion des Alpes et des Jura". Bulletin de la Société vaudoise des sciences naturelles. 37: 547–579. 
  • Jaccard, P. (1912). "The Distribution of the flora in the alpine zone". New Phytologist. 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x.