Data mining adalah adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan didalam daftar data. Data mining merupakan proses yang menggunakan teknik statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstrasi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai daftar data besar. Data Clustering merupakan salah satu metode data mining yang bersifat tanpa arahan (unsupervised). Ada dua jenis data clustering yang sering dipergunakan dalam proses pengelompokan data yaitu hierarchical (hirarki) data clustering dan non-hierarchical (non hirarki) data clustering

Proses clustering adalah proses pengelompokan data ke dalam cluster berdasarkan parameter tertentu sehingga obyek-obyek dalam sebuah cluster memiliki tingkat kemiripan yang tinggi satu sama lain dan sangat tidak mirip dengan obyek yang lain pada cluster yang berbeda. Sampai saat ini, para ilmuwan masih terus melakukan berbagai usaha untuk melakukan perbandingan model cluster sehingga dapat menghasilkan cluster yang cocok digunakan pada sebuah penelitian.

Dalam data mining terdapat sebuah metode yang digunakan untuk mengklaster data menjadi kelompok-kelompok data, yaitu metode K-Means. Algoritma K-Means adalah algoritma klastering yang paling sederhana dibanding algoritma klastering yang lain. Algoritma ini mempunyai kelebihan mudah diterapkan dan dijalankan, relatif cepat, mudah untuk diadaptasi, dan paling banyak dipraktekkan dalam tugas data mining.

Selain data mining, terdapat cabang ilmu matematika yang mempunyai metode untuk mengklaster data yaitu logika fuzzy. Dalam teori fuzzy, keanggotaan sebuah data tidak diberi nilai secara tegas dengan nilai 1 (menjadi anggota) dan 0 (tidak menjadi anggota), melainkan dengan suatu nilai derajat keanggotaan yang jangkauan nilainya 0 sampai 1. Dalam pengklasteran data, metode Fuzzy C-Means adalah salah satu metode yang digunakan dalam logika fuzzy.