Sekarang kita berada di era 5.0 dimana Peningkatan penggunaan internet di seluruh dunia menghasilkan data dalam jumlah yang sangat besar. Supaya memberikan manfaat dan dapat digunakan untuk membuat keputusan, data harus dikumpulkan dan diproses terlebih dahulu. Proses pengumpulan ini pula yang di sebut dengan dat mining loh, jadi data mining kaya bagamana sih ? apakah data meining penting ? yukk simak artikel dibawah ini yah !!
Apa itu data mining?
menurut etimologi data mining terbagi menjadi 2 suku kata yaitu Data dan mining, Data yang berupa fakta tersebut ketika diolah maka akan menjadi informasi. Sebagai contoh data misal "data mahasiswa Teknik Informatika kelas genap angkatan 2020". Untuk contoh informasi sendiri misal "Rata - rata nilai matakuliah pemrograman kelas genap sebesar 80.85". sedangkan arti mining sendiri dapat berupa penambangan, penggalian, pengelolaan.
Jadi, Data mining adalah proses pengumpulan dan pengolahan data yang bertujuan untuk mengekstrak informasi penting pada data. Proses pengumpulan dan ekstraksi informasi tersebut dapat dilakukan menggunakan perangkat lunak dengan bantuan perhitungan statistika, matematika, ataupun teknologi Artificial Intelligence (AI). Data mining sering disebut juga Knowledge Discovery in Database (KDD).
·
Tujuan Data Mining
Data mining dilakukan untuk mencapai tujuan tertentu.
Tujuan dari data mining adalah:
Data mining dapat
digunakan sebagai sarana untuk menggambarkan situasi penelitian.
Ø Konfirmasi
Data
mining dapat digunakan sebagai sarana untuk mengkonfirmasi pernyataan atau
mengkonfirmasi hipotesis.
Ø Penyelidikan
Data mining dapat digunakan sebagai sarana untuk menemukan pola baru yang sebelumnya tidak dikenali.
Knowledge Discovery (KDD) Process ?
Tentang Proses Knowledge Discovery (KDD) Jika
berbicara tentang data mining, tentunya ada proses teknisnya. Proses-proses ini
terdiri dari fondasi dasar yang paling mendasar: database.
Proses kedua adalah integrasi data. Data dalam suatu
database tidak tunggal, tetapi terhubung dengan data lain. Proses ketiga adalah
pembersihan data. Hal ini dimaksudkan untuk membersihkan data yang tidak
penting. B. Menghapus data yang berlebihan, menghapus nilai null dan data
dengan tipe data yang tidak sesuai.
Setelah data dibersihkan, proses keempat adalah
menyimpan data di gudang penyimpanan yang disebut gudang data. Juga, pilih data
sesuai dengan relevansinya dengan tugas yang ingin Anda lakukan. Rangkaian
proses dari database hingga pemilihan data ini disebut "data
preprocessing".
Kemudian memasuki proses penambangan data yang
dijelaskan di atas. Setelah proses data mining selesai maka masuk ke proses
evaluasi pola. Setelah proses evaluasi selesai, data menjadi pengetahuan.
Pengetahuan ini digunakan dalam proses pendukung/pengambilan keputusan
(decision making).
Proses ini diulang sampai diperoleh model yang lebih akurat.
· Metode data mining
Ø
Association
Teknik
pertama adalah asosiasi. Asosiasi adalah metode berbasis aturan yang digunakan
untuk menemukan asosiasi dan hubungan variabel dalam kumpulan data. Analisis
ini biasanya terdiri dari pernyataan sederhana "jika atau kemudian".
Pemetaan sering digunakan untuk mengidentifikasi korelasi antar produk dalam
keranjang belanja untuk memahami kebiasaan konsumsi pelanggan. Ini membantu
perusahaan mengembangkan strategi penjualan dan menciptakan sistem rekomendasi
yang lebih baik. Setelah klasifikasi, ini adalah metode yang paling umum
digunakan dalam data mining. Klasifikasi adalah tindakan memprediksi kelas
suatu objek
Ø Classification
Setelah klasifikasi, ini adalah metode yang paling umum digunakan dalam data mining. Klasifikasi adalah tindakan memprediksi kelas suatu objek.
Ø
Regression
Regresi
adalah teknik yang menjelaskan variabel dependen melalui proses analisis
variabel independen. Misalnya, perkiraan penjualan produk didasarkan pada
korelasi antara harga produk dan tingkat pendapatan rata-rata pelanggan.
Ø Clustering
Terakhir, metode clustering. Clustering digunakan untuk membagi suatu dataset menjadi beberapa kelompok berdasarkan kesamaan atribut yang dimiliki dataset tersebut. Salah satu contohnya adalah segmentasi pelanggan. Mengkategorikan pelanggan ke dalam kelompok berdasarkan kesamaan.
· Penerapan data mining
Ø
Edukasi
Dalam
dunia pendidikan, data mining membantu kita memahami karakteristik setiap
siswa. Tujuannya adalah untuk menemukan pola belajar terbaik untuk digunakan
dalam sesi belajar Anda.
Ø
Bisnis
Dalam
bisnis, data mining biasanya digunakan untuk pemasaran, analisis pasar, dan
analisis kebutuhan pelanggan. Mari kita bahas satu per satu.
Ø
Perbankan
Sektor perbankan menggunakan data mining untuk memprediksi kemungkinan bahwa pelanggan tidak akan dapat membayar kembali pinjaman mereka. Hal ini dilakukan untuk meminimalkan risiko kerugian
Jadi, apa itu data mining?
Berdasarkan uraian di atas, data mining adalah proses
pengumpulan dan pengolahan data yang bertujuan untuk mengekstrak informasi
penting pada data. Data mining memiliki tiga tujuan yaitu sebagai sarana untuk
menjelaskan atau explanatory, untuk konfirmasi atau confirmatory,
dan untuk eksplorasi atau exploratory. Ia juga memiliki beberapa metode
seperti Association, Classification, Regression, dan Clustering.
Demikian pembahasan kita mengenai data mining kali
ini.
Referensi :
https://algorit.ma/blog/teknik-data-mining-2022/