Data Mining

Data Mining. Apa sih sebenarnya data mining itu?

Data mining merupakan proses terotomasi dengan menyortir sebuah data yang ukurannya besar agar kita dapat mengidentifikasi tren dan pola serta menemukan ada keterhubungan, untuk memecahkan masalah bisnis atau menghasilkan peluang baru melalui analisis data.

Salah satu kegunaannya yaitu, kita dapat melihat data telah terjadi di masa lalu dan data tersebut kita gunakan untuk bertindak secara cerdas pada masa sekarang. Alat dan teknik pada data mining memungkinkan kita memprediksi apa yang akan terjadi di masa depan dan bertindak secara cerdas untuk memanfaatkan tren mendatang.

Contoh Penerapan Daata Mining

RETAILERS dapat menggunakan data mining untuk mengidentifikasi produk mana yang kemungkinan dibeli orang berdasarkan kebiasaan pembelian mereka sebelumnya, atau barang mana yang kemungkinan akan dijual pada waktu-waktu tertentu dalam setahun. Ini dapat membantu untuk penyimpanan serta ketersediaan produk mereka.

BANK DAN PENYEDIA JASA KEUANGAN lainnya dapat menambang data yang terkait dengan akun klien mereka, transaksi, dan preferensi saluran untuk memenuhi kebutuhan mereka dengan lebih baik. Mereka juga dapat mengumpulkan kemudian menganalisis data dari situs web dan interaksi media sosial mereka untuk membantu meningkatkan kesetiaan pelanggan yang sudah ada, dan menarik pelanggan baru.

PERUSAHAAN MANUFAKTUR dapat menggunakan data mining untuk mencari pola dalam proses produksi, sehingga mereka dapat secara tepat mengidentifikasi bottleneck dan metode yang salah dan menemukan cara untuk meningkatkan efisiensi. Mereka juga dapat menerapkan pengetahuan dari penambangan data ke desain produk, dan membuat “tweak” berdasarkan umpan balik dari pengalaman pelanggan.

LEMBAGA PENDIDIKAN dapat mengambil manfaat dari penambangan data seperti menganalisis set data untuk memprediksi perilaku pembelajaran di masa depan dan kinerja siswa, dan kemudian menggunakan pengetahuan ini untuk membuat perbaikan dalam metode pengajaran atau kurikulum.

PENYEDIA LAYANAN KESEHATAN dapat menambang dan menganalisis data untuk menentukan cara yang lebih baik dalam memberikan perawatan kepada pasien dan memotong biaya. Dengan bantuan penambangan data, mereka dapat memprediksi berapa banyak pasien yang perlu dirawat dan jenis layanan apa yang diperlukan pasien. Dalam ilmu kehidupan, pertambangan dapat digunakan untuk mengumpulkan wawasan dari data biologis besar-besaran, untuk membantu mengembangkan obat-obatan baru dan perawatan lainnya.

Di beberapa industri, termasuk perawatan kesehatan dan ritel, kita dapat menggunakan penambangan data untuk mendeteksi penipuan dan pelanggaran lainnya — jauh lebih cepat daripada dengan metode tradisional untuk mengidentifikasi kegiatan tersebut.

Komponen Utama pada Data Mining

Proses penambangan data mencakup beberapa komponen berbeda yang mengatasi berbagai kebutuhan:

PREPROCESSING. Sebelum kita menerapkan algoritma penambangan data, kita perlu membuat kumpulan target data. Salah satu sumber umum untuk data adalah data mart atau gudang. Anda perlu melakukan preprocessing untuk dapat menganalisis kumpulan data.

DATA CLEANSING AND PREPARATION. Kumpulan target data harus dibersihkan dan jika tidak disiapkan, untuk menghilangkan “noise”, alamat nilai yang hilang, menyaring titik data yang terluar (untuk deteksi anomali) untuk menghapus kesalahan atau melakukan eksplorasi lebih lanjut, membuat aturan segmentasi, dan melakukan fungsi lain yang terkait dengan persiapan data.

ASSOCIATION RULE LEARNING (also known as market basket analysis). Alat ini mencari hubungan antar variabel dalam kumpulan data, seperti menentukan produk mana di toko yang sering dibeli bersama.

CLUSTERING. Fitur penambangan data ini digunakan untuk menemukan kelompok dan struktur dalam kumpulan data yang dalam beberapa cara yang mirip satu sama lain, tanpa menggunakan struktur yang dikenal dalam data.

CLASSIFICATION. Alat yang dapat melakukan klasifikasi menggeneralisasi struktur yang dikenal untuk diterapkan ke titik data baru, seperti ketika aplikasi email mencoba mengklasifikasikan pesan sebagai email atau spam yang sah.

REGRESSION. Teknik penambangan data ini digunakan untuk memprediksi berbagai nilai numerik, seperti penjualan, nilai perumahan, suhu, atau harga ketika diberi kumpulan data tertentu.

SUMMARIZATION. Teknik ini memberikan representasi ringkas dari kumpulan data, termasuk visualisasi dan pembuatan laporan.

Data mining sekarang telah menjadi komponen yang sangat penting dari strategi IT di banyak organisasi yang berusaha mendapatkan suatu value dari segala informasi yang mereka kumpulkan atau dapat mereka akses.

Dorongan terkait data mining sudah tidak diragukan lagi karena semakin cepatnya kemajuan yang sedang berlangsung dalam analisis prediktif, kecerdasan buatan, pembelajaran mesin, dan teknologi terkait lainnya.

Leave a Reply

Your email address will not be published. Required fields are marked *