Definisi Data
Mining
Data
mining didefinisikan sebagai satu set teknik yang digunakan secara
otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan
relasi-relasi yang kompleks pada set data yang sangat besar.
Data
mining dapat juga didefinisikan sebagai “pemodelan dan penemuan polapola
yang tersembunyi dengan memanfaatkan data dalam volume yang besar”1. Data
mining menggunakan pendekatan discovery-based dimana pencocokan
pola (pattern-matching) dan algoritmaalgoritma yang lain digunakan untuk
menentukan relasi-relasi kunci di dalam data yang diekplorasi. Data
mining merupakan komponen baru pada arsitektur sistem pendukung
keputusan (DSS) di perusahaan-perusahaan. Ruang Lingkup Data
Mining.
Data
mining (penambangan data), sesuai dengan namanya, berkonotasi sebagai pencarian
informasi bisnis yang berharga dari basis data yang sangat besar. Usaha pencarian
yang dilakukan dapat dianalogikan dengan penambangan logam mulia dari lahan
sumbernya. Dengan tersedianya basis data dalam kualitas dan ukuran yang
memadai.
Data Mining mengidentifikasi fakta- fakta atau
kesimpulan-kesimpulan yang di sarankan berdasarkan penyaringan melalui data untuk
menjelajahi pola-pola atau anomali-anomali data. Data Mining mempunyai 5
fungsi:
a. Classification
Classification,
yaitu menyimpulkan definisi-definisi karakteristik sebuah grup. Contoh:
pelanggan-pelanggan perusahaan yang telah berpindah kesaingan perusahaan yang
lain.
b. Clustering
Clustering,
yaitu mengindentifikasikan kelompok-kelompok dari barang-barang atau
produk-produk yang mempunyai karakteristik khusus(clustering berbeda dengan
classification, dimana pada clustering tidak terdapat definisi-definisi
karakteristik awak yang di berikan pada waktu classification.)
c. Association
Association,
yaitu mengidentifikasikan hubungan antara kejadian-kejadian yang terjadi pada
suatu waktu, seperti isi-isi dari keranjang belanja.
d. Sequencing
Hampir sama
dengan association, sequencing mengidentifikasikan hubungan-hubungan yang
berbeda pada suatu periode waktu tertentu, seperti pelanggan-pelanggan yang
mengunjungi supermarket secara berulang-ulang.
e. Forecasting
Forecasting memperkirakan nilai pada masa yang
akan datang berdasarkan pola-pola dengan sekumpulan data yang besar, seperti
peramalan permintaan pasar.
Tujuan data mining antara lain:
a. Explanatory
Untuk
menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan truk pick up
meningkat di colorado.
b. Confirmatory
Untuk
mempertegas hipotesis, seperti halnya 2 kali pendapatan keluarga lebih suka di
pakai untuk membeli peralatan keluarga, di bandingkan dengan satu kali
pendapatan keluarga.
c. Exploratory
Menganalisis data untuk hubungan yang baru yang
tidak di harapkan, seperti halnya pola apa yang cocok untuk kasus penggelapan
kartu kredit.
Fase-fase dimulai dari data mentah dan berakhir
dengan pengetahuan atau informasi yang telah diolah, yang didapatkan sebagai
hasil dari tahapan-tahapan berikut:
1.
Data Cleansing, juga dikenal sebagai data
cleansing, ini adalah sebuah fase dimana data-data tidak lengkap, mengndung
error dan tidk konsisten dibuang dari koleksi data, sehingga data yang telah
bersih relevan dapat digunakan untuk diproses ulang untuk penggalian
pengetahuan(discovery knowledge)
2.
Data Integration, pada tahap ini terjadi
integrasi data,dimana sumber-sumber data yang berulang(multiple data),
file-file yang berulang(multiple file), dapat dikombinasikan dan digabungkan
kedalam suatu sumber.
3.
Data Selection, pada langkah ini, data yang
relevan terhadap analisis dapat dipilih dan diterima dari koleksi data yang
ada.
4.
Data Transformation, juga dikenal sebagai data
consolidation. Pada tahap ini, dimana data-data yang telah terpilih,
ditransformasikan kedalam bentuk-bentuk yang cocok untuk prosedur penggalian
(meaning proedure) dengan cara melakukan normalisasi dan agregasi data.
5.
Data Mining, tahap ini adalah tahap yang paling
penting, dengan menggunakan teknik-teknik yang diaplikasikan untuk mengekstrak pola-pola
potensial yang berguna.
6.
Pattern Evaluation, pada tahap ini, pola-pola
menarik dengan jelas mempresentasikan pengetahuan telah diidentifikasi
berdasarkan measure yang telah diberikan.
7.
Knowledge Representation, ini merupakan tahap
terakhir dimana pengetahuan yang telah ditemukan secara visual ditampilkan
kepada user.Tahap penting ini menggunakan teknik visualisasi untuk membantu
user dalam mengerti dan menginterpresentasikan hasil dari data mining.
Implementasi
(Penerapan)
Dalam bidang apa saja data mining dapat diterapkan? Berikut beberapa contoh bidang penerapan data mining:
Dalam bidang apa saja data mining dapat diterapkan? Berikut beberapa contoh bidang penerapan data mining:
·
Analisa pasar
dan manajemen.
Solusi yang dapat diselesaikan dengan data mining, diantaranya: Menembak target pasar, Melihat pola beli pemakai dari waktu ke waktu, Cross-Market analysis, Profil Customer, Identifikasi kebutuhan Customer, Menilai loyalitas Customer, Informasi Summary.
Solusi yang dapat diselesaikan dengan data mining, diantaranya: Menembak target pasar, Melihat pola beli pemakai dari waktu ke waktu, Cross-Market analysis, Profil Customer, Identifikasi kebutuhan Customer, Menilai loyalitas Customer, Informasi Summary.
·
Analisa
Perusahaan dan Manajemen resiko.
Solusi yang dapat diselesaikan dengan data mining, diantaranya: Perencanaan keuangan dan Evaluasi aset, Perencanaan sumber daya (Resource Planning), Persaingan (Competition).
Solusi yang dapat diselesaikan dengan data mining, diantaranya: Perencanaan keuangan dan Evaluasi aset, Perencanaan sumber daya (Resource Planning), Persaingan (Competition).
·
Telekomunikasi.
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual.
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual.
·
Keuangan.
Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry) .
Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry) .
·
Asuransi.
Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi .
Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi .
·
Olahraga.
IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim New York Knicks dan Miami Heat.
IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim New York Knicks dan Miami Heat.
·
Astronomi.
Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar Observatory berhasil menemukan 22 quasar dengan bantuan data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa.
Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar Observatory berhasil menemukan 22 quasar dengan bantuan data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa.
·
Internet Web
surf-aid
IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses halaman Web khususnya yang berkaitan dengan pemasaran guna melihat prilaku dan minat customer serta melihat ke- efektif-an pemasaran melalui Web.
Contoh kasus penerapan: Implementasi data mining dengan teknik Clustering untuk melakukanCompetitive Intelligence perusahaan.
Pembangunan perangkat lunak data mining dengan metode clustering menggunakan algoritma hirarki divisive untuk pengelompokan customer dalam studi kasus ini, fungsi – fungsi yang dipakai adalah fungsi untuk menentukan titik-titik pusat yang berguna sebagai pusat-pusat kelompok customer.
IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses halaman Web khususnya yang berkaitan dengan pemasaran guna melihat prilaku dan minat customer serta melihat ke- efektif-an pemasaran melalui Web.
Contoh kasus penerapan: Implementasi data mining dengan teknik Clustering untuk melakukanCompetitive Intelligence perusahaan.
Pembangunan perangkat lunak data mining dengan metode clustering menggunakan algoritma hirarki divisive untuk pengelompokan customer dalam studi kasus ini, fungsi – fungsi yang dipakai adalah fungsi untuk menentukan titik-titik pusat yang berguna sebagai pusat-pusat kelompok customer.
Daftar
Pustaka
Tugas Softskill: Arbi Pramana
Tidak ada komentar:
Posting Komentar