Data Mining

A. Pengertian
  • Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali teladan yang penting atau menawan dari data yang terdapat pada basis data.
  • Datamining khususnya digunakan untuk mencari pengetahuan yang terdapat dalam basis data yang besar sehingga sering disebut Knowledge Discovery Databases (KDD).
  • Data Mining yaitu serangkaian proses untuk menggali nilai tambah berupa isu yang selama ini tidak dimengerti secara manual dari suatu basis data.
B. Latar Belakang
  • Dilatar belakangi dengan kondisi berlimpahnya data (overload data) dan Ledakan berita (explotion information) yang dialami oleh perusahaan, institusi atau organisasi.
  • Berlimpahnya data merupakan akumulasi dari datra transaksi yang terekam bertahun-tahun.
  • Data transaksi tersebut lazimnya menggunakan aplikasi OLTP (On-Line transaction Processing)
C. Manfaat
  • Pemanfaatan data mining dilihat dari dua sudut pandang, adalah sudut pandang komersial dan sudut pandang keilmuan.
  • Dari sudut pandang komersial, pemanfaatan datamining mampu dipakai untuk menanggulangi meledaknya volume data, dengan menggunakan teknik komputasi mampu dipakai untuk menciptakan info-informasi  yang diharapkan  yang merupakan asset yang mampu meningkatkan daya saing suatu institusi.
Contohnya:
  1. bagamana mengenali hilangnya pelanggan alasannya adalah pesaing
  2. Bagaimana mengetahui item produk atau konsumen yang memiliki kesamaan karakteristik
  3. Bagaimana mengidentifikasi produk-produk yang terjual bersama-sama dengan produk lain
  4. bagaimana memprediksi tingkat penjualan
  5. Bagaimana menganggap tingkat resiko dalam memilih jumlah buatan sebuah item
  6. Bagaimana mempresiksi perilaku bisnis dimasa yang akan dating

·         Dari sudut pandang keilmuan, data mining dapat digunakan untuk mengcapture, menganalisis serta menyimpan data yang bersifat real time dan sangat besar, misalnya:
1.      Remote semsor yang diposisikan pada suatu satelit
2.      Telescope yang dipakai untuk memindai langit
3.      Simulasi saintifik yang membangkitkan data dalam ukuran terrabytes



D.Proses
  • Data mining ialah salah satu dari rangkaian Knowledge Discovery in Database(KDD). KDD berafiliasi dengan teknik integrasi dan inovasi ilmiah, interpretasi dan visualisasi dari contoh-pola sejumlah data.
  • Serangkaian proses tersebut mempunyai tahap sbb (Tan, 2004):

1.      Pembersihan data dan integritas data (Cleaning & Integration)
Proses ini digunakan untuk mencampakkan data yang tidak konsisten dan bersifat noise dari data yang terdapat di aneka macam basisdata yang mungkin berlawanan format maupun platform yang lalu dinintegrasikan dalam satu database datawarehouse
2.      Seleksi dan transformasi data (selection and transformation)
Data yang ada dalam database datawarehouse kemudian direduksi untuk menerima hasil yang akurat. Beberapa cara seleksi, antara lain:
Ø  Sampling, adalah seleksi subset representative dari populasi data yang besar
Ø  Denoising, adalah proses menghilangkan noise dari data yang mau ditranformasikan
Ø  Feature extraction, yaitu proses membuka spesifikasi data yang signifikan dalam konteks tertentu.
Transformasi data diperlukan sebagai tahap pre-procecing, dimana data yang siap untuk ditambang. Beberapa cara transformasi, antara lain (Santosa, 2007):
Ø  Centering, meminimalkan setiap data dengan rata-rata setiap atribut yang ada
Ø  Normalisation, membagi setiap data yang dicentering dengan persyaratan deviasi dari atribut yang bersangkutan
Ø  Scaling, mengubah data sehingga berada dalam skala tertentu
3.      Penambangan data (data mining)
Data yang telah ditransformasi, kemudian ditambang dengan banyak sekali teknik. Proses data mining yaitu proses mencari teladan atau berita mempesona dalam data terpilih dengan menggunkan fungsi-fungsi tertentu. Fungsi atau algoritma dalam data mining sungguh bervariasi, dimana pemilihannya bergantung pada tujuan dan proses pencarian wawasan secara menyeluruh.
4.      Evaluasi teladan dan penyajian wawasan
Tahap ini merupakan bab dari proses pencarian pengetahuan yang mencakup investigasi apakah teladan atau isu yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Langkah terakhir KDD adalah mempresentasikan pengetahuan dalam bentuk yang gampang diketahui pengguna.
E. Fungsi-Fungsi
  • Fungsi-fungsi yang biasa diterapkan dalam data mining (Haskett, 2000)
  1. Assosiation, adalah proses untuk menemukan aturan assosiatif antara suatu variasi item dalam sebuah waktu
  2. Sequence, proses untuk mendapatkan hukum assosiatif antara suatu kombinasi item dalam sebuah waktu dan dipraktekkan lebih dari satu era
  3. Clustering, adalah proses pengelompokan seumlah data/obyek ke dalam kelompok data sehingga setiap kalangan berisi data yang mirip
  4. Classification, proses penemuan versi atau fungsi yang menjelaskan atau membedakan rancangan atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak dikenali.
  5. Regretion, yaitu proses pemetaan data dalam suatu nilai prediksi
  6. Forecasting, yaitu proses pengestimasian nilai prediksi menurut pola-acuan di dalam sekumpulan data.
  7. Solution, yakni proses penemuan akar masalah dan persoalan solving dari problem bisnis yang dihadapkai atau paling tidak sebagai berita dalam pengambilan keputusan.
  Metode Elektronik Recam Medik

G. Disiplin ilmu dan teknik-teknik
·         Data mining dalam penerapannya memadukan berbagai bidang ilmu, antara lain: Sistem basis data, statistic, sistem pandai, pembelajaran mesin, pengenalan pola, dan visualisasi
·         Contoh aplikasi beserta fungsi dan teknik yang dipergunakan

F. Penerapan
  1. Analisa Pasar & Manajemen
Sumber data yang digunakan seperti transaksi kartu kredit, kartu anggota club tertentu, kupon diskon, ganjalan pembeli, ditambah dengan studi tentang gaya hidup public.
Beberapa solusi yang mampu diatasi dengan data mining antara lain:
    • Menembak target pasar
Data mining dapat melakukan pengelompokan(clustering) dari versi-versi pembeli dan melaksanakan pembagian terstruktur mengenai terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kedukaan yang sma, tingkat penghasilan yang serupa, kebiasaan membeli dan karakteristik yang lain.
    • Melihat teladan beli pemakai dari waktu ke waktu
Data mining mampu dipakai untuk menyaksikan acuan beli dari waktu ke waktu. Sebagai pola, saat seorang menikah bias saja beliau kemudian memutuskan untuk pidah dari single account ke joint account.
    • Cross Market Analysis
Kita mampu memanfaatkan untuk menyaksikan hubungan antara pemasaran satu produk dengan produk yang lain.
    • Profil Customer
Data mining mampu menyaksikan profil customer sehingga dapat mengenali golongan customer tertentu suka berbelanja produk apa saja.
    • Identifikasi keperluan customer
Dapat mengidentifikasi produk apa saja yang terbaik untuk tiap kelompok customer dan factor apa saja yang dapat mempesona konsumen baru.
    • Menilai Loyalitas Customer
    • Informasi Summary
Dapat dipakai untuk membuat laporan summary yang bersifat multi dimensi dan dilengkai dengan gosip statistic yang lain.
  1. Analisa Perusahaan dan Manajemen Resiko
  • Perencanaan Keuangan dan Evaluasi AsetData mining mampu membantu melaksanakan analisi dan prediksi cash flow serta mampu melaksanakan contingent claim analysis untuk memeriksa aset. Selain itu mampu menggunakan untuk analisis demam isu.
  • Perencanaan Sumber DayaDengan menyaksikan ringkasan informasi serta pola pembelanjaan dan pemasukan dari masing-masing resource. Maka mampu memanfaatkan untuk resouce rencana.
  • PersainganData mining dapat membantu untuk memonitor pesaing-pesaing dengan melihat market direction mereka.
  • Data mining juga mampu melakukan pengelompokan customer dan mampu memperlihatkan variasi harga untuk masing-masing grup.
  Teladan Penutup Makalah

  1. Telekomunikasi

Data mining melihat jutaan transaksi yang masuk, dan menyaksikan transaksi mana sajakah yang masih harus ditangani secara manual. Tujuannya yakni untuk menambah layanan otomatis.