Data Mining Dalam Proses Kdd (Knowledge Data Discovery)

Data Mining Dalam Proses KDD (Knowledge Data Discovery)
Data Selection
Pada proses ini, seluruh data yang ada si data base dihimpun dan dipilih menjadi target data. Seleksi data ini dijalankan sebelum tahap penggalian isu yang lebih dalam. Data disimpan dalam berkas terpisah.
Pre-processing/ Cleaning
Proses pembersihan dari noise yang mengganggu data yang relevan. Proses cleaning mencakup pembuangan data yang dupliat, menyelidiki data yang inkonsisten, memeperbaiki kesalahan data seperti kesalahan cetak (tipografi). Dilakukan juga proses enrichmnent ialah memperbesar data ekternal yang mungkin mampu memperkaya isu yang berhubungan.
Transformation
Seluruh data yang tealh di perkaya dan dipilih mengalami perubahan (transformasi) sesuai kebutuhan pada proses data mining. Intinya, data diadaptasi biar mampu dimasak pada data mining.
Data mining
Pemilihan data yang berhubungan dengan kebutuhan. Pemilihan tersebut berisikan klasifikasi, regresi, clustering, dan lainnya. Proses penelusuran data yang menawan memakai sistem tertentu yang sesuai dengan tujuan dan proses KDD secara keseluruhan.
Interpretation/ Evaluation
Pola yang dihasilkan oleh data mining diterjemahkan sehingga lebih diketahui. Tahap ini akan mengusut apakah ada data yang berlawanan atau berbeda dengan hipotesa yang sudah dibentuk sebelumnya. 
Arsitektur Data Mining
1. Data cleaning: mencampakkan data yang tidak butuhatau noise
2. Data integration : menggabungkan data dari banyak sumber
3. Data Mining Engine : Mentranformasikan data semoga mampu diolah oleh data mining
4. Pattern evaluation : untuk menemukan data yang bernilai lewat knowledge base.
5. Graphical User Interface (GUI) : untuk end user.
Kelebihan dan Kekurangan Data Mining
Kelebihan: 
  • Tidak perlu lagi jasa dalam memeriksa data perusahaan dengan cara manual sebab sudah ada perabotan lunak data mining yang bisa memprediksi target ke depan.
  • Meminimalkan ongkos riset.
  • Meminimalkan kemungkinan kerugian ke depannya.
  • Khususnya bagi penjualan interaktif, para pelaku bisnis yangv gres ingin membuat web, data mining membantu untuk penyusunan konten. Hal ini mampu menciptakan web perusahaan menjadi lebih efektif.
Kelemahan: 
Data perusahaan yang tidak lengkap menciptakan tata cara data mining kurang akurat, terlebih bila data tersebut penting dan berkaitan, kalangan data yang tidak konsisten bisa menciptakan data susah teranalisa. Misalnya: data customer tidak di update, sehingga customer yang tidak loyal masih masuk dalam customer tetap. 
Penggunaan Data Mining
  • Perusahaan kartu kredit mampu memanfaatkan data transaksi konsumen-pelanggannya untuk merancang produk kredit gres yang hendak menarik minat para customer tersebut.
  • Perusahaan produk makanan atau keperluan keseharian mampu memakai data mining untuk memajukan pemasaran produk ke retailer. Dengan melihat data customer, pengiriman, competitor, kita bisa menganalisis sebab mengapa customer berpindah ke produk yang lain dan bisa menyususn seni manajemen penjualan gres yang lebih efektif.
  • Perusahaan farmasi bisa menyaksikan kegiatan pemasaran terkininya dan menargetkan produk apa yang kedepannya mampu lebih berkembang atau laku dipasaran.
AKAMAI
  • Merupakan penyuplaijasa akselerasi konten dan aktivitas bisnis online ternama.
  • Dipercaya oleh lebih dari 2.000 organisasi untuk menjadikan Internet sebagai daerah yang aman dan dapat mengemban amanah bagi mereka untuk membuka usaha.
  • Memiliki platform global dengan ribuan server yang dilengkapi khusus untuk menolong Internet semoga bertahan dari seruan konten interaktif, transaksi, dan aplikasi harian yang berlebihan.
  • Menyediakan jasa kepada pelanggan tanpa perlu membangun atau memasang infrastruktur.
Sebagai profesional yang ingin meningkatkan penampilan dan reliabilitas Website, konten, dan aplikasi Anda, maka Akamai merupakan rekan kerja yang sempurna. Akamai mendeteksi dan menghindari duduk perkara dan kekurangan Internet yang sering muncul untuk memutuskan Website tampil secara optimal, pengunduhan media dan piranti lunak tanpa hambatan, and aplikasi tampil konstan.
Cakupan Pasar
• Jasa Keuangan
Melindungi dan melaksanakan transaksi untuk Charles Schwab, E*TRADE, Morgan Stanley dan institusi terkemuka yang lain. 
• Permainan
Melakukan penyampaian konten permainan untuk konsol mirip Nintendo, dan membantu banyak perusahaan lain untuk berjumpa gamer. 
• Hotel dan Usaha Perjalanan
Menangani penyewaan online untuk hotel dan travel terbesar di dunia mirip Expedia, Marriott, dan Travelocity. 
• Manufaktur dan Otomotif
Dipercaya oleh seluruh usahawan otomotif teratas – Toyota, GM, Audi, BMW, dan lainnya. 
• Media dan Hiburan
Menyediakan konten untuk lima dari enam situs musik online, 29 dari 30 perusahaan media atau hiburan.
• Sektor Publik
Melakukan operasi online untuk sepuluh dari pemerintahan di seluruh dunia, seluruh cabang milliter AS, dan banyak organisasi yang lain.
• Retail dan Barang Konsumsi
Memungkinkan $100 juta pendapatan tahunan e-commerce, digunakan oleh lebih dari 85% retailer online ternama. 
• Piranti Lunak dan Teknologi
Digunakan oleh lima besar perusahaan anti-virus untuk menyalurkan piranti lunak secara online.
Infrastruktur Akamai
Cara Kerja
Secara singkat, server Akamai akan mengambil dan menyalin konten dari klien untuk lalu disampaikan terhadap pengguna akhir. Klien Akamai tidak butuhmembangun infrastruktur karena Akamai telah membangun sejumlah server di region dunia. Dengan menggunakan server Akamai, penyaluran konten kepada pengguna akhir akan lebih cepat dan akurat.
Teknologi Akamai
EdgePlatform ialah salah satu platform komputerisasi distribusi paling besar di dunia. Jaringan EdgePlatform mempunyai lebih dari 48,000 server yang kondusif yang dilengkapi oleh perabotan lunak yang tepat dan dipasang di 70 negara, berdasar pada matematika terapan dan algoritma, untuk memecahkan dilema keunggulan muatan dan kekurangan Internet.
Pendekatan EdgePlatform
Memotong Jalur Panjang
Server-server EdgePlatform ini diposisikan di kurang lebih 1,000 jaringan dunia yang mengawasi Internet setiap saat. Akamai menyalin lalu menyampaikan konten dan aplikasi dari server terdekat ke pengguna tamat di seluruh dunia.
Optimalisasi Jalur
Akamai memetakan keseluruhan jalur Internet untuk menghindari titik dilema, kompresi konten, dan menyalin paket data agar penyampaian aplikasi lebih cepat, lebih konstan, serta lebih kondusif. 
Server Akamai
  • Tokyo: Vectant dan NTT Communications
  • Beijing: ChinaNetCenter Co Ltd
  • New York: Cable & Wireless
  • Boston: Akamai Technologies Assets
  • Hong Kong: iAdvantage
  • Singapore: EyeBlaster Ltd
  • Paris: France Telecom Long Distance
  • Malaysia: Telekom Malaysia Berhad
  • Amsterdam: Global Switch
  • Sydney: Telstra BigPond Australia dan Equinix
  Pemahaman Penokohan
GOOGLE ANALYTICS
Google Analytic ialah sebuah layanan gratis dari google.com yang menghidangkan informasi mengenai hadirin dari sebuah website. Google Analytics ialah solusi analisis web tingkat perusahaan yang memperlihatkan isu secara rinci ihwal kunjungan situs web dan keefektifan pemasaran. Kini, fitur yang kuat, luwes, serta mudah dipakai membuat Anda dapat menyaksikan dan menganalisis data kunjungan dengan cara gres. Dengan Google Analytics, Anda dapat membuat iklan bertarget yang lebih baik, memperkuat prakarsa penjualan dan menciptakan situs web konversi yang lebih tinggi. Google Analytic merupakan salah satu aplikasi yang menyajikan berita hasil web usage mining yang memakai teknik page tags.
Semua gosip tersebut disajikan dalam laporan visual yang mudah dibaca, lengkap, dan intuitif. Google Analytics tidak akan mengusik performa atau penampilan situs Web dan tidak ada file aksesori yang harus di-host di situs Web. Dengan informasi dari Google Analytics, pengguna mampu mengarahkan kemudian lintas ke situs secara lebih efisien dan mengkonversikan lalu lintas tersebut secara lebih efektif.
Dengan menggunakan google analytic, para pemilik website mampu menerima berita detail tentang hadirin, disamping itu juga dapat mengetahui jumlah pengunjung perbulan, perhari serta jam-jam tertentu, serta jumlah pengunjung dari masing-masing negara atau kota, dan juga kita dapat mengenali statistik jumlah hadirin tiap halaman yang ada. Nah, dengan menggunakan Google Analytics ini, jumlah kunjungan ke blog atau situs web kita akan ditampilkan, lengkap dengan detail-detail lainnya, seperti jumlah halaman yang dibuka visitor, judul yang paling disenangi visitor, asal negara visitor, dan lain-lain.
Google Analytics mengumumkan ihwal cara pengunjung mendapatkan dan berinteraksi dengan situs. Pengguna mampu membandingkan sikap dan laba pengunjung yang diarahkan dari setiap iklan, kata kunci, mesin telusur, dan email, serta menerima pengertian yang berharga tentang cara menyempurnakan konten dan rancangan situs. Apapun ukuran situs dan bagaimanapun pengguna mengarahkan kemudian lintas ke situs tersebut – dengan pencarian gratis, situs mitra, AdWords, atau program ongkos per klik lainnya – Google Analytics akan melacaknya, dari klik hingga konversi.
Semua gosip tersebut dihidangkan dalam laporan visual yang gampang dibaca, lengkap, dan intuitif. Google Analytics tidak akan mengusik tampilan atau penampilan situs Web dan tidak ada file tambahan yang mesti di-host di situs Web.
Dengan gosip dari Google Analytics, pengguna dapat mengarahkan kemudian lintas ke situs secara lebih efisien dan mengkonversikan lalu lintas tersebut secara lebih efektif.
Cara Kerja
Cara kerja dan penggunaan Google Analytics sangatlah mudah. Cukup dengan menyisipkan arahan Javascript yang telah ditawarkan sesudah anda menjadi anggota pengguna Google Analytics maka semua statistik halaman web yang telah disisipkan arahan tersebut akan diproses oleh Google. Layanan ini memberi akomodasi dan dispensasi kerja bagi webmaster atau pemilik situs.\
Google Analytics memakai cookie dan isyarat JavaScript untuk menghimpun berita ihwal pangunjung dan melacak data. Google Analytics secara anonim melacak interaksi hadirin dengan situs Web, termasuk asal mereka, acara mereka di situs, dan apakah mereka menyelesaikan tujuan konversi situs. Analytics juga melacak data e-commerce dan menggabungkannya dengan info dan konversi untuk menawarkan pengertian perihal performa iklan.
Caranya:
1. Login ke Google, bisa juga pake account email @gmail.com
2. Lalu ke: www.google.com/analytics
3. Daftar disana, dan ikuti semua langkah-langkah yang ada, nanti dikasih arahan.
Contoh Kodenya:
Catatan: Kode yang diberikan sbg contoh diatas JANGAN di copy paste.
Gunakan HANYA instruksi yang diberikan oleh Google Analytics. Nantinya arahan yang diberikan akan berlawanan di yang saya kasih bold dikode.
4. Copy paste keseluruhan instruksi tersebut ke Blogspot.
5. Lokasi ngopi-nya: Dashboard -> Layout -> Edit HTML
6. Pada bagian “Edit Template”, scroll sampai paling bawah kolom arahan-instruksi tsb.
Cari:
7. Tambahkan (copy paste) instruksi dari Google Analytics tersebut persis diatas/diantara:
8. Lalu “Save Template”.
9. Di akun google analyticsnya di save juga pas habis final pasang aba-aba. Tunggu 24 jam sesudah instruksi terpasang, baru akan dihitung pengunjungnya.
Catatan: Jika mengubah Theme, seluruh widget yang terpasang akan hilang. Makara harus dipasang kembali. Caranya:
1. Masuk ke google analytics,
2. Klik “edit” pada alamat situs web.
3. Klik “check status” dibagian atas.
4. Copy kembali seluruh kodenya, dan diletakkan ditempat yang sama mirip langkah2 diatas.
Phishing, Apa dan Bagaimana Cara Kerjanya?
Dalam ruang lingkup computer security, phishing yakni salah bentuk kejahatan elektro dalam bentuk penipuan. Dimana proses phishing ini berniat untuk menangkap isu yang sangat sensitif seperti username, password dan detil kartu kredit dalam bentuk menyaru sebagai sebuah entitas yang dapat diandalkan/ legitimate organization dan lazimnya berkomunikasi secara elektronik.
Komunikasi yang digunakan ini mulai dalam bentuk web site social yang sungguh popular di mata penduduk , site-site auction/ lelang, pengolah transaksi online payment atau dalam bentuk lain yang lazimnya user memakai site tersebut untuk kepentingan manajemen, mirip email site, site jejaring public, dan yang lain. Bentuk phishing lainnya ialah mengirimkan email official dan instant messaging terhadap user yang lazimnya menggunakan site-site legitimate dan site-site nama besar perusahaan yang diketahui penduduk dilengkapi dengan logo perusahaan, header email official sampai dengan cap dan tanda tangan salah satu pimpinan perusahaan tersebut. 
Cukup menakjubkan untuk mempengaruhi user, tujuan dari phishing ini bermacam-macam:
  • Pertama, cuma untuk menangkap user account dan password, bertujuan untuk eksploitasi data user dan direktur. 
  • Kedua, memperlihatkan ajuan investasi imitasi, bermaksud untuk membohongi.
  • Tiga, bisa saja memberikan berita sesat kepada user, yang bertujuan untuk melakukan justifikasi buruk terhadap perusahaan lain (black campaign). Teknik yang terakhir ini mampu dibilang social engineering, sebuah teknik yang jarang dijalankan oleh hacker tetapi sungguh ampuh untuk membuat opini jelek terhadap perusahaan pesaingnya.
  Perabotan –Piranti Metode Mikroprosessor
Teknik phishing pertama kali disampaikan dalam pelatihan TI di sebuah lembaga internasional di US oleh International HP group Interex pada tahun 1987. Istilah phisTeknik phishing pertama kali disampaikan dalam seminar TI di suatu lembaga internasional di US oleh International HP group Interex pada tahun 1987. Istilah phishing pertama kali dibukukan dan dicatat pada 2 Januari tahun 1996 oleh AOL Usenet newsgroup. Istilah lain dari phishing yaitu phreaking, istilah ini dipakai untuk menangkap info-gosip yang berjenis financial, namun tidak begitu popular dikalangan hacker.
Berbagai Teknik Phishing
1. Social Engineering, penduduk mempunyai sebuah reaksi kepada kejadian-kejadian penting, teknik ini sungguh ampuh dipakai oleh hacker untuk menangkap isu-informasi penting tanpa usaha yang rumit, seperti mengirimkan header email “Bantulah Rakyat Aceh yang tertimpa Tsunami, kirimkan info anda selaku volunteer”, header email lain yang menyentuh “Bantulah Korban Bencana Alam Situ Gintung, kirimkan secuil harta anda kepada mereka”, dan yang lain.
2. Manipulasi Link, teknik ini adalah menyesatkan user dengan mengklik salah satu URL yang ada di email legimate yang diantarkan oleh hacker, seluruh email isinya orisinil dari perusahaan yang mengirimkannya, namun ada salah satu link yang dibelokkan oleh hacker yang hendak menuju ke server lain yang bukan server sesungguhnya (unlegitimate server). Nah, isu user akan tertangkap oleh server artifisial tersebut.
3. Filter Evasion, seorang ahli phisher/hacker akan menggunakan teknik ini untuk menyingkir dari jeratan/filter phishing, lazimnya akan menempelkan image untuk phishing, sehingga filter phishing yang dibuat oleh developer tidak dapat mengenali adanya phishing atau tidak.
4. Website Forgery, seorang user sebagai korban yang mengunjungi situs web phishing tidak dapat mengenali secara pasti, apakah situs web tersebut asli atau imitasi, karena website akan dibuat sedemikian rupa sama dengan aslinya. Mungkin Anda masih ingat masalah website artifisial clickbca.com atau kilkbca.com yang digunakan untuk menangkap username dan password user yang salah ketik ke situs tersebut. 
Sekarang telah lebih aman karena dilengkapi token untuk filtering transaksi e-banking. Teknik ini sungguh ampuh dan sudah usang dipakai oleh hacker untuk mengelabui user. Teknik ini populer dengan sebutan Man-in-the middle.
5. Phone Phishing, tidak semua serangan phishing memakai situs web imitasi. Seringkali hacker menggunakan media lain yang dipakai untuk phishing. Model phone phishing digunakan para hacker untuk mengelabui para user, umumnya mengantarkan email yang berlogo asli bank yang dipakai oleh user. 
Dengan memakai beberapa kalimat official, hacker beralasan melakukan maintenance atau memajukan keamanan account bank user, si user dipersilahkan memasukkan kembali username dan password internet banking atau account banking, lalu disertakan nomor telpon administrator atau customer service sebagai heldesk dilema ini. Tetapi semua fasilitasi ini yaitu palsu, dengan keinginan user tidak sadar tertipu dan semua gosip rahasia bahkan mentransfer sejumlah dana terhadap para phone phishing tersebut.
6. Teknik phone phishing yang lain ialah menempelkan script kecil ke situs-situs banking yang legitimate. Bila user tidak teliti maka user akan terkena jebakan yang akan menggiring user tersebut ke suatu situs palsu namun official. Situs ini bisa dikatakan aspal, karena user tidak menyadari sedang mengakses situs artifisial di dalam situs orisinil.
*) Penulis yakni IGN Mantra, Analis Senior Keamanan Jaringan dan Pemantau Trafik Internet ID-SIRTII sekaligus Dosen Keamanan Jaringan dan Cybercrime, dapat dihubungi di email: mantra@idsirtii.or.id.
Cara Mengatasi Phishing
Phishing filter mampu diinstal pada komputer pengguna untuk membantu menangkal serangan phishing terjadi. Filter tersebut bekerja dengan cara mengetahui mana yang merupakan email sah dan yang mana yang tidak. 
Semua filter ini bekerja dengan menawarkan real-time pertolongan kepada segala jenis penipuan phishing karena mereka mampu mengetahui situs-situs imitasi ketika seseorang memakai Internet. Beberapa perusahaan seperti Microsoft telah mempunyai penyaring yang diinstal ke dalam browser Internet. Anda mungkin perlu mengunduh versi terbaru dari browser untuk memperolehnya.
Filter yang diinstal ke browser Internet sekali dihidupkan akan pribadi memindai setiap website yang dilihat. Kemudian mereka akan menyaksikan lebih dekat karakteristik tertentu setiap situs dan mereka akan dapat melakukan kenali situs-situs yang benar dan mana yang penipuan. Begitu mereka mengidentifikasi orang-orang yang phising, kemudian mereka akan mem-blok aksesnya.
Pada perkara Citibank, untuk menanggulangi phishing Citibank mampu berbelanja domain web site palsu ketika era berlakunya telah habis untuk lalu dialihkan ke web site resmi Citibank.