17,5 Juta DPT Invalid dari Kacamata Data Science

by Kontributor Palontaraq | Jumat, Apr 12, 2019 | 50 views
File Data tak Wajar dalam DPT (foto: ist/palontaraq)

File Data tak Wajar dalam DPT (foto: ist/palontaraq)

 

Oleh:  DR. Ridho Rahmadi M.Sc, Pakar Data Science

 

Outliers atau data tidak wajar, sifatnya propagated. Sekali ada di data, maka hasil apapun dari data tersebut (analisis, dan lain-lain) menjadi bias, statistically less power, dan questionable.

Intentional Extreme Outliers:
• Extreme outliers adalah data yang sangat jauh berbeda dengan pola umum yang ada pada sebuah populasi
• 17.5 juta DPT Pemilu dengan tiga tanggal lahir 1 Juli, 31 Desember dan 1 Januari, adalah contoh extreme outliers, karena frekuensi yang kelewat tak lazim.
• Melihat pola 17.5 juta DPT tersebut, diindikasikan adanya intentional extreme outliers atau outliers yang disengaja.
• Dalam konteks DPT Pemilu, ketidaksiapan data tersebut seharusnya menjadi pertanyaan: seberapa legitimate DPT untuk menjadi hasil yang sah?
• Dalam data science, solusi untuk semacam outliers ini adalah satu: hapuskan!

Lihat juga: KPU Belum Bereskan Carut Marut DPT,  Pilpres 2019 Berpotensi Chaos

Data tak wajar

File Data tak wajar Berkode Khusus (sumber:  RidhoR/*ist)

Data tak wajar

Hitungan Statistik Jumlah wajar kelahiran pada tanggal 3 tersebut (sumber:  RidhoR/*ist)

Lihat juga: Pidana bagi Pelanggar Pemilu

Potensi Masalah Lain:

– Dalam teknologi informasi, data dapat dipanggil dengan query. Contoh sebuah query dalam sehari-hari adalah, ketika kita melakukan pencarian di Google.

– Google mengembalikan hasil pencarian, dengan puluhan atau ratusan halaman yang diranking, kurang dari 1 detik.

– Tahukah Anda, bahwa query yang kita kirim dari smartphone kita, sesungguhnya menempuh jarak yang jauh. Di US, rata-rata, sebuah query menempuh 2400 KM, pulang-pergi, dari kita menuju Google server, kembali ke smartphone kita dengan hasil pencarian.

– Bayangkan seberapa cepat 2400 KM hanya ditempuh sebuah query kurang dari 1 detik.

Data tak wajar

Contoh DPT tidak wajar yang ada dalam TPS dalam 1 TPS bisa ada sampai 200 orang lebih bertanggal lahir sama. (Sumber:  RidhoR/*BPN)

Potensi Masalah Lain:

– Dengan analogi yang sama, seorang hacker/intruder dapat masuk ke sistem KPU, dan melakukan query terhadap, umpama 9 jutaan DPT bertanggal lahir 1 Juli, dengan waktu kurang dari 1 detik.

– Setelah dilakukan query, kemudian DPT, yang sesungguhnya invalid, atau tidak ada, atau palsu, dapat kemudian diarahkan pada rekapitulasi TPS-TPS tertentu, dimanipulasi utuk memenangkan jumlah suara pasangan tertentu.

– Sudah amankah sistem KPU?Harian the Guardian mengatakan, puluhan serangan hacker tiap harinya mencobamasuk ke sistem KPU

– Sudahkah sistem KPU berstandar internasional seperti ISO 27001 yang menjadi keamanan data?

(*)

 

Like it? Share it!

Leave A Response