Marcus Groß ingin menunjukkan apa yang mungkin terjadi dengan data besar: Untuk pemilu musim gugur, ia mengembangkan model yang memungkinkan prediksi hasil pemilu.
Ini bukan masa yang mudah bagi lembaga survei. Lembaga-lembaga pemungutan suara sering kali salah dalam memberikan pernyataannya mengenai pemilu mendatang. Contoh paling mencolok: keberhasilan Donald Trump dalam pemilihan presiden AS, yang hampir tidak dapat diprediksi oleh para ahli.
Nate Silver yang sangat kutu buku, yang meramalkan pemenang sebenarnya untuk masing-masing dari 50 negara bagian pada tahun 2012, juga memberi Hillary Clinton peluang 71 persen untuk memenangkan pemungutan suara sesaat sebelum pemilu. Prediksi lainnya bahkan lebih jauh dari hasilnya: The Waktu New York Peluang Clinton terlihat sebesar 85 persen Pos Huffington pada 98 persen.
Tapi: Nilai-nilai ini adalah probabilitas. Sulit bagi banyak orang untuk memahaminya, namun probabilitas 71 persen dari satu hasil juga berarti bahwa hasil lainnya akan terjadi pada satu dari tiga kasus.
Nate Silver juga eksotik bagi kami orang Jerman karena kedisiplinannya – dalam memprediksi hasil pemilu – praktis tidak ada di negara ini. Terdapat sejumlah lembaga pemungutan suara yang sangat dihormati seperti Forsa, Allensbach and Co., namun ketika menyangkut pemilu mendatang, para lembaga survei ini fokus pada pertanyaan yang disebut pertanyaan hari Minggu: Partai mana yang akan Anda pilih jika ada pemilu federal berikutnya. Minggu ? Hal ini mencerminkan suasana politik saat ini dengan baik, namun jika menyangkut hasil pemilu yang tidak akan berlangsung dalam beberapa bulan, survei tersebut tidak terlalu berarti. (Meskipun banyak media sering menggambarkannya seolah-olah memang demikian.)
Marcus Groß ingin mengisi kesenjangan di pasar prediksi politik. Ahli statistik muda, yang bekerja di sebuah lembaga analisis big data kecil yang berbasis di Berlin, telah menciptakan apa yang menurutnya merupakan model pertama pemilu federal Jerman, yang menggabungkan survei terkini dan historis serta hasil pemilu aktual dan juga memberi bobot berdasarkan seberapa akurat masing-masing lembaga selama ini sudah memperkirakan hasil pemilu dan berulang kali melebih-lebihkan atau meremehkan partai tertentu. “Kami melangkah lebih tinggi dari lembaga rekaman, ke tingkat meta,” jelas Groß dalam sebuah wawancara dengan Gründerszene. “Kami memperoleh teorema baru yang sejauh ini belum mampu dilakukan oleh institut tersebut.”
Di Blog Statistik INWT majikannya Groß menjelaskan pendekatannya dan metodologi di baliknya secara rinci. Dan mulai saat ini dia akan memberikan prediksinya seminggu sekali, setiap hari Senin. Saat ini, hal tersebut cukup mengejutkan: Uni Eropa kemungkinan besar akan memperoleh 35 persen, sedangkan SPD hanya 28 persen setelah efek Schulz tampaknya menghilang. Partai terkuat ketiga adalah Partai Hijau, sedangkan FDP nyaris tidak bisa masuk ke Bundestag. AfD akan mendapat sembilan persen – meskipun dalam kasus ini databasenya mungkin yang paling lemah, karena modelnya sebagian besar didasarkan pada nilai-nilai masa lalu dan AfD baru berpartisipasi dalam pemilihan federal untuk kedua kalinya.
Model tersebut melihat probabilitas setidaknya sebesar 32,5 persen untuk mayoritas merah-merah-hijau, dan 28,5 persen untuk mayoritas kulit hitam-hijau. Dalam keadaan seperti ini, Angela Merkel mempunyai peluang 66,9 persen untuk tetap menjadi kanselir – dan Martin Schulz, secara logis, hanya berpeluang 33,1 persen untuk memenangkan jabatan kanselir.
Groß menguji model penghitungannya pada pemilu sebelumnya, dan hasilnya: prediksi tersebut sebelas persen lebih akurat dibandingkan prediksi terakhir lembaga survei tradisional. Hal ini menimbulkan pertanyaan: Mengapa hal seperti ini belum ada? Penjelasan Groß, yang mungkin juga dianut oleh banyak pemikir digital: “Orang Jerman tidak begitu paham tentang data besar.” Dan: “Ini rumit untuk diterapkan.”
Faktanya, ada proyek lain yang setidaknya mengumumkan bahwa mereka akan “menggunakan model statistik (…) untuk mengembangkan perkiraan pemilu yang tertimbang di seluruh lembaga dan faktor lainnya.” Tim ini didukung oleh Media Innovation Center Babelsberg Sinyal dan kebisingan Namun, hal itu masih belum dimulai. Di antara tawaran yang ada, lembaga riset opini bisa mendekati Pollytix terdekat, yang menghitung tren dari survei 20 hari terakhir.
Jelas bahwa Groß dapat menciptakan model yang baik dan layak: ia belajar statistik di Munich dan Berlin, meraih gelar PhD dalam model kesalahan pengukuran spasial, dan sekarang menjadi pakar statistik Bayesian di INWT. Dia mulai mengerjakan sisi perkiraan pemilu, sebagai “proyek yang menyenangkan”, katanya.
Tentu saja, perusahaannya masih mendapatkan keuntungan: semuanya bisa menjadi iklan yang sangat bagus untuk INWT. Perusahaan yang memiliki sebelas karyawan ini merupakan spin-off dari Free University of Berlin dan membantu klien seperti Zalando dan Otto menganalisis data dalam jumlah besar.
Bagaimanapun, proyek Groß menunjukkan apa yang mungkin terjadi dengan data besar – terlepas dari apakah prediksinya akan mendekati hasil pemilu atau tidak. Satu hal yang sudah jelas: Marcus Groß ingin mengkritik manuver yang dilakukan setelahnya. Dan menganalisis mana model yang sudah baik dan mana yang masih perlu ditingkatkan.