Metodologi

gambar

Ratusan legislasi diusulkan untuk menjadi UU setiap lima tahun sekali. Hanya sekitar sepuluh persen yang akan lolos. Legislasi mana yang perlu menjadi perhatian?. Peta Kebijakan mengkomputasikan prognosis setiap legislasi, yang merupakan kemungkinan lolos tidaknya legislasi. Komputasi ini dilakukan berdasarkan faktor-faktor yang menentukan sukses tidaknya legislasi pada periode sebelumnya.

Prognosis dilakukan dengan "melatih" model berdasarkan periode legislasi 2015-2019 sebagai dasar untuk menghitung probabilitas legislasi saat ini. Analisas ini dilakukan menggunakan metode Random Forest. Hasil prediksi Random Forest ini adalah nilai probabilitas untuk setiap faktor penentu lolos tidaknya legislasi. Untuk faktor faktor yang kami gunakan dalam prediksi, kami menggunakan beberapa faktor relevan seperti : sponsor, periode, penugasan, status proses, prioritas, pengusul, dan jumlah tahun prioritas. Sehingga didapatkan nilai presentase sebagai probabilitas nilai lolos tidaknya RUU.

Selain itu, Kami melakukan komputasi Document Similarity untuk menghitung tingkat kemiripan antar isi dokumen setiap RUU, kami menggunakan metode count vectorizer dan cosine similarity. Count Vectorizer adalah teknik yang digunakan untuk mengubah dokumen teks menjadi vektor numerik yang mewakili frekuensi kata dalam dokumen. Di sisi lain, cosine similarity adalah ukuran kesamaan antara dua vektor. Dalam konteks NLP, cosine similarity sering digunakan untuk menghitung kesamaan antara vektor dokumen yang diperoleh dari teknik sebelumnya. Dengan membandingkan cosine similarity antara pasangan vektor dokumen, didapatkan nilai seberapa mirip atau tidaknya masing-masing dokumen yang dalam hal ini adalah RUU.