ABSTRAK
ABSTRAK
Nama : Rini Jannati
Pogram studi : Ilmu Komputer
Judul : Perbandingan Penggunaan Metode Machine Learning dan Deep
Learning, Word Embedding dan Feature Engineering Pada
Pendeteksian Berita Palsu
Pembimbing : Dra. Mirna Adriani, Ph.D.
Pengaruh sosial media dan media online mendukung penyebaran berita secara cepat.
Namun, penyebaran berita ini tidak digunakan secara baik sehingga terjadi penyebaran
berita yang tidak sesuai dengan fakta yang dapat merugikan sebagian orang atau
kelompok yang menjadi target. Oleh karena itu, dibutuhkan suatu cara untuk menghindari
dan membuat solusi dari masalah penyebaran berita palsu. Berita palsu ini marak terjadi
pada acara politik seperti pemilihan presiden. Oleh karena itu, penelitian ini
menggunakan dataset LIAR yang berisikan informasi pemilihan presiden US pada tahun
2016. Penelitian ini berisikan teks pernyataan pendek dan data-data lainnya yang
kemungkinan berpengaruh pada hasil yang ingin dilakukan, misalnya data justifikasi
pernyataan. Dataset ini dilakukan klasifikasi dengan menggunakan machine learning dan
deep learning. Metode machine learning yang digunakan adalah naïve bayes, logistic
regression dan adaboost sedangkan deep learning akan menggunakan Bidirectional
Gated Recurrent Unit (Bi-GRU) dengan menambahkan attention mechanism. Penelitian
pada deep learning membutuhkan word embedding sehingga pada word embedding diuji
adalah Word2Vec, GloVe dan Fasttext. Pada penelitian ini juga dibangun word2vec dari
data sendiri. Teks juga diproses untuk mendapatkan fitur yang digunakan sebagai input
ke model seperti Part of Speech, Depedency Parsing dan Name Entity Recognition. Hasil
eksperimen menunjukkan bahwa metode Bi-GRU dengan Attention Mechanism dengan
menggunakan word embedding GloVe dan kombinasi pernyataan (ST), justifikasi
pernyataan (JS), credit history (CH), Meta, POS dan DEP mendapatkan hasil terbaik
sebesar 56.12% dengan nilai precision, recall dan f1-score sebesar 58.04%, 56.41%, dan
56.95%.
Kata Kunci: berita palsu, machine learning, deep learning, word embedding
|