ABSTRAK
Nama : Shandy Darma
Program Studi : Ilmu Komputer
Judul : Normalisasi Teks Twitter Bahasa Indonesia dengan Metode
Berbasis Word Embedding, Bipartite Graph Random Walk, dan
Binary Classifier
Data dari Twitter, jika digunakan untuk penelitian pengolahan bahasa manusia,
akan memberikan hasil yang kurang akurat. Oleh karena itu, perlu dilakukan
normalisasi teks pada data Twitter sebelum digunakan untuk penelitian. Berbagai
metode dapat dilakukan untuk normalisasi teks. Metode yang digunakan yaitu
metode berbasis word embedding, metode bipartite graph random walk, dan
metode berbasis binary classifier. Hasil penelitian menunjukkan bahwa metode
word embedding memberikan hasil F1-score 0,721 dan accuracy 0,731, metode
bipartite graph random walk memberikan hasil F1-score 0,004 dan accuracy 0,526,
serta metode binary classifier memberikan hasil F1-score 0,752 dan accuracy
0,857.
Kata Kunci:
Text normalization, Twitter, random walk, word embedding, binary classifier,
features engineering
|
|