Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-1666 (Softcopy SK-1148) Source Code Sk-666
Collection Type Skripsi
Title Normalisasi Teks Twitter Bahasa Indonesia dengan Metode Berbasis Word Embedding, Bipartite Graph Random Walk, dan Binary Classifier
Author Shandy Darma;
Publisher Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-1666 (Softcopy SK-1148) Source Code Sk-666 TERSEDIA
Tidak ada review pada koleksi ini: 46459
ABSTRAK Nama : Shandy Darma Program Studi : Ilmu Komputer Judul : Normalisasi Teks Twitter Bahasa Indonesia dengan Metode Berbasis Word Embedding, Bipartite Graph Random Walk, dan Binary Classifier Data dari Twitter, jika digunakan untuk penelitian pengolahan bahasa manusia, akan memberikan hasil yang kurang akurat. Oleh karena itu, perlu dilakukan normalisasi teks pada data Twitter sebelum digunakan untuk penelitian. Berbagai metode dapat dilakukan untuk normalisasi teks. Metode yang digunakan yaitu metode berbasis word embedding, metode bipartite graph random walk, dan metode berbasis binary classifier. Hasil penelitian menunjukkan bahwa metode word embedding memberikan hasil F1-score 0,721 dan accuracy 0,731, metode bipartite graph random walk memberikan hasil F1-score 0,004 dan accuracy 0,526, serta metode binary classifier memberikan hasil F1-score 0,752 dan accuracy 0,857. Kata Kunci: Text normalization, Twitter, random walk, word embedding, binary classifier, features engineering