Bibliografi
Pengarang
Shandy Darma;
Barcode
Cat. Karya
No. Induk
Pembimbing
Rahmat Mahendra
Kata Kunci
Text normalization, Twitter, random walk, word embedding, binary classifier, features engineering
Pembimbing 3
Pembimbing 2
Tahun buku
2019
Barcode RFID baru
11655254
Tahun Angkatan
2014
Progam Studi
Ilmu Komputer
Lokasi
FASILKOM-UI;
Tanggal Datang
23/01/2019
Abstrak Indonesia
ABSTRAK Nama : Shandy Darma Program Studi : Ilmu Komputer Judul : Normalisasi Teks Twitter Bahasa Indonesia dengan Metode Berbasis Word Embedding, Bipartite Graph Random Walk, dan Binary Classifier Data dari Twitter, jika digunakan untuk penelitian pengolahan bahasa manusia, akan memberikan hasil yang kurang akurat. Oleh karena itu, perlu dilakukan normalisasi teks pada data Twitter sebelum digunakan untuk penelitian. Berbagai metode dapat dilakukan untuk normalisasi teks. Metode yang digunakan yaitu metode berbasis word embedding, metode bipartite graph random walk, dan metode berbasis binary classifier. Hasil penelitian menunjukkan bahwa metode word embedding memberikan hasil F1-score 0,721 dan accuracy 0,731, metode bipartite graph random walk memberikan hasil F1-score 0,004 dan accuracy 0,526, serta metode binary classifier memberikan hasil F1-score 0,752 dan accuracy 0,857. Kata Kunci: Text normalization, Twitter, random walk, word embedding, binary classifier, features engineering
Daftar Isi
Cat. Umum
Judul
Normalisasi Teks Twitter Bahasa Indonesia dengan Metode Berbasis Word Embedding, Bipartite Graph Random Walk, dan Binary Classifier
Asal
Korporasi
NPM
1406622692
Abstrak English
ABSTRACT Name : Shandy Darma Study Program : Computer Science Title : Twitter Text Normalisation in Indonesian Language using Word Embedding, Bipartite Graph Random Walk, and Binary Classifier Methods The Twitter data, if used in natural language processing research, will yield a less accurate result. Therefore, text normalisation is necessary. There are several methods that can be used, which are word embedding based method, bipartite graph random walk method, and binary classifier method. This research shows that word embedding based method yields F1-score 0.721 and accuracy, bipartite graph random walk method yields F1-score 0.004 and accuracy 0.526, and binary classifier based method F1-score 0.752 and accuracy 0.857. Keywords: Text normalization, Twitter, random walk, word embedding, binary classifier, features engineering
Pengarang 2
Subjek
Penguji 2
Kasiyah
Penguji 3
Pembimbing 1
Indra Budi
Fisik
xii, 46 halm.;ill; 30 cm
Bahasa
Ind
Lulus Semester
Ganjil 2018/2019
Penerbitan
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019
No. Panggil
SK-1666 (Softcopy SK-1148) Source Code Sk-666
Penguji 1
Harry Budi Santoso
Lulus semester SI