Bibliografi |
|
Pengarang |
Shandy Darma; |
Barcode |
|
Cat. Karya |
|
No. Induk |
|
Pembimbing |
Rahmat Mahendra |
Kata Kunci |
Text normalization, Twitter, random walk, word embedding, binary classifier, features engineering |
Pembimbing 3 |
|
Pembimbing 2 |
|
Tahun buku |
2019 |
Barcode RFID baru |
11655254 |
Tahun Angkatan |
2014 |
Progam Studi |
Ilmu Komputer |
Lokasi |
FASILKOM-UI; |
Tanggal Datang |
23/01/2019 |
Abstrak Indonesia |
ABSTRAK
Nama : Shandy Darma
Program Studi : Ilmu Komputer
Judul : Normalisasi Teks Twitter Bahasa Indonesia dengan Metode
Berbasis Word Embedding, Bipartite Graph Random Walk, dan
Binary Classifier
Data dari Twitter, jika digunakan untuk penelitian pengolahan bahasa manusia,
akan memberikan hasil yang kurang akurat. Oleh karena itu, perlu dilakukan
normalisasi teks pada data Twitter sebelum digunakan untuk penelitian. Berbagai
metode dapat dilakukan untuk normalisasi teks. Metode yang digunakan yaitu
metode berbasis word embedding, metode bipartite graph random walk, dan
metode berbasis binary classifier. Hasil penelitian menunjukkan bahwa metode
word embedding memberikan hasil F1-score 0,721 dan accuracy 0,731, metode
bipartite graph random walk memberikan hasil F1-score 0,004 dan accuracy 0,526,
serta metode binary classifier memberikan hasil F1-score 0,752 dan accuracy
0,857.
Kata Kunci:
Text normalization, Twitter, random walk, word embedding, binary classifier,
features engineering |
Daftar Isi |
|
Cat. Umum |
|
Judul |
Normalisasi Teks Twitter Bahasa Indonesia dengan Metode Berbasis Word Embedding, Bipartite Graph Random Walk, dan Binary Classifier |
Asal |
|
Korporasi |
|
NPM |
1406622692 |
Abstrak English |
ABSTRACT
Name : Shandy Darma
Study Program : Computer Science
Title : Twitter Text Normalisation in Indonesian Language using Word
Embedding, Bipartite Graph Random Walk, and Binary Classifier
Methods
The Twitter data, if used in natural language processing research, will yield a less
accurate result. Therefore, text normalisation is necessary. There are several
methods that can be used, which are word embedding based method, bipartite graph
random walk method, and binary classifier method. This research shows that word
embedding based method yields F1-score 0.721 and accuracy, bipartite graph
random walk method yields F1-score 0.004 and accuracy 0.526, and binary
classifier based method F1-score 0.752 and accuracy 0.857.
Keywords:
Text normalization, Twitter, random walk, word embedding, binary classifier,
features engineering |
Pengarang 2 |
|
Subjek |
|
Penguji 2 |
Kasiyah |
Penguji 3 |
|
Pembimbing 1 |
Indra Budi |
Fisik |
xii, 46 halm.;ill; 30 cm |
Bahasa |
Ind |
Lulus Semester |
Ganjil 2018/2019 |
Penerbitan |
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019 |
No. Panggil |
SK-1666 (Softcopy SK-1148) Source Code Sk-666 |
Penguji 1 |
Harry Budi Santoso |
Lulus semester SI |
|