Bibliografi |
|
Pengarang |
Harnindyto Wicaksana; Samuel Ludwig Ian, Setyawan Pratama; |
Barcode |
|
Cat. Karya |
|
No. Induk |
|
Pembimbing |
Rahmat Mahendra |
Kata Kunci |
benchmarking, analisis sentimen, bahasa Indonesia, ekstraksi fitur, leksikon, word embedding, rule-based, machine learning, deep learning, convolutional neural network, long short term memory, bidirectional encoder representations for transformers. |
Pembimbing 3 |
|
Pembimbing 2 |
|
Tahun buku |
2022 |
Barcode RFID baru |
11736038 |
Tahun Angkatan |
2018 |
Progam Studi |
Sistem Informasi |
Lokasi |
FASILKOM-UI; |
Tanggal Datang |
23/03/2022 |
Abstrak Indonesia |
ABSTRAK
Nama : Harnindyto Wicaksana, Samuel Ludwig Ian, Setyawan Pratama
Program Studi : Sistem Informasi
Judul : Benchmarking Analisis Sentimen Teks Berbahasa Indonesia
Pembimbing : Rahmad Mahendra, S.Kom., M.Sc. & Mei Silviana Saputri, S.Kom.,
M.Kom.
Penelitian analisis sentimen sudah banyak dikaji untuk berbagai bahasa, termasuk
bahasa Indonesia. Namun sayangnya, belum terdapat penelitian benchmarking analisis
sentimen untuk teks berbahasa Indonesia. Hal ini menyebabkan kesulitan bagi para
peneliti untuk mendapatkan informasi mengenai metode klasifikasi dengan performa
terbaik pada saat ini. Dengan adanya permasalahan tersebut, penelitian ini dilakukan
dengan tujuan membantu memberikan arahan untuk penelitian sentimen analisis dalam
bahasa Indonesia. Untuk dapat memberikan arahan, penelitian ini berusaha untuk
membandingkan pendekatan klasifikasi sentimen rule-based, machine learning dan
deep learning serta teknik ekstraksi fitur untuk mendapatkan skenario analisis sentimen
terbaik. Berdasarkan hasil eksperimen penelitian, ditunjukkan bahwa klasifikasi terbaik
dicapai oleh deep learning, disusul dengan metode klasifikasi machine learning dan
rule-based. Pencapaian nilai terbaik pada klasifikasi menggunakan deep learning
diperoleh menggunakan model BERT. Untuk klasifikasi menggunakan machine
learning, didapatkan bahwa nilai F1-Score terbaik diperoleh saat digunakan metode
klasifikasi Logistic Regression dengan teknik ekstraksi fitur kombinasi unigram dengan
leksikon kombinasi. Sedangkan untuk klasifikasi rule-based nilai F1-Score tertinggi
didapatkan menggunakan metode klasifikasi adjektiva.
Kata Kunci : benchmarking, analisis sentimen, bahasa Indonesia, ekstraksi fitur,
leksikon, word embedding, rule-based, machine learning, deep learning, convolutional
neural network, long short term memory, bidirectional encoder representations for
transformers. |
Daftar Isi |
|
Cat. Umum |
|
Judul |
Benchmarking Analisis Sentimen Teks Berbahasa Indonesi |
Asal |
|
Korporasi |
|
NPM |
1806146991 |
Abstrak English |
ABSTRACT
Name :Harnindyto Wicaksana, Samuel Ludwig Ian, Setyawan Pratama
Study Program : Information System
Title : Benchmarking for Sentiment Analysis in Indonesia
Counsellor : Rahmad Mahendra, S.Kom., M.Sc. & Mei Silviana Saputri, S.Kom.,
M.Kom.
Currently, there have been many kinds of research done on sentiment analysis.
However, there are no papers on sentiment analysis benchmarks for the Indonesian
language. Due to the absence of such research, it became difficult for researchers to get
information about classifiers with the best performance. Because of this problem, this
research is conducted so it would be easier for researchers to get information and
direction on doing Indonesian sentiment analysis. In this paper, we held an experiment
comparing sentiment classification using rule-based, machine learning, and deep
learning and comparing feature extraction techniques to achieve the best sentiment
analysis scenario. Based on our experiments in this research, prediction using deep
learning classification gave the best result compared to machine learning and rule-based
classification. Using deep learning classification, the BERT model is used to get the best
result. The best F1-Score for machine learning classification is obtained using a Logistic
Regression classifier alongside a combination of unigram and combined lexicon feature
extraction. Meanwhile, the best F1-Score for the rule-based classification is obtained
using the Adjective classification method.
Keywords: benchmarking, sentiment analysis, Indonesian-language, feature extraction,
lexicon, word embedding, rule-based, machine learning, deep learning, convolutional
neural network, long short term memory, bidirectional encoder representations for
transformer |
Pengarang 2 |
Samuel Ludwig Ian, Setiawan Pratama |
Subjek |
|
Penguji 2 |
Alfan Farizki Wicaksono |
Penguji 3 |
|
Pembimbing 1 |
Mei Silviana Saputra |
Fisik |
xxiii, 190 hlm.;ill; 30 cm. |
Bahasa |
ind |
Lulus Semester |
|
Penerbitan |
Depok : Fakultas Ilmu Komputer Universitas Indonesia, 2022 |
No. Panggil |
SK-1914 (Softcopy SK-1396)Source code SK-740 |
Penguji 1 |
Bayu Anggorojati |
Lulus semester SI |
Genap 2022 |