Bibliografi
Pengarang
Harnindyto Wicaksana; Samuel Ludwig Ian, Setyawan Pratama;
Barcode
Cat. Karya
No. Induk
Pembimbing
Rahmat Mahendra
Kata Kunci
benchmarking, analisis sentimen, bahasa Indonesia, ekstraksi fitur, leksikon, word embedding, rule-based, machine learning, deep learning, convolutional neural network, long short term memory, bidirectional encoder representations for transformers.
Pembimbing 3
Pembimbing 2
Tahun buku
2022
Barcode RFID baru
11736038
Tahun Angkatan
2018
Progam Studi
Sistem Informasi
Lokasi
FASILKOM-UI;
Tanggal Datang
23/03/2022
Abstrak Indonesia
ABSTRAK Nama : Harnindyto Wicaksana, Samuel Ludwig Ian, Setyawan Pratama Program Studi : Sistem Informasi Judul : Benchmarking Analisis Sentimen Teks Berbahasa Indonesia Pembimbing : Rahmad Mahendra, S.Kom., M.Sc. & Mei Silviana Saputri, S.Kom., M.Kom. Penelitian analisis sentimen sudah banyak dikaji untuk berbagai bahasa, termasuk bahasa Indonesia. Namun sayangnya, belum terdapat penelitian benchmarking analisis sentimen untuk teks berbahasa Indonesia. Hal ini menyebabkan kesulitan bagi para peneliti untuk mendapatkan informasi mengenai metode klasifikasi dengan performa terbaik pada saat ini. Dengan adanya permasalahan tersebut, penelitian ini dilakukan dengan tujuan membantu memberikan arahan untuk penelitian sentimen analisis dalam bahasa Indonesia. Untuk dapat memberikan arahan, penelitian ini berusaha untuk membandingkan pendekatan klasifikasi sentimen rule-based, machine learning dan deep learning serta teknik ekstraksi fitur untuk mendapatkan skenario analisis sentimen terbaik. Berdasarkan hasil eksperimen penelitian, ditunjukkan bahwa klasifikasi terbaik dicapai oleh deep learning, disusul dengan metode klasifikasi machine learning dan rule-based. Pencapaian nilai terbaik pada klasifikasi menggunakan deep learning diperoleh menggunakan model BERT. Untuk klasifikasi menggunakan machine learning, didapatkan bahwa nilai F1-Score terbaik diperoleh saat digunakan metode klasifikasi Logistic Regression dengan teknik ekstraksi fitur kombinasi unigram dengan leksikon kombinasi. Sedangkan untuk klasifikasi rule-based nilai F1-Score tertinggi didapatkan menggunakan metode klasifikasi adjektiva. Kata Kunci : benchmarking, analisis sentimen, bahasa Indonesia, ekstraksi fitur, leksikon, word embedding, rule-based, machine learning, deep learning, convolutional neural network, long short term memory, bidirectional encoder representations for transformers.
Daftar Isi
Cat. Umum
Judul
Benchmarking Analisis Sentimen Teks Berbahasa Indonesi
Asal
Korporasi
NPM
1806146991
Abstrak English
ABSTRACT Name :Harnindyto Wicaksana, Samuel Ludwig Ian, Setyawan Pratama Study Program : Information System Title : Benchmarking for Sentiment Analysis in Indonesia Counsellor : Rahmad Mahendra, S.Kom., M.Sc. & Mei Silviana Saputri, S.Kom., M.Kom. Currently, there have been many kinds of research done on sentiment analysis. However, there are no papers on sentiment analysis benchmarks for the Indonesian language. Due to the absence of such research, it became difficult for researchers to get information about classifiers with the best performance. Because of this problem, this research is conducted so it would be easier for researchers to get information and direction on doing Indonesian sentiment analysis. In this paper, we held an experiment comparing sentiment classification using rule-based, machine learning, and deep learning and comparing feature extraction techniques to achieve the best sentiment analysis scenario. Based on our experiments in this research, prediction using deep learning classification gave the best result compared to machine learning and rule-based classification. Using deep learning classification, the BERT model is used to get the best result. The best F1-Score for machine learning classification is obtained using a Logistic Regression classifier alongside a combination of unigram and combined lexicon feature extraction. Meanwhile, the best F1-Score for the rule-based classification is obtained using the Adjective classification method. Keywords: benchmarking, sentiment analysis, Indonesian-language, feature extraction, lexicon, word embedding, rule-based, machine learning, deep learning, convolutional neural network, long short term memory, bidirectional encoder representations for transformer
Pengarang 2
Samuel Ludwig Ian, Setiawan Pratama
Subjek
Penguji 2
Alfan Farizki Wicaksono
Penguji 3
Pembimbing 1
Mei Silviana Saputra
Fisik
xxiii, 190 hlm.;ill; 30 cm.
Bahasa
ind
Lulus Semester
Penerbitan
Depok : Fakultas Ilmu Komputer Universitas Indonesia, 2022
No. Panggil
SK-1914 (Softcopy SK-1396)Source code SK-740
Penguji 1
Bayu Anggorojati
Lulus semester SI
Genap 2022