Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-1914 (Softcopy SK-1396)Source code SK-740
Collection Type Skripsi
Title Benchmarking Analisis Sentimen Teks Berbahasa Indonesi
Author Harnindyto Wicaksana; Samuel Ludwig Ian, Setyawan Pratama;
Publisher Depok : Fakultas Ilmu Komputer Universitas Indonesia, 2022
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-1914 (Softcopy SK-1396)Source code SK-740 TERSEDIA
Tidak ada review pada koleksi ini: 48964
ABSTRAK Nama : Harnindyto Wicaksana, Samuel Ludwig Ian, Setyawan Pratama Program Studi : Sistem Informasi Judul : Benchmarking Analisis Sentimen Teks Berbahasa Indonesia Pembimbing : Rahmad Mahendra, S.Kom., M.Sc. & Mei Silviana Saputri, S.Kom., M.Kom. Penelitian analisis sentimen sudah banyak dikaji untuk berbagai bahasa, termasuk bahasa Indonesia. Namun sayangnya, belum terdapat penelitian benchmarking analisis sentimen untuk teks berbahasa Indonesia. Hal ini menyebabkan kesulitan bagi para peneliti untuk mendapatkan informasi mengenai metode klasifikasi dengan performa terbaik pada saat ini. Dengan adanya permasalahan tersebut, penelitian ini dilakukan dengan tujuan membantu memberikan arahan untuk penelitian sentimen analisis dalam bahasa Indonesia. Untuk dapat memberikan arahan, penelitian ini berusaha untuk membandingkan pendekatan klasifikasi sentimen rule-based, machine learning dan deep learning serta teknik ekstraksi fitur untuk mendapatkan skenario analisis sentimen terbaik. Berdasarkan hasil eksperimen penelitian, ditunjukkan bahwa klasifikasi terbaik dicapai oleh deep learning, disusul dengan metode klasifikasi machine learning dan rule-based. Pencapaian nilai terbaik pada klasifikasi menggunakan deep learning diperoleh menggunakan model BERT. Untuk klasifikasi menggunakan machine learning, didapatkan bahwa nilai F1-Score terbaik diperoleh saat digunakan metode klasifikasi Logistic Regression dengan teknik ekstraksi fitur kombinasi unigram dengan leksikon kombinasi. Sedangkan untuk klasifikasi rule-based nilai F1-Score tertinggi didapatkan menggunakan metode klasifikasi adjektiva. Kata Kunci : benchmarking, analisis sentimen, bahasa Indonesia, ekstraksi fitur, leksikon, word embedding, rule-based, machine learning, deep learning, convolutional neural network, long short term memory, bidirectional encoder representations for transformers.