ABSTRAK
Nama Mahasiswa 1 : Gilang Catur Yudishtira
Nama Mahasiswa 2 : Kaysa Syifa Wijdan Amin
Nama Mahasiswa 3 : Nabila Dita Putri
Program Studi : Ilmu Komputer
Judul : Pembangunan Data dan Model Analisis Emosi
Fine-Grained pada Teks Media Sosial Berbahasa
Indonesia
Pembimbing 1 : Rahmad Mahendra, S.Kom., M.Sc.
Pembimbing 2 : Meganingrum Arista Jiwanggi, S.Kom.,
M.Kom., M.Comp.Sc
Saat ini, di Indonesia belum ada penelitian analisis emosi yang menggunakan
fine-grained emotion. Selain itu, dataset yang tersedia untuk melakukan analisis emosi
juga masih terbatas, baik dari segi jumlah data, cakupan emosi, serta sumbernya. Pada
penelitian ini, peneliti membangun dataset besar untuk tugas analisis emosi pada data
teks berbahasa Indonesia, di mana dataset ini dikumpulkan dari berbagai domain dan
sumber. Dataset ini mengandung 33 ribu teks, yang terdiri dari tweet yang dikumpulkan
dari Twitter, serta komentar unggahan yang dikumpulkan dari Instagram dan Youtube.
Domain yang dicakup pada dataset ini adalah domain olahraga, hiburan, dan life
chapter. Dataset ini telah dianotasi oleh 36 annotator dengan label emosi fine-grained
secara multi-label, di mana label emosi yang digunakan ini merupakan hasil dari
taksonomi emosi baru yang diusulkan oleh peneliti. Pada penelitian ini, peneliti
mengusulkan taksonomi emosi baru yang terdiri dari 44 fine-grained emotion, yang
dikelompokkan ke dalam 6 basic emotion. Selain itu, peneliti juga membangun baseline
model untuk melakukan analisis emosi. Didapatkan dua baseline model, yaitu hasil
fine-tuning IndoBERT yang mencapai f1-score micro tertinggi sebesar 0.3786, dan
model hierarchical logistic regression yang mencapai exact match ratio tertinggi
sebesar 0.2904. Kedua baseline model tersebut juga dievaluasi di lintas domain untuk
melihat seberapa general dan robust model yang telah dibangun tersebut.
Kata kunci:
Penambangan Data, Taksonomi Emosi, Anotasi Data, Klasifikasi Emosi
|
|