ABSTRAK
ABSTRAK
Nama : Rinda Wahyuni Program Studi : Magister Ilmu Komputer Judul : Kombinasi Fitur Semantik, Fitur Linguistik, dan Fitur Leksikal pada Klasifikasi Emoji di Dataset Twitter
Emoji merupakan karakter gambar yang digunakan dalam komunikasi informal khususnya pada media sosial. Emoji digunakan oleh penulis pesan untuk mengekspresikan emosi sebuah pesan. Besarnya penggunaan emoji, membuat emoji sangat berpengaruh terhadap komunikasi dimedia sosial. Emoji digunakan sebagai salah satu fitur untuk analisis sentimen dan ekstraksi emosi dalam penelitian Natural Language Processing dan Information Retrieval, namun masih sedikit penelitian yang fokus menentukan emoji dari sebuah teks. Banyaknya emoji dan kemiripan makna antar emoji membuat klasifikasi emoji menjadi lebih kompleks jika dibandingkan dengan analisis sentimen atau klasifikasi teks pada umumnya. Penelitian ini menggunakan fitur leksikal, fitur semantik, dan fitur linguistik pada permasalahan klasifikasi emoji untuk mengetahui pengaruh setiap fitur pada performa klasifikasi emoji dan mengetahui kombinasi fitur terbaik dalam klasifikasi emoji. Hasil eksperimen menunjukkan fitur semantik memiliki performa terbaik saat digunakan secara individu. Sedangkan fitur leksikal memiliki pengaruh besar terhadap kenaikan performa klasifikasi emoji saat dikombinasikan dengan fitur baseline. Hasil uji statistik paired t-test menunjukkan kombinasi tiga fitur dan kombinasi empat fitur menaikkan akurasi baseline secara signifikan. Kombinasi terbaik didapatkan ketika mengkombinasikan baseline, fitur linguistik, fitur leksikal, dan fitur semantik dengan peningkatan akurasi 12.19% dan f1-score sebesar 12% jika dibandingkan dengan hanya menggunakan fitur baseline.
Kata Kunci:
Emoji, text classification, leksikal, semantik, linguistik, f1-score, akurasi.
|