ABSTRAK
Nama : Muhammad Ridho Ananda
Program Studi : Ilmu Komputer
Judul : Pengembangan Part-of-Speech Tagger Menggunakan Hidden Markov Model untuk Disambiguasi Kelas Kata pada
Indonesian Morphological Analyzer
Pembimbing : Ika Alfina, S.Kom., M.Kom.
Aksara merupakan suatu morphological analyzer untuk bahasa Indonesia dan dapat
melakukan word segmentation (tokenisasi), lemmatization, POS tagging, dan morphological features analysis. Sayangnya, masih terdapat kekurangan yaitu Aksara
memiliki permasalahan ambiguitas kelas kata. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan POS tagger metode hybrid dengan menggabungkan
Hidden Markov Model (HMM) dan keluaran dari POS tagging Aksara. Permasalahan ambiguitas dilakukan dengan memprediksi kelas kata menggunakan algoritma Viterbi. Model bigram dan trigram digunakan untuk melatih HMM. Model
hybrid diuji menggunakan metode 10-fold cross-validation dan memperoleh hasil
yang cukup baik dengan model bigram sedikit lebih unggul. Model trigram memperoleh akurasi 86,75% dan rata-rata F1-score 81,07%. Sementara itu, model bigram memperoleh akurasi 86,47% dan rata-rata F1-score 79,54%. Pengujian juga
menunjukkan bahwa model hybrid menggabungkan rule-based dari Aksara dan
HMM memperoleh hasil yang lebih baik dibandingkan model HMM yang independen dengan margin akurasi sebesar 7,26%.
Kata kunci:
Aksara, disambiguasi, HMM, POS tagging, morphological analyzer
|
|