ABSTRAK
Nama : Valentina Kania Prameswara Artari
Program Studi : Ilmu Komputer
Judul : Coreference Resolution untuk Bahasa Indonesia
Menggunakan Pendekatan Multi-Pass Sieve dan
Association Rules
Coreference resolution adalah tugas pencarian hubungan pada kumpulan ekspresi
apakah kumpulan ekspresi tersebut merujuk pada konsep yang sama. Penelitian
coreference resolution bahasa Indonesia sebagian besar masih terbatas pada
resolusi pronomina dan entitas bernama. Penelitian ini mencoba mengaplikasikan
pendekatan coreference resolution untuk ruang lingkup frasa nominal secara
umum menggunakan pendekatan Multi-Pass Sieve dan Association Rules dengan
hand-crafted features dari atribut terkait frasa nominal. Pendekatan Multi-Pass
Sieve adalah pendekatan rule-based yang mengimplementasikan beberapa lapis rule
untuk menentukan hubungan koreferensi antar dua frasa. Pendekatan Association
Rules pada coreference resolution mencari pola hubungan antar atribut untuk
menentukan hubungan koreferensi antar dua frasa. Penelitian dilakukan pada 201
dokumen artikel Wikipedia bahasa Indonesia dengan total frasa nominal yang
diidentifikasi sebanyak 16.460 frasa. Hasil coreference resolution mendapatkan
MUC F-measure sebesar 72.24% dan BCUBED F-measure sebesar 52.20%
untuk pemodelan Multi-Pass Sieve, serta MUC F-measure mencapai 73.20% dan
BCUBED F-measure sebesar 57.44% untuk metode Association Rules.
Kata Kunci:
coreference resolution, bahasa Indonesia, Wikipedia, Multi-Pass Sieve, Association
Rules
viii
|
|