ABSTRAK
Nama : Sepstiviana Savitri
Program Studi : Ilmu Komputer
Judul : Pengembangan Lanjut Ekspansi Entitas DBpedia pada
Pembuatan Dataset Secara Otomatis untuk Named Entity
Recognition Bahasa Indonesia
Penelitian ini merupakan studi lanjutan terhadap pengembangan NER bahasa
Indonesia menggunakan dataset yang dibangun secara otomatis menggunakan
Wikipedia sebagai sumber data dan DBpedia sebagai referensi jenis entitas. Pada
penelitian sebelumnya telah diusulkan metode ekspansi entitas DBpedia yang
berhasil meningkatkan recall klasifikasi named entity. Pada penelitian ini
diusulkan rule-rule tambahan pada metode ekspansi entitas DBpedia untuk
meningkatkan performa NER. Selain itu, diusulkan juga rule untuk
menghilangkan ambiguitas pada tahap pelabelan. Dataset yang telah dibentuk
secara otomatis akan dijadikan data training dalam pembuatan model pada
Stanford NER. Hasil dari penelitian ini mampu meningkatkan f1-score sebesar
6% dari penelitian sebelumnya.
Kata Kunci:
Named Entity Recognition, pembuatan dataset, rule based, Wikipedia, DBpedia
|
|