ABSTRAK
Nama : Hadi Syah Putra Program Studi : Ilmu Komputer Judul : Pembangunan Knowledge Base melalui Pendekatan Ekstraksi Informasi dengan Studi Kasus Warisan Budaya
Warisan budaya dan sejarah alam perlu dilestarikan. Salah satu upaya yang dapat diimplementasikan adalah dengan memanfaatkan teknologi informasi melakukan otomatisasi ekstraksi entitas warisan budaya dari teks guna membangun knowledge base yang dapat digunakan untuk manajemen pengetahuan mengenai warisan budaya. Pada penelitian ini artikel-artikel Wikipedia mengenai provinsi dan kabupaten/kota di Indonesia dijadikan sebagai sumber ekstraksi dengan total artikel yang diekstrak, yaitu 34 artikel provinsi dan 515 artikel kabupaten/kota. Proses ekstraksi dibagi menjadi tiga, yaitu ekstraksi tabel, ekstraksi daftar, dan ekstraksi teks bebas. Pada akhir penelitian, terekstrak sebanyak 4425 entitas warisan budaya yang dikategorikan ke dalam 33 kategori. Dengan menggunakan gold standard yang dibentuk secara manual dari artikel-artikel mengenai provinsi di Indonesia, didapatkan precision sebesar 0,84 dan recall sebesar 0,62. Hal tersebut menunjukkan bahwa teknik yang dikembangkan untuk melakukan ekstraksi data memiliki potensi yang cukup baik untuk membangun knowledge base mengenai warisan budaya.
Kata Kunci:
Warisan budaya, sejarah alam, DBpedia, Wikidata, Wikipedia
|
|