Tidak ada review pada koleksi ini: 46486
ABSTRAK
Nama : Ionia Veritawati
Program Studi : Ilmu Komputer
Judul : Interpretasi Teks Menggunakan Ontologi Berbasis Additive Fuzzy
Spectral Clustering
Saat ini, data dalam bentuk teks semakin berlimpah pada berbagai domain
dan media, baik media cetak maupun online. Penambahan kumpulan dokumen
teks ini menyebabkan kemudahan akses suatu informasi atau pengetahuan yang
ada pada teks semakin berkurang. Selain itu, informasi atau pengetahuan yang
ada tersebut semakin sulit untuk diinterpretasi dan dipahami secara menyeluruh.
Untuk itu diperlukan suatu cara untuk membantu mempermudah pemahaman
suatu data teks. Hal ini dengan melakukan penggalian pengetahuan pada data teks
yang melimpah melalui pemrosesan data yang tidak terstruktur (text mining),
dengan mengembangkan metode interpretasi berbasis ontologi pada teks untuk
memperoleh pengetahuan baru sebagai state of the art.
Dalam penelitian ini, dikembangkan beberapa teknik /metode. Pertama
adalah pengembangan teknik preprocessing pada data teks (korpus) serta key
phrase extraction menggunakan AST (Annotated Suffix Tree) untuk memperoleh
key phrase (frasa kunci) dan frekuensi kemunculan. Kedua adalah pengembangan
pemodelan ontologi sebagai basis pengetahuan pada suatu domain berupa relasi
antar key phrase menggunakan clustering dan Bayesian Network. Ketiga adalah
pengembangan metode sparse clustering pada data sparse, yaitu is-FADDIS
(iterative scaling – Additive Fuzzy Spectral Clustering) untuk proses pemilahan
data teks, yang merupakan pengembangan dari metode clustering FADDIS
(Additive Fuzzy Spectral Clustering) serta keempat adalah pengembangan metode
matching dan correlating terhadap ontologi, sebagai teknik yang digunakan saat
interpretasi teks.
Secara terintegrasi, pembangunan ontologi dari teks, dengan domain berita,
dilakukan diawal dengan tahapan ekstraksi key phrase, clustering (is-FADDIS,
opsional) dan structure learning untuk membentuk ontologi-tree. Key phrase
sebagai konsep, menjadi node pada ontologi tersebut, yang menjadi basis
pengetahuan domain. Tahapan berikutnya adalah melakukan interpretasi teks pada
suatu teks input yang terdiri dari satu key phrase atau satu cluster menggunakan
ontologi tersebut untuk mendapatkan pengetahuan baru.
Interpretasi dilakukan dengan ontologi berasal dari teks dengan dua domain
dan satu domain. Hasil interpretasi teks menggunakan ontologi berbasis Additive
Fuzzy Spectral Clustering (is-FADDIS) ini dievaluasi menggunakan usulan -
score relevansi. Pada teks input dengan satu key phrase sejumlah lima input yang
diinterpretasi, hasilnya adalah 40% relevan, 40% kurang relevan dan 20% tidak
relevan. Pada teks input satu cluster sejumlah dua input yang diinterpretasi,
hasilnya adalah relevan. Nilai score relevansi yang relevan, secara empiris adalah
lebih 0,3 dari skala 1, dan score relevansi yang didapat, ada yang mencapai 0,33.
Dengan pembandingan hasil interpretasi melalui variasi teknik pada pembangunan
vi Universitas Indonesia
vii
ontologi, didapatkan, penggunaan ontologi berbasis is-FADDIS untuk interpretasi
teks, relatif pada penelitian ini belum memberikan hasil optimal. Dalam
penggunaan teknik-teknik yang dikembangkan, metode ini memberikan keluaran
interpretasi teks yang dapat membantu untuk mengolah informasi teks dalam
jumlah tidak terlalu besar tetapi cepat.
Kata kunci : text mining, Annotated Suffix Tree, sparse clustering, is-FADDIS,
ontologi, interpretasi teks.