ABSTRAK
Nama : Christian Halim
Program Studi : Ilmu Komputer
Judul : Ekstraksi Hubungan Symptom-Disease Pada Sistem Tanya
Jawab Bidang Kesehatan Menggunakan Metode Support
Vector Machine dan Multi Layer Perceptron
Ekstraksi Informasi merupakan suatu pekerjaan dalam bidang pemrosesan bahasa
untuk mengubah informasi yang tidak beraturan yang terdapat pada suatu dokumen
menjadi suatu informasi yang terstruktur. Salah satu pekerjaan yang ada
dalam Ekstraksi Informasi adalah Ekstraksi Hubungan, yaitu sebuah pekerjaan untuk
memasangkan entitas-entitas bernama yang ada pada teks dengan sebuah hubungan.
Penelitian yang dikerjakan penulis kali ini menggunakan pendekatan pembelajaran
mesin supervised dengan model Support Vector Machine (SVM) dan Multi
Layer Perceptron (MLP) untuk mengklasifikasikan hubungan "mengindikasikan"
antara pasangan entitas Gejala (dianotasikan dengan Symptom) dan Penyakit (dianotasikan
dengan Disease) untuk suatu pasangan pertanyaan dan jawaban pada
sistem tanya jawab medis, yaitu hubungan yang menyatakan apakah suatu entitas
Gejala merupakan gejala dari suatu entitas Penyakit. Dalam penelitian ini, hubungan
yang diklasifikasikan oleh penulis hanyalah hubungan "mengindikasikan" antara
entitas Gejala dan Penyakit saja, sehingga klasifikasi yang dikerjakan adalah
klasifikasi biner. Dalam penelitian ini diusulkan dua buah modul, yaitu modul untuk
melakukan ekstraksi hubungan antar pasangan entitas yang berada dalam satu
kalimat dan yang terpisah antar kalimat. Untuk model klasifikasi pasangan entitas
dalam satu kalimat, model dengan nilai F1 Score terbaik adalah MLP berukuran
3 hidden layer 5 neuron tanpa fitur POS Tag menggunakan teknik penyeimbangan
SMOTE dengan nilai F1 Score 0.85 untuk kelas yang tidak berelasi dan 0.76 untuk
kelas yang berelasi. Untuk model klasifikasi pasangan entitas yang terpisah antar
kalimat, model dengan nilai F1 Score terbaik adalah MLP berukuran 3 hidden layer
5 neuron dengan fitur POS Tag menggunakan teknik penyeimbangan SMOTE dengan
nilai F1 Score 0.93 untuk kelas yang tidak berelasi dan 0.40 untuk kelas yang
berelasi
Kata Kunci:
Sistem Tanya Jawab, Ekstraksi Informasi, Ekstraksi Hubungan, Perolehan Informasi
vii
|
|