ABSTRAK ABSTRAK
Nama : NINA SEVANI
Program Studi : Doktor Ilmu Komputer
Judul : PENGGUNAAN BOBOT DAN JARAK DALAM FEATURE-
TRANSFER LEARNING UNTUK KLASIFIKASI GAMBAR
Pembimbing : Prof. Dr. Eng. Wisnu Jatmiko, S.T., M.Kom.
Transfer learning merupakan pengembangan dari pembelajaran mesin biasa
(tradisional) yang dapat diterapkan pada cross-domain. Cross-domain adalah
domain yang memiliki perbedaan pada feature space atau pada marginal dan
conditional distribution, sehingga sulit ditangani dengan metode pembelajaran
mesin biasa. Perbedaan ini banyak terjadi pada kasus computer vision atau pattern
recognition seperti untuk mengenali korban bencana alam melalui foto yang
diambil dari atas menggunakan drone atau helikopter. Terjadinya perbedaan feature
space dan distribusi data ini karena adanya perbedaan sudut, cahaya, dan alat yang
berbeda. Kondisi seperti ini semakin menyulitkan untuk dilakukannya klasifikasi
gambar terlebih pada domain dengan keterbatasan label. Implementasi transfer
learning terbukti dapat memberikan performance yang baik pada banyak kasus,
termasuk kasus yang menggunakan dataset gambar.
Dalam transfer learning penting untuk menghindari terjadinya negative transfer
learning, sehingga perlu dilakukan pengukuran kesamaan (similarity) antar domain.
Penelitian ini menerapkan feature-representation-transfer dan menggunakan
Maximum Mean Discrepancy (MMD) untuk mengukur jarak antar feature pada
domain yang terlibat di transfer learning. Setelah mengukur kesamaan antar
domain, maka akan dilakukan pemilihan feature berdasarkan jarak antar feature.
Feature terpilih adalah feature yang mempunyai jarak kurang dari threshold yang
ditentukan. Bobot akan diberikan kepada feature terpilih. Selain melakukan
pemilihan feature berdasarkan kesamaan domain, metode ini juga melakukan
pemilihan feature yang signifikan antar class label dan dalam class label dengan
menggunakan ANOVA (Analysis of Variance). Hanya feature yang signifikan yang
akan digunakan untuk proses prediksi.
Metode yang diusulkan juga menerapkan inter-cluster class label untuk
memperkecil perbedaan conditional distribution. Prinsip kerja inter-cluster class
label ini adalah menghitung jarak minimal dari instance pada domain target ke
setiap center of cluster class label. Rumus jarak yang digunakan adalah Euclidean
Distance. Properti statistik seperti rata-rata dan varians akan digunakan pada
metode ini, untuk menggambarkan struktur data lokal dalam setiap domain.
Penggunaan rata-rata digunakan untuk menentukan threshold dan pusat cluster
class label, sedangkan varians digunakan untuk pemilihan feature yang signifikan.
Proses prediksi label dilakukan berdasarkan feature terpilih yang telah diberi bobot
dan jarak terpendek setiap instance ke salah satu class label.
Tidak terdapat parameter tambahan dalam fungsi pembelajaran yang diusulkan.
Selain itu, proses penentuan label juga dilakukan tanpa iterasi, sehingga
memungkinkan metode ini dapat dijalankan dengan keterbatasan resource. Hasil
eksperimen menunjukkan bahwa metode yang diusulkan dapat memberikan
ix Universitas Indonesia
performance sebesar 46,6%, pada saat menggunakan SVM sebagai classifier dan
51.7% pada saat menggunakan logistic regression. Akurasi yang didapat dengan
SVM ini mengimbangi metode feature-representation-transfer sebelumnya.
Namun akurasi dari logistic regression sudah dapat mengungguli metode
sebelumnya. Hasil ini menunjukkan bahwa penggunaan metode feature selection
menggunakan properti statistik yang dikombinasikan dengan pemberian bobot pada
feature terpilih dan jarak minimal dapat memberikan hasil akurasi yang baik tanpa
memerlukan resource yang besar.
Kata Kunci:
feature-representation-transfer, MMD, bobot, rata-rata, jarak.
|
|