Saat ini penentuan area riset masih banyak bergantung kepada pendapat
para ahli. Meskipun ahli tersebut memiliki pengetahuan yang mendalam di
bidangnya, akan tetapi tidak semua area riset yang emerging dapat diketahui oleh
ahli tersebut mengingat cepatnya perkembangan sumber-sumber informasi
tentang ilmu pengetahuan dan teknologi. Namun demikian, analisis data yang
berjumlah besar memerlukan waktu yang lama dan bisa jadi subyektif jika
menggunakan cara manual. Beberapa penelitian sebelumnya telah menggunakan
teknik kuantitatif dengan menghitung trend berdasarkan jumlah kata kunci dari
suatu topik riset dan memprediksi trend tersebut untuk masa yang akan datang.
Untuk prediksi trend dari data time series, saat ini pendekatan machine learning
mulai banyak dikaji disamping pendekatan statistik yang sebelumnya lazim
digunakan.
Sementara itu, pendekatan ensemble yang menggabungkan hasil prediksi,
teknik prediksi atau representasi data diyakini dapat meningkatkan akurasi
prediksi. Multiple Kernel Learning (MKL) merupakan suatu teknik ensemble
melalui penggabungan kernel yang menggunakan teknik machine learning, yakni
Support Vector Machine (SVM), sebagai classifier atau prediktor. Dalam
penelitian sebelumnya, MKL telah dimanfaatkan untuk menggabungkan fitur,
yang biasa disebut sebagai data integration, dalam bidang image processing tetapi
masih menggunakan single kernel. Dalam penelitian ini, MKL dimanfaatkan
untuk menggabungkan fitur data time series yang berupa sliding windows dan
diterapkan pada multiple kernel. Disamping itu, penelitian ini juga mengajukan
penggunaan data historis sebagai pengganti training dataset untuk memilih model
prediksi yang sesuai dengan karakteristik time series karena setiap model prediksi
memiliki kelebihan dan keterbatasan dalam memprediksi data time series yang
jenisnya cukup beragam.
vii Universitas Indonesia
Metodologi yang digunakan dalam penelitian bersifat kuantitatif, dengan
tahapan: penyusunan data time series, ujicoba teknik prediksi yang diusulkan
terhadap data acuan (benchmark), dan implementasi teknik prediksi tersebut
terhadap data publikasi ilmiah dan laporan penelitian. Data benchmark didapatkan
dari kompetisi time series, terutama NN3 dan M3, yang banyak digunakan
sebagai acuan oleh beberapa peneliti sebelumnya. Sedangkan data laporan
penelitian didapatkan dari situs Garuda dan basis data publikasi ilmiah dari
Scopus. Tema riset mengacu kepada kata kunci yang digunakan dalam LCSH
(Library of Congress Subject Heading) untuk data Garuda dan kata kunci area
riset dalam Agenda Riset Nasional (ARN) dan dalam dokumen Scopus.
Dari hasil eksperimen dapat disimpulkan bahwa teknik prediksi secara
ensemble yang diusulkan dapat memberikan hasil yang cukup kompetitif
dibandingkan dengan hasil terbaik dari kompetisi time series sebelumnya. Lebih
lanjut, penerapan teknik prediksi yang diajukan terhadap terhadap area riset di
Indonesia diharapkan dapat membantu penentu kebijakan dalam memutuskan
kebijakan prioritas riset dan alokasi sumberdaya penelitian pada masa yang akan
datang.
|
|