ABSTRAK
Saat mencari artikel yang diterbitkan dalam periode waktu yang panjang,
pengguna biasanya membutuhkan dokumen yang tidak hanya relevan terhadap
topik tetapi juga relevan terhadap waktu. Tesis ini membahas tentang
pemeringkatan dokumen dengan konsep waktu atau temporal, di mana dokumen
dengan topik dan waktu yang dekat dengan query harus diberikan peringkat yang
lebih tinggi. Untuk mengetahui waktu yang sesuai dengan query pengguna, tesis
ini mengembangkan teknik pemeringkatan temporal yang diperoleh dari distribusi
keterkaitan kata dari waktu ke waktu yang dipelajari pada sebuah arsip berita
dalam Bahasa Indonesia. Keterkaitan kata dipelajari menggunakan Dynamic
Embeddings yaitu Word2Vec yang dipelajari terpisah dari waktu ke waktu,
OrthoTrans-Word2Vec dan Dynamic Bernoulli Embeddings. Dalam menangkap
relevansi secara topikal, model yang diusulkan menggunakan Dual Embedding
Space Model (DESM) yang dibangun dengan teknik temporal sesuai dengan
waktu pembuatan dokumen. Untuk meningkatkan nilai presisi, model tersebut
juga menggunakan sebuah klasifikasi temporal yang dipelajari menggunakan
Support Vector Machine (SVM) dan Basis Threshold. Skor tertinggi dicapai
ketika membangun model menggunakan Word2Vec yaitu 66% pada presisi ratarata dan 68% pada presisi awal. Model tersebut juga terbukti efektif pada query
temporal yang memiliki pola seperti tren, periodisitas, dan musiman.
Kata Kunci :
pemeringkatan temporal, keterkaitan kata, Dynamic Embeddings, klasifikasi
temporal, topik temporal
|