ABSTRAK

Saat mencari artikel yang diterbitkan dalam periode waktu yang panjang, pengguna biasanya membutuhkan dokumen yang tidak hanya relevan terhadap topik tetapi juga relevan terhadap waktu. Tesis ini membahas tentang pemeringkatan dokumen dengan konsep waktu atau temporal, di mana dokumen dengan topik dan waktu yang dekat dengan query harus diberikan peringkat yang lebih tinggi. Untuk mengetahui waktu yang sesuai dengan query pengguna, tesis ini mengembangkan teknik pemeringkatan temporal yang diperoleh dari distribusi keterkaitan kata dari waktu ke waktu yang dipelajari pada sebuah arsip berita dalam Bahasa Indonesia. Keterkaitan kata dipelajari menggunakan Dynamic Embeddings yaitu Word2Vec yang dipelajari terpisah dari waktu ke waktu, OrthoTrans-Word2Vec dan Dynamic Bernoulli Embeddings. Dalam menangkap relevansi secara topikal, model yang diusulkan menggunakan Dual Embedding Space Model (DESM) yang dibangun dengan teknik temporal sesuai dengan waktu pembuatan dokumen. Untuk meningkatkan nilai presisi, model tersebut juga menggunakan sebuah klasifikasi temporal yang dipelajari menggunakan Support Vector Machine (SVM) dan Basis Threshold. Skor tertinggi dicapai ketika membangun model menggunakan Word2Vec yaitu 66% pada presisi ratarata dan 68% pada presisi awal. Model tersebut juga terbukti efektif pada query temporal yang memiliki pola seperti tren, periodisitas, dan musiman. Kata Kunci : pemeringkatan temporal, keterkaitan kata, Dynamic Embeddings, klasifikasi temporal, topik temporal