Tingginya jumlah laporan penelitian yang dihasilkan peneliti Indonesia tidak diimbangi dengan jumlah jurnal ilmiah berstandar internasional. Padahal setiap peneliti diwajibkan menghasilkan jurnal ilmiah sebagai luaran atas penelitian yang dilakukannya. Untuk mengetahui kecenderungan seorang peneliti menghasilkan jurnal ilmiah dari laporan penelitian, diperlukan suatu pemetaan antara laporan penelitian dan paper, salah satu jenis tulisan ilmiah. Tujuannya adalah menginformasikan trend penelitian yang ada di Indonesia. Salah satu metode yang bisa digunakan adalah Vector Space Model (VSM). VSM menghitung frekuensi term yang ada pada dokumen untuk diukur tingkat kemiripannya. Dengan menggunakan pendekatan VSM, dilakukan beberapa uji coba terhadap beberapa atribut yang diperkirakan dapat mempengaruhi tingkat relevansi. Atribut tersebut mencakup jenis bahasa pada korpus, kombinasi section informasi pada dokumen, ekstraksi N-gram, jenis perhitungan similarity, serta jenis batasan threshold yang digunakan. Uji coba tertinggi didapat ketika menggunakan ekstraksi N-gram, section pengarang dan afiliasi, menghitung kemiripan dengan cosine, dan menggunakan batasan threshold sebesar 30%.