Pesatnya perkembangan teknologi internet membuat persebaran informasi semakin mudah dan cepat. Dengan besar jumlah data yang tersebar di Internet, pengguna Internet terkadang perlu membaca berbagai artikel untuk suatu berita tertentu agar dapat memperoleh informasi yang cukup. Selain itu, kemudahan mendapatkan informasi di Internet memungkinkan pengguna Internet untuk memperoleh artikel berita dalam berbagai bahasa. Hal tersebut mendorong penulis untuk melakukan penelitian Peringkasan Dokumen Multi bahasa untuk Bahasa Indonesia dan Bahasa Inggris. Kendala bahasa diatasi dengan melakukan penerjemahan bahasa. Pengelompokan dokumen berdasarkan topik dilakukan dengan dua metode. Metode pertama dilakukan penerjemahan sebelum pengelompokan dokumen. Metode kedua dilakukan penerjemahan setelah pengelompokan dokumen untuk tiap bahasa yang kemudian diikuti pengelompokan dokumen secara keseluruhan. Dari penelitian ini juga diteliti lima skenario peringkasan dokumen. Dari hasil penelitian, kedua metode pengelompokan dokumen dapat digunakan untuk koleksi dokumen berbahasa Indonesia dan dokumen berbahasa Inggris. Pembobotan kalimat dengan mempertimbangkan bobot judul dokumen, pemotongan imbuhan sebelum dilakukan pemeriksaan kesamaan dua kalimat, dan pemberian prioritas terhadap bahasa ringkasan (dalam penelitian ini adalah Bahasa Indonesia) dapat meningkatkan kualitas suatu ringkasan.
|
|