ABSTRAK

Dalam implementasi komputerisasi Kamus Besar Bahasa Indonesia(KBBI) terdapat masalah kebutuhan penyimpanan disk yang relatif besar. Salah satu cara pemecahannya adalah menggunakan kompresi data. KBBI memiliki bentuk dan besar data yang sangat beragam untuk tiap entrinya. Oleh karena itu digunakan basis data tekstual yang mempunyai ciri khas variable-length field (panjang field yang bervariasi), yang cocok untuk karakteristik data KBBI. Untuk implementasi kompresi terhadap data KBBI dipilih 3 algoritme kompresi yaitu Huffman, Aritmetic, dan Lempel-Ziv 78. Namun kompresi data yang dilakukan perlu memperhatikan kebutuhan KBBI yaitu pencarian kembali hanya sebagian kecil data dan waktu akses yang harus cepat. Untuk itu juga dirancanga strategi-strategi kompresi terhadap data KBBI. Strategi I mengkompresi keseluruhan berkas data, strategi II membagi berkas data dalam blok-blok kecil yang besarnya sama, dan strategi III membagi berkas data sesuai data sesuai dengan banyaknya data tiap entri. Untuk mencari bagaimana kompresi data yang terbaik untuk KBBI, dilakukan uji coba dengan mengimplementasikan algoritme-algoritme dan strategi-strategi kompresi diatas dan kemudian mengukur kinerjanya berupa rasio kompresi dan kecepatan eksekusinya. Dari pengukuran dan pengamatan terhadap ukuran kinerja semua kombinasi strategi dan algoritme dapat dipilih strategi dan algoritme pemampatan data teks untuk KBBI.