Dalam upaya pengkomputerisasian Kamus Besar Bahasa Indonesia timbul permasalahan tentand metode penyimpanan datta untuk menghemat penggunaan ruan disk. Metoda yang palin gsederhana adalah dengan melakukan pengindeksan berdasarkan lema dan sublema. Tetapi cara ini akan mengakibatkan ukuran berkas indeks yang semakin besar setiap kali terjadi penambahan lema atau sublema baru. Pengindeksan berdasarkan lema dapat memperkecil ukuran berkas indeks karena tidak semua entri dimasukkan ke dalam berkas. Namun hal ini akan menimbulkan masalah dalam pencarian sublema. Untuk mengatasinya sistem harus bisa membentuk kembali lema yang membentuk sublema tersebut. Algorirma stemming adalah salah satu cara yang dapat dilakukan untuk mengembalikan bentuk dasar yang membentuk sublema tersebut. Metode yang digunakan pada algoritma ini adalah metoda pemotongan imbuhan (affix removal). Algoritma ini dapat memisahkan semua jenis imbuhan dari sublema berimbuhan untuk memperoleh lema yang membentuknya sehingga pencarian sublema tersebut tetap dapat dilakukan.
|
|