Salah satu bagian dari ekstraksi informasi adalah pengenalan entitas bernama yang bertujuan untuk memperoleh entitas bernama, ekspressi waktu dan ekspresi angka yang terdapat dalam suatu dokumen. Penelitian ini dilakukan untuk mengembangakan sistem pengenalan entitas bernama pada dokumen berbahasa Indonesia. Pendekatan yang digunakan dalam penelitian ini adalah machine learning approach dengan menggunakan. Hidden Markov Model (HMM) seabgai metode untuk mengenal entitas bernama. Untuk membantu mengenali entitas dari suatu token digunakan fitur morfologi dan kelas kata. Pengujian sistem dilakukan dengan menggunakan fitur morfologi, kelas kata, dan gabungan dari keduanya . Hasil pengujian menunjukkan bahwa sistem dapat memberikan hasil terbaik ketika mengunakan fitur morfologi. Hasil pengujian tersebut memiliki F-measure sebesar 75,24%
|
|