ABSTRAK
Nama : Natanael Taufik
Program Studi : Ilmu Komputer
Judul : MyNER: Pengenalan Entitas Bernama pada Tweet Bahasa
Indonesia
Twitter adalah salah satu social media yang sedang populer di Indonesia saat ini.
Banyak masyarakat Indonesia yang menggunakan Twitter sebagai media penyalur
opini maupun informasi lainnya. Hal ini membuat banyak informasi yang dapat
digunakan, bersirkulasi dalam tweets. Melalui penelitian mengenai pengenalan entitas
bernama pada tweet bahasa Indonesia ini, informasi entitas bernama dalam
tweets dapat diambil dan disimpan dalam bentuk yang terstruktur. Penelitian ini
dilakukan dengan menggunakan pendekatan supervised learning dan CRF sebagai
algoritmanya. Dalam penelitian ini, dilakukan eksperimen dengan menggunakan
berbagai kombinasi fitur, dan kemudian mencari kombinasi fitur yang memberikan
hasil terbaik. Pada akhir penelitian ini, sistem MyNER yang dibangun sebagai pengenal
entitas bernama pada tweet bahasa Indonesia mampu mendapatkan performa
F-measure terbaik sebesar 59.36%. Nilai tersebut didapat dengan menggunakan
kombinasi fitur its own word, word length, pattern, inside bracket, stanford postagger
- left 2 words and postag, region, stopword, abbreviation, dan last 3 letter.
Kata Kunci:
Twitter, pengenalan entitas bernama, CRF, Indonesia
|
|