Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number T-1120 (Softcopy T-829) source code T-233
Collection Type Tesis
Title Normalisasi kata pada pesan/status singkat berbahasa Indonesia
Author Putra Pandu Adikara;
Publisher Depok: Fakultas Ilmu Komputer, 2015
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
T-1120 (Softcopy T-829) source code T-233 TERSEDIA
Tidak ada review pada koleksi ini: 42850
ABSTRAK Nama : Putra Pandu Adikara Program Studi : Magister Ilmu Komputer Judul : Normalisasi Kata pada Pesan/Status Singkat Berbahasa Indonesia Penggunaan teknologi seperti pesan singkat, status pada media sosial yang memiliki ruang terbatas, seperti Twitter, membawa dampak terhadap penggunaan kata serta kualitas teks yang dihasilkan. Keterbatasan panjang karakter yang dapat diinputkan serta kebutuhan untuk mengetik secara efisien dan cepat menyebabkan kecenderungan untuk menggunakan kata tidak baku. Ketidakbakuan ini juga disebabkan oleh ragam bahasa yang umumnya digunakan remaja. Adanya permasalahan ini maka diperlukan suatu model normalisasi kata yang dapat mengoreksi kata tidak baku menjadi kata baku sesuai kebakuan dalam bahasa Indonesia. Penelitian yang telah ada kebanyakan berfokus pada bahasa Inggris. Sedangkan dalam bahasa Indonesia terdapat pola pengubahan kata baku menjadi tidak baku yang tidak dapat diatasi dengan model pada bahasa Inggris. Atas permasalahan ini maka dalam penelitian akan dibuat model normalisasi kata tidak baku yang spesifik terhadap bahasa Indonesia menggunakan pre-normalisasi berbasiskan aturan dan model noisy channel. Metode yang diusulkan dapat menaikkan hasil akurasi terutama pada kata berimbuhan tidak baku dan pengubahan kata slang menjadi kata baku pada bahasa Indonesia. Hasil dari normalisasi menggunakan pre-normalisasi berbasiskan aturan dan model noisy channel di tingkat kata berdasarkan 1-best sebesar 63.0%, recall 0.86, precision 0.70 untuk penyingkatan seluruh vokal dan 1-best sebesar 64.9%, recall 0.78, precision 0.73 untuk penyingkatan sebagian vokal, kata berimbuhan tidak baku dan out-of-vocabulary (OOV). Hasil normalisasi di tingkat kalimat berdasarkan BLEU score adalah sebesar 0.638. Kata kunci: normalisasi teks, Twitter, noisy channel model, bahasa Indonesia