Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-1718 (Softcopy SK-1200) Source Code SK-693
Collection Type Skripsi
Title Ekstraksi Atribut pada Produk Buku di Marketplace Menggunakan Pendekatan Named Entity Recognition
Author Faisal Satrio Priatmadji;
Publisher Depok: Fakultas Ilmu Komputer Universias Indonesia, 2019
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-1718 (Softcopy SK-1200) Source Code SK-693 TERSEDIA
Tidak ada review pada koleksi ini: 46681
ABSTRAK Nama : Faisal Satrio Priatmadji Program Studi : Sistem Informasi Judul : Ekstraksi Atribut pada Produk Buku di Marketplace Menggunakan Pendekatan Named Entity Recognition Pembimbing : Rahmad Mahendra, S.Kom., M.Sc. & Dr. Indra Budi, S.Kom., M.Kom. Produk yang dijual di marketplace dewasa ini sangat banyak dan beragam. Salah satunya adalah produk buku. Informasi produk buku tersebut dapat diesktrak melalui judul produk menjadi suatu informasi seperti judul buku, penulis, penerbit, dan lain-lain. Atribut yang sudah diekstrak tersebut dapat berguna dalam membuat katalog, fungsi pencarian, maupun recommender system. Pada penelitian ini dilakukan ekstraksi atribut terhadap produk buku melalui judul produk dengan menggunakan data dari salah satu marketplace di Indonesia yaitu Bukalapak. Permasalahan ini dipandang sebagai sequence labeling, karena penelitian ini melakukan prediksi label untuk setiap kata pada judul produk dalam satu kesatuan sequence. Adapun atribut buku yang diekstrak pada penelitian ini antara lain judul buku, penulis, penerbit, subjudul, tahun, edisi, volume, dan seri. Atribut-atribut tersebut dilakukan ekstraksi fitur terhadap empat konfigurasi ekstraksi fitur antara lain lexical feature, position feature, tag feature, dan word shape feature. Hasil ekstraksi terbaik pada percobaan ini ditunjukkan oleh kombinasi lexical feature dan word shape feature yaitu dengan F-measure sebesar 48.682% dan token-based accuration 70.992%. Selain itu dilakukan juga pecobaan dengan hanya menilainya dari tiga atribut utama saja yaitu judul, penulis, dan penerbit. Pada skenario pertama yaitu menjalankan eksperimen dengan semua atribut mendapatkan F-measure sebesar 54.810%. Selanjutnya eksperimen dilakukan dengan menghilangkan atribut subjudul dan berhasil menaikkan F-measure menjadi 57.418%. Terakhir, penelitian ini menjalankan eksperimen terhadap tiga atribut utama saja sehingga mendapatkan hasil F-measure terbaik yaitu 58.297%. Evaluasi terhadap sequence labeling yang digunakan dalam penelitian ini dilakukan secara full-matching. Kata kunci: marketplace, judul produk, ekstraksi atribut, ekstraksi fitur, sequence labeling