Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-1360 (Softcopy SK-842) Source Code SK-545
Collection Type Skripsi
Title Pengembangan metode penambangan frequent sequence berbasis framework komputasi terdistribusi spark
Author Prasetya AJie Utama;
Publisher Depok: FASILKOM UI, 2015
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-1360 (Softcopy SK-842) Source Code SK-545 TERSEDIA
Tidak ada review pada koleksi ini: 42815
ABSTRAK Nama : Prasetya Ajie Utama Program Studi : Ilmu Komputer Judul : Pengembangan Metode Penambangan Frequent Sequence berbasis Framework Komputasi Terdistribusi Spark Penambangan sequence pattern berbentuk n-gram (rangkaian kata yang saling bersebelahan) dari data teks berukuran besar merupakan bagian penting dalam berbagai aplikasi information retrieval dan natural language processing. Dalam penelitian ini, diperkenalkan metode bernama Spark-gram, yaitu metode penambangan frequent sequence berskala besar berbasis framework komputasi terdistribusi Spark. Metode ini diadaptasi dari metode ekivalen yang dikembangkan pada MapReduce yang disebut dengan Suffix-σ. Desain metode Spark-gram memungkinkan perhitungan n-gram berukuran maksimal σ dan kemunculan minimal τ, secara iteratif dengan hanya satu kali fase shuffle. Hasil evaluasi menunjukkan bahwa performa Spark-gram dapat mengungguli Suffix-σ terutama untuk nilai τ yang semakin besar. Namun, performa Spark-gram menurun dengan laju yang cepat seiring dengan bertambahnya nilai σ, sehingga terdapat kemungkinan bahwa performa Spark-gram yang lebih buruk dibandingkan dengan Suffix-σ untuk nilai σ yang lebih besar. Kata Kunci: Komputasi terdistribusi, Hadoop, MapReduce, Spark, Penambangan Frequent Sequence, Information Retrieval, Natural Language Processing