ABSTRAK Nama : Prasetya Ajie Utama Program Studi : Ilmu Komputer Judul : Pengembangan Metode Penambangan Frequent Sequence berbasis Framework Komputasi Terdistribusi Spark Penambangan sequence pattern berbentuk n-gram (rangkaian kata yang saling bersebelahan) dari data teks berukuran besar merupakan bagian penting dalam berbagai aplikasi information retrieval dan natural language processing. Dalam penelitian ini, diperkenalkan metode bernama Spark-gram, yaitu metode penambangan frequent sequence berskala besar berbasis framework komputasi terdistribusi Spark. Metode ini diadaptasi dari metode ekivalen yang dikembangkan pada MapReduce yang disebut dengan Suffix-σ. Desain metode Spark-gram memungkinkan perhitungan n-gram berukuran maksimal σ dan kemunculan minimal τ, secara iteratif dengan hanya satu kali fase shuffle. Hasil evaluasi menunjukkan bahwa performa Spark-gram dapat mengungguli Suffix-σ terutama untuk nilai τ yang semakin besar. Namun, performa Spark-gram menurun dengan laju yang cepat seiring dengan bertambahnya nilai σ, sehingga terdapat kemungkinan bahwa performa Spark-gram yang lebih buruk dibandingkan dengan Suffix-σ untuk nilai σ yang lebih besar. Kata Kunci: Komputasi terdistribusi, Hadoop, MapReduce, Spark, Penambangan Frequent Sequence, Information Retrieval, Natural Language Processing