Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-1715 (Softcopy SK-1197) Source Code SK-691
Collection Type Skripsi
Title Penjajaran Vocabulary antara Data Tabular pada Portal Data Terbuka dengan Knowledge Graph Wikidata
Author Gibran Muhammad Fajar;
Publisher Depok: Fakultas Ilmu Komputer Universias Indonesia, 2019
Subject
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-1715 (Softcopy SK-1197) Source Code SK-691 TERSEDIA
Tidak ada review pada koleksi ini: 46674
ABSTRAK Nama : Gibran Muhammad Fajar Wisesa Program Studi : Ilmu Komputer Title : Penjajaran Vocabulary antara Data Tabular pada Portal Data Terbuka dengan Knowledge Graph Wikidata Dengan banyak bermunculnya portal data terbuka, maka banyak data khususnya data tabular yang tersedia dan dapat dimanfaatkan. Namun, data tabular seperti data berformat CSV mempunyai kekurangan dalam hal semantik dan keterhubungan. Argumen ini diperkuat dengan sistem rating 5-Star Open Data Portal yang menilai portal data terbuka yang datanya berformat CSV hanya memiliki rating bintang tiga, sedangkan untuk mendapatkan rating bintang lima perlu menerapkan konsep linked data seperti URIs dan RDF. Wikidata sebagai Knowledge Graph yang mendukung format RDF, dapat memberi manfaat-manfaat lain dari portal data terbuka. OD2WD yaitu sebuah sistem yang dapat mengubah data tabular ke dalam Knowledge Graph Wikidata secara semi-otomatis dengan pendekatan pattern-based, yaitu dengan cara mengidentifikasi pola-pola yang ada pada proses penjajaran vocabulary sehingga dapat diterapkan pada kasus yang lain. Salah satu isu utama pada OD2WD adalah penjajaran vocabulary dari data tabular ke dalam Knowledge Graph Wikidata. Penelitian ini membahas rancangan sistem penjajaran vocabulary dengan pendekatan alignment pattern yang dibagi menjadi tiga tahap, yaitu: pemetaan properti, penghubungan kelas, dan penghubungan entitas. Setiap tahap sistem akan mencari pasangan vocabulary di data tabular dengan vocabulary yang ada pada Knowledge Graph Wikidata dengan melihat nilai kemiripan menggunakan algoritme text similarity, yaitu word embedding. Setiap tahap telah dievaluasi dengan menggunakan 50 data tabular yang ada pada portal data nasional, Jakarta, dan Bandung dengan hasil pada tahap pemetaan properti, penghubungan kelas, dan penghubungan entitas masing-masing mendapatkan akurasi 79.21%, 70%, dan 88.42%. Implementasi dari sistem yang telah dibuat berupa OD2WD API yang dapat diakses di http://od2wd.id/api/. Kata Kunci: Data Terbuka, Wikidata, Alignment Pattern