ABSTRAK
Nama : Sulisetyo Puji Widodo
Program Studi : Magister Ilmu Komputer
Judul : Table-to-text generation dengan penalaran numerik meng- gunakan
pendekatan Graph2Seq dan R2RML
Pembimbing : Adila Alfa Krisnadhi, S.Kom., M.Sc., Ph.D.
Tabel merupakan bentuk menyajian data yang memiliki format ringkas, mudah dibaca,
dan mudah diproses. Namun tabel tidak dapat menjelaskan datanya sendiri. Oleh karena
itu, menginterpretasikan data pada tabel menjadi narasi merupakan hal yang penting
untuk dilakukan. Namun selain itu ada kebutuhan menghasilkan narasi yang lebih analitik
yang umumnya dibuat oleh manusia dari hasil penalaran numerik dengan cara
membandingkan dan menyimpulkan data dari tabel. Pada banyak domain, table-to-text
generation (T2XG) telah menunjukkan hasil yang baik dalam menghasilkan teks
deskriptif daritabel. Sequence-to-sequence (Seq2Seq) menjadi struktur encoder-decoder
yang paling banyak digunakan dalam menghasilkan narasi dari tabel. Seq2Seq
memerlukan input berupa rangkaian teks sehingga tabel perlu dilinearisasi mengikuti
format tertentu agar dapat diproses pada model. Namun linearisasi langsung dari tabel
akan menghilangkan informasi struktural dan dapat mengalami masalah halusinasi
sehingga narasi yang di- hasilkan tidak selaras dengan data pada tabel. Selain Seq2Seq,
terdapat struktur encoder- decoder lain yaitu graph-to-sequence (Graph2Seq) yang
memanfaatkan graph encoder seperti graph neural network (GNN) atau graph
convolutional network (GCN) sebagai encoder. Pada beberapa penelitian Graph2Seq
mampu mengungguli Seq2Seq karena graph encoder lebih baik dalam menangkap
informasi penting pada data. Namun belum ada penelitian yang menerapkan Graph2Seq
pada T2XG padahal pada dasarnya tabel mengandung informasi terstruktur yang dapat
dipresentasikan dengan graf. Penelitian ini bermaksud untuk menerapkan Graph2Seq
sebagai basis komponen utama untuk menyele-saikan masalah T2XG. Ide intuitifnya
adalah struktur pada tabel direpresentasikan dahulu sebagai graf yang kemudian
disematkan ke ruang vektor menggunakan graph encoder. Vektor tersebut kemudian
diteruskan pada decoder berbasis sequence untuk menghasilkan teks. Karena belum ada
penelitian yang menggunakan Graph2Seq pada T2XG, maka penelitian ini memulai
dengan GCN-RNN, GGNN-RNN, dan Graphsage-RNN.
Kata kunci: table-to-text generation, penalaran numerik, graph, graph neural network,
graph convo-lutional network, recurrent neural network
|