Algoritma pencarian string telah menjadi topik yang ramai dibicarakan di dunia komputer sejak berpuluh-puluh tahun yang lalu. Banyak para ahli yang mencoba menemukan algoritma pencarian string yang dapat memberikan hasil yang tepat dalam waktu singkat. Algoritma-algoritma baru bermunculan untuk memperbaiki kinerja algoritma pencarian string yang telah ada sebelumnya. Pentingnya sebuah algoritma pencarian string yang mampu memberikan hasil yang tepat dalam waktu yang relatif cepat memang sangat beralasan. Mengingat manipulasi string sangat diperlukan dalam dunia komputer. Banyak hal yang dapat dilakukan dengan adanya algoritma pencarian string yang handal. Permasalahan yang sering berkaitan dengan pengolahan string adalah mengenai ukuran data yang sangat besar dan juga pola atau karakteristik string yang berbedabeda. Ukuran data yang sangat besar jelas memberikan pengaruh yang besar terhadap waktu serta space yang dibutuhkan untuk melakukan pencarian. Sedangkan karakteristik dari string yang akan diproses berpengaruh terhadap
kematangan sebuah algoritma pencarian string. Algoritma yang dapat bekerja dengan baik pada string umum (string yang terdiri dari banyak jenis karakter serta tidak memiliki pola tertentu) belum tentu dapat memberikan hasil yang sama apabila diterapkan pada string yang khusus. String khusus yang dimaksudkan di sini adalah string yang hanya terdiri dari karakter-karakter tertentu saja ataupun string yang memiliki pola tertentu. Salah satu string khusus yang berbeda dari string yang akrab dengan kehidupan manusia sehari-hari adalah string yang berisi informasi DNA mahluk hidup. Jenis string ini
hanya terdiri dari empat karakter inti, yaitu A, C, G, dan T. Hanya dari empat karakter tersebut, dapat tersusun milyaran informasi DNA yang berbeda-beda. Pencarian string pada data DNA (data genomic), merupakan suatu permasalahan yang patut diberikan perhatian khusus. Karena penelitian mengenai DNA mahluk hidup merupakan suatu penelitian yang mendatangkan banyak sekali manfaat bagi
seluruh mahluk hidup. Manfaat dari proses pencarian atau pencocokan string pada data genomic antara lain adalah untuk mengetahui kemiripan suatu mahluk hidup dengan mahluk hidup lain ataupun juga mengetahui manfaat dari suatu protein tertentu dengan melakukan perbandingan dengan protein-protein yang terdapat di bank data protein. Oleh karena itu, sangat beralasan jika algoritma pencarian string untuk data genomic yang dapat memberikan hasil yang tepat dalam waktu yang singkat sangat diperlukan.
|
|