ABSTRAK

Pengguna financial news (financial newspapers, news agencies, dan lain-lain), analis keuangan, pekerja dari Securities Companies, dan pengguna individu yang memiliki financial knowledge setiap hari harus berurusan dengan sejumlah besar informasi. Semua pengguna tersebut mengetahui bahwa kemajuan dari capital market bergantung pada banyak news yang relevan. Itulah sebabnya muncul kebutuhan untuk mendapatkan informasi dari dokumen teks dan memanfaatkan informasi yang telah diperoleh tersebut untuk melakukan klasifikasi dokumen. Text mining adalah suatu teknologi untuk mendapatkan informasi yang lebih bermanfaat dan dapat diinterpretasikan pada suatu data yang tidak terstruktur. Penelitian ini memanfaatkan teknologi text mining untuk melakukan klasifikasi dokumen financial yang berasal dari web. Dalam penelitian ini diterapkan dua metode klasifikasi yaitu vector space model dan algoritma naīve bayes. Dalam penelitian ini terbukti bahwa text mining dengan menggunakan metode vector space model dan pembobotan TF IDF dapat memberikan hasil yang lebih baik dibandingkan dengan algoritma Naīve Bayes serta pembobotan frekuensi. Kombinasi vector space model dan TF IDF dalam klasifikasi terbukti mampu melakukan klasifikasi dokumen dalam jumlah besar dan memberikan hasil yang akurat. Penggunaan text mining dalam klasifikasi menambah value dari masing-masing dokumen karena kini dokumen dapat diprediksi kontennya dan dapat diorganisir dengan baik.