ANALISIS DAN PERBANDINGAN STEMMING ALGORITMA PORTER DENGAN ALGORITMA AHMAD YUSOFF SEMBOK DALAM DOKUMEN TEKS BAHASA INDONESIA

Authors

  • Arif Siswandi Universitas Pelita Bangsa
  • Nurhadi Surojudin Universitas Pelita Bangsa

Keywords:

STEMMING ALGORITMA PORTER, ALGORITMA AHMAD YUSOFF SEMBOK, DOKUMEN TEKS

Abstract

Stemming adalah proses untuk mengklasifikasi berbagai macam variasi morfologikal dari sebuah kata maupun kalimat menjadi satu bentuk dasar yang sama. Di dalam stemming berbahasa Indonesia, terdapat dua jenis metode stemming yang sudah ada, yaitu algoritma stemming yang berbasis kamus (dictionary based) dan algoritma stemming yang berbasis non-kamus (purely rule based). Penelitian ini menggunakan model perbandingan dua algoritma stemming berbasis kamus dan algoritma stemming menggunakan aturan imbuhan. Algoritma yang digunakan adalah algoritma Porter Indonesia untuk yang berbasis kamus. Algoritma stemming berbasis aturan imbuhan yang digunakan adalah algoritma Ahmad Yusoff Sembok. Pengujian dilakukan dengan menggunakan 100 dokumen teks Bahasa Indonesia yang sudah ditentukan sebelumnya. Hasil pengujian yang dilakukan menunjukkan bahwa nilai Akurasi yang paling tinggi terdapat pada algoritma Porter, nilai Overstemming dan Understemming yang paling sedikit juga terdapat pada algoritma Porter. Dari pengujian yang telah dilakukan menunjukkan bahwa algoritma Porter lebih baik daripada Algoritma Ahmad Yusoff Sembok. Kata Kunci : Information Retrieval, Stemming, Akurasi, Overstemming dan Understemming

Published

2020-10-13