Optimasi Stemming Porter KBBI dan Cross Validation Naïve Bayes untuk Klasifikasi Topik Soal UN Bahasa Indonesia

Authors

  • A. Yudi Permana Jurusan Teknik Informatika STT PELITA BANGSA
  • Ismasari Jurusan Teknik Informatika STT PELITA BANGSA
  • M. Makmun Effendi Jurusan Teknik Informatika STT PELITA BANGSA

Abstract

Penelitian ini dimaksudkan untuk mencari nilai akurasi klasifikasi topik soal UN bahasa indonesia yang terdiri dari 12 kategori topik soal UN (ujian nasional) bahasa indonesia untuk tingkat SMK. Tujuan utama dari penelitian ini adalah mencari klasifikasi dari pada topik soal UN (ujian nasional) Bahasa indoensia yang kemudian di evaluasi hasil akurasinya dengan beberapa pendekatan optimasi algirtma. Metode penelitian yang digunakan adalah dengan terlebih dahulu melakukan Preprocessing dan optimasi stemming porter KBBI pada data soal UN (ujian nasional) bahasa indonesia, Dengan jumlah data training 350 soal dan data testing 150 soal. Proses Preprocessing merupakan proses melakukan Case Folding, Stopword Removal dan menerapkan optimasi algoritma Stemming porter KBBI. Setelah Preprocessing data kemudian dicari nilai frekuensi kata pada tiap soal sehingga setiap kata dari dokumen soal UN (ujian nasional) Bahasa indoensia tersebut mempunyai nilai. Kemudian diberikan label klasifikasi secara manual dan pada tahapan akhir metode dilakukan klasifikasi dengan algoritma Naïve. Dari hasil penelitian akurasi klasifikasi dengan optimasi pendekatan stemming porter KBBI dan pendekatan metode klasifiksai cross validation naibe bayes, dengan hasil akurasi data training 94,34% dan data testing cross validation 72.67%.

Downloads

Download data is not yet available.

Downloads

Published

25-12-2018

How to Cite

[1]
Permana, A.Y., Ismasari and Effendi, M.M. 2018. Optimasi Stemming Porter KBBI dan Cross Validation Naïve Bayes untuk Klasifikasi Topik Soal UN Bahasa Indonesia: Array. Jurnal Ilmiah Komputasi. 17, 4 (Dec. 2018), 357–368.
Abstract View: 106 times