Pengklasifikasian Dokumen Berbahasa Arab Menggunakan K-Nearest Neighbor

Authors

  • Fahrul Agus Mulawarman University
  • Heliza Rahmania Hatta Mulawarman University
  • Mahyudin Mahyudin Mulawarman University

DOI:

https://doi.org/10.55601/jsm.v18i1.413

Keywords:

k-Nearest Neighbor, Klasifikasi dokumen berbahasa Arab

Abstract

Pengklasifikasian dokumen didasarkan atas kesamaan fitur atau kesamaan isi dokumen. Klasifikasi dilakukan dengan cara memasukan dokumen-dokumen kedalam kategori-kategori yang sudah ditentukan sebelumnya. K-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Algoritma ini bertujuan untuk mengklasifikasi objek baru berdasarkan atribut dan training sampel. Uji coba dilakukan pada dokumen teks berbahasa Arab diambil dari koleksi dokumen surat kabar Arab Al-Jazirah. Algoritma kNN dipilih karena lebih sederhana, efektif, dan dapat diaplikasikan pada jumlah training yang sedikit. Hasil uji coba membuktikan bahwa penggunaan algoritma kNN dapat melakukan�?�  klasifikasi dokumen berbahasa Arab dengan nilai lokal optimal F-Measure terbaik sebesar 0.85 dan tingkat akurasi 96%.

Author Biographies

Fahrul Agus, Mulawarman University

Computer Science
Mulawarman University

Heliza Rahmania Hatta, Mulawarman University

Computer Science
Mulawarman University

Mahyudin Mahyudin, Mulawarman University

Computer Science
Mulawarman University

Downloads

Published

25-04-2017