PENGKLASIFIKASIAN DOKUMEN BERBAHASA ARAB MENGGUNAKAN K-NEAREST NEIGHBOR

Fahrul Agus, Mahyudin Mahyudin

Abstract


Pengklasifikasian dokumen didasarkan atas kesamaan fitur atau kesamaan isi dokumen. Klasifikasi dilakukan dengan cara memasukan dokumen-dokumen kedalam kategori-kategori yang sudah ditentukan sebelumnya. K-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Algoritma ini bertujuan untuk mengklasifikasi objek baru berdasarkan atribut dan training sampel. Uji coba dilakukan pada dokumen teks berbahasa Arab diambil dari koleksi dokumen surat kabar Arab Al-Jazirah. Algoritma kNN dipilih karena lebih sederhana, efektif, dan dapat diaplikasikan pada jumlah training yang sedikit. Hasil uji coba membuktikan bahwa penggunaan algoritma kNN dapat melakukan  klasifikasi dokumen berbahasa Arab dengan nilai lokal optimal F-Measure terbaik sebesar 0.85 dan tingkat akurasi 96%.


Keywords


k-Nearest Neighbor, Klasifikasi dokumen berbahasa Arab

Full Text: PDF

Refbacks

  • There are currently no refbacks.


Creative Commons License
The JSM site and its metadata are licensed under CC BY-NC-ND