PERBANDINGAN KINERJA NAIVE BAYES DAN RANDOM FOREST DENGAN PENANGANAN IMBALANCE DATA

Authors

  • Fortunatus Adhiethera Tuah Putra Universitas Tanjungpura
  • Arif Bijaksana Putra Negara Universitas Tanjungpura
  • Helen Sastypratiwi Universitas Tanjungpura

Keywords:

data mining, klasifikasi, naive bayes, random forest, SMOTE, undersampling.

Abstract

Data mining merupakan proses penting untuk mengekstraksi informasi berharga dari kumpulan data besar dan kompleks. Salah satu teknik utamanya adalah klasifikasi, yang digunakan untuk memprediksi kategori data berdasarkan fitur tertentu. Penelitian ini membandingkan performa algoritma Naïve Bayes dan Random Forest dalam mengatasi klasifikasi pada data tidak seimbang. Dataset yang digunakan adalah Bank Marketing dari UCI Machine Learning Repository yang memiliki distribusi kelas tidak seimbang, dengan perbandingan signifikan antara label “yes” dan “no”. Penelitian ini mengevaluasi pengaruh dua teknik penyeimbangan data, yaitu Synthetic Minority Oversampling Technique (SMOTE) dan undersampling, terhadap kinerja kedua algoritma dengan metrik akurasi, presisi, recall, dan F1-score. Pada Naïve Bayes, model default memberikan hasil terbaik (akurasi 91,78%, presisi 90,59, recall 91,78, F1-Score 90,93), sedangkan penggunaan SMOTE atau undersampling justru menurunkan seluruh metrik, dengan penurunan terbesar pada SMOTE (−9,25%). Pada Random Forest, SMOTE meningkatkan akurasi, recall, dan F1-Score secara signifikan, yaitu 5,18% pada akurasi, menghasilkan kombinasi terbaik (akurasi 93,08%, presisi 93,35, recall 93,08, F1-Score 93,07). Hal ini menunjukkan bahwa SMOTE efektif untuk algoritma berbasis pohon, sementara Naïve Bayes lebih optimal tanpa penyeimbangan data tambahan.

Downloads

Published

2025-09-15

How to Cite

Putra, F. A. T., Negara , A. B. P., & Sastypratiwi , H. (2025). PERBANDINGAN KINERJA NAIVE BAYES DAN RANDOM FOREST DENGAN PENANGANAN IMBALANCE DATA . Scientica: Jurnal Ilmiah Sains Dan Teknologi, 3(6), 161–170. Retrieved from https://jurnal.researchideas.org/index.php/scientica/article/view/1748