Blog

Data Science & Data Analyst

Apa Itu Naive Bayes Classifier? Pengertian dan Cara Kerja

Irhan Hisyam Dwi Nugroho

•

25 November 2025

•

495

Naive Bayes Classifier adalah algoritma klasifikasi yang digunakan untuk memprediksi kategori data berdasarkan probabilitas. Algoritma ini mengasumsikan bahwa fitur dalam data saling independen satu sama lain.

Cara kerjanya cukup sederhana, Warga Bimbingan, yaitu dengan menghitung probabilitas setiap kelas dan memilih yang paling tinggi. Meskipun sederhana, algoritma ini sangat efektif, terutama untuk data besar dan klasifikasi teks.

Yuk, kita bahas lebih lanjut bagaimana Naive Bayes bekerja dan aplikasinya dalam dunia machine learning!

Apa Itu Naive Bayes Classifier?

Naive Bayes Classifier adalah algoritma klasifikasi yang digunakan dalam machine learning untuk memprediksi kategori atau kelas suatu data.

Algoritma ini bekerja berdasarkan prinsip probabilitas, dengan menghitung kemungkinan sebuah data masuk ke dalam kelas tertentu.

Yang unik dari Naive Bayes adalah asumsi independensi antara fitur, yang berarti setiap fitur dianggap tidak saling mempengaruhi.

Meskipun terlihat sederhana, algoritma ini sangat efektif, terutama untuk klasifikasi teks seperti email spam atau analisis sentimen.

Cara Kerja Naive Bayes

Naive Bayes menggunakan probabilitas untuk memprediksi kelas data berdasarkan fitur yang ada. Berikut tiga langkah utama dalam cara kerjanya:

1. Menghitung Prior Probability

Langkah pertama adalah menghitung kemungkinan setiap kelas muncul dalam dataset. Ini dilakukan dengan membandingkan jumlah data di setiap kelas dengan total data, memberikan bobot awal untuk setiap kelas.

2. Menghitung Likelihood

Selanjutnya, dihitung kemungkinan fitur muncul dalam setiap kelas. Misalnya, untuk email spam, dihitung berapa sering kata-kata tertentu muncul di email spam versus non-spam, dengan asumsi independensi antar fitur.

3. Menggunakan Teorema Bayes untuk Klasifikasi

Terakhir, Teorema Bayes digunakan untuk menghitung probabilitas akhir setiap kelas berdasarkan prior probability dan likelihood.

Kelas dengan probabilitas tertinggi dipilih sebagai hasil prediksi, memberikan keputusan yang paling tepat berdasarkan data yang ada.

Jenis-Jenis Naive Bayes

Naive Bayes memiliki beberapa varian yang disesuaikan dengan jenis data yang digunakan. Berikut adalah tiga jenis Naive Bayes yang umum digunakan dalam machine learning:

1. Gaussian Naive Bayes

Gaussian Naive Bayes digunakan untuk data kontinu yang mengikuti distribusi normal atau Gaussian.

Pada jenis ini, setiap fitur diasumsikan mengikuti distribusi normal, dan parameter yang digunakan adalah mean dan standar deviasi. Ini cocok digunakan untuk data numerik yang tidak terlalu banyak outlier.

2. Multinomial Naive Bayes

Multinomial Naive Bayes lebih cocok untuk data yang berbasis frekuensi, seperti teks atau dokumen.

Algoritma ini menghitung kemungkinan berdasarkan frekuensi kemunculan fitur (misalnya kata dalam teks) dalam setiap kelas. Biasanya digunakan dalam masalah klasifikasi teks, seperti klasifikasi email spam atau analisis sentimen.

3. Bernoulli Naive Bayes

Bernoulli Naive Bayes digunakan untuk data biner, di mana fitur hanya memiliki dua nilai, seperti 0 atau 1.

Algoritma ini menghitung probabilitas fitur yang muncul atau tidak muncul dalam sebuah kelas. Ini sangat berguna dalam masalah klasifikasi dengan data kategorikal atau biner, seperti analisis keberadaan kata tertentu dalam dokumen.

Kelebihan Naive Bayes

Naive Bayes memiliki beberapa keunggulan utama yang membuatnya sangat efektif untuk tugas klasifikasi. Berikut adalah beberapa di antaranya:

1. Cepat dan Efisien

Naive Bayes sangat cepat dalam pelatihan dan prediksi, bahkan pada dataset besar. Algoritma ini hanya memerlukan perhitungan probabilitas dasar, sehingga sangat efisien dan cocok untuk aplikasi real-time yang membutuhkan kecepatan tinggi.

2. Skalabilitas Tinggi

Algoritma ini dapat menangani dataset besar dengan baik tanpa penurunan kinerja yang signifikan.

Naive Bayes tetap efektif meskipun jumlah fitur atau atribut meningkat, menjadikannya ideal untuk analisis teks dan data besar lainnya.

3. Berkinerja Baik dengan Data Tidak Seimbang

Naive Bayes tetap efektif meski distribusi kelas tidak seimbang, seperti dalam masalah deteksi penipuan atau klasifikasi spam.

Algoritma ini tetap akurat meskipun satu kelas memiliki lebih banyak sampel dibandingkan kelas lainnya.

Kekurangan Naive Bayes

Meskipun Naive Bayes memiliki banyak keunggulan, ada beberapa kekurangan yang perlu dipertimbangkan sebelum memilihnya untuk suatu tugas klasifikasi. Berikut adalah tiga kekurangan utama dari Naive Bayes:

1. Asumsi Independen Antar Fitur

Naive Bayes mengasumsikan bahwa fitur dalam data saling independen satu sama lain, yang seringkali tidak realistis.

Dalam banyak kasus, fitur-fitur ini bisa saling bergantung, seperti pada data gambar atau data dengan hubungan kompleks. Ketika asumsi ini dilanggar, akurasi Naive Bayes bisa menurun secara signifikan.

2. Kinerja Buruk dengan Data Kecil

Naive Bayes mungkin tidak memberikan hasil yang baik pada dataset kecil atau tidak cukup representatif.

Karena algoritma ini sangat bergantung pada probabilitas, jika data yang ada tidak cukup untuk menggambarkan distribusi kelas dengan baik, hasil prediksi bisa menjadi tidak akurat. Hal ini mengurangi efektivitas Naive Bayes pada kasus dengan data terbatas.

3. Kesulitan Menangani Data yang Tidak Terstruktur

Meskipun Naive Bayes sering digunakan untuk data terstruktur, algoritma ini dapat kesulitan menangani data tidak terstruktur yang kompleks, seperti gambar atau suara.

Model ini lebih cocok untuk data berbasis teks atau data numerik. Dalam kasus data tidak terstruktur, Naive Bayes memerlukan teknik preprocessing tambahan yang bisa mengurangi kemudahan penggunaannya.

Contoh Penggunaan Naive Bayes

Sumber: Canva

Naive Bayes adalah algoritma yang sangat fleksibel dan dapat diterapkan pada berbagai jenis masalah klasifikasi. Berikut adalah empat contoh penggunaan Naive Bayes dalam berbagai bidang:

1. Klasifikasi Email (Spam vs Non-Spam)

Naive Bayes sering digunakan untuk mendeteksi email spam dengan menganalisis kata-kata yang muncul dalam email.

Dengan menghitung probabilitas kata-kata tertentu muncul dalam email spam atau non-spam, algoritma ini dapat memprediksi kategori email secara akurat.

Hal ini sangat membantu dalam menyaring email yang tidak diinginkan dan meningkatkan efisiensi penggunaan email.

2. Analisis Sentimen

Naive Bayes banyak digunakan dalam analisis sentimen untuk mengklasifikasikan teks menjadi kategori positif, negatif, atau netral.

Algoritma ini menghitung probabilitas kata-kata dalam teks yang menunjukkan perasaan tertentu, seperti “bagus” atau “buruk”.

Ini memungkinkan perusahaan untuk menganalisis ulasan pelanggan, media sosial, dan feedback untuk mengetahui sentimen publik terhadap produk atau layanan mereka.

3. Klasifikasi Dokumen

Naive Bayes dapat digunakan untuk mengklasifikasikan dokumen atau artikel ke dalam kategori yang sudah ditentukan, seperti politik, ekonomi, atau teknologi.

Dengan menghitung frekuensi kata-kata dalam dokumen dan membandingkannya dengan kategori yang ada, algoritma ini bisa dengan cepat menentukan kelas yang sesuai.

Ini sangat berguna untuk pengorganisasian dokumen atau pencarian informasi berbasis teks.

4. Deteksi Penyakit (Medical Diagnosis)

Naive Bayes dapat diterapkan dalam bidang medis untuk membantu mendiagnosis penyakit berdasarkan gejala yang ada.

Dengan menghitung probabilitas gejala-gejala tertentu yang muncul pada pasien, algoritma ini dapat memprediksi kemungkinan diagnosis penyakit tertentu. Ini membantu dokter dalam membuat keputusan yang lebih cepat dan akurat dalam perawatan pasien.

Ingin Jadi Data Science & Data Analyst Profesional?

Setelah memahami dasar-dasar pengolahan data dan algoritma machine learning, kini saatnya memanfaatkan pengetahuan ini untuk menganalisis data dengan lebih efektif!

Yuk, ikuti Bootcamp Data Science & Data Analyst di dibimbing.id! Di sini, kamu akan mempelajari teknik analisis data, visualisasi, dan penggunaan alat-alat seperti Python, SQL, serta berbagai algoritma untuk mengambil keputusan berbasis data.

Belajar langsung dari mentor berpengalaman dengan kurikulum aplikatif dan praktis yang membantumu menguasai keterampilan analisis data yang dibutuhkan oleh industri.

Dengan lebih dari 840+ hiring partner dan tingkat keberhasilan alumni 96%, peluang kariermu di dunia Data Science semakin terbuka lebar!

Jadi, tunggu apa lagi? Hubungi di sini dan daftar sekarang di dibimbing.id untuk memulai perjalananmu menjadi seorang Data Science & Data Analyst profesional. #BimbingSampeJadi!

Bootcamp Data Science & AI Machine Learning