dibimbing.id - Confusion Matrix Adalah: Contoh, Fungsi, dan Perhitungannya

Confusion Matrix Adalah: Contoh, Fungsi, dan Perhitungannya

Irhan Hisyam Dwi Nugroho

26 June 2025

143

Image Banner

Warga Bimbingan, confusion matrix adalah alat yang digunakan untuk menilai seberapa baik model klasifikasi bekerja. Confusion matrix membandingkan hasil prediksi dengan data asli untuk mengetahui kesalahan yang terjadi dalam model.

Dalam confusion matrix, ada empat elemen penting yang harus dipahami: TP, TN, FP, dan FN. Dari elemen-elemen ini, kita bisa menghitung metrik penting seperti akurasi, presisi, dan recall untuk mengevaluasi performa model.

Dengan memahami confusion matrix, Warga Bimbingan bisa tahu kekuatan dan kelemahan model kamu. Yuk, kita bahas lebih dalam agar model kamu semakin canggih!

Baca juga : Panduan Memilih Bootcamp Data Science Terbaik di 2025


Apa Itu Confusion Matrix?


Confusion matrix adalah alat yang digunakan untuk mengevaluasi performa model klasifikasi dalam machine learning

Alat ini berbentuk tabel yang membandingkan hasil prediksi model dengan data asli, sehingga kita bisa mengetahui apakah model membuat kesalahan atau tidak. 

Dalam confusion matrix, ada empat elemen utama yang perlu diperhatikan, yaitu True Positive (TP), True Negative (TN), False Positive (FP), dan False Negative (FN). 

Dengan menganalisis keempat elemen tersebut, kita dapat menghitung berbagai metrik evaluasi seperti akurasi, presisi, recall, dan F1-score untuk mengukur seberapa efektif model dalam melakukan klasifikasi.

Baca juga : Panduan Cara Belajar Python untuk Data Scientist, Lengkap!


Fungsi Confusion Matrix


Sumber: Canva

Confusion matrix berfungsi untuk mengevaluasi kinerja model klasifikasi secara mendalam dan mengidentifikasi kesalahan dalam prediksi. Berikut adalah beberapa fungsi utama confusion matrix:


1. Mengukur Akurasi Model


Confusion matrix digunakan untuk menghitung akurasi, yaitu proporsi prediksi yang benar. Namun, akurasi tidak selalu cukup untuk menilai model secara menyeluruh, terutama dalam masalah klasifikasi yang tidak seimbang.


2. Menganalisis Jenis Kesalahan


Melalui TP, TN, FP, dan FN, kita bisa mengetahui jenis kesalahan yang dilakukan model. Ini membantu untuk memperbaiki dan meningkatkan akurasi model di masa depan.


3. Menghitung Metrik Lainnya


Confusion matrix memungkinkan kita menghitung metrik seperti presisi, recall, dan F1-score, yang memberikan wawasan lebih mendalam tentang performa model.


4. Menilai Performa Kelas Individu


Confusion matrix membantu menilai bagaimana model bekerja di setiap kelas, penting terutama pada dataset yang tidak seimbang, untuk memastikan model tidak bias terhadap kelas mayoritas.

Baca juga : Panduan Analisis Data dengan Python Pandas, Mudah Dipelajari


Contoh Tabel Confusion Matrix


Struktur Confusion matrix terdiri dari empat elemen utama yang masing-masing mewakili jenis hasil yang bisa terjadi dalam proses klasifikasi. Elemen-elemen tersebut adalah:


1. True Positive (TP):


Ini adalah jumlah kasus yang benar-benar positif dan diprediksi sebagai positif oleh model. Misalnya, dalam deteksi penyakit, ini berarti pasien yang benar-benar sakit dan terdeteksi oleh model sebagai sakit.


2. False Positive (FP):


Ini adalah jumlah kasus yang sebenarnya negatif (tidak sakit) tetapi diprediksi positif (terdeteksi sakit) oleh model. Kesalahan ini sering disebut sebagai Type I Error.


3. False Negative (FN):


Ini adalah jumlah kasus yang sebenarnya positif (sakit) tetapi diprediksi negatif (tidak sakit) oleh model. Kesalahan ini disebut sebagai Type II Error.


4. True Negative (TN):


Ini adalah jumlah kasus yang benar-benar negatif dan diprediksi sebagai negatif oleh model. Misalnya, pasien yang sehat dan terdeteksi oleh model sebagai sehat.

Baca juga : Python untuk Data Analyst: Arti, Manfaat, Library, dan Tips


Contoh Kasus Confusion Matrix:


Misalnya, kita memiliki model klasifikasi yang digunakan untuk mendeteksi apakah gambar yang diberikan berisi hewan atau bukan hewan. Model ini mengklasifikasikan gambar sebagai “hewan” atau “bukan hewan.”

  1. True Positive (TP): Gambar yang benar-benar hewan dan diprediksi sebagai hewan oleh model. Misalnya, 50 gambar yang berisi hewan dan model mengklasifikasikannya sebagai hewan.
  2. False Positive (FP): Gambar yang sebenarnya bukan hewan, tetapi diprediksi sebagai hewan oleh model. Misalnya, 10 gambar yang berisi benda bukan hewan tetapi model mengklasifikasikannya sebagai hewan.
  3. False Negative (FN): Gambar yang sebenarnya hewan, tetapi diprediksi bukan hewan oleh model. Misalnya, 15 gambar hewan yang diprediksi model sebagai bukan hewan.
  4. True Negative (TN): Gambar yang benar-benar bukan hewan dan diprediksi sebagai bukan hewan oleh model. Misalnya, 70 gambar yang bukan hewan dan model mengklasifikasikannya dengan benar sebagai bukan hewan.


Metode Perhitungan dari Confusion Matrix:


Dari confusion matrix, kita bisa menghitung metrik evaluasi untuk menilai kinerja model, berikut adalah perhitungannya:


1. Akurasi


Akurasi mengukur seberapa baik model dalam melakukan klasifikasi secara keseluruhan.

Rumus:

Akurasi =

Contoh:

Jika TP = 50, TN = 70, FP = 10, dan FN = 15, maka akurasi model adalah:


2. Presisi


Presisi mengukur seberapa banyak prediksi positif (hewan) yang benar-benar hewan.

Rumus:

Contoh:

Jika TP = 50 dan FP = 10, maka presisi model adalah:


3. Recall (Sensitivitas)


Recall mengukur seberapa banyak gambar hewan yang berhasil diprediksi dengan benar oleh model.

Rumus:

Contoh:

Jika TP = 50 dan FN = 15, maka recall model adalah:


4. F1-Score


F1-Score adalah rata-rata harmonis antara presisi dan recall, memberikan keseimbangan keduanya.

Rumus:

Contoh:

Jika presisi = 0,83 dan recall = 0,77, maka F1-Score adalah:


Implementasi Confusion Matrix untuk Klasifikasi Biner Menggunakan Python


Confusion matrix adalah salah satu metrik evaluasi yang sangat berguna dalam machine learning, terutama dalam klasifikasi biner. 

Di sini, kita akan melihat bagaimana cara mengimplementasikan confusion matrix dengan menggunakan Python.


Step 1: Import Library yang Diperlukan


Langkah pertama adalah mengimpor pustaka yang dibutuhkan. Kita akan menggunakan NumPy untuk membuat array dan Scikit-learn untuk menghitung confusion matrix

Selain itu, kita juga membutuhkan Seaborn dan Matplotlib untuk memvisualisasikan confusion matrix.

import numpy as np

from sklearn.metrics import confusion_matrix

import seaborn as sns

import matplotlib.pyplot as plt


Step 2: Membuat Array NumPy untuk Label Aktual dan Prediksi


Pada langkah ini, kita akan membuat dua array NumPy yang berisi label aktual (sebenarnya) dan label prediksi yang dihasilkan oleh model. 

Misalnya, kita menguji model klasifikasi untuk mendeteksi apakah gambar berisi hewan atau bukan.

# Label aktual (sebenarnya) dan prediksi dari model

actual = np.array([1, 0, 1, 1, 0, 1, 0, 1, 0, 1]) # 1 = Hewan, 0 = Bukan Hewan

predicted = np.array([1, 0, 0, 1, 0, 1, 0, 1, 1, 1]) # Prediksi model


Step 3: Menghitung Confusion Matrix


Sekarang kita dapat menghitung confusion matrix dengan menggunakan fungsi confusion_matrix dari Scikit-learn. 

Fungsi ini akan menghitung jumlah True Positives, False Positives, False Negatives, dan True Negatives berdasarkan label aktual dan prediksi.

# Menghitung confusion matrix

cm = confusion_matrix(actual, predicted)


# Menampilkan confusion matrix

print("Confusion Matrix:")

print(cm)


Step 4: Menampilkan Confusion Matrix dengan Visualisasi Heatmap


Untuk lebih memudahkan pemahaman, kita akan memvisualisasikan confusion matrix dengan menggunakan heatmap dari pustaka Seaborn. Ini akan memberikan gambaran yang lebih jelas tentang performa model dalam bentuk warna.

# Plot confusion matrix menggunakan seaborn heatmap

plt.figure(figsize=(6, 4))

sns.heatmap(cm, annot=True, fmt="d", cmap="Blues", xticklabels=["Bukan Hewan", "Hewan"], yticklabels=["Bukan Hewan", "Hewan"])


plt.title("Confusion Matrix - Klasifikasi Biner")

plt.xlabel("Prediksi")

plt.ylabel("Aktual")

plt.show()

Baca juga : Panduan Memilih Bootcamp Data Analyst untuk Karier Impianmu


Ingin Menjadi Data Scientist Profesional?


Setelah memahami konsep confusion matrix dan perhitungannya, kini saatnya kamu memanfaatkan pengetahuan ini untuk menguasai ilmu Data Science lebih mendalam!

Yuk, ikuti Bootcamp Data Science di dibimbing.id! Di sini, kamu akan mempelajari lebih banyak konsep penting seperti analisis data, machine learning, dan statistik, yang sangat berguna untuk membangun model prediktif yang akurat.

Belajar langsung dari mentor berpengalaman dengan kurikulum aplikatif dan praktis yang membantumu memahami cara bekerja dengan data dan mengembangkan solusi cerdas di dunia nyata.

Dengan lebih dari 840+ hiring partner dan tingkat keberhasilan alumni 95%, peluang kariermu sebagai Data Scientist semakin terbuka lebar!

Jadi, tunggu apa lagi? Hubungi di sini sekarang dan daftarkan diri kamu! Mulai perjalananmu menjadi seorang Data Scientist profesional. #BimbingSampeJadi!


Referensi


  1. Understanding the Confusion Matrix in Machine Learning [Buka]

Share

Author Image

Irhan Hisyam Dwi Nugroho

Irhan Hisyam Dwi Nugroho is an SEO Specialist and Content Writer with 4 years of experience in optimizing websites and writing relevant content for various brands and industries. Currently, I also work as a Content Writer at Dibimbing.id and actively share content about technology, SEO, and digital marketing through various platforms.

Hi!👋
Kalau kamu butuh bantuan,
hubungi kami via WhatsApp ya!