dibimbing.id - Missing Value Adalah: Penyebab, Dampak, dan Contohnya

Missing Value Adalah: Penyebab, Dampak, dan Contohnya

Irhan Hisyam Dwi Nugroho

20 May 2025

459

Image Banner

Missing value adalah kondisi di mana suatu data dalam dataset tidak tersedia atau kosong. Meskipun terlihat sederhana, data yang hilang dapat memengaruhi hasil analisis dan menyebabkan kesimpulan yang kurang akurat jika tidak ditangani dengan baik.

Dalam artikel ini, MinDi akan membahas pengertian missing value, penyebab umum terjadinya, dampaknya terhadap analisis data, serta beberapa contoh kasus yang sering ditemui. 

Yuk, simak penjelasannya agar Warga Bimbingan lebih siap menghadapi data yang tidak selalu lengkap.


Apa Itu Missing Value?


Missing value adalah kondisi ketika suatu data dalam sebuah dataset tidak terisi atau kosong, baik sebagian maupun seluruhnya. 

Situasi ini bisa terjadi karena berbagai hal, seperti kesalahan saat input data, responden yang tidak menjawab pertanyaan, atau data memang tidak tersedia sejak awal. 

Meskipun terlihat sepele, missing value bisa memengaruhi hasil analisis dan membuat kesimpulan jadi tidak akurat. 

Oleh karena itu, penting untuk mengenali dan menangani missing value dengan tepat sebelum mulai menganalisis data lebih lanjut.

Baca juga : Panduan Memilih Bootcamp Data Science Terbaik di 2025


Penyebab Missing Value


Sumber: Canva

Missing value adalah kondisi umum dalam analisis data yang perlu dipahami sejak awal. Sebelum menanganinya, penting untuk tahu apa saja penyebab data hilang berikut ini:


1. Responden Tidak Mengisi Data


Dalam survei atau kuesioner, responden terkadang melewatkan pertanyaan karena merasa tidak nyaman, lupa, atau tidak relevan. 

Akibatnya, beberapa kolom data menjadi kosong. Ini adalah salah satu penyebab paling umum dalam riset berbasis formulir.


2. Kesalahan Teknis saat Pengambilan Data


Missing value juga bisa muncul akibat masalah sistem, seperti error saat impor data, koneksi jaringan yang terputus, atau bug dalam aplikasi. 

Ketika proses pengumpulan tidak berjalan lancar, sebagian data mungkin gagal tersimpan. Hal ini sering terjadi dalam sistem berbasis digital atau otomatis.


3. Data Tidak Relevan untuk Semua Subjek


Tidak semua data berlaku untuk semua entri. Misalnya, kolom “gaji” tidak relevan untuk siswa dalam survei umum, sehingga memang dibiarkan kosong. Ini disebut missing value karena data memang tidak perlu diisi untuk kasus tertentu.


4. Input Manual yang Tidak Konsisten


Dalam proses input data secara manual, human error seperti lupa mengisi, salah ketik, atau melewatkan kolom sangat mungkin terjadi. 

Jika tidak ada validasi otomatis, kesalahan ini bisa lolos tanpa disadari. Lama-kelamaan, jumlah data hilang bisa menumpuk dan memengaruhi kualitas dataset.

Baca juga : Panduan Cara Belajar Python untuk Data Scientist, Lengkap!


Dampak Missing Value 


Sumber: Canva

Missing value adalah kondisi yang bisa berdampak serius jika tidak ditangani dengan tepat. Selain mengganggu proses analisis, data yang hilang juga dapat menurunkan kualitas hasil. Berikut beberapa dampak yang perlu diperhatikan:


1. Menurunkan Akurasi Hasil Analisis


Ketika sebagian data hilang, perhitungan statistik seperti rata-rata, median, atau total bisa menjadi tidak representatif. 

Hal ini membuat hasil analisis menjadi tidak akurat dan sulit dipercaya. Dalam jangka panjang, ini bisa berdampak pada pengambilan keputusan yang kurang tepat.


2. Menghambat Proses Pemodelan Data


Banyak algoritma analisis dan machine learning tidak dapat berjalan jika dataset mengandung nilai kosong. 

Akibatnya, proses pemodelan jadi lebih lama karena harus membersihkan atau mempersiapkan data terlebih dahulu. Ini tentu bisa menghambat efisiensi kerja.


3. Memunculkan Bias dalam Kesimpulan


Jika missing value tidak muncul secara acak, misalnya hanya terjadi pada kelompok tertentu, maka hasil analisis bisa jadi tidak netral. 

Hal ini menyebabkan bias yang memengaruhi interpretasi data. Dampaknya, kesimpulan bisa menyesatkan atau tidak relevan.


4. Mengurangi Kualitas Keputusan Bisnis 


Analisis data yang didasarkan pada informasi tidak lengkap berisiko menghasilkan keputusan yang salah. 

Dalam konteks bisnis, ini bisa berarti strategi yang tidak efektif atau salah sasaran. Oleh karena itu, penting untuk memastikan kualitas data sebelum digunakan sebagai dasar pengambilan keputusan.

Baca juga : Panduan Analisis Data dengan Python Pandas, Mudah Dipelajari


Jenis-Jenis Missing Value


Warga Bimbingan, missing value adalah kondisi yang muncul dalam beberapa bentuk berbeda. Berikut tiga jenis missing value yang perlu diketahui:


1. Missing Completely At Random (MCAR)


MCAR terjadi saat data hilang secara acak dan tidak memiliki hubungan dengan variabel lain dalam dataset. 

Hilangnya data tidak dipengaruhi oleh nilai apa pun, baik yang terlihat maupun yang tersembunyi. 

Jenis ini dianggap paling “aman” karena tidak menimbulkan bias serius dalam analisis, sehingga bisa ditangani dengan metode sederhana seperti penghapusan data.


2. Missing At Random (MAR)


MAR terjadi saat data hilang karena berkaitan dengan variabel lain, tetapi tidak berkaitan dengan nilai dari data yang hilang itu sendiri. 

Misalnya, orang dengan usia muda lebih cenderung tidak mengisi penghasilan, tapi bukan karena besar atau kecilnya penghasilan mereka. 

Dalam kasus MAR, penanganan bisa dilakukan dengan imputasi menggunakan informasi dari variabel lain yang tersedia.


3. Missing Not At Random (MNAR)


MNAR adalah jenis missing value yang paling kompleks karena data hilang disebabkan oleh nilai dari data itu sendiri. 

Contohnya, seseorang dengan pendapatan sangat rendah mungkin memilih untuk tidak mengisi kolom gaji karena alasan pribadi atau rasa tidak nyaman. 

Penanganannya memerlukan pendekatan lebih hati-hati karena jika tidak ditangani dengan benar, bisa menghasilkan analisis yang bias dan menyesatkan.

Baca juga : Python untuk Data Analyst: Arti, Manfaat, Library, dan Tips


Contoh Missing Value dalam Dataset


Sumber: Canva

Warga Bimbingan, missing value adalah hal yang sering muncul saat mengolah data. Berikut ini beberapa contoh nyatanya dalam dataset:


1. Kolom Data Kosong dalam Survei


Misalnya, dalam survei pelanggan, beberapa responden tidak mengisi kolom “usia” atau “pendapatan”. 

Kolom yang kosong ini akan muncul sebagai missing value dalam dataset. Jika jumlahnya cukup banyak, hal ini bisa memengaruhi hasil analisis demografi atau segmentasi pasar.


2. Data Transaksi Tidak Lengkap di Sistem Penjualan


Dalam laporan penjualan, terkadang kolom “diskon” atau “jumlah barang” tidak terisi karena kasir lupa input atau sistem error. 

Nilai kosong tersebut akan terbaca sebagai missing value saat data diolah. Hal ini bisa menyebabkan total penjualan terlihat lebih rendah dari yang sebenarnya.


3. Informasi Medis Tidak Dicatat dalam Rekam Pasien


Contoh lain bisa ditemukan di data rumah sakit, misalnya kolom “tekanan darah” atau “riwayat alergi” yang kosong pada beberapa pasien. 

Bisa jadi karena pemeriksaan belum dilakukan atau petugas lupa mencatat. Missing value seperti ini penting untuk diperhatikan karena bisa berdampak pada diagnosis atau perencanaan perawatan.

Baca juga : Panduan Memilih Bootcamp Data Analyst untuk Karier Impianmu


Ingin Jadi Data Scientist Profesional?


Setelah memahami apa itu missing value, penyebabnya, dampaknya, dan contoh penerapannya, sekarang saatnya kamu memperdalam pemahaman tentang analisis data secara menyeluruh!

Yuk, ikuti Bootcamp Data Science di dibimbing.id! Di sini, kamu akan belajar cara menangani missing value secara tepat, melakukan analisis data eksploratif, membangun model machine learning, hingga visualisasi data yang powerful.

Belajar langsung dari mentor-mentor berpengalaman dengan kurikulum aplikatif yang disusun sesuai kebutuhan industri. Materi disampaikan secara praktis agar kamu bisa langsung paham dan siap terjun ke dunia kerja.

Dengan lebih dari 840+ hiring partner dan tingkat keberhasilan alumni mencapai 96%, peluangmu untuk berkarier di bidang data makin terbuka lebar!

Jadi, tunggu apa lagi? Daftar sekarang di sini dan mulai perjalananmu menjadi seorang Data Scientist yang siap bersaing di dunia profesional. #BimbingSampeJadi!


Referensi


  1. Missing Data | Types, Explanation, & Imputation [Buka]
  2. ML | Handling Missing Values [Buka]

Share

Author Image

Irhan Hisyam Dwi Nugroho

Irhan Hisyam Dwi Nugroho is an SEO Specialist and Content Writer with 4 years of experience in optimizing websites and writing relevant content for various brands and industries. Currently, I also work as a Content Writer at Dibimbing.id and actively share content about technology, SEO, and digital marketing through various platforms.

Hi!👋
Kalau kamu butuh bantuan,
hubungi kami via WhatsApp ya!