dibimbing.id - Apa itu Regresi Logistik? Pengertian, Jenis & Contohnya

Apa itu Regresi Logistik? Pengertian, Jenis & Contohnya

Muthiatur Rohmah

•

18 July 2024

•

11550

Image Banner

Dalam proses analisis data, memahami dan memprediksi probabilitas kejadian biner, seperti ya atau tidak, sukses atau gagal, merupakan hal yang penting. Bagaimana caranya? Sobat MinDi bisa menggunakan regresi logistik.

Regresi logistik adalah metode statistik yang digunakan untuk memodelkan dan menganalisis hubungan antara satu atau lebih variabel independen dengan variabel dependen biner. 

Metode ini membantu dalam memahami faktor-faktor yang mempengaruhi hasil, dan dapat membuat prediksi yang akurat tentang kejadian di masa depan. 

Penasaran lebih lanjut mengenai apa itu regresi logistik? Apa saja jenis regresi logistik? Bagaimana contoh penerapan regresi logistik? Yuk simak pengertian lengkapnya berikut ini.


Apa itu Regresi Logistik?

Tunggu dulu Sobat MinDi, sebelum kita membahas lebih lanjut mengenai regresi logistik, pertama-tama yuk pahami dulu apa yang dimaksud regresi logistik melalui beberapa pengertian berikut ini.

Dilansir dari IBM, Regresi logistik adalah metode statistik yang digunakan untuk memperkirakan probabilitas terjadinya suatu kejadian, seperti apakah seseorang memilih atau tidak memilih, berdasarkan serangkaian variabel independen yang ada dalam dataset. 

Dalam regresi logistik, model dibangun untuk memprediksi nilai variabel dependen biner (yang memiliki dua kategori, misalnya 0 dan 1) dengan menggunakan satu atau lebih variabel independen. 

Model ini menghasilkan output dalam bentuk probabilitas yang menunjukkan kemungkinan terjadinya kejadian tertentu. 

Misalnya, dalam sebuah penelitian pemilu, regresi logistik dapat digunakan untuk memprediksi probabilitas seseorang akan memilih berdasarkan faktor-faktor seperti usia, pendidikan, dan pendapatan. 

Dengan demikian, regresi logistik membantu analisis yang mendalam tentang faktor-faktor yang mempengaruhi kejadian biner dan membantu dalam pengambilan keputusan berdasarkan data.


Perbedaan Regresi Linier dan Regresi Logistik

Regresi linier dan regresi logistik adalah dua metode statistik yang digunakan untuk memodelkan hubungan antara variabel independen dan variabel dependen, tetapi keduanya digunakan dalam konteks yang berbeda dan memiliki karakteristik yang berbeda. 

Lantas apa saja perbedaan regresi linier dan regresi logistik? Yuk simak selengkapnya!


Regresi Linier

Regresi linier digunakan untuk memodelkan hubungan antara variabel independen dan variabel dependen kontinu. 

Dalam regresi linier, kita mencoba menemukan garis lurus yang paling sesuai dengan data sehingga dapat memprediksi nilai variabel dependen berdasarkan nilai variabel independen. 

Model regresi linier menghasilkan persamaan linier, misalnya Y=a+bX,, di mana Y adalah variabel dependen, X adalah variabel independen, a adalah intersep, dan b adalah koefisien kemiringan.


Regresi Logistik

Di sisi lain, regresi logistik digunakan ketika variabel dependen adalah biner atau dikotomi, artinya hanya memiliki dua kemungkinan hasil, seperti ya/tidak, sukses/gagal, atau 0/1. 

Model regresi logistik memprediksi probabilitas terjadinya kejadian tertentu berdasarkan nilai variabel independen. Alih-alih menggunakan garis lurus, regresi logistik menggunakan fungsi logit untuk memodelkan hubungan antara variabel. 

Persamaan regresi logistik berbentuk logit(p)=ln(p1-p)=a+bX di mana p adalah probabilitas kejadian, a adalah intersep, dan b adalah koefisien. Hasil dari model ini adalah probabilitas, yang kemudian dapat diubah menjadi nilai biner berdasarkan ambang tertentu.

Regresi linier lebih cocok untuk situasi di mana hasil yang diukur adalah kontinu dan tidak terbatas, sedangkan regresi logistik lebih sesuai untuk situasi di mana hasil yang diukur adalah biner dan terbatas pada dua kategori. 

Oleh karena itu, pemilihan antara regresi linier dan regresi logistik sangat bergantung pada sifat dari variabel dependen dan tujuan analisis.


Kapan seorang Peneliti Menggunakan Regresi Logistik?

Seorang peneliti menggunakan regresi logistik ketika variabel dependen yang ingin diprediksi atau dianalisis bersifat biner atau dikotomi, yaitu memiliki dua kemungkinan hasil seperti ya/tidak, sukses/gagal, atau 0/1. 

Misalnya, dalam penelitian medis, peneliti mungkin ingin memprediksi apakah seorang pasien memiliki risiko tinggi atau rendah untuk terkena penyakit berdasarkan faktor-faktor seperti usia, tekanan darah, dan riwayat keluarga. 

Regresi logistik juga digunakan dalam bidang pemasaran untuk memprediksi apakah pelanggan akan membeli produk atau tidak berdasarkan data demografis dan perilaku pembelian sebelumnya. 

Secara umum, regresi logistik digunakan ketika tujuan analisis adalah untuk memperkirakan probabilitas kejadian tertentu dan memahami faktor-faktor yang mempengaruhinya.


Bagaimana Cara Kerja Regresi Logistik?


Regresi logistik bekerja dengan memodelkan hubungan antara satu atau lebih variabel independen dan variabel dependen biner (dua kategori). Proses dimulai dengan mengumpulkan data dan menentukan variabel yang akan digunakan dalam model. 

Regresi logistik kemudian menggunakan fungsi logit untuk mengubah probabilitas kejadian menjadi bentuk log-odds, yang dapat dimodelkan sebagai kombinasi linear dari variabel independen. 

Persamaan dasar regresi logistik adalah

Model ini kemudian dilatih menggunakan data yang ada untuk mengestimasi koefisien-koefisien tersebut, yang kemudian digunakan untuk memprediksi probabilitas kejadian berdasarkan nilai variabel independen. 

Hasil prediksi berupa probabilitas ini dapat diubah kembali menjadi kategori biner dengan menetapkan ambang tertentu, biasanya 0,5, untuk menentukan kategori hasil akhir.


Manfaat Regresi Logistik

Apa saja manfaat menggunakan regresi logistik? Yuk simak penjelasan lengkapnya berikut ini.

Berdasarkan informasi dari LinkedIn, terdapat 4 manfaat regresi logistik yang dapat Sobat MinDi pahami.


1. Kemudahan Implementasi dan Interpretasi

Regresi logistik mudah diimplementasikan dan diinterpretasikan. Peneliti hanya perlu menentukan variabel input dan output, dan algoritma akan melakukan selebihnya. 

Parameter yang dihasilkan oleh model regresi logistik juga mudah dipahami, sehingga peneliti dapat dengan jelas melihat bagaimana setiap variabel independen mempengaruhi probabilitas masing-masing kelas.


2. Kemampuan Menangani Masalah Klasifikasi Biner dan Multikelas

Regresi logistik tidak hanya mampu menangani masalah klasifikasi biner (dua kelas), tetapi juga masalah klasifikasi multikelas. 

Untuk masalah multikelas, metode seperti one-vs-all atau softmax regression dapat digunakan. Ini menjadikan regresi logistik alat yang fleksibel untuk berbagai jenis masalah klasifikasi.


3. Model Relasi Linear dan Nonlinear

Regresi logistik dapat memodelkan hubungan linear dan nonlinear antara fitur dan variabel target. 

Dengan menambahkan istilah polinomial atau interaksi ke dalam model, peneliti dapat meningkatkan akurasi dan fleksibilitas model tanpa menyebabkan overfitting. Ini memungkinkan peneliti untuk menangkap dinamika yang lebih kompleks dalam data.


4. Mengatasi Fitur Kategorikal dan Numerik

Regresi logistik dapat menangani baik fitur kategorikal maupun numerik. Fitur kategorikal dapat dikodekan menggunakan dummy atau one-hot encoding, yang memungkinkan model untuk menangkap efek dari berbagai tingkat atau nilai dari setiap fitur pada hasil. 

Hal ini membuat regresi logistik mampu bekerja dengan berbagai jenis data dan variabel yang ada dalam dataset.

Dengan manfaat-manfaat ini, regresi logistik menjadi pilihan yang kuat dan serbaguna dalam analisis data dan pemodelan prediktif, yang membantu peneliti dalam membangun model yang efektif dan mudah dipahami untuk berbagai masalah klasifikasi.

Baca Juga: Predictive Analytics Adalah: Arti, Manfaat, Teknik & Contoh


Jenis Regresi Logistik

Dalam analisis data, terdapat beberapa jenis regresi logistik yang dapat Sobat MinDi gunakan. Lantas apa saja jenis regresi logistik tersebut?

Dikutip dari Master Data Science, terdapat 3 jenis regresi logistik dalam analisis data, yuk simak penjelasannya!


1. Regresi Logistik Biner

Regresi logistik biner digunakan ketika variabel dependen hanya memiliki dua kemungkinan hasil atau kategori, misalnya ya/tidak, sukses/gagal, atau 0/1. Model ini memperkirakan probabilitas terjadinya salah satu dari dua kategori tersebut berdasarkan satu atau lebih variabel independen. 

Contohnya, dalam penelitian medis, regresi logistik biner dapat digunakan untuk memprediksi apakah seorang pasien akan terkena penyakit tertentu (ya/tidak) berdasarkan faktor-faktor seperti usia, tekanan darah, dan riwayat keluarga.


2. Regresi Logistik Multinomial 

Regresi logistik multinomial digunakan ketika variabel dependen memiliki lebih dari dua kategori yang tidak memiliki urutan atau peringkat. Model ini memprediksi probabilitas masing-masing kategori berdasarkan variabel independen. 

Misalnya, dalam penelitian pemasaran, regresi logistik multinomial dapat digunakan untuk memprediksi preferensi produk pelanggan (misalnya, memilih produk A, B, atau C) berdasarkan data demografis dan perilaku pembelian. 

Teknik seperti one-vs-all (satu lawan semua) atau softmax regression sering digunakan dalam model ini untuk menangani masalah klasifikasi multikelas.


3. Regresi Logistik Ordinal    

Regresi logistik ordinal digunakan ketika variabel dependen memiliki lebih dari dua kategori yang memiliki urutan atau peringkat. Model ini memprediksi probabilitas kategori berdasarkan urutan atau peringkat tersebut. 

Contohnya, dalam survei kepuasan pelanggan, regresi logistik ordinal dapat digunakan untuk memprediksi tingkat kepuasan pelanggan (misalnya, sangat tidak puas, tidak puas, netral, puas, sangat puas) berdasarkan berbagai faktor seperti kualitas layanan dan harga. 

Model ini mempertimbangkan bahwa kategori memiliki hubungan urutan, yang membedakannya dari regresi logistik multinomial.

Ketiga jenis regresi logistik ini membantu peneliti untuk menangani berbagai situasi dan jenis data dalam analisis prediktif, sehingga memberikan fleksibilitas dalam penerapan metode statistik yang tepat sesuai dengan karakteristik variabel dependen.


Contoh Penerapan Regresi Logistik dalam Berbagai Bidang

Penasaran mengenai contoh regresi logistik? Yuk simak beberapa contoh penerapan regresi logistik dalam berbagai bidang berikut ini.


1. Bidang Kesehatan

Dalam bidang kesehatan, regresi logistik sering digunakan untuk memprediksi kemungkinan terjadinya penyakit atau kondisi medis tertentu berdasarkan berbagai faktor risiko. 

Misalnya, regresi logistik biner dapat digunakan untuk memprediksi apakah seorang pasien memiliki risiko tinggi untuk terkena diabetes berdasarkan variabel seperti usia, indeks massa tubuh (BMI), kadar gula darah, dan riwayat keluarga. 

Model ini membantu dokter dan peneliti kesehatan dalam mengidentifikasi individu yang berisiko dan mengambil tindakan pencegahan yang tepat.


2. Bidang Pemasaran

Dalam bidang pemasaran, regresi logistik digunakan untuk memahami dan memprediksi perilaku konsumen. 

Sebagai contoh, perusahaan dapat menggunakan regresi logistik multinomial untuk memprediksi produk mana yang akan dipilih oleh pelanggan di antara beberapa opsi yang tersedia. 

Variabel independen yang digunakan bisa mencakup data demografis, riwayat pembelian, dan preferensi pelanggan. 

Informasi ini membantu perusahaan dalam merancang strategi pemasaran yang lebih efektif dan personalisasi penawaran produk kepada segmen pasar yang berbeda.


3. Bidang Pendidikan

Dalam bidang pendidikan, regresi logistik dapat diterapkan untuk memprediksi keberhasilan akademik siswa berdasarkan faktor-faktor seperti prestasi akademik sebelumnya, partisipasi dalam kegiatan ekstrakurikuler, dan latar belakang keluarga. 

Misalnya, regresi logistik ordinal dapat digunakan untuk memprediksi tingkat kelulusan siswa (misalnya, tidak lulus, lulus dengan pujian, lulus dengan nilai baik) berdasarkan nilai ujian dan faktor-faktor lainnya. 

Hasil dari analisis ini dapat membantu institusi pendidikan dalam mengidentifikasi siswa yang membutuhkan dukungan tambahan dan merancang program intervensi yang sesuai.

Penerapan regresi logistik dalam berbagai bidang ini menunjukkan fleksibilitas dan kegunaannya dalam memodelkan dan memprediksi berbagai hasil yang penting, membantu pengambilan keputusan yang lebih baik berdasarkan data.

Baca Juga: 4 Jenis Machine Learning Populer yang Wajib dipelajari!


Ingin Belajar Regresi Logistik Lebih Lanjut? Yuk Ikuti Bootcamp Dibimbing.id

Sobat MinDi, itulah beberapa pembahasan mengenai regresi logistik, mulai dari pengertian, cara kerja hingga contoh penerapan regresi logistik. 

Kesimpulannya, Regresi logistik adalah metode statistik yang digunakan untuk memprediksi probabilitas kejadian biner berdasarkan satu atau lebih variabel independen, memungkinkan analisis dan pengambilan keputusan yang lebih akurat.

Ingin belajar regresi logistik lebih lanjut? Tertarik switch career sebagai AI/Machine Learning engineer? Bingung harus mulai dari mana?

Yuk ikuti Bootcamp AI Machine Learning Dibimbing.id, sebuah bootcamp terbaik dengan pembelajaran inovatif dan intensif. Bootcamp ini didampingi oleh mentor profesional dan terbaik yang bakal bantu kamu jadi AI ML engineer sukses.

Belum memiliki pengalaman tentang AI/ Machine Learning sama sekali?

Tenang saja, dibimbing.id siap bimbing kamu mulai dari nol, dengan kurikulum terlengkap, update serta beginner friendly. 

Sebanyak 94% alumni bootcamp dibimbing.id telah berhasil mendapatkan kerja sesuai bidang mereka. Nah, jangan khawatir nganggur setelah lulus bootcamp ya, dibimbing.id juga menyediakan job connect ke 570+ hiring partner khusus buat Sobat MinDi.

Tunggu apalagi? buruan konsultasi di sini, apapun tujuan karirmu dibimbing.id siap #BimbingSampeJadi karir impianmu.

Reference:

  1. What is logistic regression? - Buka
  2. What are the advantages of using logistic regression for classification? - Buka
  3. What Is Logistic Regression? | Master's in Data Science - Buka


Share

Author Image

Muthiatur Rohmah

Muthia adalah seorang Content Writer dengan kurang lebih satu tahun pengalaman. Muthia seorang lulusan Sastra Indonesia yang hobi menonton dan menulis. Sebagai SEO Content Writer Dibimbing, Ia telah menulis berbagai konten yang berkaitan dengan Human Resources, Business Intelligence, Web Development, Product Management dan Digital Marketing.

Hi!👋

Kalau kamu butuh bantuan,

hubungi kami via WhatsApp ya!