dibimbing.id - Regresi Linier Berganda: Definisi dan Cara Membuat di Python

Regresi Linier Berganda: Definisi dan Cara Membuat di Python

Syaukha Ahmad Risyad

โ€ข

26 June 2023

โ€ข

1934

Image Banner

Sobat MinDi, kalau kamu sedang melakukan analisis data, kamu mungkin pernah diminta untuk menganalisis hubungan antar banyak variabel. Meskipun begitu, kamu mungkin kebingungan bagaimana caranya. Perkenalkan, regresi linier berganda!

Ada kalanya kamu perlu menganalisis hubungan lebih dari dua variabel. Tentunya menggunakan metode regresi linier sederhana tidak akan cukup. Itulah mengapa sangat penting untuk bisa menguasai teknik regresi linier berganda sebagai salah satu keterampilan analisis data kamu.

Dalam artikel ini, MinDi mau mengajak Sobat MinDi untuk belajar tentang definisi regresi linier berganda, beserta dengan cara membuatnya di Python! Selain itu, MinDi juga bakal menjelaskan bagaimana kamu bisa menggunakan model yang kamu peroleh untuk memprediksi data baru. Yuk, simak sampai akhir!

Apa itu Regresi Linier Berganda

Regresi linier berganda adalah teknik statistika yang digunakan untuk memodelkan hubungan antara sebuah variabel dependen dengan lebih dari satu variabel independen. Tujuan dari regresi linier berganda adalah untuk mengestimasi besar koefisien dari setiap variabel independen terhadap variabel dependen. Regresi linier mengasumsikan bahwa hubungan dari variabel-variabel independen terhadap variabel dependen adalah linier.

Persamaan umum dari regresi linier berganda dapat dinyatakan sebagai:

y = a+b1x1+b2x2+...+bnxn,

dengan

  • y adalah variabel dependen,

  • xn adalah variabel independen,

  • a adalah intersep, dan

  • bn adalah gradien.


Perbedaan Regresi Linier Berganda dengan Sederhana

Sobat MinDi mungkin pernah mendengar tentang regresi linier sederhana. Lalu bagaimana perbedaannya dengan regresi linier berganda?

Seperti regresi linier berganda, regresi linier sederhana juga memodelkan hubungan antara suatu variabel dependen dengan variabel independen lain. Meskipun begitu, perbedaan antara regresi linier sederhana dengan berganda adalah regresi linier sederhana hanya memodelkan hubungan dengan satu variabel independen, sedangkan regresi linier berganda memodelkan hubungan untuk lebih dari satu variabel independen.

Persamaan dari regresi linier sederhana adalah seperti berikut.

y = a+bx,

dengan

  • y adalah variabel dependen,

  • x adalah variabel independen,

  • a adalah intersep, dan

  • b adalah gradien.

Dapat dilihat bahwa pada regresi linier sederhana, gradien b berlaku untuk keseluruhan dari model. Berbeda dengan regresi linier berganda yang gradien bn-nya memiliki nilai untuk masing-masing variabel x.

Kapan Menggunakan Regresi Linier Berganda

Regresi linier berganda adalah tool yang sangat berguna dalam analisis data kamu, jika kamu memiliki banyak variabel. Berikut adalah beberapa kondisi yang membuat kamu dapat menggunakan regresi linier berganda.

  • Memprediksi nilai dari variabel tertentu jika diketahui nilai pada variabel, variabel lain,

  • Mencari besar pengaruh beberapa variabel terhadap variabel lain.

Dengan memperoleh kedua hal tersebut, kamu dapat menggunakannya untuk beragam kebutuhan bisnis, seperti penilaian risiko dan analisis penjualan. Misalnya untuk melakukan analisis penjualan untuk mengetahui pengaruh beberapa kanal marketing (seperti harga, biaya iklan, dan engagement pada media sosial) terhadap performa penjualan.


Membuat Regresi Linier Berganda di Python

Sebelum kamu memulai koding kamu, pastikan bahwa kamu sudah memiliki library berikut terpasang di perangkat kamu:

  • Numpy,

  • Pandas,

  • Scikit-learn.

Jika sudah, maka di editor kamu, kamu harus terlebih dahulu memanggil library tersebut. Tuliskan kode berikut.

import numpy as np

import pandas as pd

from sklearn.linear_model import LinearRegression


Memasukkan Data

Selanjutnya, siapkan dataset kamu menggunakan Pandas, dan pisahkan kategori-kategori di tabel kamu ke dalam dua variabel: variabel dependen dan variabel independen.

Kamu dapat mengimpor data kamu dari CSV menggunakan kode berikut.

data = pd.read_csv('nama_file.csv')

X = data[['variabel_independen1', 'variabel_independen1', ...]]

y = data['variabel_dependen']

Pastikan bahwa kamu sudah menentukan mana variabel dependen dan mana variabel independen yang ingin kamu analisis. Di bagian โ€˜['variabel_independen1', 'variabel_independen1', ...]โ€™ tuliskan berdasarkan kategori-kategori yang ingin kamu masukkan.

Membuat Model Regresi Linier Berganda

Setelah kamu memasukkan data, kamu sudah bisa membuat model regresi linier berganda kamu.

Untuk membuat model regresi liner berganda, kita akan menggunakan fungsi โ€˜LinearRegressionโ€™ dengan kode berikut.

reg = LinearRegression()

reg.fit(X, y)

Selamat! Kamu sudah berhasil membuat model regresi linier berganda kamu di Python.

Memeriksa Gradien dan Intersep

Kamu dapat memeriksa besar nilai dari setiap parameter dari model regresi linier berganda kamu. Tuliskan kode berikut di editor kamu.

a = reg.coef_

b = reg.intercept_

Parameter โ€˜aโ€™ memberikan koefisien (alias gradien) dari model regresi kamu, sedangkan โ€˜bโ€™ memberikan besar intersep.

Kode tersebut akan memberikan gradien untuk setiap variabel. Artinya, jika kamu memiliki tiga variabel independen, maka Python akan menampilkan tiga gradien yang diurutkan berdasarkan susunan data kamu.

Memprediksi Data dengan Regresi Linier Berganda

Model dari regresi linier berganda memungkinkan kamu untuk memprediksi data baru atau nilai variabel dependen baru berdasarkan nilai-nilai variabel independen yang kamu masukkan. Caranya adalah dengan menggunakan fungsi โ€˜predict()โ€™ pada regresi kamu.

Terlebih dahulu, masukkan terlebih dahulu data-data baru untuk variabel independen kamu dengan kode berikut.

data_baru = pd.DataFrame({

    'variabel_independen1': [nilai1, nilai2, ...],

    'variabel_independen2': [nilai3, nilai4, ...]

})

Lakukan untuk semua kategori yang sesuai beserta nilainya. Pastikan bahwa banyak data yang kamu masukkan untuk satu variabel independen konsisten dengan banyak data di variabel independen lainnya. Pastikan juga urutan data yang kamu masukkan sesuai dengan yang kamu butuhkan.

Kemudian buat prediksi dengan kode berikut.

predictions = reg.predict(data_baru)

Python akan menampilkan data prediksi sebanyak data yang kamu masukkan untuk setiap variabel independen. Artinya, jika kamu memasukkan tiga buah data untuk setiap variabel independen, maka kamu akan memperoleh tiga buah data prediksi.

Seperti itu, Sobat MinDi, penjelasan beserta cara membuat regresi linier berganda di Python! Mudah, bukan?

MinDi sangat menyarankan buat Sobat MinDi mencoba dan mengotak-atik data kamu sendiri, biar semakin mahir menggunakan regresi linier berganda di Python! Karena regresi linier adalah teknik yang penting buat kamu kuasai jika kamu ingin mendalami analisis data, seperti di data science.

Nah, kalau misalkan Sobat MinDi ingin mempelajari teknik-teknik lain yang penting di data science, kamu dapat bergabung buat ikutan Bootcamp Data Science dari Dibimbing.id!

Di sana, kamu bakal belajar lebih dalam tentang teori-teori data science beserta cara mengoperasikan tools-nya, seperti Python, SQL, dan Tableau. Tentunya kamu bakal dibimbing oleh mentor-mentor ahli yang sudah berpengalaman di bidang data science!

Makanya, kalau kamu ingin belajar data science , yuk bergabung di Bootcamp Data Science dari Dibimbing.id !

Share

Author Image

Syaukha Ahmad Risyad

Menulis artikel demi bisa membeli model kit.

Hi!๐Ÿ‘‹

Kalau kamu butuh bantuan,

hubungi kami via WhatsApp ya!