Sesi 13 – Multiple Regression Analysis
Learning Guide
Sesi ini membahas regresi linear berganda sebagai pengembangan dari regresi linear sederhana. Metode ini digunakan untuk memprediksi variabel dependen berdasarkan lebih dari satu variabel independen, termasuk variabel kategorik yang direpresentasikan dengan variabel dummy.
Catatan Penting (Wajib):
- Variabel dependen (Y) harus numerik dan kontinu
- Variabel independen (X) numerik kontinu atau kategorik yang dikodekan (dummy)
Learning Objectives
- Membedakan regresi sederhana dan berganda
- Menyusun model regresi berganda
- Menafsirkan koefisien regresi
- Menentukan variabel yang relevan dan paling berpengaruh
- Mengintegrasikan variabel kategorik dalam model
14.1 Simple vs Multiple Linear Regression
| Aspek | Simple | Multiple |
|---|---|---|
| Jumlah X | 1 | > 1 |
| Tujuan | Hubungan sederhana | Prediksi komprehensif |
14.2 Multiple Regression Model
Model umum regresi linear berganda:
Y = b0 + b1X1 + b2X2 + … + bkXk
Contoh Bisnis:
Y = Penjualan (juta rupiah)
X1 = Biaya iklan (juta rupiah)
X2 = Harga (ribu rupiah)
X3 = Lokasi (dummy: 1 = pusat kota, 0 = luar kota)
14.3 Interpretation of Regression Coefficients
- bi: perubahan rata-rata Y akibat kenaikan satu unit Xi, dengan variabel lain konstan
- Tanda (+/−) menunjukkan arah pengaruh
Interpretasi Dummy Variable:
Koefisien dummy menunjukkan perbedaan rata-rata Y antara kategori referensi dan kategori yang dikodekan.
14.4 Selecting Independent Variables
Pemilihan variabel independen harus mempertimbangkan:
- Dasar teori dan logika bisnis
- Signifikansi statistik (p-value)
- Multikolinearitas (VIF)
Praktik Umum:
Gunakan kombinasi pertimbangan teoritis dan statistik, bukan sekadar memasukkan semua variabel yang tersedia.
14.5 Identifying Important Predictors
- Nilai p-value (lebih kecil → lebih signifikan)
- Standardized coefficients (Beta)
- Perubahan R²
Praktik Excel
Data → Data Analysis → Regression
Sumber: Levine et al. (2017), Chapter 14
Statistika Bisnis – Materi Tambahan
Advanced Regression Models for Categorical & Non-Linear Data
Learning Guide
Materi tambahan ini membahas jenis-jenis regresi yang digunakan ketika
data penelitian tidak memenuhi asumsi regresi linear klasik,
khususnya ketika variabel bersifat kategorik, nominal, ordinal,
atau hubungan antar variabel tidak linier.
Banyak penelitian bisnis dan manajemen menggunakan data skala Likert
atau data kategorik, tetapi tetap dianalisis dengan regresi linear berganda.
Materi ini menjelaskan mengapa dan kapan pendekatan tersebut
perlu diganti dengan model regresi yang lebih tepat.
Mengapa Regresi Linear Tidak Selalu Tepat?
Regresi linear mensyaratkan bahwa variabel dependen:
- Bersifat numerik dan kontinu
- Memiliki jarak antar nilai yang bermakna
- Residual berdistribusi normal dan homoskedastik
Jika variabel dependen berupa kategori, peringkat (ordinal),
atau probabilitas, maka regresi linear dapat menghasilkan
estimasi yang bias dan interpretasi yang menyesatkan.
1. Dummy Regression
Regresi dummy digunakan ketika variabel independen bersifat kategorik
(nominal), tetapi variabel dependen tetap numerik dan kontinu.
- Kategori dikodekan sebagai variabel dummy (0–1)
- Satu kategori menjadi reference group
Lokasi usaha → 1 = pusat kota, 0 = pinggiran
Regresi dummy tidak mengubah sifat variabel dependen.
Jika Y bersifat ordinal, maka regresi linear tetap tidak tepat.
2. Logistic Regression (Binary)
Regresi logistik digunakan ketika variabel dependen bersifat dikotomik (0/1).
Model ini memprediksi probabilitas kejadian.
- Contoh: Beli / Tidak beli
- Output utama: odds ratio
Karena regresi linear dapat menghasilkan probabilitas < 0 atau > 1.
3. Multinomial Logistic Regression
Digunakan ketika variabel dependen bersifat nominal dengan
lebih dari dua kategori dan tidak memiliki urutan.
- Contoh: metode pembayaran, pilihan merek
- Satu kategori dijadikan referensi
Analisis preferensi konsumen, pilihan layanan, dan segmentasi pasar.
4. Ordinal Logistic Regression
Regresi logistik ordinal digunakan ketika variabel dependen
bersifat ordinal, seperti skala Likert.
- Mempertahankan urutan kategori
- Tidak memaksakan jarak yang sama antar kategori
Sebagian besar penelitian bisnis di Indonesia menggunakan skala Likert
yang secara teori bersifat ordinal.
Regresi linear pada data Likert dapat digunakan sebagai pendekatan praktis,
namun regresi ordinal lebih tepat secara metodologis.
5. Non-Linear Regression
Regresi non-linier digunakan ketika hubungan X dan Y
tidak dapat direpresentasikan secara garis lurus.
- Eksponensial (pertumbuhan)
- Logaritmik (learning curve)
- Kuadratik (diminishing return)
Efektivitas iklan yang meningkat cepat di awal,
namun melambat setelah titik tertentu.
Ringkasan Pemilihan Model Regresi
| Jenis Data Y | Model yang Tepat |
|---|---|
| Numerik kontinu | Linear / Multiple Regression |
| Biner | Logistic Regression |
| Nominal (>2) | Multinomial Logistic |
| Ordinal (Likert) | Ordinal Logistic |
| Non-linier | Non-Linear Regression |
Materi Tambahan – Penguatan Metodologi Regresi untuk Penelitian Bisnis Indonesia
Video pendukung: Regresi Logistik Ordinal & Multinomial (digunakan pada Statistika Bisnis dan Riset Bisnis)