Statistika Bisnis Sesi 13

Sesi 13 – Multiple Regression Analysis


Learning Guide

Sesi ini membahas regresi linear berganda sebagai pengembangan dari regresi linear sederhana. Metode ini digunakan untuk memprediksi variabel dependen berdasarkan lebih dari satu variabel independen, termasuk variabel kategorik yang direpresentasikan dengan variabel dummy.

Catatan Penting (Wajib):

  • Variabel dependen (Y) harus numerik dan kontinu
  • Variabel independen (X) numerik kontinu atau kategorik yang dikodekan (dummy)

Learning Objectives

  • Membedakan regresi sederhana dan berganda
  • Menyusun model regresi berganda
  • Menafsirkan koefisien regresi
  • Menentukan variabel yang relevan dan paling berpengaruh
  • Mengintegrasikan variabel kategorik dalam model

14.1 Simple vs Multiple Linear Regression

AspekSimpleMultiple
Jumlah X1> 1
TujuanHubungan sederhanaPrediksi komprehensif

14.2 Multiple Regression Model

Model umum regresi linear berganda:

Y = b0 + b1X1 + b2X2 + … + bkXk

Contoh Bisnis:
Y = Penjualan (juta rupiah)
X1 = Biaya iklan (juta rupiah)
X2 = Harga (ribu rupiah)
X3 = Lokasi (dummy: 1 = pusat kota, 0 = luar kota)


14.3 Interpretation of Regression Coefficients

  • bi: perubahan rata-rata Y akibat kenaikan satu unit Xi, dengan variabel lain konstan
  • Tanda (+/−) menunjukkan arah pengaruh

Interpretasi Dummy Variable:
Koefisien dummy menunjukkan perbedaan rata-rata Y antara kategori referensi dan kategori yang dikodekan.


14.4 Selecting Independent Variables

Pemilihan variabel independen harus mempertimbangkan:

  • Dasar teori dan logika bisnis
  • Signifikansi statistik (p-value)
  • Multikolinearitas (VIF)

Praktik Umum:
Gunakan kombinasi pertimbangan teoritis dan statistik, bukan sekadar memasukkan semua variabel yang tersedia.


14.5 Identifying Important Predictors

  • Nilai p-value (lebih kecil → lebih signifikan)
  • Standardized coefficients (Beta)
  • Perubahan R²

Praktik Excel

Data → Data Analysis → Regression

Sumber: Levine et al. (2017), Chapter 14

Statistika Bisnis – Materi Tambahan

Advanced Regression Models for Categorical & Non-Linear Data


Learning Guide

Materi tambahan ini membahas jenis-jenis regresi yang digunakan ketika
data penelitian tidak memenuhi asumsi regresi linear klasik,
khususnya ketika variabel bersifat kategorik, nominal, ordinal,
atau hubungan antar variabel tidak linier.

Konteks Indonesia:
Banyak penelitian bisnis dan manajemen menggunakan data skala Likert
atau data kategorik, tetapi tetap dianalisis dengan regresi linear berganda.
Materi ini menjelaskan mengapa dan kapan pendekatan tersebut
perlu diganti dengan model regresi yang lebih tepat.

Mengapa Regresi Linear Tidak Selalu Tepat?

Regresi linear mensyaratkan bahwa variabel dependen:

  • Bersifat numerik dan kontinu
  • Memiliki jarak antar nilai yang bermakna
  • Residual berdistribusi normal dan homoskedastik
Masalah Umum:
Jika variabel dependen berupa kategori, peringkat (ordinal),
atau probabilitas, maka regresi linear dapat menghasilkan
estimasi yang bias dan interpretasi yang menyesatkan.

1. Dummy Regression

Regresi dummy digunakan ketika variabel independen bersifat kategorik
(nominal), tetapi variabel dependen tetap numerik dan kontinu.

  • Kategori dikodekan sebagai variabel dummy (0–1)
  • Satu kategori menjadi reference group
Contoh:
Lokasi usaha → 1 = pusat kota, 0 = pinggiran

Regresi dummy tidak mengubah sifat variabel dependen.
Jika Y bersifat ordinal, maka regresi linear tetap tidak tepat.


2. Logistic Regression (Binary)

Regresi logistik digunakan ketika variabel dependen bersifat dikotomik (0/1).
Model ini memprediksi probabilitas kejadian.

  • Contoh: Beli / Tidak beli
  • Output utama: odds ratio
Mengapa bukan regresi linear?
Karena regresi linear dapat menghasilkan probabilitas < 0 atau > 1.

3. Multinomial Logistic Regression

Digunakan ketika variabel dependen bersifat nominal dengan
lebih dari dua kategori dan tidak memiliki urutan.

  • Contoh: metode pembayaran, pilihan merek
  • Satu kategori dijadikan referensi
Sangat relevan:
Analisis preferensi konsumen, pilihan layanan, dan segmentasi pasar.

4. Ordinal Logistic Regression

Regresi logistik ordinal digunakan ketika variabel dependen
bersifat ordinal, seperti skala Likert.

  • Mempertahankan urutan kategori
  • Tidak memaksakan jarak yang sama antar kategori
Sangat penting:
Sebagian besar penelitian bisnis di Indonesia menggunakan skala Likert
yang secara teori bersifat ordinal.
Catatan Akademik:
Regresi linear pada data Likert dapat digunakan sebagai pendekatan praktis,
namun regresi ordinal lebih tepat secara metodologis.

5. Non-Linear Regression

Regresi non-linier digunakan ketika hubungan X dan Y
tidak dapat direpresentasikan secara garis lurus.

  • Eksponensial (pertumbuhan)
  • Logaritmik (learning curve)
  • Kuadratik (diminishing return)
Contoh Bisnis:
Efektivitas iklan yang meningkat cepat di awal,
namun melambat setelah titik tertentu.

Ringkasan Pemilihan Model Regresi

Jenis Data Y Model yang Tepat
Numerik kontinu Linear / Multiple Regression
Biner Logistic Regression
Nominal (>2) Multinomial Logistic
Ordinal (Likert) Ordinal Logistic
Non-linier Non-Linear Regression

Materi Tambahan – Penguatan Metodologi Regresi untuk Penelitian Bisnis Indonesia

Video pendukung: Regresi Logistik Ordinal & Multinomial (digunakan pada Statistika Bisnis dan Riset Bisnis)

Progress: Sesi 13 dari 14

Leave a Comment

Your email address will not be published. Required fields are marked *