Regression Models for Categorical and Nonlinear Data

Statistika Bisnis: Learning Guide & Materi Tambahan

Fokus: Metodologi & Ketepatan Model By: aurinodjamaris@gmail.com

Bagian ini menjelaskan model regresi yang digunakan ketika variabel dependen atau independen bersifat kategorik, nominal, ordinal, atau tidak kontinu. Materi ini sangat relevan dengan praktik penelitian di Indonesia, di mana data skala Likert sering kali dianalisis menggunakan regresi linear berganda tanpa mempertimbangkan asumsi model.

⚠️ Masalah Umum di Indonesia:

Banyak penelitian menggunakan regresi linear berganda untuk data Likert (ordinal), data kategorik, atau variabel dummy, tanpa justifikasi metodologis yang memadai.

Mengapa Regresi Linear Tidak Selalu Tepat?

Regresi linear klasik mensyaratkan bahwa:

  • Variabel dependen berskala numerik dan kontinu.
  • Hubungan antar variabel bersifat linear.
  • Residual berdistribusi normal dan homoskedastik.

Implikasi: Jika variabel dependen berupa kategori, peringkat (ordinal), atau probabilitas, maka regresi linear dapat menghasilkan estimasi yang bias dan interpretasi yang menyesatkan.


1. Dummy Regression (Categorical X)

Regresi dummy digunakan ketika variabel independen bersifat kategorik (nominal), tetapi variabel dependen tetap numerik kontinu.

  • Variabel kategorik dikodekan menjadi dummy (0–1).
  • Satu kategori dijadikan reference group.
Contoh: Lokasi toko (Pusat Kota / Pinggiran).
Dummy: X = 1 (Pusat Kota), X = 0 (Pinggiran).

2. Logistic Regression (Binary Outcome)

Digunakan ketika variabel dependen bersifat dikotomik (0/1). Contoh: Ya/Tidak, Lulus/Tidak Lulus.

  • Model memprediksi probabilitas, bukan nilai langsung.
  • Mencegah prediksi < 0 atau > 1 yang tidak masuk akal.
Contoh: Keputusan pembelian (Beli / Tidak Beli).

3. Multinomial Logistic Regression

Digunakan ketika variabel dependen bersifat nominal dengan lebih dari dua kategori dan tidak memiliki urutan alami.

Contoh: Metode pembayaran (Tunai, QRIS, Kartu).

Kesalahan Umum: Menggunakan regresi linear berganda untuk variabel dependen nominal.

4. Ordinal Logistic Regression

Digunakan ketika variabel dependen bersifat ordinal (memiliki urutan, tetapi jarak antar kategori tidak pasti).

Contoh: Skala Likert (Sangat Tidak Setuju – Sangat Setuju).

Model mempertahankan struktur urutan. Regresi ordinal lebih tepat secara teoritis untuk Likert.

5. Nonlinear Regression

Regresi nonlinier digunakan ketika hubungan antara X dan Y tidak dapat direpresentasikan secara linear.

  • Hubungan eksponensial (pertumbuhan)
  • Hubungan logaritmik (learning curve)
  • Hubungan kuadratik (diminishing returns)
Contoh Bisnis: Efek iklan yang meningkat cepat di awal, namun melambat setelah titik tertentu (Saturated).

Ringkasan Pemilihan Model Regresi

Jenis Data Y Model yang Tepat
Numerik kontinu Linear / Multiple Regression
Biner (0/1) Logistic Regression
Nominal (>2) Multinomial Logistic
Ordinal (Likert) Ordinal Logistic
Nonlinear Nonlinear Regression

🧩 Coba-Pikir-Tindak: Logika Pemilihan Model

Kasus: Anda meneliti pengaruh harga terhadap “Loyalitas Pelanggan” yang diukur dengan skala Likert 1-5.

Klik untuk Verifikasi Metodologis
Pikirkan: Apakah jarak antara “Sangat Tidak Setuju” ke “Tidak Setuju” sama persis dengan “Setuju” ke “Sangat Setuju”? Secara matematis, tidak. Ini data ordinal.

Tindak: Jika Anda ingin ketajaman riset maksimal, gunakan Ordinal Logistic Regression. Namun, jika jumlah sampel sangat besar dan distribusi normal terpenuhi, regresi linear dapat digunakan sebagai pendekatan praktis (heuristic) dengan catatan limitasi yang jelas.

Materi tambahan ini bertujuan memperkuat ketepatan metodologis dalam penelitian bisnis di Indonesia. Bagian ini juga menjadi jembatan konseptual menuju mata kuliah Riset Bisnis.

© Aurinoworks.com | Digital Intellectual Legacy

Leave a Comment

Your email address will not be published. Required fields are marked *