Statistika Bisnis (Tambahan)

Regression Models for Categorical and Nonlinear Data


Learning Guide

Bagian ini menjelaskan model regresi yang digunakan ketika variabel dependen atau independen bersifat kategorik, nominal, ordinal, atau tidak kontinu. Materi ini sangat relevan dengan praktik penelitian di Indonesia, di mana data skala Likert sering kali dianalisis menggunakan regresi linear berganda tanpa mempertimbangkan asumsi model.

Masalah Umum di Indonesia:
Banyak penelitian menggunakan regresi linear berganda untuk data Likert (ordinal), data kategorik, atau variabel dummy, tanpa justifikasi metodologis yang memadai.


Mengapa Regresi Linear Tidak Selalu Tepat?

Regresi linear klasik mensyaratkan bahwa:

  • Variabel dependen berskala numerik dan kontinu
  • Hubungan antar variabel bersifat linear
  • Residual berdistribusi normal dan homoskedastik

Implikasi:
Jika variabel dependen berupa kategori, peringkat (ordinal), atau probabilitas, maka regresi linear dapat menghasilkan estimasi yang bias dan interpretasi yang menyesatkan.


1. Dummy Regression (Regression with Categorical X)

Regresi dummy digunakan ketika variabel independen bersifat kategorik (nominal), tetapi variabel dependen tetap numerik kontinu.

  • Variabel kategorik dikodekan menjadi dummy (0–1)
  • Satu kategori dijadikan reference group

Contoh:
Lokasi toko (Pusat Kota / Pinggiran)
Dummy: X = 1 (Pusat Kota), X = 0 (Pinggiran)

Kapan Digunakan?
Jika Y numerik kontinu, tetapi X kategorik.


2. Logistic Regression (Binary Outcome)

Regresi logistik digunakan ketika variabel dependen bersifat dikotomik (0/1).

  • Contoh: Ya / Tidak, Lulus / Tidak Lulus
  • Model memprediksi probabilitas, bukan nilai langsung

Contoh di Indonesia:
Keputusan pembelian (Beli / Tidak Beli)

Mengapa Tidak Regresi Linear?
Karena prediksi regresi linear bisa < 0 atau > 1, yang tidak masuk akal untuk probabilitas.


3. Multinomial Logistic Regression

Regresi logistik multinomial digunakan ketika variabel dependen bersifat nominal dengan lebih dari dua kategori dan tidak memiliki urutan alami.

  • Contoh: Metode pembayaran (Tunai, QRIS, Kartu)
  • Satu kategori dijadikan referensi

Kapan Digunakan?
Jika Y nominal (>2 kategori) dan X campuran (numerik/kategorik).

Kesalahan Umum:
Menggunakan regresi linear berganda untuk variabel dependen nominal.


4. Ordinal Logistic Regression

Regresi logistik ordinal digunakan ketika variabel dependen bersifat ordinal (memiliki urutan, tetapi jarak antar kategori tidak pasti).

  • Contoh: Skala Likert (Sangat Tidak Setuju – Sangat Setuju)
  • Model mempertahankan struktur urutan

Sangat Relevan di Indonesia:
Sebagian besar kuesioner penelitian menggunakan skala Likert, yang secara teori bersifat ordinal.

Catatan Metodologis:
Regresi linear untuk Likert dapat digunakan sebagai pendekatan praktis, tetapi regresi ordinal lebih tepat secara teoritis.


5. Nonlinear Regression

Regresi nonlinier digunakan ketika hubungan antara X dan Y tidak dapat direpresentasikan secara linear.

  • Hubungan eksponensial (pertumbuhan, difusi)
  • Hubungan logaritmik (learning curve)
  • Hubungan kuadratik (diminishing returns)

Contoh Bisnis:
Efek iklan yang meningkat cepat di awal, namun melambat setelah titik tertentu.

Alternatif:
Transformasi variabel (log, square) atau model nonlinier eksplisit.


Ringkasan Pemilihan Model Regresi

Jenis Data YModel yang Tepat
Numerik kontinuLinear / Multiple Regression
BinerLogistic Regression
Nominal (>2)Multinomial Logistic
Ordinal (Likert)Ordinal Logistic
NonlinearNonlinear Regression

Catatan Penutup:
Materi tambahan ini bertujuan memperkuat ketepatan metodologis dalam penelitian bisnis di Indonesia, khususnya dalam pemilihan model regresi yang sesuai dengan skala pengukuran data. Bagian ini juga menjadi jembatan konseptual menuju mata kuliah Riset Bisnis, di mana mahasiswa akan menerapkan model-model regresi ini dalam penyusunan dan analisis data penelitian.

Leave a Comment

Your email address will not be published. Required fields are marked *