KONSEP REGRESI LOGISTIK + CONTOH DENGAN SPSS 16
(Kasus Binary Reglog)
Malam ni sobat semua,, Wah wah wah.. Pada gimana nih kabarnya? Moga baik dan sehat-sehat saja ya hehehe.. Yap, sekarang kita belajar lagi yuk materi yang baru.. Nah, kali ini saya mau ngebahas dan ngasi contoh untuk metode statistik Regresi Logistik.
Kalau sobat pernah baca postingan saya tentang multiple regression, maka bedanya ada pada skala data variabel terikatnya sob.. Untuk regresi logistik, skala data variabel terikat (Y) adalah kategorik (non metrik). Ya bisa dua kategori, lebih dari dua (banyak kategori) dan bisa juga skala datanya ordinal kategorik. Terkait konsep, sebenarnya sama saja dengan regresi biasa (sederhana maupun berganda) yaitu melihat pengaruh dari variabel-variabel bebas terhadap variabel terikat.
Regresi logistik ini juga dipakai sebagai alternatif dari analisis multivariat yaitu analisis diskriminan (pembeda). Nah, sebagai pengantar pengetahuan saja, dalam analisis diskriminan kan dibutuhkan asumsi kenormalan multivariat.
Nah, bedanya dengan uji asumsi kenormalan biasa seperti ini; kalau uji asumsi kenormalan biasa, yang diuji kenormalannya adalah residual dari variabel terikat/dependennya sedangkan untuk multivariate normal, yang diuj kenormalannya adalah seluruh variabel bebasnya.
Asumsi multivariat normal ini terkadang sulit dipenuhi dalam analisis diskriminan karena variabel bebas yang digunakan merupakan gabungan antara skala data kategorik/non metrik dan kontinyu/metrik.
Dalam regresi logistik dikenal konsep Odds Ratio yang sama artinya dengan probabilitas atau kecenderungan.
By the way, terkait analisis diskriminan ini akan dibahas secara khusus pada postingan berikutnya. Sabar aja ya hehe..
Kalau seandainya,dalam penelitian sobat, pakainya ada dua kategori pada variabel terikatnya misalnya “lulus” dan “tidak lulus”, maka dinamakan binary logistic regression. Kalau semisalnya lebih dari dua kategori alias banyak dinamakan multinomial logistic regression. Nah, satu lagi, kalau skala data variabel terikatnya ordinal (peringkat), dinamakan ordinal logistic regression.
Oke deh kali ini saya berikan contoh pengerjaannya. Monggo, datanya download disini
Kalo sobat sudah ambil dan lihat datanya, ada tiga buah variabel yakni hasil tes tertulis, jenis kelas dan nilai tes praktikum. Disini saya mengambil sampel secara acak yakni 30 mahasiswa jurusan tehnik sipil suatu kampus. Hasil tes tertulis yang adalah variabel terikat merupakan kategorik (dua kategori yaitu 1=lulus dan 0=tidak lulus), jenis kelas juga kategorik (1=reguler dan 0=non reguler) dan nilai tes praktikum adalah non kategorik (kontinyu).
Berikut cuplikan tampilan data view dan variabel viewnya:
Langkah pertama, klik Analyze, Regression, lalu pilih Binary Logistics.
Masukkan variabel hasil tes tertulis ke dalam bagian Independent sedangkan variabel jenis kelas dan nilai tes praktikum masukkan ke bagian Covariates.. Berikut gambarannya:
Lalu, klik pada bagian Options dan centang seperti terlihat pada gambar di bawah ini:
Lalu klik Continue dan OK, maka akan dihasilkan output seperti berikut (langsung dengan penjelasannya).
Apakah model sudah fit? Perhatikan saja nilai statistik-2 Log Likelihood. Untuk bagian Beginning, yaitu nilai -2 Log likelihood yang masih hanya menggunakan konstanta (c) adalah 41,455 sedangkan saat kita sudah melibatkan dua variabel bebasnya (jenis kelas dan nilai tes praktikum), nilai -2 Log Likelihood adalah 8,809 (iterasi maksimum/20).
Nah, hal ini sudah nunjukin ada penurunan nilai dong saat variabel bebas sudah ikut “bermain” yakni sebesar 41,455-8,809= 32,646 (Lebih jelasnya, lihat pada bagian Omnibus Tests of Coefficients)
Untuk Beginning, ternyata dihasilkan koefisien dari -2 Log Likelihood 0,134 yang lebih besar dibanding alpha 5% sehingga dengan demikian kita menerima hipotesis nol yakni model sudah fit. Atau bisa juga dengan membandingkan nilai 41,455 dengan nilai statistik Chi Square (0,05; df=30-1) yaitu 42,5569678. Hasilnya tetap kita menerima hipotesis nol dan disimpulkan model sudah fit.
Selanjutnya, untuk block 1
Nilai -2LogL kedua adalah sebesar 8,809. Lalu, kita bandingkan nilai ini dengan Chi Square (0,05,df=30-3), ternyata hasilnya 8,809 < 40,1132721 (terima hipotesis nol >> tidak signifikan) sehingga model sudah fit dengan data.
Kalau dalam regresi biasa, kita pakai nilai R square untuk menunjukkan pengaruh bersama. Nah, pada regresi logistik kita pakai Cox & Snell dan Nagelkerke R Square. Secara bersama, variabel jenis kelas dan nilai tes praktikum yang kita pakai dalam penelitian sudah mampu menjelaskan keragaman data pada variabel hasil tes tertulis sebesar 88,6% (misal dengan Nagelkerke) sedangkan sisanya sebesar 11,4% dijelaskan oleh variabel lain di luar model penelitian
Saatnya kita uji hipotesis dengan Hosmer and Lemeshow Test. Hasilnya, nilai Sig 0,999 lebih besar daripada Alpha 5% sehingga kita menerima hipotesis nol (secara statistik tidak terdapat perbedaan yang signifikan antara model dengan nilai observasi) sehingga model sudah fit dengan data. Bisa juga dengan membandingkan nilai Chi Square hitung Hosmer dan Lemeshow Test dengan chi square tabel seperti berikut; 0,583 < 14,0671404 (hasilnya tetap terima hipotesis nol)
Sekarang, sampai di bagian akhir untuk interpretasi model regresi logistik.. Yes yes yes hehehe.. Oiya berikut model penelitiannya yaaa..
Ln P/1-P=-19,856+2,552 Nilai_Tes_Praktikum+19,683 Jenis_Kelas
Karena variabel jenis kelas secara statistik tidak berpengaruh secara signifikan, maka yang kita modelkan dan interpretasikan hanya variabel nilai tes praktikum saja. Tapi, camkan satu hal bahwa variabel jenis kelas ini dikatakan tidak signifikan secara statistik, bukan berarti pengaruhnya tidak ada (nol rasio), melainkan ada pengaruhnya, hanya saja sangat kecil. Mungkin untuk penelitian lain (beda waktu, beda mahasiswa, beda universitas) bisa saja hasilnya akan signifikan. Naaah, ini model penelitian yang akan kita ajukan hehehe..
Ln P/1-P=-19,856+2,552 Nilai_Tes_Praktikum
Tidak seperti regresi berganda, karena kita memakai Odds Ratio, maka untuk interpretasi variabel kualitatif tentu cukup sulit dilakukan. Memang terkesan cukup memaksa kita menginterpretasikan seperti ini:
"Kecenderungan mahasiswa jurusan teknik sipil untuk lulus tes tertulis berhubungan positif dengan nilai tes praktikum. Setiap peningkatan nilai tes praktikum sebesar satu poin, membuat tendensi/kecenderungan lulus tes tertulis 12,833 kali".
Naaaah, interpretasi sedemikian kurang rasional dan terkesan sedikit absurd, makanya untuk variabel kuantitatif pada reglog cukup kita interpretasikan seperti ini:
"Semakin tinggi nilai tes praktikum mahasiswa jurusan teknik sipil, maka kecenderungannya untuk lulus pada tes tertulis akan meningkat"
Andaikata, variabel jenis kelas kita anggap signifikan (ini sekedar belajar cara membaca output variabel kualitatif yaaa hehehe) maka interpretasinya sebagai berikut:
Nilai odds ratio sebesar 3,533 yang artinya Kecenderungan mahasiswa jurusan teknik sipil kelas reguler untuk lulus dalam ujian tertulis 3,533 kali mahasiswa jurusan teknik sipil kelas non reguler.
Dalam interpretasi variabel kualitatif ini, kita gunakan mahasiswa non reguler (kode nol) sebagai reference category. Kita pilih saja "first" pada Change Contrast. Naaah, untuk penelitian yang menggunakan lebih dari dua kategori pada variabel bebas kualitatif, misalkan besar, sedang dan kecil, maka penentuan reference category (variabel bebas rujukan untuk interpretasi) ini sangat penting. Gunanya untuk kepentingan interpretasi..
Kalau dalam penelitian ini, saya hanya pakai dua kategori pada variabel kualitatif yaitu kelas non reguler dan reguler sehingga pengaturan reference categorinya sudah langsung pada category first (kelas non reguler).
Oke deh sobat semua, ini dulu yang bisa saya bagikan tentang binary logistic regression.. Kurang lebihnya saya minta maaf.. Doakan aja ya agar reglog multinomial dan ordinal bisa saya berikan postingannya juga hehehe.. Oke deh.. Semoga bermanfaat.. Salam sukses :-)
sumber: Disini
Tidak ada komentar:
Posting Komentar