Model Linier Umum

Dipublikasikan oleh Siti Nur Rahmawati

22 Agustus 2022, 11.10

www.sampoernaacademy.sch.id

Model linier umum atau model regresi multivariat umum adalah cara yang kompak untuk secara bersamaan menulis beberapa model regresi linier berganda. Dalam pengertian itu, ini bukan model linier statistik yang terpisah. Berbagai model regresi linier berganda dapat ditulis secara ringkas sebagai 

\mathbf {Y} =\mathbf {X} \mathbf {B} +\mathbf {U} ,

di mana Y adalah matriks dengan serangkaian pengukuran multivariat (setiap kolom menjadi kumpulan pengukuran pada salah satu variabel terikat), X adalah matriks pengamatan pada variabel bebas yang mungkin merupakan matriks desain (setiap kolom menjadi kumpulan pengamatan pada salah satu variabel bebas), B adalah matriks yang berisi parameter-parameter yang biasanya akan diestimasi dan U adalah matriks yang mengandung kesalahan (noise). Kesalahan biasanya diasumsikan tidak berkorelasi di seluruh pengukuran, dan mengikuti distribusi normal multivariat. Jika kesalahan tidak mengikuti distribusi normal multivariat, model linier umum dapat digunakan untuk mengendurkan asumsi tentang Y dan U.

Model linier umum menggabungkan sejumlah model statistik yang berbeda: ANOVA, ANCOVA, MANOVA, MANCOVA, regresi linier biasa, uji-t dan uji-F. Model linier umum adalah generalisasi dari regresi linier berganda untuk kasus lebih dari satu variabel dependen. Jika Y, B, dan U adalah vektor kolom, persamaan matriks di atas akan mewakili regresi linier berganda.

Uji hipotesis dengan model linier umum dapat dilakukan dengan dua cara: multivariat atau sebagai beberapa uji univariat independen. Dalam pengujian multivariat kolom Y diuji bersama-sama, sedangkan dalam pengujian univariat kolom Y diuji secara independen, yaitu, sebagai beberapa pengujian univariat dengan matriks desain yang sama.

Perbandingan dengan regresi linier berganda

Regresi linier berganda adalah generalisasi dari regresi linier sederhana untuk kasus lebih dari satu variabel independen, dan kasus khusus model linier umum, terbatas pada satu variabel dependen. Model dasar untuk regresi linier berganda adalah

{\displaystyle Y_{i}=\beta _{0}+\beta _{1}X_{i1}+\beta _{2}X_{i2}+\ldots +\beta _{p}X_{ip}+\epsilon _{i}}

untuk setiap pengamatan i = 1, ... , n.

Dalam rumus di atas kita mempertimbangkan n pengamatan dari satu variabel terikat dan p variabel bebas. Jadi, Yi adalah pengamatan ke-i terhadap variabel terikat, Xij adalah pengamatan ke-i terhadap variabel bebas ke-j, j = 1, 2, ..., p. Nilai j mewakili parameter yang akan diestimasi, dan i adalah galat normal terdistribusi identik independen ke-i.

Dalam regresi linier multivariat yang lebih umum, ada satu persamaan dari bentuk di atas untuk masing-masing m > 1 variabel dependen yang memiliki kumpulan variabel penjelas yang sama dan karenanya diestimasi secara simultan satu sama lain:

{\displaystyle Y_{ij}=\beta _{0j}+\beta _{1j}X_{i1}+\beta _{2j}X_{i2}+\ldots +\beta _{pj}X_{ip}+\epsilon _{ij}}

untuk semua observasi diindeks sebagai i = 1, ... , n dan untuk semua variabel dependen diindeks sebagai j = 1, ... , m.

Perhatikan bahwa, karena setiap variabel dependen memiliki seperangkat parameter regresinya sendiri untuk dipasang, dari sudut pandang komputasi, regresi multivariat umum hanyalah urutan regresi linier berganda standar yang menggunakan variabel penjelas yang sama.

Perbandingan dengan model linier umum

Model linier umum dan model linier umum (GLM) adalah dua keluarga metode statistik yang umum digunakan untuk menghubungkan sejumlah prediktor kontinu dan/atau kategoris ke variabel hasil tunggal.

Perbedaan utama antara kedua pendekatan tersebut adalah bahwa model linier umum secara ketat mengasumsikan bahwa residual akan mengikuti distribusi normal bersyarat, sedangkan GLM melonggarkan asumsi ini dan memungkinkan berbagai distribusi lain dari keluarga eksponensial untuk residual. Sebagai catatan, model linier umum adalah kasus khusus dari GLM di mana distribusi residual mengikuti distribusi normal bersyarat.

Distribusi residual sangat tergantung pada jenis dan distribusi variabel hasil; berbagai jenis variabel hasil menyebabkan berbagai model dalam keluarga GLM. Model yang umum digunakan dalam keluarga GLM termasuk regresi logistik biner[5] untuk hasil biner atau dikotomis, regresi Poisson[6] untuk hasil penghitungan, dan regresi linier untuk hasil yang terdistribusi normal dan berkelanjutan. Ini berarti bahwa GLM dapat dikatakan sebagai keluarga umum model statistik atau sebagai model khusus untuk jenis hasil tertentu.

Aplikasi

Aplikasi model linier umum muncul dalam analisis beberapa pemindaian otak di bidang ilmiah eksperimen di mana Y berisi data dari pemindai otak, X berisi variabel desain eksperimental dan perancu. Biasanya diuji dengan cara univariat (biasanya disebut univariat massa dalam pengaturan ini) dan sering disebut sebagai pemetaan parametrik statistik.

 

Sumber Artikel: en.wikipedia.org