Modele de ecuații structurale - Statistici Wiki Ratgeber Lexikon

Introducere generală

Atunci când investighează fapte empirice, psihologii, biologii, statisticienii etc. caută legături între diferite variabile. Aceste variabile pot fi modelate atât prin variabile măsurabile (observabile), cât și latente (neobservabile). O metodă care este adesea utilizată este regresia liniară. Cu această metodă, înregistrați relația liniară între variabilele măsurabile examinate. Nu primiți nicio informație despre cauza și efectul (cauzalitatea) dintre variabilele dvs. În plus, relațiile complexe dintre variabilele dvs. pot rămâne nedetectate.

Modelul ecuației structurale poate rezolva aceste două puncte. În special, vă poate oferi o perspectivă asupra structurilor „ascunse” ale variabilelor dvs. (de aici și numele). Metoda este un amestec de analiză factorială, regresie liniară și analiză cale. În literatură, termenul „model de ecuație structurală” este folosit pentru metode diferite, dar în esență similare. Ca și în cazul majorității metodelor de analiză statistică, trebuie să formați ipoteze și apoi să le testați pentru semnificație. De asemenea, puteți utiliza analiza factorială pentru a defini variabilele latente.

Un model de ecuație structurală în practică

Să presupunem că faceți următoarea ipoteză:

Stresul și munca fizică grea înrăutățesc sănătatea.

După cum puteți vedea, există o relație de cauzalitate între variabilele latente exogene stres și munca fizică și starea de sănătate a variabilelor latente endogene. Cu ajutorul unui model de ecuație structurală, puteți căuta structura în contextul variabilelor dvs. Pentru a face acest lucru, aveți nevoie de variabile măsurabile pentru a capta variabilele latente. În acest exemplu, puteți măsura stresul, de exemplu, prin somn și pierderea în greutate. Puteți măsura munca fizică după caloriile arse și numărul de cazuri de epuizare. Puteți de ex. prin măsurarea nivelului zahărului din sânge și a tensiunii arteriale. O reprezentare grafică sub forma unei diagrame de cale este foarte utilă, astfel încât să puteți urmări modelul. Următoarea diagramă a traseului ilustrează acest lucru

O reprezentare grafică a modelului din exemplul de mai sus folosind o diagramă de cale.

Modelul ecuației structurale din exemplul de mai sus. Puteți recunoaște variabilele măsurabile ca pătrate galbene și variabilele latente ca ovale albastre. Modelul structural este conturat. Săgețile punctate reprezintă structura care vă interesează. Ipoteza dvs. este matematic:

Parametrii modelului și sunt semnificativ diferiți de 0.

Parametrii pentru, precum și și sunt parametrii măsurabili și pot de ex. poate fi determinată prin analiza factorială. După determinarea parametrilor, puteți actualiza diagrama de cale în consecință. Ca alternativă la ipoteza de mai sus, puteți estima variabilele latente, adică structura modelului, utilizând analiza factorului sau varianței.

Cum estimați parametrii?

Următorul exemplu vă arată cum sunt determinate variabilele latente și parametrii estimate. În figura de mai jos puteți găsi un grafic de împrăștiere a două seturi de date fictive pentru duratele de somn și pierderea în greutate cu 200 de valori fiecare. Seriile cronologice au fost centrate fiecare în jurul valorii de 0 (prin scăderea mediei valorilor din fiecare valoare). Pentru a rămâne cu exemplul de mai sus, tensiunea variabilă latentă trebuie determinată cu ajutorul analizei factorilor. După cum puteți vedea în figură, răspândirea datelor, adică varianța datelor, este pe linii diferite

variabil	parametru	valoare
Ora de culcare	c1	0,3
Pierdere în greutate	c2	0,7

Tabelul 1: Varianța datelor

variabil	Varianța
X1	0,97
X2	4,88
X1 ′	5,71
X2 ′	0,15

Tabelul 2: Parametri pentru determinarea factorului

Linii de origine de diferite dimensiuni. Acum doriți să explicați la maximum varianța stresului variabil cu variabilele dvs. măsurabile și căutați în consecință direcția cu varianța maximă. Puteți face acest lucru cu mai multe metode.

O metodă bună și adesea utilizată este metoda axei principale (a se vedea analiza componentelor principale). Această metodă determină linia dreaptă prin origine, adică prima axă principală de-a lungul căreia dispersia datelor este maximă. Cu aceasta puteți determina a doua axă principală. Aceasta are cea mai mare variație de date între toate liniile drepte prin origine care sunt perpendiculare pe prima axă principală. Procedați în mod similar atunci când determinați alte axe principale. Vă puteți imagina metoda ca pe o schimbare a întregului sistem de coordonate.

Pentru datele actuale, cele două componente principale sunt prezentate ca cele două linii încrucișate X1 'și X2' din figură. Variațiile datelor pot fi găsite în Tabelul 1. Varianța de-a lungul coordonatelor originale (solidele X1 și X2) este mai mică decât varianța de-a lungul primei axe principale X1 'și mai mare decât varianța de-a lungul celei de-a doua axe principale X2'. Apoi, puteți vedea această nouă variabilă X1 'ca factorul 1, adică stresul variabil latent.

Cu această metodă nu obțineți doar varianțele, ci și parametrii și ieșirea. Puteți găsi rezultatele pentru aceasta în Tabelul 2. Puteți calcula valorile tensiunii variabilei latente explicate de variabilele măsurabile cu următoarea ecuație (nume de variabile prescurtate):

Deci, explicați varianța datelor de-a lungul primei componente principale X1 'din 5.71. Varianța de-a lungul celei de-a doua componente principale X2 'de 0,15 este varianța inexplicabilă, care reprezintă 2,6% din varianța explicată.

După ce ați determinat toate variabilele latente, puteți estima parametrii și, de exemplu, cu regresie liniară. Ecuația corespunzătoare este, unde pentru munca fizică stă:

În această ecuație, varianța sănătății variabilei nu este explicată de variabilele din ecuație. Cel mai simplu mod de a determina parametrii de regresie și cu ajutorul unui software statistic. Majoritatea programelor oferă atât valorile estimate, cât și semnificația estimării. În tabelul de mai jos puteți găsi un exemplu de estimare pentru valori fictive ale datelor. Rezultatul ar putea arăta astfel, de exemplu:

variabil	Valoarea estimată	Statistică t	valoarea p
constant	0,04	0,59	0.55543
stres	0,89	12.26	4.10E-25
Muncă	-0,64	-9.30	2.78E-13

Metoda

1. Formularea întrebării (ipoteză): În acest moment trebuie să vă gândiți cu atenție la ce întrebare specifică doriți să urmăriți. Acesta este aspectul central al modelului dvs., adică structura acestuia.

2. Selectarea variabilelor măsurabile și diagrama traseului: Pentru a vă testa empiric ipotezele, trebuie să selectați variabilele măsurabile. Acestea ar trebui să vă confirme ipoteza și să fie reprezentative. Apoi, afișați grafic întregul model cu ajutorul unei diagrame de cale (ca mai sus).

3. Recunoașteți structura modelului: folosind diagrama de cale, recunoașteți relațiile asumate sau așteptate. În special, acest lucru vă oferă o imagine de ansamblu bună pe care o puteți pierde rapid cu mai multe variabile.

4. Estimarea parametrilor și testarea semnificației: estimările parametrilor din modelul ecuației structurale pot varia. Cele mai comune metode sunt regresia liniară și analiza factorială sau analiza componentelor principale, așa cum ați putea vedea în exemplul de mai sus. În practică, sunt utilizate programe pentru aceasta, care efectuează toți pașii necesari pentru calcul. Pachete software importante pentru acest lucru sunt, de exemplu, SPSS Amos, Mplus sau SmartPLS.

5. Modificări posibile ale modelului: puteți renunța la parametrii care nu sunt semnificativ diferiți de 0. Apoi eliminați săgețile corespunzătoare din diagrama traseului. Parametrii care nu sunt semnificativi trebuie aruncați o singură dată. Cu o privire la diagrama de cale actualizată, puteți efectua din nou estimarea fără parametrii eliminați. În funcție de rezultatul final, puteți să vă respingeți ipoteza, să o păstrați sau să o reinterpretați.

literatură

Jöreskog, K. G. și Sörbom, D. (1989). LISREL 7: Un ghid pentru program și aplicații (ediția a II-a). Chicago, IL: SPSS