Calculați și înțelegeți corelația statistică - cu un exemplu

Postat pe 5 aprilie 2019 de Valerie Benning. Actualizat la 21 iulie 2020.

Corelația ne spune gradul de relație dintre două variabile.

O corelație pozitivă înseamnă că variabilele se dezvoltă în aceeași direcție. Deci, dacă o variabilă crește, crește și cealaltă variabilă. În cazul unei corelații negative, opusul este adevărat: o creștere a variabilei 1 înseamnă o scădere a variabilei 2.

Notă Corelația este întotdeauna nedirecționată, adică adică nu spune care variabilă o provoacă pe cealaltă. Mai degrabă, putem folosi corelația pentru a stabili dacă există o conexiune și cât de puternică este.

Cuprins

Determinați corect și interpretați corelațiile

Corelația este indicată cu coeficientul de corelație. Aceasta ia întotdeauna o valoare între -1 și +1.

Exemplu Vrem să determinăm relația dintre înălțimea (variabila 1) și greutatea (variabila 2) a oamenilor.

  • apropiat de numărul 1 → corelație pozitivă puternică,
    z. De exemplu, persoanele mai înalte au o greutate mai mare.
  • aproape de numărul -1 → corelație negativă puternică
    z. De exemplu, persoanele mai înalte au o greutate mai mică.
  • aproape de numărul 0 → Nu există aproape nicio legătură între variabilele înălțime și greutate.

Tabelul vă oferă o prezentare generală a dezvoltării celor două variabile în funcție de corelarea lor pozitivă sau negativă.

Dezvoltarea corelației exemplului de variabile
Corelație pozitivă Variabila 1 crește → Variabila 2 crește Pe măsură ce mărimea crește, crește și greutatea.
Variabila 1 scade → Variabila 2 scade Dacă dimensiunea scade, scade și greutatea.
Variabila 2 crește → Variabila 1 crește Pe măsură ce greutatea crește, crește și dimensiunea.
Variabila 2 scade → Variabila 1 scade Dacă greutatea scade, la fel și dimensiunea.
Corelația negativă Variabila 1 crește → variabila 2 scade Dacă dimensiunea crește, greutatea scade.
Variabila 1 scade → variabila 2 crește Dacă dimensiunea scade, greutatea crește.
Variabila 2 crește → variabila 1 scade Dacă greutatea crește, dimensiunea scade.
Variabila 2 scade → variabila 1 crește Dacă greutatea scade, dimensiunea crește.
Notă Dacă doriți să faceți afirmații despre direcția relației sau dacă aveți o variabilă dependentă și una independentă, puteți utiliza o analiză de regresie.

Calculați corelația - Pearson sau Spearman?

Pentru a calcula și indica corelația, se determină coeficientul de corelație. Depinde de scara datelor care coeficient de corelație este cel corect.

Folosiți coeficientul de corelație Pearson dacă datele dvs. sunt metrice și coeficientul de corelație a rangului Spearman dacă aveți date ordinale.

Notă Pentru datele nominal scalate, determinăm coeficientul de contingență pentru a indica relația dintre două variabile.

Care este scorul tău?

Aflați înăuntru 10 minute, indiferent dacă ați creat neintenționat plagiat.

  • 70+ miliarde de surse de internet
  • 69+ milioane de publicații
  • Protecție securizată a datelor

corelația

Interpretează corelația cu graficul scatter

În plus față de calcularea coeficientului de corelație, puteți crea un grafic scatter. Aceasta ilustrează relația dintre cele două variabile.

Ilustrația prezintă graficul de împrăștiere pentru exemplul nostru cu înălțimea și greutatea oamenilor. Vedem că există o corelație pozitivă, deoarece distribuția observațiilor (punctelor) este mai mult ca o linie.

Deci, variabilele se mișcă în aceeași direcție și putem concluziona că o dimensiune mai mare merge mână în mână cu o greutate mai mare.

Notă Dacă distribuția observațiilor arată mai mult ca o linie, aceasta indică o conexiune mai puternică între cele două variabile și, astfel, un coeficient de corelație mai mare (valoarea r) decât dacă observațiile sunt răspândite pe scară largă.

Grafic de împrăștiere în SPSS, Excel și Foi de calcul Google

Utilizați pașii următori pentru a crea un grafic scatter folosind SPSS, Excel și Foi de calcul Google:

SPSS excela
Foi de calcul Google
Grafică → Creare diagramă → Diagramă dispersie/punct
Inserare → Diagramă → Punct (X, Y) sau diagramă scatter

Corelația și cauzalitatea

La determinarea corelației, este important să rețineți că corelația, deși indicativă a unei relații cauzale, nu este o dovadă.

Acest lucru este demonstrat de exemplul observării berzelor și a natalității:

Dacă observăm un număr crescut de berze și se înregistrează, de asemenea, o rată a natalității mai mare în regiune, putem spune că există o corelație, dar nu că există o legătură cauzală (de exemplu, berza aduce bebelușii).

Dacă doriți să aflați dacă există o relație de cauzalitate, ar trebui să faceți cercetări experimentale sau analize de regresie cu mai multe variabile de control.

întrebări frecvente

Corelația ne spune gradul de relație dintre două variabile.

Folosiți coeficientul de corelație Pearson pentru datele metrice și coeficientul de corelație a rangului Spearman pentru datele ordinale pentru care determinați o corelație.

Nu, o corelație este o indicație, dar nu o dovadă, a unei relații cauzale între două variabile.