Putere d; un test statistic și erori de evitat

Acest articol despre erorile din statistici vă va ajuta să înțelegeți și să evitați capcanele obișnuite în testarea statistică. Acesta este cel mai recent dintr-o serie de trei articole despre utilizarea testelor statistice, care pot fi găsite pe blogul nostru.

teste statistice sunt instrumente puternice de inferență statistică, adică permit deducerea proprietăților unei populații observate din eșantionul colectat. Dar un astfel de avantaj nu poate fi atins fără efort! Acordați atenție posibilelor greșeli.

În primul rând, trebuie să luați în considerare două puncte ca urmare a:

test

  • Proba trebuie prelevată la întâmplare, prin urmare eșantioane aleatorii, pentru a avea date imparțiale ale populației.
  • Nu poți fi sigur dacă o ipoteză sau alta este cu totul adevărată. Sunteți capabil să respingeți sau să nu respingeți ipoteza nulă (H0) cu o anumită probabilitate.

Într-adevăr, există 4 situații posibil în funcție de faptul dacă H0 este adevărat și dacă respingeți H0:

În abstract:

  • Eroare de tip I: noi descendenți ipoteza adevărată nulă (H0).
  • Eroare de tip II: noi nu reușiți să respingeți ipoteza falsă nulă (H0).

Cum putem controla aceste erori ?

Răspunsul la această întrebare necesită introducerea unui concept important: nivelul de semnificație

Nivelul de semnificație

Dacă îți amintești de al meu postarea anterioară pe diferite tipuri de teste, am calculat valoarea p, care a fost probabilitatea de a obține statistica pe care o observăm sau ceva mai extrem (adică mai departe de medie: de exemplu, o diferență de salarizare între bărbați și femei mai mare decât sau egal cu 1%).

Am spus că, dacă valoarea lui p este suficient de mică, respingem ipoteza nulă H0 (ipoteza că această diferență se datorează pur și simplu întâmplării). Dar ce înseamnă să fii „suficient de mic”? 0.1 este suficient de mic? Dar 0,05? Sau 0,01 ?

Statisticienii aleg de obicei această „valoare p suficient de mică” ca 0,05 sau 0,01, ceea ce reprezintă o șansă de 5% sau 1% să apară. Aceștia denotă această valoare p specifică prin litera greacă α (alfa) și o numesc nivelul de semnificație. Deci, atunci când p este mai mic sau egal cu α, observația dvs. este semnificativă, ipoteza 0 poate fi respinsă.