Ce test statistic ar trebui să aleg Crash Course Statistics

Explicații simple, exemple și sarcini de examen

Acest articol se bazează pe articolul general despre Cum se testează o ipoteză. Vă recomand să citiți și să înțelegeți acest articol în prealabil; acest lucru facilitează mult fluxul de citire și înțelegere a acestui articol.

Tabelul pentru selectarea testelor

Următorul tabel (faceți clic pe acesta pentru o imagine mai mare) vă arată care este testul cel mai potrivit pentru un anumit nivel de scară al țintei și variabilele care influențează. ->

Explicația pentru aceasta o puteți găsi în restul acestui articol. La sfârșit, există câteva exemple de exerciții care demonstrează modul de utilizare a acestui tabel.

test

Mai întâi determinați tipul variabilei țintă, apoi tipul variabilei dvs. care influențează. În acest tabel veți găsi apoi metoda adecvată pentru analiza datelor dvs.

Un avertisment rapid: Pentru multe situații, alegerea testului potrivit este foarte ușoară și există practic o singură opțiune. Cu toate acestea, în unele cazuri, există mai multe teste adecvate care ar putea fi utilizate. Dacă de ex. Dacă există două teste posibile, atunci poate că unul are avantajul că trebuie să facă mai puține ipoteze despre date (de exemplu, distribuția normală), iar celălalt ar avea avantajul că poate recunoaște mai bine un efect existent efectiv.

În acest tabel am colectat teste care, în opinia mea, sunt fie cea mai simplă, fie cea mai bună soluție pentru un anumit set de date - este important să rețineți că acest lucru nu înseamnă că alte teste sunt în mod automat greșite sau mai rele.

Explicația tabelului

Există o serie de proceduri de testare care pot părea copleșitoare la prima vedere. Testul exact care trebuie ales într-o anumită situație depinde de o serie de întrebări la care trebuie răspuns din nou în fiecare situație.

O căutare de imagini Google pentru „ce test statistic” sau „ce test statistic” oferă multe diagrame diferite, care au detalii diferite și încep diferit. Unele sunt orientate spre obiective, adică prima întrebare este „Ce vreau să realizez?”, iar obiectivele posibile sunt de ex. „Comparați o medie cu o valoare ipotetică”. Alte diagrame se bazează pe proprietățile datelor. Aici începeți cu întrebarea „Care este variabila țintă?” este nominală sau continuă. În opinia mea, acest lucru este mai ușor de început, motiv pentru care ne punem aceste două întrebări:

1.) Care este dimensiunea țintă? -->

Variabila țintă este caracteristica care se va modifica datorită efectului influențării variabilelor. Depinde de factorii care influențează. Aș vrea de ex. dovedește efectul antihipertensiv al unui medicament nou, atunci variabila mea țintă este tensiunea arterială, iar variabila care influențează este medicamentul (de exemplu, ai avea două grupuri, o persoană fără medicament și o persoană cu medicament).

Acum determinați de ce tip (ce nivel de scară) este dimensiunea țintă:

2.) Care sunt factorii care influențează?

--> În al doilea rând, trebuie să stabilim dacă avem o variabilă de influență și, dacă da, ce tip de scară are.

Important: Nu contează ce distribuție au variabilele care influențează. Deci, dacă o variabilă de influență este distribuită în mod normal sau nu este irelevantă pentru procedura de testare.

sarcini

Pentru fiecare dintre următoarele cazuri, determinați ce test este potrivit în fiecare caz. Mai întâi identificați dimensiunea țintă și determinați tipul acesteia (nominală, ordinală etc.). Apoi determinați dacă există una sau mai multe variabile care influențează și ce tip sunt. Apoi utilizați tabelul pentru a găsi testul adecvat.

(Cu excepția cazului în care se menționează în mod specific în exercițiu, nu puteți presupune o distribuție normală a variabilelor.)

  • 1a) Valoarea țintă aici este numărul de țigări pe zi. Acestea sunt date de numărare, astfel încât variabila țintă este scalată în mod ordinal (puteți, de asemenea, să o considerați ca fiind scalată în interval). Factorul de influență este momentul în timp (înainte/după), adică o variabilă nominală cu două grupuri. Cele două grupuri sunt împerecheate, deoarece măsurătorile sunt conectate: aceleași persoane au fost intervievate înainte și după terapie. Conform tabelului, testul adecvat este aici Wilcoxon a semnat testul de rang.
    • 1b) În comparație cu 1a), singurul lucru care se schimbă aici este faptul că variabila care influențează nu mai are doar două, ci mai multe grupuri. Deci, conform tabelului, acum folosim Testul Friedman.
  • 2a) Aici doriți să testați o parte simplă. Există un rezultat nominal în două grupuri și nu există predictor. Aici este Test binomial cel potrivit.
    • 2b) Acum nu există încă nicio variabilă de influențare, dar variabila țintă are acum mai multe grupuri. Aici folosești unul Test de bunătate de potrivire Chi-pătrat.
  • 3a) Aici aveți o variabilă țintă nominală cu două categorii și mai multe variabile de influență, continue și categorice. A regresie logistică este potrivit aici.
    • 3b) Rezultatul este continuu, dar nu este distribuit în mod normal. Factorul de influență este categoric cu două grupuri. Deoarece cele două grupuri (bărbați și femei) nu sunt împerecheați (așa cum ar fi cazul grupurilor înainte/după, de exemplu), este mai bine să luați unul aici Testul U Wilcoxon-Mann-Whitney.
    • 3c) Dacă există mai mult de două grupuri, utilizați testul U în locul celui Wilcoxon-Mann-Whitney Testul Kruskal-Wallis.
  • 4) Cu două variabile continue sau distribuite în mod normal, se poate calcula corelația dintre ele și Test de corelație Pearson executa. Alternativ, ar fi, de asemenea, posibil model liniar (adică regresie liniară).
  • 5) Rezultatul este distribuit în mod normal, iar factorul de influență este categoric cu două grupuri. Acest lucru se potrivește T-test cu două eșantioane.
  • 6) Variabila țintă este partea aleasă, adică o variabilă categorică cu mai multe grupuri. Factorul de influență, calificarea educațională, este, de asemenea, categoric. Prin urmare, se potrivește aici Testul Chi-pătrat. Testul Fisher este, de asemenea, o alternativă. Este utilizat în cazurile cu mai puține date, de ex. dacă există mai puțin de 1000 de observații sau dacă cel puțin una dintre celulele din tabla încrucișată are mai puțin de 5 observații.
  • 7a) Aici este examinată influența unei variabile de influență categorice asupra unei variabile țintă distribuite în mod normal. A ANOVA este instrumentul potrivit pentru aceasta, ar fi posibilă și o alternativă model de regresie liniară.
    • 7b) Dacă există mai mulți factori de influență, unul se îndreaptă spre regresie liniară multiplă afară.
  • 8a) Aici se testează o variabilă țintă ordinală (fără a influența variabile) pe mediană. A Test de semnare poate testa asta.
    • 8b) Variabila țintă este încă ordinală, dar acum există o variabilă care influențează constant. Se poate calcula corelația rangului Spearman a acestor două variabile, iar apoi Testul Spearman aleargă pentru a testa o corelație.
  • 9a) Este o variabilă țintă categorică cu două grupuri (hipertensiune arterială da/nu). Variabila de influență are, de asemenea, două grupuri și este asociată, deoarece aceiași oameni sunt măsurați în grupul „înainte” și „după”. Deci există Test McNemar la.
    • 9b) Dacă dimensiunea țintă este distribuită în mod normal în loc de categorică, tu conduci una test t asociat afară.

3 gânduri despre „ce test statistic ar trebui să aleg? "

Sunt confuz de exemplul dvs. de influențare constantă a variabilelor sau sarcina 1: „Numărul de apeluri într-o centrală” și „țigări pe zi” sunt valori discrete, de ce apar aici ca continue sau ordinale?