Statistici pentru disertație medicală, partea 1
Formularea precisă a întrebării
Înainte de a începe colectarea datelor pentru teza de doctorat, ar trebui să vă planificați cu atenție studiul. Pentru a face acest lucru, formulați întrebarea cât mai precis posibil. Puneți-vă întrebarea: La ce întrebare ar trebui să răspundă studiul dvs.?
Apoi, gândiți-vă la ce date aveți nevoie pentru a putea răspunde la această întrebare. Acest lucru te va face să realizezi,
- ce valori măsurate trebuie colectate (de exemplu, clasificarea diagnosticului, sexul, severitatea simptomelor),
- În ce momente din timp colectați valorile măsurate (de exemplu, înainte și după un tratament, diferite etape ale cursului, doar un moment în timp) și
- din ce populație ar trebui colectate datele (de exemplu, pacienții cu un anumit diagnostic, anumite grupuri de risc).
De câte cazuri aveți nevoie?
Pentru a putea estima câte cazuri sunt necesare pentru a răspunde la întrebarea dvs. înainte de a începe să colectați date, puteți planifica numărul de cazuri. Aici, se determină numărul de cazuri de care aveți nevoie cel puțin pentru a dovedi că rezultatul așteptat/dorit este semnificativ.
O planificare anticipată a dimensiunii eșantionului are sens:
- Evită să se constate după analiză că proba a fost prea mică pentru a demonstra diferența/conexiunea dorită.
- În caz contrar, vă scutește de la a investi prea mult timp, efort și bani în colectarea datelor dintr-un eșantion inutil de mare.
Un program gratuit care acceptă calcularea dimensiunii eșantionului pentru diferite modele de studiu și metode de analiză este G * power 3 (Heinrich-Heine-Universität Düsseldorf, 2013, http://www.gpower.hhu.de/)
Structura analizei datelor

Fig. 1: Structura analizei datelor, de la J. Webinger, D. Keller, B. Budrich: Cum scriu o teză de doctorat? Ghid pentru profesioniștii din domeniul medical și stomatologi. Springer 2014.
Analiza datelor statistice constă din două componente: statisticile descriptive și statisticile bazate pe acestea (vezi Fig. 1).
Statisticile descriptive descrie datele prin calcularea măsurilor adecvate. Statisticile descriptive includ, de asemenea, imagini pe care le puteți utiliza pentru a reprezenta datele și pentru a vizualiza diferențele/relațiile posibile.
În închiderea statisticilor se calculează teste statistice care verifică semnificația diferențelor/relațiilor descrise în partea descriptivă. O diferență sau asociere observată este considerată a fi semnificativă statistic numai dacă probabilitatea (p) unei astfel de observații într-un eșantion extras aleatoriu ar fi foarte scăzută, dacă în realitate nu ar exista nicio diferență/asociere în populația totală. Doar cu o semnificație dovedită, puteți avea încredere, cu o probabilitate redusă de eroare (nivel de semnificație, adesea stabilit la 5%), că efectul observat în studiul dvs. nu a avut loc întâmplător, ci că reflectă o diferență/relație reală în populația generală. Calculul dimensiunilor efectului (de exemplu, raportul de probabilități, r, d, η2) permite, de asemenea, o evaluare a dimensiunii efectului observat.
Alegerea metodei corecte
Statisticile descriptive
Alegerea metodei corecte pentru descrierea datelor depinde în mare măsură de tipul variabilei. În cele ce urmează, sunt menționate pe scurt câteva metode descriptive utilizate frecvent pentru descrierea datelor categorice (de exemplu, sex, fumător/nefumător, clasificare diagnostic) și date metrice (de exemplu, puterea simptomelor, valorile scalei chestionarului).
Caracteristicile categorice ale eșantionului examinat sunt descriptive cu Tabelele de frecvență și - atunci când combinați mai multe variabile categorice - cu Crosstabs afișate. După cum se potrivește o imagine grafic de bare sau a grafic cu bare grupate (vezi fig. 2).
Fig. 2: diagramă de bare grupată pentru a afișa date categorice. Variabile categorice: fumat (nu/da), boală (nu/da). Înălțimea barelor arată numărul de persoane din fiecare categorie.
Pentru descrierea caracteristicilor metrice ale eșantionului, se utilizează măsuri ale tendinței centrale, de ex. B. In medie și Median, și pentru împrăștiere, de ex. B. Deviație standard, IQR, minim și maxim, calculat. În plus, pot fi utilizate valorile medii și abaterile standard Intervale de încredere a calcula. Acestea descriu gama de valori în care media populației totale z. B. cu probabilitate de 95%.
Pe de o parte, acestea sunt bune pentru cartografierea datelor metrice Parcele de cutii, care arată atât tendința centrală (mediană), cât și dispersia (IQR, minim, maxim), identifică valori aberante și ilustrează comparații de grup, adică comparații între nivelurile unei variabile categorice (vezi Fig. 3). Pe de altă parte, cu Grafice cu bare (vezi Fig. 4) sau - în special pentru a arăta o secvență cronologică - cu Diagrame liniare (vezi Fig. 5) descriu valorile medii. Abaterile standard sau intervalele de încredere sub formă de Barele de erori poate fi vizualizat. Pentru maparea comună a două variabile metrice sunt potrivite Scatterplots (vezi fig. 6).
Fig. 3: Parcele de cutii pentru afișarea datelor metrice. Variabilă metrică dependentă: puterea simptomelor (scară de la 0 la 50), variabilă categorică independentă: fumat (nu/da). Linia de despărțire din cadrul casetelor arată mediana, lungimea casetelor arată IQR, punctele finale ale antenelor („mușchii”) arată minimul și maximul, cercul arată o valoare anterioară.
Fig. 4: Grafice cu bare pentru afișarea datelor metrice. Variabilă metrică dependentă: puterea simptomelor (scară de la 0 la 50), variabilă categorică independentă: fumat (nu/da). Înălțimea barelor arată valorile medii ale celor două grupuri de eșantioane, barele de eroare arată abaterile standard.
Fig. 5: Diagramele liniare pentru afișarea datelor metrice. Variabilă metrică dependentă: puterea simptomelor (scară de la 0 la 50), variabile categorice independente: tratament (placebo/medicament), punct de timp (înainte de tratament/după tratament/măsurare de urmărire). Punctele arată valorile medii ale celor două grupuri de trei ori, barele de eroare arată abaterile standard.
Fig. 6: Diagrama de împrăștiere pentru afișarea datelor metrice. Variabile metrice: puterea simptomelor (scara de la 0 la 50), numărul de țigări pe zi (scara de la 0 la 40). Fiecare punct corespunde unui subiect individual și își arată valorile pe cele două scale metrice.