3.9 Evaluare

În primul rând, sursele generale de eroare ar trebui luate în considerare înainte ca posibilitățile statistice ale evaluării să fie discutate.

3.9.1 Surse de eroare în evaluare

În sondaje, sursele de eroare (răspunsuri distorsionate) pot apărea din erori în instrument sau din răspunsuri incorecte ale participantului. Erorile din instrument pot fi reduse la minimum printr-o structură științifică. În primul rând, totuși, ar trebui descrise efecte care pot apărea în evaluare și nu sunt direct legate de instrument sau de respondent, ci mai degrabă de „natura problemei” în sine.

Este o selecție de efecte care trebuie luate în considerare la efectuarea și mai ales la evaluare.

Mortalitatea statistică

Se vorbește despre mortalitatea statistică atunci când nu mai este posibil să intervievăm pe toți cei care au fost inițial afectați de măsură (de exemplu, curs, seminar). Evaluarea se efectuează în cadrul cursului de administrare a afacerilor din Tübingen, în care acest efect este ilustrat în mod exemplar. În mod surprinzător, evaluările seminariilor duc adesea la note foarte bune până la bune, în mod neașteptat.

Dacă priviți mai atent procesul, apar două probleme. În primul rând, sondajul va avea loc la sfârșitul semestrului în timpul prelegerii. Studenții care au găsit seminarul atât de rău încât nu mai vin nu sunt în mod inevitabil incluși în evaluare cu opinia lor. Așa că renunți la anchetă.

Dezirabilitatea socială

A doua problemă a evaluării descrise mai sus se bazează pe dezirabilitatea socială, în acest caz combinată cu sancțiuni negative. Sondajul are loc cu puțin timp înainte de examene. Dacă evaluarea se dovedește slabă, trebuie să ne temem că notele examenelor vor fi similare. Deziderabilitatea socială este înțeleasă ca „un comportament de răspuns orientat către așteptările examinatorului” (Sassenberg/Kreutz 1999, p.61).

maturizare

Participantul se maturizează în timpul măsurii, dar nu neapărat prin măsură. Aceasta înseamnă că o schimbare poate fi constatată în timpul unei examinări înainte și după, dar apare o problemă de atribuire: Participantul a câștigat câștigul din măsură sau din alte evenimente, de ex. Conversații afară, citirea ziarului?

Tendință de consimțământ (achiziție)

Aceasta înseamnă consimțământul la întrebări fără referire la conținut. Acest lucru apare la persoanele care de ex. Răspundeți da la următoarea întrebare: „Deținerea armelor de foc în Germania ar trebui garantată în Legea fundamentală.” Cu toate acestea, sunteți de acord cu contrariul: „Deținerea armelor de foc ar trebui să fie interzisă în Germania de legea fundamentală.” Pentru acest fenomen există o explicație mai ales persoanele cu o putere scăzută a ego-ului tind să fie de acord.

Efectele primatului și actualității

Efectul de primat este similar cu tendința menționată mai sus spre acord, cu diferența că nu există un acord în principiu, ci se alege mai degrabă prima opțiune de răspuns care satisface un participant.

Un efect de primat poate fi presupus dacă există o tendință către unul dintre primele răspunsuri dintr-o listă. Efectul de primat apare relativ frecvent cu liste de răspunsuri disponibile vizual (cf. McClendon în Vogt 1999, p.134). Acest fenomen poate fi explicat teoretic cu un principiu satisfăcător aplicat, adică respondentul selectează primul răspuns care îl „satisface”, prin care alte răspunsuri alternative sunt ignorate. O lipsă de cunoștințe sau lipsa de interes pentru subiectul întrebării poate fi, de asemenea, decisivă (cf. Vogt 1999, p.135).

În contrast, există efectul recency, în care tendințele de răspuns tind spre una dintre ultimele poziții dintr-o listă. Acest lucru se întâmplă v. A. în interviurile orale când respondentul a uitat deja primele opțiuni și astfel face o selecție din ultimele puncte ascultate.

efect de halou

Dacă o întrebare se află în contextul întrebărilor anterioare, aceasta poate fi influențată de întrebările sau răspunsurile anterioare. Respondentul folosește apoi întrebările și răspunsurile anterioare ca ghid. Această problemă este denumită efectul halo sau radiație. Astfel de efecte apar în principal atunci când întrebările tratează același subiect sau un subiect într-un fel. Cu toate acestea, „nu pot fi dovedite decât în cazuri izolate. Aparent nu există rezultate consistente pentru anumite efecte de secvență ”(Vogt 1999, p.131; cf. Schnell și colab. 1999, p.320). Cu toate acestea, trebuie acordată atenție posibilelor efecte de difuzare legate de conținut.

Tendință centrală sau eroare de duritate ușoară

În cazul tendinței centrale, respondentul evită manifestările extreme. Respondenții tind spre mijloc. Un fenomen similar, care tinde să fie extrem de pozitiv, este descris de Gerl: „O problemă (.) Apare adesea că participanții tind să facă în general evaluări și evaluări foarte favorabile ale cursului lor și/sau instructorului lor de curs. Elementele individuale prezintă uneori distribuții extrem de distorsionate. "(Gerl 1983, p.46)

Această problemă coincide cu experiența activității mele de curs. În evaluare, 85-100% dintre participanți votează pentru „foarte bine”. Gerl numește două motive posibile ale acestui comportament: Pe de o parte, participarea la curs, spre deosebire de condițiile normale de viață, duce de fapt la o mare satisfacție, relativ independentă de calitatea didactică. Cursul poate fi simțit ca o vacanță din viața de zi cu zi.

Pe de altă parte, a doua explicație foarte valabilă: Participanții nu pot fi obișnuiți să dea critici diferențiate prin intermediul unui instructor de curs, care în acest moment este personalul de conducere. Ceea ce face mai dificilă o evaluare proastă este că liderul cursului este de obicei prietenos și i se oferă o evaluare bună din „simpatie” (sau din milă). În acest fel, se pot face evaluări foarte bune pentru toate răspunsurile, indiferent de întrebare.

Gerl sugerează rezumarea pe bază de calcul a categoriilor rămase, mai sărace și compararea acestora cu rezultatul evaluărilor foarte bune (Gerl 1983, p.46).

Rezumatul servește pentru a oferi o imagine de ansamblu și poate, în anumite circumstanțe, relativiza evaluările excesiv de pozitive.

3.9.2 Metode statistice

Spre deosebire de inteligența umană, inteligența computerului poate greși cu un grad de precizie mult mai mare. (Autor necunoscut)

Statisticile sunt parametri numerici, tehnici de evaluare și cele mai variate reprezentări grafice, care permit o înregistrare și o analiză semnificativă a datelor de observare.

Evaluarea matematică conform procedurilor descriptive

Pentru prima dată, dimensiunile și caracteristicile locației și măsurile de împrăștiere dau o impresie a rezultatelor așteptate. Un alt scop foarte important este „crearea unei anumite sensibilități din partea cercetătorului pentru datele disponibile” (Maier și colab. 2000, p.35). Acest lucru previne erorile care se pot strecura relativ rapid în timpul transformării variabilei. În viața de zi cu zi, acest proces are loc intuitiv, ca atunci când rulați factura restaurantului. Deci ajută „de ex. atunci când recunoașteți distribuții neverosimile, valorile medii aventuroase sau un număr neobișnuit de mare sau mai puțin valabil de valori "(Maier ibid.).

Proceduri descriptive

Cunoașterea procedurilor descriptive este importantă, deoarece aceste valori pot fi calculate automat ulterior când se utilizează software-ul, indiferent de cât de absurd sunt valorile sau întrebările originale. Astfel se va calcula întrebarea „Cât de mare este proporția străinilor din Garda Elvețiană în statul Vaticanului”.

Pentru o înțelegere de bază, este necesară mai întâi o înțelegere a nivelurilor scării.

În primul rând, Scala nominala Necesar. Cu această scalare există un singur „fie-fie”. Întrebările sunt de ex. împărțit în funcție de sex și intențiile de vot. Răspunsurile nu pot fi ordonate, deci nu au rang. De obicei nu există etape intermediare.

În Scara ordinală Spre deosebire de scara nominală, datele pot fi plasate într-o anumită ordine dacă anumite caracteristici sunt formal „mai valoroase” decât altele. La absolvire de ex. Abiturul contează mai mult decât Realschule, care la rândul său este mai bine decât Hauptschule. Se poate spune doar că ceva este mai bun, nu cât este mai bine.

La Scale de intervale În plus față de proprietățile scalelor nominale și ordinale, există și posibilitatea de a determina diferența. Exemplul clasic al oricărei prelegeri statistice este diferența de temperatură - diferența dintre 10 și 20 de grade este la fel de mare ca între 60 și 70 de grade.

În Scara raportului În plus față de proprietățile celorlalte scalări, se adaugă punctul zero definit permanent. Acest lucru face posibilă calcularea raporturilor. Deci, se poate spune că persoana A este de trei ori mai mare decât B, care câștigă de două ori mai mult.

[Tabelul 16: Compararea scalelor nominale, ordinale, de interval și de raport conform Maier și colab. (2000, p. 36)

Înțelegerea baremelor este primul pas fundamental în aplicarea cu succes a metodelor statistice. Prin crearea automată a categoriilor de întrebări ar putea fi generată prin integrarea în software. În studiile de științe sociale, există în principal trăsături care corespund scalelor nominale și ordinale.

Tendințele centrale sunt, de asemenea, importante. Aici se amintesc doar media aritmetică (medie, medie), modul (valoarea modală), mediana (valoarea centrală) și cuantilele.

Măsurile de dispersie oferă o perspectivă asupra variabilității unei distribuții de caracteristici. Măsurile de dispersie includ minim și maxim, interval, interval intercuartil, deviație standard, varianță și coeficientul de varianță (dispersie relativă).

Pentru a nu depăși sfera lucrării, ar trebui să se facă trimitere la cărți de statistici pentru explicații ale tendințelor și măsurilor de dispersie, care explică de obicei acești termeni în primele capitole (vezi Maier și colab. 2000).

Proceduri analitice

Scopul metodei analitice este de a verifica dacă concluziile care pot fi generalizate pot fi extrase din datele obținute sau dacă există relații între variabile individuale. În cele ce urmează, sunt prezentate pe scurt trei metode importante de analiză a datelor. pot fi de interes și sunt calculate automat de unele dintre pachetele software descrise.

Tabel încrucișat (sinonime: distribuție bidimensională a frecvenței, tabel de contingență)

Un tabel încrucișat arată relația dintre două variabile. Acestea sunt încrucișate și aceasta arată distribuția frecvenței unei variabile, care este definită de caracteristicile celei de-a doua variabile. Iată un exemplu simplu: o evaluare ar putea întreba despre satisfacția participanților. În plus, genul este determinat în evaluare. Aceste două variabile sunt încrucișate și se poate face o declarație despre satisfacția participanților în funcție de sex.

Afirmațiile pot fi verificate pentru semnificație folosind testul chi 2, care este de obicei utilizat pentru tabelele încrucișate. Dacă există semnificație statistică, măsura asocierii este interesantă. Gradul de asociere exprimă amploarea relației stabilite. Acest lucru ar trebui să fie suficient în acest moment pentru a putea evalua software-ul. Mai departe și mai presus de toate, procedurile de proces precise sunt în Maier și colab. (2000, p.46 și urm.).

Analiza corelației

În analiza corelației, relația statistică dintre două variabile scalate metric ar trebui cuantificată, cu condiția să existe o relație. Reprezentarea în diagrame are loc printr-un nor de puncte. Dacă punctele sunt împrăștiate difuz, nu există nicio corelație (coeficientul de corelație Pearson r = 0). Dacă punctele sunt apropiate și aproape pe o linie imaginară, atunci coeficientul de corelație tinde spre r = 1 (cf. Maier și colab. 2000, p.62 și urm.).

Analiza factorilor

Analiza factorială este adesea utilizată atunci când datele sunt disponibile cu o structură necunoscută, adică atunci când nu se știe cum variabilele individuale ar putea fi legate teoretic între ele. Iată un exemplu viu: un chestionar despre cumpărarea unei mașini întreabă despre profesie și importanța deținerii unei mașini. Aceste date sunt evaluate cu o analiză factorială. Următoarea diagramă prezintă punctele tari ale analizei factorilor și reprezentarea sub forma unei hărți factoriale.

[Figura 15: Exemplu de evaluare a importanței proprietății unei mașini, prezentat pe o hartă factorială

Analiza factorială merge chiar mai departe decât în exemplu și oferă posibilități uimitoare de cunoaștere.

Din nou, Maier și colab. (2000, p.116 și urm.) Pentru informații suplimentare.

Reflecție finală asupra statisticilor

Procesele statistice pot oferi rezultate perspicace. Cerința de bază este și rămâne o înțelegere de bază a proceselor statistice, chiar și atunci când se utilizează anchete computerizate. Următorul capitol al patrulea arată cât de mult este susținută de soluțiile software utilizarea metodelor descriptive și analitice.