Noțiuni de bază ale statisticii Care este diferența dintre caracteristicile discrete și continue - și când sunt acestea?
Noțiuni de bază ale statisticii: Care este diferența dintre caracteristicile discrete și continue - și când pot fi acumulate caracteristicile?
Ca parte a unei prelegeri statistice introductive, se tratează de obicei problema importantă a proprietăților care ar putea fi utilizate pentru a clasifica caracteristici statistice sau variabile. De cele mai multe ori, se discută despre distincția dintre caracteristicile acumulative și neacumulabile, precum și caracteristicile continue și discrete, care este, prin urmare, și subiectul articolului de azi de pe blog.

Caracteristici cumulative și necumulative
O caracteristică este considerată cumulativă dacă poate lua mai multe forme cu privire la aceeași unitate statistică. Acesta este cazul într-un sondaj personal, de exemplu, cu caracteristici cum ar fi un hobby sau o pregătire profesională, deoarece este întru totul plauzibil ca o persoană de test să poată urmări hobby-uri foarte diferite sau chiar să fi parcurs mai multe cursuri de formare profesională. Deci, pot exista unul sau mai multe răspunsuri valide la o întrebare. Alte caracteristici, cum ar fi anul nașterii sau sexul (biologic), pe de altă parte, trebuie considerate necumulative, deoarece nu poate exista decât o informație corectă per persoană testată.
În practică, problema acumulării are o mare relevanță atunci când datele colectate prin chestionar urmează să fie convertite într-o structură de tabel. Dacă, la crearea tabelului, se trece cu vederea faptul că o caracteristică poate îmbrăca mai multe forme, iar acest lucru este observat doar atunci când este introdusă a n-a înregistrare de date, este posibil ca tabelul să fie complet recreat și cu introducerea datelor - cel puțin parțial - ia-o de la început. Pentru a evita dramele nervoase, merită, așadar, să faceți o pauză pentru o clipă înainte de a introduce datele colectate pe computer - și din alte motive - și să vă gândiți la ce structură de tabel este potrivită pentru datele disponibile.
Caracteristici discrete și continue
Adevăruri simple pentru o lume complicată
O caracteristică este considerată discretă dacă poate presupune doar un număr numărabil de manifestări. În practică, acest lucru înseamnă de obicei că numărul de expresii posibile este finit. Acesta este cazul, de exemplu, cu notele școlare, anul nașterii, culoarea părului, sexul sau numărul de participanți la un eveniment - în toate aceste cazuri numărul de valori posibile este finit și, de obicei, poate fi chiar complet limitat în avans (de exemplu, notele școlare de la 1 la 6, numărul de participanți între 0 și maximum 10.000 etc. pp.). În multe manuale, pe lângă „numeroase expresii” cu „multe expresii numărabile”, este dată o a doua definiție pentru trăsăturile discrete, care la prima vedere pare puțin confuză - la urma urmei, s-ar putea crede că un set este fie infinit, fie unul le poate număra.
Totuși, ceea ce se înțelege aici este că o mulțime A este un subset infinit al mulțimii (la fel infinit) de numere naturale N, ale cărei elemente pot fi numărate. Mulțimea numerelor prime este, de exemplu, o mulțime infinită, deoarece, deși există un număr infinit de numere prime, este mai mică decât mulțimea numerelor naturale (nu fiecare număr este un număr prim) și puteți număra elementele sale: Primul număr prim este 2, al doilea 3, al treilea 5 - și așa mai departe și așa mai departe ... Definiția formală corectă a expresiei „infinit numărabil” („În teoria mulțimilor, o mulțime A se numește infinit numărabil dacă are aceeași putere ca și Set de numere naturale. Aceasta înseamnă că există o bijecție între A și setul de numere naturale. ”) Poate fi citit și în Wikipedia.
Omologul caracteristicilor discrete sunt caracteristicile continue. Acestea sunt definite de faptul că pot asuma un număr infinit de forme. În practică, acest lucru se exprimă prin faptul că, teoretic, noi valori suplimentare ar putea fi întotdeauna inserate între două valori strâns distanțate ale unei caracteristici continue dacă caracteristica de bază poate fi măsurată numai cu o precizie suficientă. Un exemplu în acest sens este specificarea nivelului apei în cm. Între cele două informații 10,5 cm și 10,6 cm, puteți pune orice număr suplimentar de informații: 10,51 cm, 10,511 cm, 10,512 cm etc. Practic tot ce poate fi măsurat fizic (cu o precizie crescândă).
O greșeală tipică la diferențierea caracteristicilor continue și discrete, care ar trebui menționate în acest moment, constă în presupunerea că prezența zecimalelor înseamnă automat că este prezentă o caracteristică continuă. De exemplu, scara Richter, care este utilizată pentru a măsura puterea cutremurelor („Un cutremur cu magnitudinea de 4,4 pe scara Richter s-a cutremurat astăzi ...”), în ciuda zecimalelor sale, are doar un număr foarte limitat de valori posibile și, prin urmare, este discret considera.
Caracteristici aproape continue
În cele din urmă, un caz special va fi luat în considerare cu caracteristicile cvasi-continue. Acestea sunt trăsături care sunt practic discrete (adică au un număr infinit de manifestări finite sau numărabile), dar care au atât de multe manifestări posibile încât în utilizarea practică sunt tratate ca trăsături continue (și, prin urmare, „cvasi stabile”) devin - de aici și expresia „cvasi-continuă”). Un exemplu tipic în acest sens este informația despre prețuri (în euro și cenți, de exemplu): Desigur, o informație despre preț poate avea doar un număr finit de forme - dar atât de multe (1,00 EUR; 1,01 EUR; 1,02 EUR. ...) încât poate Merită să ne prefacem că există un număr infinit de manifestări - și să tratăm variabila de fapt discretă ca o variabilă continuă.
Exercițiu: niveluri de scară și tipuri variabile
Ce nivel de scară (vezi postarea anterioară pe blog) are următoarele caracteristici - și sunt continue sau discrete?
- adâncimea apei unei piscine
- Numere de telefon ale clienților de transport
- Arome de înghețată
- Note școlare pe o scară de la 1 la 6
- Distanța dintre două clădiri în cm
- Prețul unei mașini noi în euro și cenți
- Culoarea părului clienților din salonul de coafură
- Temperatura unui bustean mocnit
- Evaluarea produsului pe o scară de la 1 la 5
- Studiați notele pe o scară de la 1.0 la 5.0
Pentru a vizualiza soluțiile, faceți clic aici.
Conținutul și sarcinile prezentate aici fac parte din prelegerea „Bazele statisticii” în cadrul programului de licență parțială în administrarea afacerilor de la Universitatea de Științe Aplicate din Harz. O prezentare completă a întregului conținut al acestei prelegeri în Turnul Științei poate fi găsită aici: Bazele statisticii.