Statistica și teoria probabilităților - PDF Descărcare gratuită

Statistică și teoria probabilității Dr. Jochen Koehler 1

teoria

Conținutul prelegerii de astăzi Statistica și teoria probabilității Rezumatul prelegerii anterioare Prezentare generală a estimării și modelării Testul χ bunătății de potrivire Testul Kolmogorov Smirnov al bunătății de potrivire Comparații de modele

Rezumatul prelegerii anterioare Am analizat posibilitatea de a putea estima parametrii unei distribuții pe baza observațiilor/datelor. Ce am învățat? Că parametrii unei distribuții pot fi estimate cu ajutorul de ex. der: Metoda momentelor MoM Metoda de maximă probabilitate MLM 3

Rezumatul prelegerii anterioare Metoda momentelor (MoM) Estimarea punctelor Principiul MoM este: Estimăm parametrii prin echivalarea momentelor calculate analitic cu momentele eșantionului. m 1 n = xˆ 1 ini = 1 1 x fx (xμ, σ) λ = dx m 1 n = xˆ ini = 1 x fx (xμ, σ) λ = dx Acest lucru duce la k ecuații care trebuie rezolvate pentru k Estimarea parametrilor. Al 4-lea

Rezumatul prelegerii anterioare Metoda estimării maxime a probabilității (MLM) a parametrilor și distribuția lor Principiul MLM este: Parametrii sunt evaluați prin maximizarea probabilității ca parametrii să reprezinte observațiile/datele. n L (θ xˆ) = f (ˆ X xi θ) i = 1 l (θ x) = log (f (ˆ X xi θ)) min (l (θ xˆ)) θ ni = 1 μ = Θ (1 1 C ΘΘ = HH ij θ, θ. Θ l (θxˆ) T n) = θ = θ θ i θ j 5

Prezentare generală a estimării și a dezvoltării modelelor Diferite tipuri de informații sunt utilizate atunci când sunt dezvoltate modele tehnice. Informații subiective Informații frecvențiste Hârtie de probabilitate subiectivă Înțelegere fizică Experiență Capacitate de evaluare Familia de distribuție Date frecvențiste Parametri de distribuție Model probabilistic Eșantion de statistici Interval de încredere Semnificație statistică Metoda momentelor Metoda probabilității maxime 6

Să presupunem că am ales o anumită funcție de distribuție pentru a modela incertitudinea unui eveniment incert. Legile fizice ale datelor Familia de distribuție f x (x) Beton de rezistență la compresiune Parametrii de distribuție a datelor μ, σ x Acum dorim să verificăm alegerea distribuției noastre folosind teste statistice. Al 7-lea

Sunt luate în considerare două cazuri diferite: Verificarea 1: Funcții de distribuție discrete p x (x) CHI pătrat (χ) Test x: Funcții de distribuție continuă Testul Kolmogorov Smirnov f x (x) x 8

Testul pătratului CHI al bunătății potrivirii Ideea din spatele acestuia este că diferențele ε j între distribuția de date așteptată și observată ar trebui să fie mici dacă familia de distribuție selectată poate descrie bine eșantionul. 10 9 8 ε j ε i Observații 7 6 5 4 3 1 0 0 5 5 30 30 35 35 Histogramă din observații Histogramă conform observațiilor așteptate în funcție de distribuția selectată și parametrii săi rezistență la compresiune beton (MPa) 9

Testul de bunătate a potrivirii pătratului CHI După cum știm deja, o funcție discretă de distribuție a probabilității cumulative este dată după cum urmează: i 1 = j = 1 Px () px () i j funcția densității probabilității Funcția de distribuție a probabilității cumulative 10

Testul de bunătate al potrivirii pătratului CHI Fie n numărul de observații ale unei variabile aleatorii discrete X. Numărul de observații ale lui X = x i adică N i este o variabilă aleatorie distribuită binomial cu următoarea valoare și varianță așteptată: [] [] EN = npx () = N ii pi, Var N = np (x) (1 p (x)) = N (1 p (x)) iii pi, i Numărul așteptat de observații cu o anumită valoare 11

Testul bunătății pătratului CHI Fie n numărul de observații ale unei variabile aleatorii discrete X. Numărul de observații ale lui X = x i adică N i este o variabilă aleatorie distribuită binomial cu următoarea valoare și varianță așteptată: [] [] EN = npx () = N ii pi, Var N = np (x) (1 p (x)) = N (1 p (x)) iii pi, i Numărul așteptat de observații de o anumită valoare Dacă modelul postulat este corect și n este suficient de mare, atunci conform teoremei limitei centrale, diferența ε i are o distribuție normală standard. ε = i N N oi, pi, pi, N (1 p (x)) i Număr observat de observații cu o anumită valoare 1

Testul pătratului CHI al bunătății potrivirii Statisticii și calculului probabilității Dacă se rezumă diferențele pătrate ale numărului observat și așteptat de observații, atunci obținem: ε (NN) kk oi, pi, = εi = i = 1 i = 1 Npi, p xi ( 1 ()) CHI pătrat distribuit cu k 1 grade de libertate ε ε 1 număr de observații 10 9 8 7 6 5 4 3 1 0 ε mk (Noi, Npi,) = N i = 1 pi, 0 1 3 ε 3 ε 4 histogramă din observații Histograma observațiilor așteptate Numărul de accidente pe lună 13

Testul pătratului CHI al bunătății potrivirii Acum este testat la un nivel de semnificație α dacă suma tuturor diferențelor pătrate observate este plauzibilă, adică Ipoteza nulă H 0 este stabilită că funcția de distribuție selectată reprezintă eșantionul observat. Regula procedurală citește apoi P ε (m) Δ = α Ipoteza alternativă H 1 este mult mai puțin informativă deoarece acceptă toate celelalte distribuții în afară de distribuția selectată. Δ α χ 1 v = k j este valoarea fractilă a distribuției cu grade de libertate. 14

Testul pătratului CHI al bunătății de potrivire Considerăm următorul exemplu: Presupunem distribuția normală ca funcție de distribuție pentru 0 observații ale rezistenței la compresiune a betonului. Valoarea medie și abaterea standard este de 33 Mpa 5 Mpa. Parametrii nu sunt estimate din observațiile disponibile. Distribuția normală este o distribuție continuă. Dar poate fi ușor discretizată! 15

Testul pătratului CHI al bunătății potrivirii Funcția de densitate a funcției de distribuție selectată este discretizată: Funcția de distribuție selectată densitatea probabilității 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,0 0,01 0 0 10 0 30 40 50 60 Rezistența la compresiune a betonului (MPa) 16

Testul pătratului CHI al bunătății de potrivire Funcția de densitate a funcției de distribuție selectată este discretizată: Densitate de probabilitate 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,0 0,01 Funcție de distribuție selectată 0 0 10 0 30 40 50 60 Interval de beton cu rezistență la compresiune (MPa) 0 5: Φ Φ) 0 0,055 1. 10 Numărul total de încercări 5 33 33 0 () (= = 5 5 17

Testul pătratului CHI al bunătății de potrivire Funcția de densitate a funcției de distribuție selectată este discretizată: Densitatea probabilității Funcția de distribuție selectată 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,0 0,01 0 0 10 0 30 40 50 60 Beton rezistent la compresiune (MPa) 1 0 Histogramă așteptată 0 5 5 30 30 35 35 Beton cu rezistență la compresiune (MPa) Interval 0 5: Φ Φ) 0 0,055 1. 10 Număr total de teste 5 33 33 0 () (= = 5 5 18

Testul pătratului CHI al bunătății de potrivire Histogramele observate și așteptate pot fi comparate acum. 10 Numărul de observații 9 8 7 6 5 4 3 1 0 0 5 5 30 30 35 35 Beton cu rezistență la compresiune (MPa) Histogramă din observații Histogramă din observațiile așteptate 19

Testul pătratului CHI al bunătății de potrivire Histogramele observate și așteptate pot fi comparate acum. Datorită numărului mic de probe din zona inferioară, cele două intervale inferioare sunt combinate. Numărul de observații 10 9 8 7 6 5 4 3 1 0 0 5 5 30 30 35 35 35 Beton rezistent la compresiune (MPa) Histogramă din observații Numărul de observații 10 Histograma 1 observații așteptate 0 9 8 7 6 5 4 3 0 30 30 35 35 Beton cu rezistență la compresiune (MPa) 0

Testul pătratului CHI al bunătății de potrivire Calcule pentru exemplul dat Statistica și probabilitatea de calcul Interval xj (MPa) Numărul de observații N o, j Probabilități așteptate Numărul așteptat de observații N p, j, statistici eșantion 0 30 5 0.96671 5.933415 0.14684 30 35 9 0.381169 7.65443 0.36537 35 6 0.344578 6.41155 0.0649 Suma 0.40987 ε NN k (o, jp, j) m = j = 1 N p, j La un nivel de semnificație de 5% obținem pentru distribuția pătratului CHI cu N = 3 1 = grade de libertate de la masă: Δ = 5,99. Deoarece 0,40987 este mai mic de 5,99, ipoteza nulă H 0 nu poate fi respinsă. 1

Testul pătratului CHI al bunătății de potrivire Dacă unul sau mai mulți (m) parametri ai distribuției selectate au fost determinați din aceleași date care au fost utilizate pentru test, atunci numărul de grade de libertate trebuie redus în mod corespunzător: v = k 1 j Presupunând că varianța a fost determinată din date, dar nu din medie, obținem n = 3-1-1 = 1 grad de libertate.

Statistică și teoria probabilității Testul pătratului CHI al bunătății de potrivire Dacă presupunem o distribuție normală cu următorii parametri: μ = 33,00 σ = 4,05 obținem următorul rezultat: Interval xj (MPa) Număr de observații N o, j Probabilități așteptate p (xj) Așteptate Numărul de observații N p, j =, 0p (xj) statistici eșantion 0 30 5 0.7453 5.485061 0.04896 30 35 9 0.381169 7.63373 0.48591 35 6 0.344578 6.891566 0.11534 sumă 0.40689 La un nivel de semnificație de 5% obținem pentru distribuția pătratului CHI cu N = 3 1 1 = 1 grade de libertate față de masă: Δ = 3,84. Deoarece 0.40689 este mai mic de 3,84, ipoteza nulă H 0 nu poate fi respinsă. 3

Testul Kolmogorov Smirnov Goodness of Fit Ideea din spatele testului Kolmogorov Smirnov este următoarea: Dacă funcția de distribuție a probabilității cumulate a distribuției alese este luată în considerare pentru observații, atunci diferența maximă dintre funcția de distribuție a probabilității cumulate și observate ar trebui să fie mică. ε max ε max