STATYSTYKA wykład 1 Wanda Olech Katedra Genetyki i Ogólnej Hodowli Zwierząt Plan wykładów Data WYKAADY 1.X rachunek prawdopodobieństwa; 8.X zmienna losowa jednowymiarowa, funkcja rozkładu, dystrybuanta 15.X parametry zmiennej losowej 22.X rozkłady zm. losowych (normalny, dwumianowy, Poissona, dwupunktowy, geometryczny) 29.X twierdzenia graniczne i rozkłady statystyk z próby 5.XI wnioskowanie (przedziały ufności 12.XI wnioskowanie (weryfikacja hipotez), istotność 19.XI hipotezy nieparametryczne 26.XI zmienna losowa dwuwymiarowa zależność stochastyczna i korelacyjna 3.XII analiza korelacji 10.XII ocena zależności 17.XII analiza regresji 7.I analiza regresji cd. 14.I analiza wariancji jednoczynnikowa 21.I powtórzenie Statystyka Pierwotnie oznaczała stan rzeczy (od status) i do XVIII wieku używana dla określenia zbioru wiadomości o państwie Statystyka obecnie: Zespół informacji liczbowych dotyczących celowo wybranej grupy lub kategorii zjawisk (statystyka produkcji, statystyka rolnictwa itp.) Dyscyplina naukowa traktująca o metodach (narzędziach) liczbowego opisu i wnioskowania o prawidłowościach występujących w procesach masowych Przedmiotem badań statystyki: są zjawiska masowe występujące w przyrodzie lub społeczeństwie a dające się mierzyć np. produkcja wyrobów, zużycie materiałów, zatrudnienie, zjawiska demograficzne, tempo wzrostu itd. Traktując te zjawiska jako losowe można zauważyć działanie przyczyn powodujących pewne prawidłowości. Przyczyny mogą być główne lub uboczne, ale ich działanie można zauważyć jedynie w większej masie przypadków (zjawiska masowe). Badania służące wyjaśnianiu tych przyczyn to badania statystyczne. Przedmiotem badań statystyki: zjawiska losowe - badane poprzez doświadczenie Doświadczenie losowe to takie, które może być powtarzane w tych samych (zasadniczo) warunkach ale jego wynik nie może być przewidziany w sposób pewny oraz zbiór wszystkich możliwych wyników jest znany i może być opisany przed przeprowadzeniem doświadczenia. . U podstaw współczesnej statystyki leży rachunek prawdopodobieństwa Rachunek prawdopodobieństwa podstawowe pojęcia Zdarzenie elementarne A . . . . : . . . : W podstawowe pojęcia " zdarzenie elementarne (pojedynczy wynik doświadczenia losowego) " zbiór wszystkich zdarzeń elementarnych (zbiór wszystkich wyników doświadczenia losowego) to zdarzenie pewne (W) Zbiór W może być skończony lub nieskończony, przeliczalny lub nieprzeliczalny " zdarzenie losowe (oznaczane np. przez A, B) jest podzbiorem W " Dopełnieniem zdarzenia A nazywamy zdarzenie A =W - A " zdarzenie niemożliwe, to zbiór pusty Ć A B = suma zdarzeń losowych (alternatywa) A B = iloczyn zdarzeń (koniunkcja) A i B są zdarzeniami wykluczającymi gdy A B = Ć B A A B A B = suma zdarzeń losowych (alternatywa) A B A B = iloczyn zdarzeń (koniunkcja) A B Definicja prawdopodobieństwa Kołmogorowa Jeżeli A W , to P(A) jest liczbą rzeczywistą spełniająca następujące aksjomaty: P(A) ł 0 P(AB) = P(A) + P(B) gdy B W i A B = Ć P(W) = 1 cd. definicji Kołmogorowa z powyższego wynikają własności: P(Ć) = 0 jeśli A B to P(A) Ł P(B) P(A ) = 1 - P(A) gdzie A = W - A 0 Ł P(A) Ł 1 P(AB) = P(A) + P(B) - P(AB) Klasyczna definicja prawdopodobieństwa Laplace a n P( A) = N n - liczba zdarzeń sprzyjających, N - liczba wszystkich zdarzeń lub A P( A) = W W - miara W, - miara A A gdzie Kombinatoryka to metody zliczania (określania liczby) wszystkich zdarzeń oraz zdarzeń sprzyjających dwa sposoby przedstawiania wyników losowania: -istotna jest kolejność losowanych elementów wariacja istotna jest liczba pobranych elementów - kombinacja Kombinatoryka wariacja ze zwracaniem - czyli wylosowanie k elementów z puli n-elementowej i rozmieszczenie ich na k miejscach k k = W n n n=6 ; k =2 W=62 Kombinatoryka wariacja bez zwracania - losowanie za każdym kolejnym razem ze zmniejszonej o jeden puli n! k = V n (n - k)! n=6 ; k =2 V=6!/4!=30 Kombinatoryka - wariacja bez zwracania gdy k = n (losowane wszystkie elementy i ustawiane w kolejności - permutacja k! k = = k! V n (n - n)! n=4 ; k =4 V=4!=24 Kombinatoryka kombinacja - wybieranie k-elementowego zbioru z n-elementowego w jednym n losowaniu ć n! k = =
C n Ł kł k! (n - k)! n=6 ; k =3 C=6!/(3!3!)=20 Przykład W klatce jest 5 białych i 2 czarne myszy. Obliczyć prawdopodobieństwo, że dwie myszy, które pierwsze wyjdą w klatki będę białe. W = 7 ć 7! 7! 76
W = 2 = 2!(7 - 2)! = 2!5! = 2 = 21
Ł ł 2! 5! ć A = =10 2 5 ć2 = Ł0ł Ł ł 0!2! 2!3! P(A) =10 21 Przykład Autobus wiozący 6 pasażerów może się zatrzymać na 4 przystankach. Jakie jest prawdopodobieństwo, że wszyscy pasażerowie wysiądą na jednym przystanku. W = W = 46 = 4096 A = 4 4 P(A) = 4096 Przykład W stadzie są 4 białe gęsi i 2 siodłate. Jakie jest prawdopodobieństwo, że siodłata gęś będzie szła pierwsza, gdy ptaki będą szły gęsiego. W = W = 6!= 720 2 ć 2!
A = 1 5!= 1!1! 5!= 240
Ł ł 240 1 P(A) = = 720 3 Niezależność zdarzenia A i B są niezależne gdy P( A B) = P( A) P(B) P(A) = 50/100 = 0, 5 P(B) = 30/100 = 0,3 P(AB)=15/100 = 0,15 = 0,5 x 0,3 Prawdopodobieństwo warunkowe prawdopodobieństwo zdarzenia A pod warunkiem, że zajdzie zdarzenie W P( A W) P( A / W) = P(W) P(A/W)=0,15/0,3=0,5 P(A/W)=0,05/0,3=1/6 Prawdopodobieństwo całkowite P ( A) = P( A/ A1) P( A1) + P( A/ A2 ) P( A2 )+...+P( A/ An ) P( An ) Gdzie A1 A2 ... An = W A P(A)=15/30 0,3 + 4/20 0,2 + + 12/40 0,4 + 5/10 0,1 = A = 0,15 + 0,04 + 0,12+ 0,05= = 0,36 Przykład Puszki do sklepu są dostarczane przez trzech producentów w proporcji 1:3:6. Wadliwość puszek wynosi 0,06; 0,04; 0,03. 0,1 0,3 0,6 P(Ai) I II III 0,94 0,06 0,96 0,04 0,97 0,03 P(C/Ai) + - + - + - P(-) = 0,1 x 0,06 + 0,3 x 0,04 + 0,6 x 0,03 = = 0,006 + 0,012 + 0,018 = 0,036 wzór Bayes a na wielkość prawdopodobieństwa a posteriori P(A/ Ai ) P(Ai ) P(Ai / A) = n P(A/ Ai ) P(Ai ) i=1 A A A P(A3/A)= (12/40 0,4)/0,36=0,12/0,35=1/3 Przykład Puszki do sklepu są dostarczane przez trzech producentów w proporcji 1:3:6. Wadliwość puszek wynosi 0,06; 0,04; 0,03 odpowiednio. 0,1 0,3 0,6 P(Ai) I II III 0,94 0,06 0,96 0,04 0,97 0,03 P(C/Ai) + - + - + - P(-) = 0,1 x 0,06 + 0,3 x 0,04 + 0,6 x 0,03 = 0,036 P(III/-) = 0,6 x 0,03 / 0,036 = 0,018/0,036 = 1/2 Przykład W populacji są osoby o grupie krwi A, B, AB i 0 w proporcji 4:2:3:1. Wrażliwość na lek wynosi odpowiednio 0,4; 0,1; 0,2; 0,6. Obliczyć prawdopodobieństwo, że osoba wrażliwa na lek ma grupę krwi AB. 0,2 0,3 P(AB /W ) = = 0,4 0,4 + 0,10,2 + 0,2 0,3 + 0,60,1 0,06 0,06 = = = 0,20 0,16 + 0,02 + 0,06 + 0,06 0,30 Pica pica