1.CO TO JEST POPULACJA?
Populacja - zbiór obiektów z wyróżnioną cechą (cechami)
2.JAKIMI PROBLEMAMI ZAJMUJE SIĘ STAT?
Statystyka zajmuje się badaniem (analizowaniem) zjawisk masowych: polega na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w postaci zestawień tabelarycznych, wykresów itp.; posługuje się rachunkiem prawdopodobieństwa
3.SFORMUŁUJ JEDNO Z ZADAŃ STATYSTYKI MATEMATYCZNEJ?
Statystyka matematyczna - dział matematyki stosowanej oparty na rachunku prawdopodobieństwa; zajmuje się badaniem zbiorów na podstawie znajomości własności ich części
4.CO TO JEST WNIOSKOWANIE STATYSTYCZNE?
Jest to uogólnienie wniosków wyciągniętych na podstawie badań próby na całą populację reprezentatywną właśnie przez badana próbą
5.CO WPŁYWA NA JAKOŚC WNIOSKOWANIA S?
- prawidłowe określenie badanej populacji i jej cechy
- prawidłowy dobór próby reprezentującej daną populację
- prawidłowa „obróbka danych” (zastosowanie odpowiednich technik statystycznych)
- ustalenie odpowiedniego poziomu istotności (ufności) dla wyciągniętych wniosków
6.ŹRÓDŁA BŁĘDÓW WE WNIOSKOWANIU STAT?
- nieprawidłowe określenie badanej populacji i jej cechy (cech)
- nieprawidłowy dobór założeń dotyczących populacji i badanej cechy
- źle dobrana próba (za mała, nie reprezentatywna)
- nieprawidłowa „obróbka próby” (zastosowanie nieodpowiednich technik statystycznych)
- ustalenie odpowiedniego poziomu istotności (ufności) dla wyciąganych wniosków
7.CO TO JEST PRÓBA?
Próba - wybrana część populacji podlegająca badaniu
8.CO TO JEST PRÓBA REPREZENTATYWNA?
Jest to próba wybrana losowo z populacji; każdy element populacji musi mieć taką samą szansę trafienia do próby; musi być odpowiednia ilość tych elementów
9.JAKA JEST RÓŻNICA MIĘDZY POPULACJĄ A PRÓBĄ?
Populacja jest pojęciem szerszym niż próba. Próba reprezentuje dana populację, jest wybrana z populacji i ona podlega badaniu. Na podstawie próby można wnioskować o populacji. Poddanie badaniom całej populacji nie jest możliwe, gdyż jest zbyt duża.
10.CO TO JEST POZIOM ISTOSTNOŚCI?
Jest to dowolna liczba z przedziału (0,1) określająca prawdopodobieństwo popełnienia błędu I rodzaju (zabezpiecza on przed popełnieniem tego błędu???) ; oznaczenie α; np. α= 0,05 , na 95% jesteśmy pewni, że nasze wnioskowanie jest prawidłowe
11.CO TO JEST POZIOM UFNOŚCI?
Poziom ufności - prawdopodobieństwo 1- α;
Jest to prawdopodobieństwo, że przedział ufności zawiera szacowaną wartość naszego parametru, np. 1 -α= 95% tzn, że na 95% jesteśmy przekonani, że wartość parametru zawiera się w przedziale ufności
12.CO TO JEST PRZEDZIAŁ UFNOŚCI?
Przedział ufnosci (estymator przedziałowy) jest przedziałem o koncach zaleznych od próby, który z pewnym z góry zadanym prawdopodobienstwem pokrywa nieznaną wartość parametru 0
P{ θ ∈( θ ( 2 (θ (X1, . . . ,Xn), 0(X1, . . . ,Xn))} = 1 - α
Zakres, w jakim zawiera się szacowana wartość parametru z prawdopodobieństwem równym żądanemu poziomowi ufności
13.OD JAKICH CZYNNIKÓW I JAK ZALEZY DŁUGOŚC d PRZEDZIAŁU UFNOŚCI?
a)liczność próby (n ↑ => d↓)
b)poziom ufności (1- α↑ => d ↓)
c)wariancja cechy (σ2↓ => d↓)
14.INTERPRETACJA PRZEDZIAŁU UFNOŚCI
np. przedział ufności (1 - 0,5; 1+ 0,5) 1- α = 0,95
z 95% pewnością można powiedzieć, że μ jest jakąś liczba z tego przedziału i wynosi co najmniej 0,5 i co najwyżej 1,5 (nie przekracza 1,5)
15.CO TO JEST CECHA?
Cecha - wielkość losowa charakteryzujaca obiekty danej populacji
16.CECHA JAKOŚCIOWA
Cecha jakosciowa
Cecha przyjmujaca wartosci nie bedace liczbami (np.kolor, płec, smakowitosc)
17.CECHA SKOKOWA (ILOŚCIOWA)
Cecha (ilosciowa) skokowa - cecha przyjmujaca pewne wartosci liczbowe i nieprzyjmujaca wartosci posrednich (np. ilosc bakterii, ilosc pracowników, ilosc pasazerów). Cechy te nazywane sa równiez dyskretnymi.
18.CECHA CIĄGŁA (ILOŚCIOWA)
Cecha (ilosciowa) ciągła - cecha przyjmująca wartości z pewnego przedziału
liczbowego (np. wzrost, waga, plon)
19.ROZKŁADY CECH I JAKEGO TYPU SĄ TO CECHY
- rozkład normalny - cechy ciągłe
- rozkład dwumianowy - cechy skokowe
- rozkład dwupunktowy - - cechy skokowe
20.JEDEN Z BADACZY TRAKTUJE WIEK JAKO CECHĘ CIĄGŁA, ZAŚ DRUGI JAKO SKOKOWĄ. KTÓRY Z NICH MA RACJĘ I DLACZEGO?
Badacz, który traktuje wiek jako cechą ciągła ma racje ponieważ wszystkie wartości z danego przedziału są możliwe (np. długość stopy, wzrost); cecha skokowa- dyskretna - tylko określone wartości z danego przedziału są możliwe np. rozmiar buta, ilość dzieci
21.2 PRZYDKŁADY CECH O ROZKŁADZIE NORMALNYM
np. wzrost, waga
22.ZMIENNA LOSOWA X MA ROZKŁAD N (10, 25). OBLICZYC P∈(X - 10 ≤ 5
-5 ≤ x -10 ≤5 => 5 < x ≤ 15 => x ∈ <5,15> Wynik: 0,68 - przedział na 1 δ
23.CO TO JEST ESTYMATOR?
Estymacja - oszacowanie parametrów rozkładu cechy
Estymator (punktowy) - jest funkcja próby w „rozsądny' sposób przybliżającą wartość parametru θ
Estymator (punktowy) jest funkcja próby θ = θ (X1,X2, . . . ,Xn) przyblizajaca wartość parametru θ
Estymator przedziałowy - przedział ufności
24.CO TO ZNACZY, ZE ESTYMATOR JEST PRECYZYJNY?
Jest bliski jedności, wysokie prawdopodobieństwo trafienia w okolicę bliską rzeczywistości
25.ROZKŁADY WE WNIOSKOWANIU STATYSTYCZNYM A ZWIĄZANE Z ROZKŁADAM NORMALNYM:
t - studenta
Fishera
Chi 2
Korelacji Pearsona
26.KIEDY MOŻNA STOSOWAC WE WNIOSKOWANIU STATYSTYCZNYM ROZKŁAD t
rozkład normalny, cechy ciągłe, porównanie 2 populacji Ho: μ1 = δ11 = δ22, cechy niezależne
27.KIEDY MOŻNA STOSOWAC WE WNIOSKOWANIU STATYSTYCZNYM ROZKŁAD chi - kwadrat
28..PRZYKŁAD PRÓBKI NIE REPREZENTATYWNEJ DLA OSZACOWANIA ŚREDNICH ZAROBKÓW LUDZI W POLSCE
np. zarobki hutników, zarobki nauczycieli, ludzi w wieku 25 - 30 lat, zarobki ludzi z woj. łódzkiego, zarobki kobiet
29.ŹRÓDŁA BŁEDÓW WE WNIOSKOWANIU STATYSTYCZNYM
- Błąd I rodzaju - bład wnioskowania polegajacy na odrzuceniu hipotezy, gdy w rzeczywistosci jest ona prawdziwa.
- Błąd II rodzaju- bład wnioskowania polegajacy na nieodrzuceniu hipotezy, gdy w rzeczywistosci jest ona fałszywa.
- Zły poziom istotności (ufności)
30.PODAĆ 2 RÓŻNE OSZACOWANIA ŚREDNIEJ WARTOŚCI CECHY
a)oszacowanie z próby losowej
b)mediana z próby losowej
31.JAKA JEST INTERPRETACJA POZIOMU UFNOŚCI
1- α = 95%, przedział ufności (160 - 180) - dla wzrostu studentek WnoŻCzłiK
na 95% jesteśmy pewni, że średnia wzrostu studentek tego wydziału jest w przedziale ufności (160 - 180)
32.W WYNIKU WERYFIKACJI Ho: μ 1 ≤ μ2 UZYSKANO p - value = 0,52480. CZY WERYFIKOWANA HIPOTEZĘ NALEŻY ODRZUCIĆ I DLACZEGO ?
α = 0,05
p - value > α - nie odrzucamy hipotezy
33.BADANO ZGODNOŚĆ ŚREDNIEGO DZIENNEGO ZUZYCIA WODY W PENEJ FABRYCE Z NORMĄ WYNOISZĄCĄ 1000m3. PRZEZ 100 DNI NOTOWANO ZUZYCIE WODY I OTRZYMANO WARTOŚĆ ODPOWIEDNIEJ STATYSTYKI 1,543
a)cecha - zużycie wody (cecha ciągła)
b)rozkład normalny N ~ (μ, δ) μ = 1000m3 δ = 543
c)Ho: μ1 =μ2 =μ3 = ... μ 100
Test Fischera
d)ponieważ wartość odpowiedniej statystyki wynosi 1,543 więc założenia Ho odrzucamy
e)średnie zużycie wody jest > niż 1000m3
34.CO TO JEST HIPOTEZA STATYSTYCZNA
Hipoteza statystyczna nazywamy dowolne przypuszczenie dotyczace rozkładu prawdopodobienstwa cechy w populacji. Oznaczenie Ho
35.CO TO JEST TEST HIPOTEZY STATYSTYCZNEJ
Testem hipotezy statystycznej nazywamy postępowanie mające na celu odrzucenie lub nie odrzucenie hipotezy statystycznej.
36.STATYSTYKA TESTOWA
Statystyka testowa nazywamy funkcje próby na podstawie której wnioskuje się o odrzuceniu lub nie hipotezy statystycznej.
37.BŁAD I RODZAJU
Błąd I rodzaju - bład wnioskowania polegajacy na odrzuceniu hipotezy, gdy w rzeczywistosci jest ona prawdziwa.
38.BŁAD II RODZAJU
Błąd II rodzaju- bład wnioskowania polegajacy na nieodrzuceniu hipotezy, gdy w rzeczywistosci jest ona fa³szywa.
39.MOC TESTU
Moca testu nazywamy prawdopodobienstwo odrzucenia testowanej hipotezy, gdy jest ona nieprawdziwa, czyli prawdopodobienstwo nie popełnienia błędu II rodzaju. Oznaczenie: 1 - β
Mocne postępowanie wychwytuje nawet małe różnice, słabe nie wychwytuje ich, nam zalezy na trym żeby moc testu była duża
- rozmiar próby↑ - moc testu ↑
- zróżnicowanie ↑- moc testu ś
40.PRZYKŁAD PRÓBKI NIEREPREZENTATYWNEJ DLA WZROSTU WSZYSTKICH KOBIET W POLSCE
Studentki AWF
41.SFORMUŁOWAC 2 HIPOTEZY WERYFIKOWANE TESTEM t
a)2 odmiany jabłek nie rónią się pod względem średniego ciężaru Ho: μ 1 =μ2
b)2 populacje serów żółtych nie różnią się pod względem średniej zawartości tłuszczu Ho: μ1 =μ2
42.CO TO SĄ PRÓWNANIE SZCZEGÓŁOWE (WIELOKROTNE)
Są to postępowania statystyczne zmierzające do podzielenia zbioru średnich na grupy jednorodne
Grupy jednorodne - największe podzbiory o równych sobie średnich
43.WSPÓŁCZYNNIK DETERMINACJI
określa na ile względna cecha X determinuje cechę Y
44.ZMIENNA LOSOWA
Jest to wynik zdarzenia losowego
Zmienna losowa (cecha) -funkcja o wartosciach rzeczywistych okreslona na zbiorze zdarzen elementarnych.
Rozkład zmiennej losowej - zbiór wartosci zmiennej losowej oraz prawdopodobienstwa
z jakimi sa te wartosci przyjmowane
np. Jednokrotny rzut kostka.
Zmienna losowa: ilosc wyrzuconych oczek. Zbiór wartosci: {1, 2, 3, 4, 5, 6}
Zmienna losowa skokowa (dyskretna) jest to zmienna, której zbiór wartości jest skonczony lub przeliczalny
Jezeli x1 oraz x2 sa kolejnymi wartosciami zmiennej losowej skokowej, to nie przyjmuje ona zadnych wartosci miedzy x1 a x2 np Rzut kostka, liczba bakterii, ilosc pracowników
Zmienna losowa ciagła jest to zmienna przyjmujaca wszystkie wartosci z pewnego przedziału (najczesciej zbioru liczb rzeczywistych)
Jezeli x1 oraz x2 sa dwiema wartosciami zmiennej losowej ciag³ej, to moze ona przyjac dowolna wartosc miedzy x1 a x2 np. Wzrost, ciezar paczki towaru, wydajnosc
pracowników
45.2 PRZYKŁADY CECH O ROZKŁADZIE DWUMIANOWYM
rzut kostką, nasiona które wykiełkowały
46.DO CZEGO SŁUZY ANALIZA REGRESJI
Służy do zbadania współzależności między 2 cechami o rozkładzie normalnym
47.JAKIE WARTOŚCI MOŻE PRZYJMOWAC WSPÓŁCZYNNIK KORELACJI WIELOKROTNEJ
Wspó³czynnik korelacji jest miernikiem zaleznosci miedzy dwiema cechami
Oznaczenie: ρθ
Własności wspó³czynnika korelacji
1. Współczynnik korelacji jest liczba niemianowana
2. ρ ∈<-1, 1〉
3. Jezeli ρ > 0, to wiekszym wartosciom jednej cechy odpowiadaja (srednio) wieksze wartosci drugiej cechy. Zaleznosc dodatnia (rosnaca, stymulujaca).
4. Jezeli ρ < 0, to wiekszym wartosciom jednej cechy odpowiadaja (srednio) mniejsze wartosci drugiej cechy. Zaleznosc ujemna (malejaca, limitujaca).
5. Jezeli ρ = 0, to bez wzgledu na wartosci przyjmowane przez jedna z cech, srednie wartosci drugiej cechy sa takie same. Cechy nieskorelowane.
6. Jezeli ρ = ±1, to istnieja takie liczby rzeczywiste a oraz b, ze Y = aX + b. Jezeli % = 1, to a> 0.Jeżeli ρ = -1, to a < 0.
Współczynnik korelacji jest miernikiem liniowej zależności miedzy cechami X oraz Y .
Im |ρ| jest blizsze 1, tym bardziej „liniowa” jest zależność miedzy cechami.
7. Jezeli (X, Y ) ma dwuwymiarowy rozk³ad normalny,
to ρ = 0 jest równowazne niezaleznosci cech X, Y .
48.JAKIE ZAŁOŻENIA MUSZA BYĆ SPEŁNIONE BY HIPOTEZĘ DOTYCZĄCĄ RÓŻNICY MIĘDZY ŚREDNIMI 2 POPUACJI MOŻNA BYŁO WERYFIKOWAC TESTEM STUDENTA? JAK MOŻNA TE ZAŁOŻENIA SPRAWDZIĆ
rozkład normalny
cechy ciągłe
Ho: μ1 = μ2
δ12 = δ22
α = 0,05
jeżeli p-value > α - nie odrzucamy Ho o równości srednich
jeżeli p - value <α - hipoteze odrzucamy
49.W JAKI SPOSÓB MOŻNA SPRAWDZIC ZAŁOŻENIE O NORMLANOŚCI
Test t - Studenta, test F - Fischera, test Chi2, tes korelacji Pearsona (????)
50.PARAMETRY ROZKŁADÓW
Dwumianowy - prawdopodobieństwo sukcesu, ilość zdarzeń
Normalny - wartość oczekiwana, wariancja
51.W GOSP WIEJSKICH BADANO ZALEŻNOŚĆ MIĘDZY SPOŻYCIEM ZIEMNIKÓW (CECHA X) I ARTYKUŁÓW ZBOZOWYCH (CEHCA Y). UZYSKANO FUNKCJE REGRESJI : - 0.987X + 1,23. ZINTERPRETWAĆ WSPÓLCZYNNIK REGRESJI W TYM RÓWNANIU
X - spożycie ziemniaków
Y - spożycie zbożowych
Wraz ze wzrostem spożycia ziemniaków o jedną jednostkę zmniejsza się spożycie zbożowych o 0,987
52.INTERPRETACJA WSPÓŁCZYNNIKA KIERUNKOWEGO (a)
Wzrost spożycia ziemniaków (x) o jednostkę powoduje średni spadek spożycia art. Zbożowych (y) o około 1,080 g/dobę y = 1 .... - 4,086x
53.PRZEDZIAŁY UFNOŚCI
W gosp o spożyciu ziemniaków 0,8kg/dobę przeciętna wartość spożycia art. Zbożowych wynosi co najmniej 0,41 i nie więcej niż 0,48kg/ dobę. Zaufanie do wniosku wynosi 95%
54.PRZEDZIAŁ PREDYKCJI (SZERSZY) DLA POJEDYNCZEGO GOSPODARSTWA
W gosp o spożyciu ziemniaków 0,8kg/ dobę prawdopodobna możliwa wielkość spożycia art. zbożowych wynosi co najmniej 0,33 i nie więcej niż 0,56kg/dobę
55.WSPÓLCZYNNIK KIERUNKOWY
Mówi o ile i jak zmieni się wartość cechy zależnej, jeśli wartość cechy niezależnej zmieni się o jednostkę
56.WYZNACZENIE GRUP JEDNORODNYCH (PROCEDURĄ TUKEYA)
NIR - najmniejsza istotna różnica; jeżeli różnice wartości średniej < NIR - populacje się nie różnią; jeżeli różnice wartości średniej > NIR - populacje się różnią
27. ZINTERPRETOWAC WNIOSEK: ODRZUCONO WERYFIKOWANA HIPOTEZE NA POZIOMIE ISTOTNOŚCI 0,05
interpretacja - na 95% jesteśmy pewni, że nasze wnioskowanie jest prawidłowe, czyli z 95% pewnością możemy stwierdzić, że weryfikowana hipoteza jest nieprawdziwa (niesłuszna)
28. SFORMUŁOWAC HIPOTEZY WERYFIKOWANE TESTEM ANALIZY WARIANCJI
Ho: μ1 = μ2 = μ3 = ...........μn
29. WYMIENIC ZAŁOŻENIA FORMUŁOWANE W ANALIZIE WARIANCJI
- cecha X ma rozkład N (μi; δi2 )
- wariancje są równe
31. CO MIERZY WSPÓŁCZYNNIK KORELACJI
Współczynnik korelacji jest miernikiem zależności miedzy dwiema cechami
Oznaczenie: ρθ
33. NA PODTSAWIE OBLICZEŃ UZYSKANO WSPÓŁCZYNNIK KORELACJI RÓWNY 1.09. JAK MOŻNA ZINTERPRETOWAĆ TĘ WARTOŚĆ?
Interpretacja - współczynnik korelacji może przyjąć wartości z zakresu (-1, 1) dlatego też można sądzić, że uzyskana wartość jest wynikiem popełnionego błędu
34. CO TO JEST FUNKCJA REGRESJI
- jest to ilościowy opis zmiennych (badanych cech)
- ilościowe powiązanie cechy X i cechy Y
38. WYMIENIC PRZYNAJMNIEJ TRZY MIERNIKI POŁOZENIA PRÓBY
mediana, dominanta, kwartyl górny, kwartyl dolny, średnia
39. WYMIENIC MIERNIKI ROZPROSZENIA CECHY
- wariancje
- odchylenie standardowe
- współczynnik .......
- rozstęp
odchylenie ....................
40. DLA PEWNEGO ROCZNIKA STUDENTÓW ŚREDNI WYNIK ZE STATYSTYKI WYNOSI 3,57 ORAZ MEDIANA 3.28. CZY WIEKSZOŚC STUDENTÓW MA OCENE ZE STATYSTKI WIEKSZA OD ŚREDNIEJ CZY NIE? ODP UZASADNIJ
Mediana jest to wartośc która dzieli zbiór uporządkowany wg wzrastajacych lub malejących na dwie równe części. Po jednej stronie mediany jest 50% jednostek posiadajacych wartosci niższe od mediany po drugiej stronie 50% jednostek o wartoscich wyższych od mediany (np. dla uporzadkowanego szeregu siedmioelementowego 7, 10, 12, 15, 21, 33, 42 mediana jest czwarty z kolei pomiar, czyli Me=15); w przypadku gdy szereg ma parzysta liczbe jednostek np. 20, wartośc mediany otrzymuje się ze średniej artmetycznej 10 i 11 jednostki.
Wobec powyższego większośc studentów (ponad 50%) ma ocenę niższa od średniej
60. BADANO ZALEZNOŚC POMIĘDZY POZIOMEM WYKSZTAŁECENIA I ZAROBKAMI. STOSUJĄC ODPOWIEDNI TEST, HIPOTEZE O BRAKU ZALEŻNOŚCI ODRZUCONO. CZY OZNACZA TO, ŻE IM WYŻSZY POZIOM WYKSZTAŁECENIA TYM WYŻSZE ZAROBKI?
Hipoteza - brak zależności między poziomem wykształcenia i zarobkami - odrzucona
Odrzucenie powyższej hipotezy świadczy o istnieniu zależności między poziomem wykształcenia i zarobkami, a więc można przyjąć, że im wyższy poziom wykształcenia tym wyższe zarobki
61. JAKIE WNIOSKI WYNIKAJA Z ODRZUCENIA HIPOTEZY OGÓLNEJ Ho: μ1 = μ2 = ...........= μk W TESCIE ANALIZY WARIANCJI?
Co najmniej jedna cecha ma inną średnią
62. W JAKIM CELU STOSUJE SIĘ STANDARYZACJE ZMIENYCH LOSOWYCH
- standaryzacja - porównanie
- standaryzacje stosuje się w celu porównania dwóch różnych zmiennych
STANSARYZACJA WAPÓŁCZYNNIKÓW
porównanie stanu zdrowia dwóch różnych populacji, uwzględniające wpływ wieku lub innych czynników mających istotne znaczenie na wskaźniki zdrowia (umieralność, chorobowość, zapadalność itd.)
polega na obliczeniu nowych, teoretycznych współczynników przy założeniu, że struktury wewnętrzne porównywanych populacji odpowiadają strukturze wewnętrznej zbiorowości przyjętej umownie za wzór (standard)
współczynniki standaryzowane nie przedstawiają umieralności (zapadalności) rzeczywistej, ich wartości służą jedynie do porównań
Jakosc wnioskowania statystycznego
Oceniamy parametr _ cechy na podstawie próby
X1,X2, . . . ,Xn. Niech ˆ_(X1,X2, . . . ,Xn) bedzie „jakas”
ocena parametru _
Nieobciazonosc - Jezeli srednia wartosc oceny ˆ_ jest równa wartosci
parametru _, to ocene ˆ_ nazywamy nieobciazona
Minimalna wariancja - z dwóch róznych nieobciazonych ocen ˆ_ oraz ˆˆ_ tego samego parametru _ za lepsza uznajemy te, która „srednio” przyjmuje wartosci blizsze parametrowi _
Minimalny b³ad sredniokwadratowy - jezeli ocena ˆ_ nie jest nieobciazona, to wówczas jako miernik jakosci stosuje sie b³ad sredniokwadratowy. Jest to „usrednienie” obciazenia oraz wariancji
Dystrybuanta F jest funkcja okreslona na zbiorze liczb rzeczywistych R wzorem F(x) = P{X _ x}, x 2 R
Najwazniejsze w³asnosci dystrybuanty
1. 0 _ F(x) _ 1
2. F(-1) = 0, F(1) = 1
3. dystrybuanta jest funkcja niemalejaca
4. P{a < X _ b} = F(b) - F(a)
Funkcja (gestosci) rozk³adu prawdopodobienstwa
f jest funkcja okreslona na zbiorze liczb rzeczywistych
R wzorem
f(x) = _F0(x), jezeli F0(x) istnieje
0, w przeciwnym przypadku
Najwazniejsze w³asnosci funkcji gestosci
1. f(x) _ 0
2. P{a < X _ b} = Rb
a f(x)dx
Rozkład normalny
Estymacja parametrów
Próba (prosta): X1,X2, . . . ,Xn
Estymator sredniej µ — srednia arytmetyczna
¯X=1nnXi=1
Xi =X1 + · · · + Xnn
Estymator wariancji _2 — wariancja próbkowa
S2 =1n - 1nXi=1(Xi - ¯X)2
Suma kwadratów odchylen od sredniej
varX =nXi=1(Xi - ¯X)2 =nXi=1X2i - n ¯X2
Estymator odchylenia standardowego _
S = pS2
WZ Statystyka 3.2
Szereg rozdzielczy (dane skumulowane)
Przedzia³ klasowy Liczebnosc
x0 - x1 n1
x1 - x2 n2...xk-1 - xk nkn
Srednia z próby ( ÿ xi = (xi-1 + xi)/2)=1ni=1ÿ xini
Suma kwadratów odchylen od sredniej
varX =i=1( ÿ xi - ¯)2ni