Błąd I rodzaju- możliwy do popełnienia przy weryfikacji hipotezy, błąd polegający na odrzuceniu hipotezy prawdziwej
Błąd II rodzaju- możliwy do popełnienia przy sprawdzaniu hipotezy, błąd polegający na przyjęciu hipotezy fałszywej
Cechy stałe- określają jednostki pod względem czasowym, rzeczowym, przestrzennym; są wspólne wszystkim jednostkom zbiorowości, nie podlegają one badaniu, a jedynie decydują o zaliczeniu jednostki do określonej zbiorowości
Cechy zmienne- właściwości, którymi różnią się poszczególne jednostki statystyczne. Dzielimy je na:
Cechy jakościowe- nie można zmierzyć lecz tylko określić (pochodzenie, uroda, kolor włosów)
Cechy ilościowe- dadzą się wyrazić przy pomocy liczb o różnych mianach (wzrost w cm, wiek w latach, zysk w zł), cechy ilościowe można podzielić na ciągłe i skokowe
Cechy ciągłe- wyniki pomiarów, wartości cech w przedziale jej kształtowania się w populacji (wzrost, waga, dochód miesięczny na członka gospodarstwa domowego)
Cechy skokowe- występowanie całkowitoliczbowych reprezentacji (liczba dzieci w rodzinie, liczba osób na mieszkanie)
Estymacja - szacowanie parametrów rozkładu badanej cechy w populacji generalnej
Estymator- dowolna statystyka Z służąca do oszacowania nieznanej wartości parametru populacji generalnej
Estymator nieobciążony- estymator Z spełniający równość E(z)=0 oznaczające że estymator Z szacuje parametr bez błędu systematycznego
Estymator przedziałowy- budowanie tzw. przedziału ufności dla parametru
Hipoteza alternatywna- konkurencyjna w stosunku to hipotezy zerowej w tym sensie, że jeżeli się odrzuca H0 to się przyjmuje hipotezę alternatywną
Hipoteza nieparametryczna- precyzująca typ rozkładu populacji
Hipoteza parametryczna- h.statystyczna precyzująca wartość parametru w rozkładzie populacji generalnej znanego typu
Hipoteza statystyczna- jakiekolwiek przypuszczenie dotyczące populacji generalnej
Hipoteza zerowa- podstawowa hipoteza statystyczna sprawdzana danym testem
Moc testu- prawdopodobieństwo podjęcia decyzji prawidłowej przy weryfikacji hipotezy danym testem, a polegającej na odrzuceniu hipotezy fałszywej
Liczebność próby- liczba jednostek elementów populacji generalnej wybranych do próby, oznacza się „n”, gdy n<30 to próba jest mała
Losowanie niezależne- schemat losowania próby ze zwracaniem każdego wylosowanego elementu w trakcie losowania, tak że jeden element może być wylosowany więcej niż jeden raz
Losowanie zależne- schemat losowania próby bez zwracania każdego wylosowanego elementu populacji, tak że jeden element może być wylosowany tylko jeden raz
Losowanie nieograniczone- losowanie elementów do próby od razu w całej populacji, co nie występuje w losowaniu warstwowym
Losowanie warstwowe- losowanie próby oddzielnie z każdej części tzw. warstwy populacji generalnej, na które została ona podzielona przed losowaniem
Losowanie indywidualne- losowanie oddzielnie poszczególnych elementów populacji generalnej do próby w odróżnieniu od np. losowania zespołowego, w którym losuje się do próby pewne naturalne zespoły populacji generalnej np. gospodarstwa domowego
Parametry populacji- parametry rozkładu badanej cechy populacji, charakteryzują on ten rozkład. Do najczęściej używanych parametrów należą tzw. momenty
Podział miar:
- miary skupienia (średnia arytmetyczna, mediana)
- miary rozrzutu (wariancja, odchylenie standardowe)
- miary asymetrii
- miary korelacji
- miary pozycyjne (kwartyle)
Populacja statystyczna (inaczej populacja generalna, zbiorowość generalna) - zbiór elementów, podlegających badaniu statystycznemu
Poziom istotności- prawdopodobieństwo popełnienia błędu I rodzaju w postępowaniu statystycznym testującym hipotezę
Próba- podzbiór populacji podlegający bezpośrednio badaniu ze względu na ustaloną cechę, w celu wyciągnięcia wniosków o kształtowaniu się wartości tej cechy w populacji
Próba losowa- próba, której dobór z całej populacji dokonuje się w drodze losowania tzn., w taki sposób że jedynie przypadek decyduje o tym, który element został wylosowany, a który nie
Próba reprezentacyjna- próbka, której struktura pod względem badanej cechy nie różni się istotnie od struktury populacji generalnej; jest jak gdyby „miniaturą” populacji generalnej, daje więc podstawę do wysuwania prawidłowych wniosków, którym sprzyja dobór właściwego schematu losowania próby
Przedział ufności- losowany przedział wyznaczony za pomocą rozkładu estymatora, a mający tę własność, że z dużym, z góry danym prawdopodobieństwem, pokrywa wartość szacowanego parametru
Przestrzeń próby- zbiór wszystkich możliwych wyników próby o liczebności n
Rodzaje szeregów statystycznych:
-szczegółowe (wyliczające)
-rozdzielcze (strukturalne): cech mierzalnych (punktowe i przedziałowe) i cechy niemierzalne
-przestrzenne (geograficzne)
-czasowe (dynamiczne): momentów i okresów
Rozkład dwumianowy- rozkład prawdopodobieństwa zmiennej losowej skokowej x o funkcji określonej wzorem
Rozkład dwupunktowy- teoretyczny rozkład prawdopodobieństwa, w którym zmienna losowa przyjmuje tylko dwie wartości
Rozkład normalny- rozkład zmiennej losowej ciągłej x o funkcji gęstości prawdopodobieństwa określonej wzorem: f(x)= 1/σ
^ (x-m)2/2e2
Rozkład normalny n- rozkład prawdopodobieństwa n- wymiarowego wektora losowego x o funkcji gęstości
Rozkład Poissona- rozkład prawdopodobieństwa zmiennej losowej skokowej x o funkcji prawdopodobieństwa
Rozkład populacji- rozkład wartości badanej cechy w całej zbiorowości
Rozkład statystyki- teoretyczny rozkład prawdopodobieństwa zmiennej losowej statystyką, zależy zwykle od rozkładu populacji i schematu losowania n- elementowej próby
Statystyka jest nauką traktującą o ilościowych modelach badania zjawisk/procesów masowych
Statystyka matematyczna zajmuje się metodami wnioskowania o całej zbiorowości na podstawie zbadania pewnej jej części zwanej próbką lub próbą
Schemat losowania próby- praktyczny sposób losowania elementów populacji do próby, uwzględniający możliwości techniczne, koszt i efektywność uzyskanych wyników; metoda reprezentatywna zajmuje się szczegółowo różnymi schematami losowania próby
Testy parametryczne: Test F i T
Test F- jest rozkładem ilorazu dwóch niezależnych zmiennych losowych chi-kwadrat, z których każda podzielona jest przez właściwą dla niej liczbę stopni swobody (analiza wariancji)
Test T Studenta- ocena istotności różnic między 2 średnimi, interpretacja wyników
Test istotności- odrzucenie hipotezy z małym ryzykiem popełnienia błędu ze względu na to, że w tekście uwzględnia się jedynie błędy I rodzaju
Test statystyczny- reguła postępowania, która na podstawie wyników próby ma doprowadzić do decyzji przyjęcia lub odrzucenia postawionej hipotezy statystycznej
Testy nieparametryczne- służą do weryfikacji różnorodnych hipotez, dotyczących m.in. zgodności rozkładu cechy w populacji z określonym rozkładem teoretycznym, zgodności rozkładów w dwóch populacjach, a także losowości doboru próby:
Test niezależności z2- pozwala na sprawdzenie czy dwie badane cechy są niezależne
Test zgodności z2- pozwala na sprawdzenie hipotezy, że populacja ma określony typ rozkładu
Weryfikacja- testowanie hipotez statystycznych dotyczących rozkładu badanej cechy zbiorowości generalnej
Zarówno w estymacji, jak i przy weryfikacji zakłada się iż populacja z której pobieramy próbę losową jest nieskończona
Współczynnik determinacji- informuje o tym, jaka część zmienności zmiennej objaśnianej została wyjaśniona przez model
Współczynnik regresji- mówi nam o tym, o ile zmieni się zmienna zależna y przy wzroście zmiennej x o jednostkę
Współczynnik ufności- prawdopodobieństwo 1-α występujący po prawej stronie wzoru na przedział ufności, a oznaczający prawdopodobieństwo z jakim parametr jest pokryty tym przedziałem
Wyniki próby- zaobserwowane wartości badanej cechy u tych elementów populacji generalnej, które zostały wybrane do próby; wyniki dużej próby grupuje się zwykle w klasy, tworząc szereg rozdzielczy
Zbiorowość statystyczna- zbiór dowolnych elementów objętych badaniem statystycznym, jednostki wchodzące w skład zbiorowości statystycznych charakteryzują się właściwościami zwanymi cechami, które mogą być stałe lub zmienne
Błąd I rodzaju- możliwy do popełnienia przy weryfikacji hipotezy, błąd polegający na odrzuceniu hipotezy prawdziwej
Błąd II rodzaju- możliwy do popełnienia przy sprawdzaniu hipotezy, błąd polegający na przyjęciu hipotezy fałszywej
Cechy stałe- określają jednostki pod względem czasowym, rzeczowym, przestrzennym; są wspólne wszystkim jednostkom zbiorowości, nie podlegają one badaniu, a jedynie decydują o zaliczeniu jednostki do określonej zbiorowości
Cechy zmienne- właściwości, którymi różnią się poszczególne jednostki statystyczne. Dzielimy je na:
Cechy jakościowe- nie można zmierzyć lecz tylko określić (pochodzenie, uroda, kolor włosów)
Cechy ilościowe- dadzą się wyrazić przy pomocy liczb o różnych mianach (wzrost w cm, wiek w latach, zysk w zł), cechy ilościowe można podzielić na ciągłe i skokowe
Cechy ciągłe- wyniki pomiarów, wartości cech w przedziale jej kształtowania się w populacji (wzrost, waga, dochód miesięczny na członka gospodarstwa domowego)
Cechy skokowe- występowanie całkowitoliczbowych reprezentacji (liczba dzieci w rodzinie, liczba osób na mieszkanie)
Estymacja - szacowanie parametrów rozkładu badanej cechy w populacji generalnej
Estymator- dowolna statystyka Z służąca do oszacowania nieznanej wartości parametru populacji generalnej
Estymator nieobciążony- estymator Z spełniający równość E(z)=0 oznaczające że estymator Z szacuje parametr bez błędu systematycznego
Estymator przedziałowy- budowanie tzw. przedziału ufności dla parametru
Hipoteza alternatywna- konkurencyjna w stosunku to hipotezy zerowej w tym sensie, że jeżeli się odrzuca H0 to się przyjmuje hipotezę alternatywną
Hipoteza nieparametryczna- precyzująca typ rozkładu populacji
Hipoteza parametryczna- h.statystyczna precyzująca wartość parametru w rozkładzie populacji generalnej znanego typu
Hipoteza statystyczna- jakiekolwiek przypuszczenie dotyczące populacji generalnej
Hipoteza zerowa- podstawowa hipoteza statystyczna sprawdzana danym testem
Moc testu- prawdopodobieństwo podjęcia decyzji prawidłowej przy weryfikacji hipotezy danym testem, a polegającej na odrzuceniu hipotezy fałszywej
Liczebność próby- liczba jednostek elementów populacji generalnej wybranych do próby, oznacza się „n”, gdy n<30 to próba jest mała
Losowanie niezależne- schemat losowania próby ze zwracaniem każdego wylosowanego elementu w trakcie losowania, tak że jeden element może być wylosowany więcej niż jeden raz
Losowanie zależne- schemat losowania próby bez zwracania każdego wylosowanego elementu populacji, tak że jeden element może być wylosowany tylko jeden raz
Losowanie nieograniczone- losowanie elementów do próby od razu w całej populacji, co nie występuje w losowaniu warstwowym
Losowanie warstwowe- losowanie próby oddzielnie z każdej części tzw. warstwy populacji generalnej, na które została ona podzielona przed losowaniem
Losowanie indywidualne- losowanie oddzielnie poszczególnych elementów populacji generalnej do próby w odróżnieniu od np. losowania zespołowego, w którym losuje się do próby pewne naturalne zespoły populacji generalnej np. gospodarstwa domowego
Parametry populacji- parametry rozkładu badanej cechy populacji, charakteryzują on ten rozkład. Do najczęściej używanych parametrów należą tzw. momenty
Podział miar:
- miary skupienia (średnia arytmetyczna, mediana)
- miary rozrzutu (wariancja, odchylenie standardowe)
- miary asymetrii
- miary korelacji
- miary pozycyjne (kwartyle)
Populacja statystyczna (inaczej populacja generalna, zbiorowość generalna) - zbiór elementów, podlegających badaniu statystycznemu
Poziom istotności- prawdopodobieństwo popełnienia błędu I rodzaju w postępowaniu statystycznym testującym hipotezę
Próba- podzbiór populacji podlegający bezpośrednio badaniu ze względu na ustaloną cechę, w celu wyciągnięcia wniosków o kształtowaniu się wartości tej cechy w populacji
Próba losowa- próba, której dobór z całej populacji dokonuje się w drodze losowania tzn., w taki sposób że jedynie przypadek decyduje o tym, który element został wylosowany, a który nie
Próba reprezentacyjna- próbka, której struktura pod względem badanej cechy nie różni się istotnie od struktury populacji generalnej; jest jak gdyby „miniaturą” populacji generalnej, daje więc podstawę do wysuwania prawidłowych wniosków, którym sprzyja dobór właściwego schematu losowania próby
Przedział ufności- losowany przedział wyznaczony za pomocą rozkładu estymatora, a mający tę własność, że z dużym, z góry danym prawdopodobieństwem, pokrywa wartość szacowanego parametru
Przestrzeń próby- zbiór wszystkich możliwych wyników próby o liczebności n
Rodzaje szeregów statystycznych:
-szczegółowe (wyliczające)
-rozdzielcze (strukturalne): cech mierzalnych (punktowe i przedziałowe) i cechy niemierzalne
-przestrzenne (geograficzne)
-czasowe (dynamiczne): momentów i okresów
Rozkład dwumianowy- rozkład prawdopodobieństwa zmiennej losowej skokowej x o funkcji określonej wzorem
Rozkład dwupunktowy- teoretyczny rozkład prawdopodobieństwa, w którym zmienna losowa przyjmuje tylko dwie wartości
Rozkład normalny- rozkład zmiennej losowej ciągłej x o funkcji gęstości prawdopodobieństwa określonej wzorem: f(x)= 1/σ
^ (x-m)2/2e2
Rozkład normalny n- rozkład prawdopodobieństwa n- wymiarowego wektora losowego x o funkcji gęstości
Rozkład Poissona- rozkład prawdopodobieństwa zmiennej losowej skokowej x o funkcji prawdopodobieństwa
Rozkład populacji- rozkład wartości badanej cechy w całej zbiorowości
Rozkład statystyki- teoretyczny rozkład prawdopodobieństwa zmiennej losowej statystyką, zależy zwykle od rozkładu populacji i schematu losowania n- elementowej próby
Statystyka jest nauką traktującą o ilościowych modelach badania zjawisk/procesów masowych
Statystyka matematyczna zajmuje się metodami wnioskowania o całej zbiorowości na podstawie zbadania pewnej jej części zwanej próbką lub próbą
Schemat losowania próby- praktyczny sposób losowania elementów populacji do próby, uwzględniający możliwości techniczne, koszt i efektywność uzyskanych wyników; metoda reprezentatywna zajmuje się szczegółowo różnymi schematami losowania próby
Testy parametryczne: Test F i T
Test F- jest rozkładem ilorazu dwóch niezależnych zmiennych losowych chi-kwadrat, z których każda podzielona jest przez właściwą dla niej liczbę stopni swobody (analiza wariancji)
Test T Studenta- ocena istotności różnic między 2 średnimi, interpretacja wyników
Test istotności- odrzucenie hipotezy z małym ryzykiem popełnienia błędu ze względu na to, że w tekście uwzględnia się jedynie błędy I rodzaju
Test statystyczny- reguła postępowania, która na podstawie wyników próby ma doprowadzić do decyzji przyjęcia lub odrzucenia postawionej hipotezy statystycznej
Testy nieparametryczne- służą do weryfikacji różnorodnych hipotez, dotyczących m.in. zgodności rozkładu cechy w populacji z określonym rozkładem teoretycznym, zgodności rozkładów w dwóch populacjach, a także losowości doboru próby:
Test niezależności z2- pozwala na sprawdzenie czy dwie badane cechy są niezależne
Test zgodności z2- pozwala na sprawdzenie hipotezy, że populacja ma określony typ rozkładu
Weryfikacja- testowanie hipotez statystycznych dotyczących rozkładu badanej cechy zbiorowości generalnej
Zarówno w estymacji, jak i przy weryfikacji zakłada się iż populacja z której pobieramy próbę losową jest nieskończona
Współczynnik determinacji- informuje o tym, jaka część zmienności zmiennej objaśnianej została wyjaśniona przez model
Współczynnik regresji- mówi nam o tym, o ile zmieni się zmienna zależna y przy wzroście zmiennej x o jednostkę
Współczynnik ufności- prawdopodobieństwo 1-α występujący po prawej stronie wzoru na przedział ufności, a oznaczający prawdopodobieństwo z jakim parametr jest pokryty tym przedziałem
Wyniki próby- zaobserwowane wartości badanej cechy u tych elementów populacji generalnej, które zostały wybrane do próby; wyniki dużej próby grupuje się zwykle w klasy, tworząc szereg rozdzielczy
Zbiorowość statystyczna- zbiór dowolnych elementów objętych badaniem statystycznym, jednostki wchodzące w skład zbiorowości statystycznych charakteryzują się właściwościami zwanymi cechami, które mogą być stałe lub zmienne