5244


Opracowanie - statystyka

OPRACOWANIE NR 1

Ad 1. CO TO JEST ROZKŁAD NORMALNY (REGUŁA 3 SIGM - RYSUNEK)

ROZKŁAD NORMALNY - Rozkład normalny (krzywa Gaussa)

Każdy rozkład normalny jest rozkładem symetrycznym

0x08 graphic
Przykładowe pytanie egzaminacyjne : od czego uzależniona jest postać krzywej normalnej?

gdy zmienia się średnia, to kształt się nie zmiena, tylko krzywa się przesuwa w lewo lub w prawo :

Krzywa przesunęła się w lewo (średnia się zmniejszyła)

(a jeśli średnia by się zwiększyła, to krzywa przesunęłaby się w prawo)

s - odchylenie standardowe - decyduje o tym, czy rozkład jest bardziej spłaszczony czy spiczasty

REGUŁA TRZECH SIGM

np. N ( 90; 11 ) - rozkład normalny o średniej 90 i odchyleniu 11

0x08 graphic
x - x

0x08 graphic
Z = s

Z - mówi nam, ile odchyleń standardowych leży w odległości od średniej (Z to odległość punktu od średniej w jednostkach odchylenia stand.)

*odczytujemy z tablic, że np. Z = 1,35 → 41,15 %

0x08 graphic

AD 2. CO OZNACZA, ŻE ODCHYLENIE STANDARDOWE WYNOSI 10?

Odchylenie standardowe oznacza średnie odchylenie danych od średniej arytmetycznej. W tym przykładzie odchylenie wynosi 10 i oznacza ono wartość oddaloną o 10 od średniej arytmetycznej.

AD 3. CO TO JEST JEDNOSTKA STATYSTYCZNA?

JEDNOSTKA STATYSTYCZNA - Obiekt, element należący do zbiorowości statystycznej, podlegający badaniu statystycznemu

AD 4. CO TO JEST WNIOSKOWANIE STATYSTYCZNE?

Dwie kategorie wnioskowania statystycznego :

  1. Sytuacje polegające na tym, że na podstawie pewnych charakterystyk, rozkładów danej zmiennej w próbie (zwanych statystykami lub estymatorami, np. średnia, proporcja) próbujemy oszacować odpowiadające im parametry rozkładu tej zmiennej w populacji. (metody estymacji parametrów populacji)

  2. W sytuacjach tych bądź stwierdzamy, iż pewne podgrupy w przebadanej przez nas próbie, czy też próby pobrane z różnych populacji różnią się swoimi parametrami, bądź też stwierdzamy, iż zmienne w badanej przez nas próbie są powiązane określonymi statystycznymi zależnościami, a następnie staramy się uogólnić owe różnice lub zależności na populację lub populacje, z których próby te zostały wylosowane (metody weryfikacji hipotez)

AD 5. CO TO JEST SKALA POMIARU I JAKIE SĄ SKALE?

skala pomiaru - układ wartości, jakie przybierać może określona wielkość

  1. Skala nominalna- tylko podział na kategorie (podział rozłączny i wyczerpujący), dana jednostka zostaje tylko zakwalifikowana do danej kategorii; nie można porównywać ze sobą danych mówiąc, że coś jest lepsze a coś gorsze; kategorie nie są ułożone po kolei; zmienne w skali nominalnej to np. płeć, wiek, kolory(oczu, włosów),

  2. Skala porządkowa- to, co w porządkowej + porównanie między jednostkami należącymi do dwóch różnych kategorii, np. wykształcenie- można powiedzieć, że ktoś ma lepsze bądź gorsze wykształcenie, wyższe lub niższe; wiek- ktoś jest w wieku przedprodukcyjnym, produkcyjnym, poprodukcyjnym,

  3. Skala interwałowa- można mówić, że coś jest większe lub mniejsze o konkretną wartość, np. temperatura, gdyż nie można powiedzieć ile razy wyższa bądź niższa, ponieważ inaczej będzie to wyglądało w stopniach Celsjusza, a inaczej Fahrenheita,

  4. Skala ilorazowa- to, co w interwałowej + ile razy większe.

*Rozróżnienie dwóch ostatnich skal z punktu widzenia socjologa jest nieostre-> obie skale są skalami ilościowymi.

AD 6. CO OZNACZA, ŻE MEDIANA WYNOSI 20?

Oznacza to, że wartość środkowa w danym szeregu wynosi 20. dzieli zbiór obserwowanych wartości wskaźników na dwie równe części, oznacza to, że 50% obserwowanych wyników ma wartość wyższą od 20 i 50% niższą

AD 7. OD CZEGO ZALEŻY WYBÓR TESTU ISTOTNOŚCI?

Od czego zależy wybór testu?

Dokładniej, wybór testu zależy od :

Przykład :

Gdy mamy dwie różne grupy, w których w różny sposób prowadzono zajęcia i chcemy sprawdzić czy ten sposób prowadzenia zajęć ma wpływ na wyniki z kolokwium - to wtedy mamy do czynienia z danymi niezależnymi (bo badamy dwie grupy w różnych warunkach - w każdej z grup w inny sposób prowadzono zajęcia)

A gdy na jednej próbie (grupie) dwa razy przeprowadzamy badanie i działa jakiś bodziec - np. za pierwszym razem pytamy badanych o preferencje wyborcze, notujemy wyniki, a za drugim razem puszczamy np. film o jakimś polityku i znów pytamy ich o preferencje wyborcze - wtedy dane zależne

Należy więc ustalić, czy mamy do czynienia z danymi niezależnymi czy zależnymi

AD 8. OD CZEGO ZALEŻY WYBÓR POZIOMU ISTOTNOŚCI?

Wybór wartości α zależy od badacza, natury problemu i od tego jak dokładnie chce on weryfikować swoje hipotezy

AD 9. OD CZEGO ZALEŻY WYBÓR MIARY SIŁY ZWIĄZKU?

Siłę współzależności dwóch zmiennych można wyrazić liczbowo za pomocą wielu mierników. Ich wybór jest uzależniony m.in. od rodzaju cech, między którymi badana jest zależność (mierzalne, niemierzalne, mieszane); liczby obserwacji (tablica korelacyjna, szeregi korelacyjne), kształtu zależności (regresja, prostoliniowa, krzywoliniowa).

gdy choc jedna z cech jest cecha jakościowa stosujemy chi2

AD 10. W JAKICH GRANICACH MOGĄ PRZYJMOWAĆ WARTOŚCI WSPÓŁCZYNNIKI: LAMBDA, GAMMA ITP.?

AD 11. CO TO JEST POZIOM ISTOTNOŚCI?

Poziom istotności - jest to maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (zazwyczaj oznaczane symbolem α). Określa tym samym maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować. Wybór wartości α zależy od badacza, natury problemu i od tego jak dokładnie chce on weryfikować swoje hipotezy, najczęściej przyjmuje się α = 0,05; rzadziej 0,1, 0,03, 0,01 lub 0,001.

AD 12. WYBORY W PL - KTÓRA Z METOD I DLA JAKICH PARTII JEST KORZYSTNIEJSZA?

Metoda Sainte-Laguë generuje wyniki lepiej odzwierciedlające poglądy wyborców, podczas gdy metoda d'Hondta sprzyja większym partiom.

AD 13. CO TO JEST TEST JEDNOSTRONNY I OBUSTRONNY?

Test jednostronny - test statystyczny, dla którego skrajne wartości obserwowanej zmiennej znajdują się po lewej lub prawej stronie jej rozkładu. 



Test dwustronny - test statystyczny, dla którego skrajne wartości obserwowanej zmiennej znajdują się po obydwu stronach jej rozkładu. 

AD 14. HIPOTEZA KIERUNKOWA I BEZKIERUNKOWA

Hipoteza kierunkowa zakłada jakiś kierunek zależności. Hipoteza niekierunkowa ma formę eksploracyjną. Dla przykładu:

Hipoteza kierunkowa: Mężczyźni są bardziej szczerzy niż kobiety.

Hipoteza niekierunkowa: Kobiety różnią się od mężczyzn pod względem szczerości.

Pierwsza hipoteza zakłada jakiś kierunek zależności, że dana grupa jest lepsza/gorsza. W przypadku hipotezy niekierunkowej nie zakładamy żadnego kierunku różnic. Stwierdzamy tylko, że one będą, ale nie wiemy, w którą stronę.

Gdy mam podstawy teoretyczne, tzw. przesłanki powinniśmy stawiać hipotezy kierunkowe. Gdy chcemy sprawdzić, czy mogą być jakieś różnice, choć nie wiemy na czyją korzyść/niekorzyść powinniśmy postawić hipotezę niekierunkową.

Stawianie hipotez kierunkowych i niekierunkowych uzależnia potem wybór rodzaju istotności (jednostronnej lub dwustronnej) w testowaniu uzyskanego wyniku w teście statystycznym.

AD 15. ETAPY TESTOWANIA HIPOTEZ

Etapy testowania hipotez statystycznych (najczęściej mówi się o 5 krokach, które trzeba wykonać, aby przeprowadzić tę procedurę weryfikacji) :

  1. określenie zmiennych i ich skal pomiarowych. Sformułowanie założeń i hipotez

  2. wybór testu statystycznego i określenie rozkładu statystyki

  3. ustalenie reguły decyzyjnej. Wybór poziomu istotności, określenie obszaru krytycznego i wartości krytycznej

  4. obliczenie wartości statystyki dla otrzymanych wyników

  5. podjęcie decyzji

AD 16. ROZKŁAD Z PRÓBY

ROZKŁAD Z PRÓBY - rozkład, w którym jednostką jest próba, a zmienną statystyka obliczona dla tej próby (możemy w każdej próbie obliczyć średnią i przedstawić ten rozkład)

AD 17. JAKIE MIARY TENDENCJI CENTRALNEJ STOSUJE SIĘ DO POZIOMU NOMINALNEGO, PORZĄDKOWEGO, INTERWAŁOWEGO, ILORAZOWEGO?

AD 18. KTÓRA ZE ZBIOROWOŚCI JEST BARDZIEJ ZRÓŻNICOWANA - PODANE N, ŚREDNIA I s.

AD 19. ZINTERPRETOWAĆ WYNIK

AD 21. CO TO JEST KORELACJA CZĄSTKOWA?

Korelacja cząstkowa - miara zależności zmiennych losowych przy usuniętym wpływie innych zmiennych losowych z ustalonego zbioru.

AD 22.PRÓBA REPREZENTATYWNA

Próba reprezentatywna - część populacji, wybrana do badania metodami statystycznymi, w założeniu badacza, zachowująca strukturę wyróżnionych cech populacji przy założonym poziomie istotności.

AD 23.PRÓBA LOSOWA

Próba losowa - zbiór elementów populacji pobranych w taki sposób, że każdy element populacji miał równe szansę znalezienia się w tym zbiorze. Próba losowa może być podstawą wnioskowania statystycznego pozwalającego z zadaną dokładnością uogólnić spostrzeżenia o elementach próby na populację, z której została wylosowana.

AD 24.MIARY ŚREDNIE; ZRÓŻNICOWANIA I ASYMETRII

Miara zróżnicowania rozkładu to taka miara rozkładu, która opisuje relację pomiędzy rozkładami różniącymi się zróżnicowaniem (rozproszeniem) wartości cechy wokół wartości centralnych.

Przykładowymi miarami zróżnicowania rozkładu są:

miary średnie:

→ klasyczne: średnia arytmetyczna, geometryczna, harmoniczna

→ pozycyjne: dominanta, kwartyle, kwintyle, decyle, centyle, mediana

Miara asymetrii rozkładu to taka miara rozkładu, która dostarcza informacji na temat symetrii rozkładu lub jej braku.

Do przykładowych miar asymetrii rozkładu należą:

  1. Miary średnie(tendencji centralnej, położenia, przeciętne poziomu wartości zmiennej)- służą do tego, aby za pomocą jakiejś liczby określić wokół jakiej wartości rozmieszczone są wszystkie wartości danej zbiorowości.