Statystyka - wykÅ‚ady 26.02.2015 (w.1) *Podstawowe pojÄ™cia statystyczne: żð Statystyka- to dyscyplina naukowa, poÅ›wiÄ™cona metodom badania(analizowania) zjawisk masowych. Statystyka opisowa polega na systematyzowaniu obserwowanych cech iloÅ›ciowych i jakoÅ›ciowych oraz przedstawianiu wyników w postaci zestawieÅ„ tabelarycznych wykresów itp. żð Zbiorowość statystyczna- zbiór dowolnych (nieidentycznych) elementów(jednostek statystycznych: przedmiotów, osób zdarzeÅ„) objÄ™tych badaniem statystycznym posiadajÄ…cych, co najmniej jednÄ… cechÄ™ wspólnÄ… (istotnÄ… e wzglÄ™du na cel badania) żð Zbiorowość generalna ( populacja) - zbiór wszystkich jednostek statystycznych, których dotyczy interesujÄ…cy problem. żð Zbiorowość próbna ( próba) część populacji poddawana badaniu statystycznemu. Próba może być maÅ‚a ( do 30 elementów) lub duża powyżej 30 elementów. żð Jednostka statystyczna- każdy element badanej zbiorowoÅ›ci. żð Cecha statystyczna - wÅ‚aÅ›ciwość jednostki statystycznej (np.; wiek kobiet) wyróżniamy cechy: staÅ‚e i zmienne. żð Cechy staÅ‚e- sÄ… wÅ‚aÅ›ciwoÅ›ciÄ… wspólnÄ… dla wszystkich jednostek żð Cechy zmienne- to wÅ‚aÅ›ciwoÅ›ci różniÄ…ce poszczególne jednostki, DzielÄ… siÄ™ na jakoÅ›ciowe i iloÅ›ciowe. żð Cecha jakoÅ›ciowa- cecha niemierzalna (opisowa) wyrażona kategoriÄ… sÅ‚ownÄ…( pÅ‚eć, zawód stan cywilny) żð Cecha iloÅ›ciowa- cecha mierzalna wyrażona liczbowo różnymi jednostkami ( wzrost waga) * Skale pomiarowe: żð Pomiar statystyczny polega na przyporzÄ…dkowaniu cechom statystycznym ustalonych symboli, którymi mogÄ… być liczby litery alfabetu kolory opis sÅ‚owny. żð Skala pomiarowa- to system pozwalajÄ…cy usystematyzować wyniki pomiarów statystycznych żð Skala nominalna- skala stosujÄ…ca wyÅ‚Ä…cznie opis sÅ‚owny dla potrzeb identyfikacji jednostki a dokÅ‚adnie ustalenia czy dana jednostka należy lub nie należy do okreÅ›lonej kategorii żð Skala porzÄ…dkowa (rangowa) - sÅ‚użąca do porzÄ…dkowania danych interesuje nas tutaj, w jakim nasileniu wystÄ™puje cecha bÄ™dÄ…ca podstawÄ… zakwalifikowania danej jednostki do pewnej kategorii ( porównujemy ze sobÄ… jednostki i oceniamy ze wzglÄ™du na dana cechÄ™ przy pomocy operacji wiÄ™kszy równy mniejszy np.; wielostopniowe odpowiedzi w kwestionariuszu skale ocen ranking szkół wyższych punktu widzenia ich atrakcyjnoÅ›ci żð Skala ilorazowa- (stosunkowa) - pozwala na uzyskanie dokÅ‚adnych wartoÅ›ciowo różnic miÄ™dzy badanymi cechami statystycznymi, dziÄ™ki posiadaniu staÅ‚ego naturalnego punktu zerowego (tzw. zero bezwzglÄ™dne ograniczajÄ…ce jednostronnie zakres skali), w której brak mierzonej cechy. Dane pisane w tej skali przyjmujÄ… zawsze wartoÅ›ci liczbowe, które sÄ… proporcjonalne do stopnia, w jakim poszczególnym elementom tych kategorii przysÅ‚uguje mierzona wÅ‚asność. CECHY JAOÅšCIOWE MIERZONE S W SKALACH NOAMIANLEJ I PORZDKOWEJ CECHY ILOÅšCIOWE MIERZONE S W SKALACH PRZEDZIAAOWEJ I ILORAZOWEJ!!!!!!!!! * Badanie statystyczne ogół czynnoÅ›ci majÄ…cych na celu poznanie rozkÅ‚adu zbiorowoÅ›ci statystycznej pod wzglÄ™dem wybranej lub wybranych cech ( analiza struktury) lub ocena rodzajów zwiÄ…zków wystÄ™pujÄ…cych miÄ™dzy cechami ( analiza współzależnoÅ›ci) * Procedura badaÅ„ statystycznych: 1. Projektowane (przygotowanie) badania: (!!!) Jest to bardzo ważny etap. Polega on na jasnym, szczegółowym i jednoznacznym sprecyzowaniu celu, (co i kogo badamy, na jakim terenie i w jakim okresie przeprowadzimy badania). Pozwala to na 1 dokÅ‚adne uÅ›wiadomienie sobie, do czego majÄ… sÅ‚użyć wnioski wprowadzone w toku badania statystycznego. 2. Obserwacja statystyczna (proces zbierania informacji) - etap ten polega na zliczeniu jednostek w poszczególnych grupach posiadajÄ…cych okreÅ›lonÄ… wartość cechy. 3. Opracowanie zebranego materiaÅ‚u i jego prezentacja 4. Analiza wyników ( opis lub wnioskowanie statystyczne) i ich interpretacja * Opracowanie metod statystycznych: żð Grupowanie statystyczne to usystematyzowanie zebranego materiaÅ‚u statystycznego (np.> kwestionariuszy, ankiet) wedÅ‚ug pewnych (ustalonych) kategorii\kryteriów (np. pÅ‚eć, klas) w szeregi rozdzielcze przedstawione w formie tabeli lub wykresów. żð Szereg rozdzielczy- to zbiór wartoÅ›ci liczbowych uporzÄ…dkowanych wedÅ‚ug wariantów badanej cechy mierzalnej lub niemierzalnej, przy czym poszczególnym wariantom zmiennej przyporzÄ…dkowane sÄ… odpowiadajÄ…ce im liczebnoÅ›ci. OkreÅ›la on strukturÄ™ badanej zbiorowoÅ›ci Rozróżniamy szeregi rozdzielcze: żð jednostopniowe (punktowe) Lp. x f czÄ™stość wystÄ™powania 1 x1 f1 2 x2 f2 & & & żð wielostopniowe (przedziaÅ‚owe) Lp. x f liczebność 1 x1 - x2 f1 2 x3- x4 f2 & & & * Etapy budowania szeregu rozdzielnego: (!!! Egzamin punkty 1-3) 1. OkreÅ›lamy obszar zmiennoÅ›ci badanej cechy tzn.: obliczamy różnicÄ™ pomiÄ™dzy najwyższa a najniższÄ… wartoÅ›ciÄ… badanej cechy: R= Xmax X min 2. Ustalamy ilość przedziałów klasowych (k): 5 d" k d" 20 k= W przypadku bardzo licznych prób k= 3. Ustalamy dÅ‚ugość przedziałów klasowych (i): i = 4. Możemy (opcjonalnie) wyznaczyć nasilenie danej cechy w stosunku do danej zbiorowoÅ›ci (%): * Prezentowanie danych: a. Metoda 1. Tabela zawiera dane statystyczne w postaci szeregów oraz parametrów opisowych. Umieszczenie w tabeli danych pozwala na uchwycenie iloÅ›ciowych zależnoÅ›ci miedzy nimi. b. Metoda 2. (równorzÄ™dna !) Najczęściej stosuje siÄ™ takie wykresy statystyczne jak: żð krzywa liczebnoÅ›ci obrazuje rozkÅ‚ad badanej zmiennej w próbie 2 żð histogram wykres sÅ‚upkowy żð krzywa liczebnoÅ›ci skumulowanych (ogniwa) * ETAPY BUDOWANIA SZEREGU ROZDZIELCZEGO WIELOSTOPNIOWEGO: (ten przykÅ‚ad na stronie) 1. Wyznaczamy obszar zmiennoÅ›ci: Najwyższa wartość badanej cechy to np. 68, a najniższa, 36 zatem: R = 68-36 = 32 2. Obliczamy liczbÄ™ przedziałów klasowych: N = 178 zatem k= = 13,3 3. Ustalamy dÅ‚ugość przedziałów klasowych: Ponieważ wyliczona wartość k nie dzieli R, to rozszerzamy obszar zmiennoÅ›ci do 33 pkt., przyjmujÄ…c 11 przedziałów klasowych ( na podstawie zasady z pkt. 2). Wobec tego l= * Tabela szeregu rozdzielczoÅ›ci: W tabeli zostanÄ… umieszczone dwie dodatkowe kolumny, które bÄ™dÄ… niezbÄ™dne do dalszego opracowywania danych empirycznych: żð Fk frekwencja skumulowana poszczególnych przedziałów klasowych żð XÅ›r Å›rodki poszczególnych przedziałów klasowych FrekwencjÄ™ skumulowanÄ… otrzymujemy sumujÄ…c liczebnoÅ›ci przedziałów poprzedzajÄ…cych oraz liczebność danego przedziaÅ‚u klasowego. Åšrodki poszczególnych przedziałów klasowych wyznaczamy obliczajÄ…c Å›redniÄ… arytmetycznÄ… z dolnej i górnej granicy danego przedziaÅ‚u. * Opis zbiorowoÅ›ci statystycznej to uporzÄ…dkowanie wyników badaÅ„ oraz ich analiza w oparciu o szereg parametrów opisowych szczególnie takich jak: żð miary poÅ‚ożenia żð miary rozproszenia żð miary asymetrii * Miary poÅ‚ożenia (tendencji centralnej, miary Å›rednie, miary przeciÄ™tne): żð WskazujÄ… miejsce gdzie leży wartość najlepiej charakteryzujÄ…ca wszystkie jednostki danej zbiorowoÅ›ci. żð MówiÄ… o przeciÄ™tnym poziomie analizowanej cechy. żð SÄ… najczęściej używane w badaniach pedagogicznych do charakterystyki szeregów rozdzielczych. Miarami tendencji centralnej sÄ…: żð w grupie klasycznych Å›rednia arytmetyczna żð w grupie pozycyjnych dominanta (modalna), mediana * Åšrednia arytmetyczna: PrzeciÄ™tny poziom obserwowanej cechy. Ma zastosowanie TYLKO do skal iloÅ›ciowych (interwaÅ‚owych i ilorazowych) Obliczamy, gdy: żð wymagana jest wiÄ™ksza rzetelność żð majÄ… być wykonane inne obliczenia żð rozkÅ‚ad jest symetryczny wzglÄ™dem Å›rodka szczególnie, gdy jest w przybliżeniu normalny Nie należy jej obliczać, gdy: żð rozkÅ‚ad jest asymetryczny żð próba losowa jest bardzo maÅ‚a żð klasy sÄ… otwarte na koÅ„cach Åšrednia arytmetyczna prosta - wyliczana jest z szeregów szczegółowych prostych (dla danych niepogrupowanych) 3 liczebność pomiaru Suma wartÅ›ci zmiennej wszystkich jednostek, badanej zbiorowoÅ›ci podzieloa przez liczbÄ™ tych jednostek. Powyższy wzór stosujemy gdy mamy do czynienia z maÅ‚Ä… liczbÄ… spostrzeżeÅ„ lub gdy każda wartość zmiennej powtarza siÄ™ tylko jeden raz. Åšrednia wyliczana z szeregów rozdzielczych punkowych (dla danych pogrupowanych). n - liczebność pomiaru x - wartość pomiaru f liczebność (frekwencja) pomiaru Powyższy wzór stosujemy przy dużej liczbie spostrzeżeÅ„. Åšrednia wyliczana z szeregów rozdzielczych przedziaÅ‚owych (dla danych pogrupowanych w tzw. przedziaÅ‚y n- liczebność pomiaru klasowe) x- Å›rodek przedziaÅ‚u Å›rednia arytmetyczna przedziaÅ‚u n oznacza ilość x1 f liczebność (frekwencja) pomiaru 5.03.2015 (w.2) * Mediana: Wyliczana z szeregów szczegółowych prostych (dla danych niepogrupowanych). Wartość Å›rodkowa szeregu statystycznego uporzÄ…dkowanego rosnÄ…co lub malejÄ…co. Obliczamy, gdy: żð ilość pomiarów jest bardzo maÅ‚a żð w rozkÅ‚adach wystÄ™pujÄ… klasy otwarte żð dane sÄ… pogrupowane żð rozkÅ‚ad jest asymetryczny żð interesuje nas czy obserwacje przypadajÄ… w dolnej czy górnej poÅ‚owie rozkÅ‚adu a nie interesuje nas ich odchylenie od punktu Å›rodkowego Mediana - wzory: Mediana wyliczana z szeregów szczegółowych prostych (dla danych niepogrupowanych): tymi wzorami wyznaczamy pozycjÄ™ mediany a nie jej wartość! Mediana wyliczana z szeregów rozdzielczych przedziaÅ‚owych (dla danych pogrupowanych): x0 dolna granica przedziaÅ‚u mediany fx Å‚Ä…czna liczba obserwacji w klasach poprzedzajÄ…cych klasÄ™ mediany fMe liczba obserwacji w przedziale mediany i rozpiÄ™tość przedziaÅ‚u klasowego n liczebność populacji 4 * Modalna (dominanta, moda): żð cecha dominujÄ…ca czyli wartość która jest najliczniej reprezentowana (wystÄ™puje najczęściej), w danej zbiorowoÅ›ci statystycznej żð nadaje siÄ™ najbardziej do charakteryzowania cech jakoÅ›ciowych żð Obliczamy gdy: - wymagana jest najszybsza ocena wartoÅ›ci centralnej - wystarczy przybliżona ocena wartoÅ›ci centralnej - chcemy wiedzieć, jaka ocena jest najbardziej typowa - wartoÅ›ci grupujÄ… siÄ™ wyraznie wokół jednego punktu - dla charakterystyki rozkÅ‚adów wyraznie asymetrycznych Modalna (dominanta, moda) - wzory Modalna wyliczana z szeregów rozdzielczych przedziaÅ‚owych (dla danych pogrupowanych) liczebność (liczba obserwacji) przedziaÅ‚u modalnej liczebność przedziaÅ‚u poprzedzajÄ…cego przedziaÅ‚ modalnej liczebność przedziaÅ‚u nastÄ™pujÄ…cego po przedziale modalnej dolna granica przedziaÅ‚u modalnej rozpiÄ™tość przedziaÅ‚u; np. dla mamy * Miary rozproszenia (Dyspersji): (!!!) żð wskazniki jakoÅ›ciowe żð informujÄ… o poziomie jednorodnoÅ›ci badanych zbiorowoÅ›ci (lub inaczej stopniu rozproszenia wyników w obrÄ™bie badanego zjawiska) żð im mniejsza wartość tych miar, tym wiÄ™ksza jednorodność w zakresie badanej cechy Miarami dyspersji sÄ…: (!!!) a. w grupie miar bezwzglÄ™dnych - odchylenie standardowe, wariancja, obszar zmiennoÅ›ci, b. w grupie miar wzglÄ™dnych - współczynnik zmiennoÅ›ci * Wariancja i odchylenie standardowe: PrzeciÄ™tne zróżnicowanie (odchylenie) badanej cech od Å›redniej arytmetycznej. Obliczamy gdy: żð potrzebna jest wartość, na której można w jak najwiÄ™kszym stopniu polegać żð mogÄ… być potrzebne dalsze obliczenia z zastosowaniem tych miar Nie obliczamy gdy badane zjawisko mierzone jest w różnych jednostkach miary (waga, wzrost) Wariancja - Å›rednia arytmetyczna kwadratów odchyleÅ„ poszczególnych wartoÅ›ci zmienne jod Å›redniej arytmetycznej caÅ‚ej zbiorowoÅ›ci Odchylenie standardowe - pierwiastek kwadratowy z wariancji Najważniejsze cechy: żð jest wielkoÅ›ciÄ… obliczanÄ… na podstawie wszystkich obserwacji żð można jÄ… poddawać przeksztaÅ‚ceniom algebraicznym żð im zbiorowość jest bardziej zróżnicowana tym wiÄ™ksze jest odchylenie standardowe (!!!) 5 ALGORYTM OBLICZANIA WARIANCJI (ODCHYLENIA STANDARDOWEGO DLA SZEREGÓW ROZDZIELCZYCH PRZEDZIAAOWYCH): 1. Wypisanie w dwóch kolumnach wartoÅ›ci danych z treÅ›ci zadania wartoÅ›ci pomiaru i ich liczebnoÅ›ci 2. Wyznaczenie Å›rodków przedziałów klasowych 3. Obliczenie wartoÅ›ci Å›redniej arytmetycznej 4. Obliczenie różnic odchyleÅ„ poszczególnych Å›rodków przedziałów klasowych od Å›redniej 5. Obliczenie kwadratów różnic odchyleÅ„ poszczególnych Å›rodków przedziałów klasowych od Å›redniej 6. Obliczenie iloczynów liczebnoÅ›ci poszczególnych przedziałów klasowych przez kwadraty powyższych różnic 7. Obliczenie sumy powyższych iloczynów. 8. Obliczenie wariancji poprzez podzielenie otrzymanej sumy przez liczebność próby n 9. Wyznaczenie odchylenia standardowego poprzez wyciagniÄ™cie pierwiastka kwadratowego z obliczonej (powyżej) wariancji. * Obszar zmiennoÅ›ci (rozstÄ™p): żð pozwala uchwycić omawiane różnice żð obliczamy, gdy: - potrzebna jest miara dotyczÄ…ca zapisów skrajnych - potrzebna jest możliwie szybka do obliczenia miara dyspersji * Współczynnik zmiennoÅ›ci - jest wzglÄ™dnÄ… miarÄ… rozproszenia, sÅ‚użącÄ… do porównania zróżnicowania dwóch różnych cech (np. wzrost i obwód ramienia) lub jednej cechy w dwóch różnych grupach (np. porównanie pÅ‚ci nauczycieli o różnych stażach pracy). Nie wolno stosować, gdy: żð lub żð dane empiryczne wyróżnione sÄ… w procentach (!!!) Informuje, jaki procent Å›redniej arytmetycznej stanowi odchylenie standardowe. Wyższa wartość oznacza wiÄ™ksze zróżnicowanie wielkoÅ›ci danej cechy. JeÅ›li współczynnik zmiennoÅ›ci przyjmuje wartoÅ›ci liczbowe z przedziaÅ‚u od 0% do 100% to fakt ten Å›wiadczy o niejednorodnoÅ›ci zbiorowoÅ›ci. JeÅ›li to zbiorowość jest znacznie zróżnicowana pod wzglÄ™dem badanej cechy. * Miary asymetrii (skoÅ›noÅ›ci): żð stosujemy, gdy interesuje nas czy odchylenie od wartoÅ›ci jest wiÄ™ksze w jednÄ… lub drugÄ… stronÄ™ żð wyniki asymetrii - wyróżniamy różnicÄ™ miÄ™dzy Å›redniÄ… arytmetycznÄ…, a modalnÄ…. Dla wyrażenia faktu wystÄ™pujÄ…ce zjawiska asymetrii bÄ…dz jej braku i jej kierunku można wykorzystać relacjÄ™ miÄ™dzy Å›redniÄ… arytmetycznÄ… a dominantÄ…. Interpretacja: zjawisko skoÅ›noÅ›ci nie wystÄ™puje; rozkÅ‚ad jest symetryczny tzn. wystÄ™puje jednakowa liczba jednostek statystycznych poniżej i powyżej Å›redniej arytmetycznej rozkÅ‚ad jest asymetryczny; skoÅ›ność prawostronna tzn. zbiorowość z dominantÄ… jednostki o wartoÅ›ci cechy niższych od Å›redniej rozkÅ‚ad jest asymetryczny; skoÅ›ność lewostronna tzn. zbiorowość z dominantÄ… jednostki o wartoÅ›ci cechy wyższych od Å›redniej 6 * Współczynnik asymetrii - wyrażamy ilorazem wskaznika asymetrii przez odchylenie standardowe. Interpretacja: współczynnik = 0 (brak skoÅ›noÅ›ci) skoÅ›ność dodatnia skoÅ›ność ujemna KORELACJE W BADANIACH PEDAGOGICZNYCH * Korelacja (współzależność cech) - zwiÄ…zek pomiÄ™dzy zmiennymi, sytuacja, gdy zmianom Å›rednich wartoÅ›ci jednej towarzyszy zmiana wartoÅ›ci drugiej skorelowanej z niÄ… zmiennej. Np. zwiÄ…zek miÄ™dzy liczbÄ… opuszczonych godzin w szkole a wynikami testu z jakiegoÅ› przedmiotu Stwierdzenie czy istnieje zwiÄ…zek miÄ™dzy dwoma badanymi cechami umożliwia analiza korelacyjna. CharakteryzujÄ…c korelacjÄ™ dwóch cech podajemy dwa czynniki: kierunek oraz siÅ‚Ä™. * Rodzaje korelacji: Ze wzglÄ™du na sposób analizy oraz charakter analizowanych zmiennych wyróżniamy: żð KorelacjÄ™ prostÄ… bada zwiÄ…zek zachodzÄ…cy miÄ™dzy dwoma cechami lub zjawiskami (rxy) żð KorelacjÄ™ czÄ…stkowÄ… informuje o zwiÄ…zku dwóch cech z wyÅ‚Ä…czeniem trzeciej zmiennej (rxy.z) żð KorelacjÄ™ wielorakÄ… informuje o zwiÄ…zku jej cechy z kilkoma ujÄ™tymi Å‚Ä…cznie (rx.yz) Rozróżniamy zwiÄ…zki korelacyjne miÄ™dzy cechami mierzalnymi i niemierzalnymi. Analiza korelacji JakoÅ›ciowa IloÅ›ciowa (umożliwia stwierdzenie (okreÅ›la siÅ‚Ä™ i kierunek zwiÄ…zku przyczynowo - zwiÄ…zku) skutkowego na podstawie merytorycznej analizy logicznej) MiarÄ… siÅ‚y i kierunku oraz ksztaÅ‚tu zwiÄ…zku jest: żð dla zmiennych porzÄ…dkowych i iloÅ›ciowych współczynnik korelacji (!!!) żð dla zmiennych nominalnych (jakoÅ›ciowych) współczynnik kontyngencji Współczynnik to liczba okreÅ›lajÄ…ca w jakim stopniu zmienne sÄ… współzależne * ZwiÄ…zek cech iloÅ›ciowych: a. korelacja PEARSONA b. korelacja rangowa SPERMANA 7 Aby ustalić zwiÄ…zek korelacyjny miÄ™dzy zmiennymi iloÅ›ciowymi należy przedstawić obie zmienne w tablicy korelacyjnej uwzglÄ™dniajÄ…cej ich współwystÄ™powanie * Interpretacja zależnoÅ›ci pomiÄ™dzy cechami iloÅ›ciowymi Współczynnik korelacji oznaczamy literkÄ…: r Wartość współczynnika należy do przedziaÅ‚u <-1,1> r = 0 brak korelacji (zależnoÅ›ci) r = -1 zależność liniowa ujemna; bardzo silny zwiÄ…zek ujemny r = +1 zależność liniowa dodatnie; bardzo silny zwiÄ…zek dodatni * Kierunek korelacji: żð ujemna (wartość współczynnika korelacji od -1 do 0, czyli r < 0) to zależność odwrotnie proporcjonalna. Informuje, że wzrostowi (spadkowi) wartoÅ›ci jednej zmiennej odpowiada spadek (wzrost) Å›rednich wartoÅ›ci drugiej zmiennej żð dodatnie (wartość współczynnika korelacji od 0 do 1, czyli r > 0) to zależność proporcjonalna. Informuje, że wzrostowi (spadkowi) wartoÅ›ci jednej zmiennej towarzyszy wzrost (spadek) Å›rednich wartoÅ›ci drugi8ej zmiennej * SiÅ‚Ä™ współczynnika, dokÅ‚adnie jego wartość bezwzglÄ™dnÄ…, odczytujemy z poniższej tabelki im jest on wiÄ™ksza tym zwiÄ…zek pomiÄ™dzy zmiennymi jest silniejszy. Na podstawie obliczonego współczynnika korelacji obliczyć można tzw. Wskaznik (współczynnik) determinacji liniowej (r2), informujÄ…cy o procencie zmiennoÅ›ci wyjaÅ›nionej liniowo w zmiennej zależnej (skutek) przez zmiennÄ… niezależnÄ… (przyczyna) r2 = 100% - procent zmiennoÅ›ci PrzykÅ‚ad: Dla r = 0,8 współczynnik determinacji liniowej wynosi 0,64 Oznacza to, że w 64% zmianÄ™ wartoÅ›ci jednej zmiennej wyjaÅ›nia zmiana wartoÅ›ci lub drugiej zmiennej lub inaczej: Zmienność wyników jednej zmiennej da siÄ™ wyjaÅ›nić zmiennoÅ›ciÄ… wyników drugiej zmiennej * WSPÓACZYNNIK KORELACJI LINIOWEJ PEARSONA: Najbardziej popularny współczynnik (wskaznik) okreÅ›lajÄ…cy poziom zależnoÅ›ci liniowej pomiÄ™dzy zmiennymi mierzalnymi (iloÅ›ciowymi). Wykorzystywany jest zatem do badania zwiÄ…zków prostoliniowych badanych zmiennych, w których zwiÄ™kszenie wartoÅ›ci jednej z cech powoduje proporcjonalne zmiany Å›rednich wartoÅ›ci drugiej cechy (wzrost lub spadek). Umożliwia ocenÄ™ kierunku i siÅ‚y zwiÄ…zku miÄ™dzy zmiennymi Np: korelacja pomiÄ™dzy wynikami z testu cichego czytania a testu sÅ‚ownikowego * Współczynnik ten możemy stosować, jeżeli speÅ‚nione sÄ… nastÄ™pujÄ…ce warunki: żð obie zmienne sÄ… zmiennymi iloÅ›ciowymi żð zwiÄ…zek pomiÄ™dzy zmiennymi jest liniowy żð obie zmienne maja rozkÅ‚ad normalny (lub zbliżony do normalnego) żð do jego obliczenia istnieje kilka równoważnych wzorów. żð w badaniach pedagogicznych czÄ™sto wykorzystywany jest wzór na obliczenie współczynnika korelacji z danych pierwotnych. UWAGA! Współczynnik korelacji Pearsona jest symetryczny, tzn. rxy =ryx 8 Dla danych niepogrupowanych drugi wzór z kowariancji odchyleÅ„ standardowych. * Kowariancja to iloczyn odchyleÅ„ wyników pomiaru dwu zmiennych od ich Å›rednich. 12.03.2015 (w.3) * Algorytm obliczania współczynnika korelacji Pearsona stosujÄ…c wzór wg momentu iloczynowego 1. Dokonanie pomiaru zmiennych X i Y 2. Zestawienie uzyskanych wyników w pary (w tabeli). 3. Obliczenie wartoÅ›ci Å›rednich arytmetycznych (Mx, My) 4. Obliczenie odchyleÅ„ od Å›redniej(xi-Mx) oraz (yi-My) 5. Obliczenie iloczynów (xi -Mx)(yi -My) 6. Wyznaczenie kwadratów odchyleÅ„ od Å›redniej & oraz& 7. Wyznaczenie sumy powyższych iloczynów oraz sumy powyższych kwadratów odchyleÅ„. 8. Podstawienie do wzoru. * Współczynnik KORELACJI RANGOWEJ SPERMANA: Współczynnik stosowany jest do badania zgodnoÅ›ci dwóch grup (np. opinii dziewczÄ…t i chÅ‚opców na wybrany temat) oraz współzależnoÅ›ci pomiÄ™dzy zmiennymi (np. pomiÄ™dzy wynikami nauczania z chemii i fizyki lub pomiÄ™dzy Å›redniÄ… ocen a odczuwanÄ… satysfakcjÄ… ze studiów). * Współczynnik jest stosowany, gdy: żð Obie zmienne (cechy) maja charakter jakoÅ›ciowy, pozwalajÄ…cy na uporzÄ…dkowanie ze wzglÄ™du na siÅ‚Ä™ tej cechy, żð Obie zmienne (cechy) maja charakter iloÅ›ciowy, ale ich liczebność jest niewielka (do 30 przypadków) żð UporzÄ…dkowanie okreÅ›lane jest za pomocÄ… rang współczynnik oparty jest na różnicach rang pomiaru. Wzór na obliczanie współczynnika korelacji rangowej ma nastÄ™pujÄ…cÄ… postać (na stronie) Ranga to liczba odpowiadajÄ…ca miejscu w uporzÄ…dkowaniu każdej z cech. Rangowanie (inaczej nadawanie rangi) to procedura, która polega na ustawieniu obiektów rangowych w porzÄ…dku od najmniejszego do najwiÄ™kszego (lub odwrotnym), a nastÄ™pnie przyporzÄ…dkowanie zajmowanym pozycjom kolejnych liczb naturalnych (wedÅ‚ug zasady podanej na sastÄ™pnym slajdzie) Obiekty rangowane to osoby, przedmioty, zjawiska podlegajÄ…ce ocenie wg wskazanego kryterium (oceny z testu, zdobytych punktów). * Jak rangować: żð sortujemy elementy obu zmiennych w jednej z dwóch kolejnoÅ›ci do wyboru, np.: w kolejnoÅ›ci malejÄ…cej (od najwiÄ™kszej) do najmniejszej wartoÅ›ci. żð obiektom przypisujemy pozycje ten, który zajÄ…Å‚ najwyższÄ… wartość otrzymuje pozycje numeru 1, kolejny nr 2 itd., żð sbiektom nadajemy rangi, wg zasady: numer rangi równy jest numerowi pozycji (czyli ten który zajÄ…Å‚ najwyższÄ… pozycje ma rangÄ™ 1) JeÅ›li w badanej zbiorowoÅ›ci jest wiÄ™cej jednostek z identycznym natężeniem badanej cechy (np. te same oceny), to jednostkom tym przypisuje siÄ™ identyczne rangi, tzw. rangi mieszane. Rangi mieszane równe sÄ… Å›redniej arytmetycznej z pozycji przypisanych tym samym jednostkom. 9 PRZYKAAD: Rangowanie przykÅ‚adowych Å›rednich ocen (X) uzyskanych przez uczniów: Åšrednia ocen (X): 4,0 3,6 4,0 5,7 3,5 4,0 3,2 3,2 4,0 * ALGORYTM OBLICZANIA WSPÓACZYNNIKA KORELACJI RANGOWEJ SPERMANA 1. Zamieszczenie w tabeli wyników zmiennej X i zmiennej Y (parami). 2. Porangowanie wyników zmiennych (Rx, Ry). 3. Obliczenie różnic rang (dla każdej pary) zmiennej X i Y (di = Ry Rx) 4. Obliczanie kwadratu różnicy rang. 5. Zsumowanie kwadratów powyższych różnic w celu otrzymania "di2 6. Podstawienie do wzoru. * Wnioskowanie statystyczne - dziaÅ‚ statystyki zajmujÄ…cy siÄ™ problemami uogólniania wyników badania próby losowej na caÅ‚Ä… populacjÄ™ oraz szacowania bÅ‚Ä™dów wynikajÄ…cych z dokonywania takich uogólnieÅ„. Wnioskowanie statystyczne zawsze jest obciążone ryzkiem popeÅ‚nienia bÅ‚Ä™du. Wyróżniamy dwa dziaÅ‚y wnioskowania statystycznego: żð estymacja (In. estymacja parametryczna) - szacowanie nieznanych wartoÅ›ci populacji generalnej w oparciu o odpowiadajÄ…ce im wartoÅ›ci wyznaczone z próby. żð weryfikacja hipotez statystycznych Próba to wybrana specjalnie do badaÅ„ część populacji za pomocÄ… odpowiedniej metody. W pedagogice przyjmuje siÄ™, że maÅ‚a próba to ok. 30 jednostek, duża to ponad 100 jednostek statystycznych. Metody pobierania prób: żð dobór losowy polega na przypadkowym doborze jednostek do próby wedÅ‚ug pewnego klucza. żð dobór celowy opiera siÄ™ na wÅ‚adzy i przeÅ›wiadczeniach badacza dotyczÄ…cych caÅ‚ej populacji. PrzykÅ‚adem jest dobór jednostek nietypowych, np. najlepszych i najgorszych uczniów ( uczestników konkursów szkolnych i uczniów majÄ…cych trudnoÅ›ci w nauce). WielkoÅ›ci szacowane to parametry, zaÅ› wielkoÅ›ci szacunkowe to estymatory. MogÄ™ nimi być: Å›rednia arytmetyczna s próby, frakcja (część wzglÄ™dna, odchylenie standardowe, wariancja. Wyróżniamy estymacjÄ™: żð punktowÄ… - polega na szacowaniu parametru na podstawie realizacji w próbie, czyli poszukiwaniu takiej liczby, która jest najlepszÄ… ocenÄ… nieznanej wartoÅ›ci parametru. żð przedziaÅ‚owÄ… - polega na wyznaczeniu (na podstawie wyników uzyskanych w próbie) takiego przedziaÅ‚u liczbowego, aby z zadanym z góry prawdopodobieÅ„stwem można byÅ‚o oczekiwać, że nieznana wartość parametru należy do tego przedziaÅ‚u. PrzedziaÅ‚ taki nazywamy przedziaÅ‚em ufnoÅ›ci, zaÅ› prawdopodobieÅ„stwo współczynnikiem ufnoÅ›ci. gdzie: a, b granice przedziaÅ‚u m, po parametry 1-sigma współczynnik ufnoÅ›ci => wielkość ta uzależniona jest od poziomu istotnoÅ›ci (od wartoÅ›ci sigma) Dla obu wielkoÅ›ci rozróżniamy odmiennÄ… symbolikÄ™. Estymator Parametr (miara wÅ‚asnoÅ›ci rozkÅ‚adu w próbie) (rozkÅ‚adu w populacji) M m S (sigma) Pi (frakcja) Po 10 * Hipotezy: (!!!) żð hipoteza statystyczna - każde przypuszczenie dotyczÄ…ce nieznanego rozkÅ‚adu zmiennej losowej. Wyróżniamy: żð hipotezy parametryczne sÄ…dy dotyczÄ…ce parametrów populacji generalnej żð hipotezy nieparametryczne sÄ…dy dotyczÄ…ce rozkÅ‚adów populacji generalnej Weryfikacja hipotez to podejmowanie okreÅ›lonych decyzji statystycznych w celu sprawdzania hipotez statystycznych. Sposoby weryfikacji hipotez nazywamy testami statystycznymi. Rozróżnia siÄ™ testy: parametryczne i nieparametryczne. hipoteza zerowa (Ho) - hipoteza sprawdzana (testowana, weryfikowana). Jest to przypuszczenie, że pomiÄ™dzy wartoÅ›ciÄ… estymatora, parametrem lub dwoma parametrami nie ma żadnej różnicy. hipoteza alternatywna (H1) hipoteza odwrotna, czyli taka, którÄ… można przyjąć, gdy zostanie odrzucona hipoteza zerowa. * Rodzaje bÅ‚Ä™dów żð BÅ‚Ä…d pierwszego rodzaju (inaczej: bÅ‚Ä…d alfa) polega na odrzuceniu hipotezy zerowej w przypadku, gdy jest ona prawdziwa. żð BÅ‚Ä…d drugiego rodzaju (inaczej: bÅ‚Ä…d beta) polega na przyjÄ™ciu hipotezy zerowej, gdy jest ona faÅ‚szywa. Ho jest prawdziwa H1 jest prawdziwa BÅ‚Ä…d pierwszego Odrzucenie Ho Ok. rodzaju BÅ‚Ä…d drugiego Nie odrzucenie Ho Ok. rodzaju * Poziom istotnoÅ›ci (zwany w skrócie alfa) to prawdopodobieÅ„stwo popeÅ‚nienia bÅ‚Ä™du pierwszego rodzaju. żð alfa = 0,05 oznacza, że podejmujemy ryzyko popeÅ‚nienia bÅ‚Ä™du Å›rednio w 5 przypadkach na 100 (5%). Poziom ufnoÅ›ci wynosi: -1 alfa czyli 0,95. Wnioski sÄ… istotne w 95%. żð alfa=0,01 oznacza, że podejmujemy ryzyko popeÅ‚nienia bÅ‚Ä™du Å›rednio w 1 przypadku na 100 (1%). Poziom ufnoÅ›ci wynosi : 1-alfa czyli 0,99. Wnioski sÄ… istotne w 99%. * Poziom beta to prawdopodobieÅ„stwo popeÅ‚nienia bÅ‚Ä™du drugiego rodzaju. * Kryteria wyboru okreÅ›lonego poziomu istotnoÅ›ci: żð praktyczne konsekwencje wyboru (dla problemów mniej ważnych można przyjąć niższy poziom, np. alfa = 0,05) żð wielkość próby dla dużych prób należy przyjmować bardziej rygorystyczny poziom istotnoÅ›ci (np. alfa = 0,01) żð stopieÅ„ kontroli zmiennych poÅ›redniczÄ…cych w badaniu o wysokim stopniu kontroli zmiennych możemy przyjąć niższy poziom wymagaÅ„ i odwrotnie. * Obszarem krytycznym nazywamy zbiór wartoÅ›ci sprawdzanej hipotezy, który przemawia za odrzuceniem hipotezy zerowej. * Etapy wnioskowania statystycznego: 1. sformuÅ‚owanie hipotezy zerowej i hipotezy alternatywnej 2. wybór testu do weryfikacji hipotezy zerowej. Kryteria wyboru: 3. skala pomiarowa 4. liczebność grup (maÅ‚e do 30 osób, duże powyżej 30 osób) 5. liczba grup (dwie lub wiÄ™cej) 6. grupy zależne lub niezależne 7. przyjÄ™cie poziomu istotnoÅ›ci alfa oraz wyznaczenie obszaru krytycznego 8. wyznaczenie (obliczenie) funkcji testu 11 9. podjÄ™cie, z okreÅ›lonym prawdopodobieÅ„stwem, decyzji o przyjÄ™ciu lub odrzuceniu hipotezy zerowej oraz sformuÅ‚owanie wniosków. PodstawÄ… do podjÄ™cia decyzji o przyjÄ™ciu lub odrzuceniu hipotezy zerowej jest porównanie wartoÅ›ci funkcji testu z wartoÅ›ciÄ… krytycznÄ…. * Testy parametryczne stosowane sÄ… w celu sprawdzania hipotez dotyczÄ…cych parametrów populacji generalnej. Do najczęściej stawianych należą hipotezy dotyczÄ…ce wartoÅ›ci Å›rednich arytmetycznych, wariancji oraz wskazników struktury. Testy parametryczne majÄ… szerokie możliwoÅ›ci zastosowania w badaniach pedagogicznych. Stosuje siÄ™ je w takich sytuacjach, jak np. porównywanie Å›rednich arytmetycznych wyników ksztaÅ‚cenia uzyskanych w nowej i starej metodzie nauczania czy porównanie Å›rednich arytmetycznych przed i po zadziaÅ‚aniu jakiegoÅ› czynnika czy zmienność wyników ksztaÅ‚cenia w różnych Å›rodowisk spoÅ‚ecznych. Testy parametryczne najczęściej stosuje siÄ™, jako testy istotnoÅ›ci. Ograniczenia w przypadku stosowania testów parametrycznych: żð niezależność pomiaru żð rozkÅ‚ad normalny żð jednorodność zbioru statystycznego * Test istotnoÅ›ci test polegajÄ…cy na odrzuceniu Ho lub stwierdzeniu braku podstaw do jej odrzucenia. W teÅ›cie tym pod uwagÄ™ brany jest tylko bÅ‚Ä…d pierwszego rodzaju (poziom istotnoÅ›ci), nie uwzglÄ™dnia siÄ™ konsekwencji popeÅ‚nienia bÅ‚Ä™du drugiego rodzaju. [stÄ…d nazwa testy istotnoÅ›ci!] żð istotność różnicy miÄ™dzy Å›rednimi żð test t-Studenta , próby niezależne statystyki z maÅ‚ych prób żð test t-Studenta, próby zależne żð istotność różnicy miÄ™dzy wariancjami żð test F-Fishera, próby niezależne żð test t-Morgana, próby zależne żð istotność różnic miar współzależnoÅ›ci żð istotność współczynnika korelacji * ISTOTNOŚĆ RÓŻNICY MIDZY ÅšREDNIMI (TEST T STUDENTA) Testy sÅ‚użą do porównania Å›rednich obliczonych dla dwóch rozkÅ‚adów zmiennej iloÅ›ciowej w dwóch próbach (dokÅ‚adnie czy różnice sÄ… istotne czy przypadkowe). GrupÄ™ tych testów stosujemy m.in. w takich sytuacjach jak: porównywanie wyników uzyskanych w nowej i starej metodzie; wyników przed i po zadziaÅ‚aniu jakiegoÅ› czynnika; wyników uzyskanych w różnych warunkach. OczywiÅ›cie nie porównuje siÄ™ tutaj wszystkich wyników, lecz wielkoÅ›ci charakterystyczne dla badanych populacji Å›rednie arytmetyczne. Hipoteza zerowa ma postać: Ho: m1 = m2 dwie próby różniÄ… siÄ™ miÄ™dzy sobÄ… w sposób m1- m2= 0 nieistotny (przypadkowy, dokÅ‚adnie brak różnic) Hipoteza alternatywna (odwrotna): H1: m1 `" m2 (nie jest równe) dwustronny test sprawdzajÄ…cy (zakÅ‚ada jedynie, że różnica jest istotna) jednostronny test sprawdzajÄ…cy (różnica miÄ™dzy m1 > m2 jednÄ… a drugÄ… Å›redniÄ… jest istotnie wyższa / niższa) 12 m1 < m2 SformuÅ‚owanie hipotezy alternatywnej decyduje o tym czy mamy do czynienia z testami jednostronnymi czy testem dwustronnym ! PrzykÅ‚ad testu dwustronnego (bezkierunkowego): Ho: Å›rednie wynagrodzenie nauczycieli szkół podstawowych na wsi jest równe Å›redniemu wynagrodzeniu nauczycieli szkół podstawowych w mieÅ›cie. H1: Å›rednie wynagrodzenia nauczycieli szkół podstawowych na wsi nie jest równe Å›redniemu wynagrodzeniu nauczycieli szkół podstawowych w mieÅ›cie. PrzykÅ‚ad testu jednostronnego (kierunkowego): Ho: Å›rednie wynagrodzenie nauczycieli szkół podstawowych na wsi jest równe Å›redniemu wynagrodzeniu nauczycieli szkół podstawowych w mieÅ›cie. H1: Å›rednie wynagrodzenie nauczycieli szkół podstawowych na wsi jest niższe (lub wyższe) od Å›redniego wynagrodzenia nauczycieli szkół podstawowych w mieÅ›cie. * RozkÅ‚ad testu t-Studenta zależy od wielkoÅ›ci odchylenia standardowego z próby i wielkoÅ›ci samej próby, wedÅ‚ug której ustala siÄ™ stopnie swobody. StopieÅ„ swobody (df) okreÅ›lajÄ… liczbÄ™ niezależnych obserwacji (pomiarów) w próbie, tzn. takich, które mogÄ™ mieć dowolnÄ… wartość. DokÅ‚adnie liczba stopni swobody informuje nas ile zmiennych w próbie możemy zmienić, nie zmieniajÄ…c przy tym ich sumy oraz wartoÅ›ci obliczanych parametrów. * Decyzja o przyjÄ™ciu lub odrzuceniu hipotezy zerowej: Z tablicy rozkÅ‚adu t-studenta odczytujemy (na podstawie alfa i df) wartość krytycznÄ… talfa1df i porównujemy jÄ… z obliczonÄ… wartość (t) testu: żð jeżeli |t|wiÄ™ksze bÄ…dz równe t alfa1df to odrzucamy Ho co wskazuje na istotność różnic żð jeżeli |t| * TEST T-STUDENTA DLA PRÓB NIEZALEÅ»NYCH (NIEOKREÅšLONYCH, NIEPOWIZNAYCH): Porównanie Å›rednich arytmetycznych dwóch wylosowanych niezależnie od siebie (tzn. wyniki pomiaru jednej grupy sÄ… niezależne od wyników pomiaru drugiej grupy) prób np. (z populacji dziewczÄ…t i chÅ‚opców, dzieci wiejskich i miejskich lub studentów studiów dziennych i zaocznych) Wymagane jest homogeniczność wariancji (wariancje obu prób muszÄ… być jednakowe). * Homogeniczność wariancji sprawdzana jest testem F-Fishera. Test t-Studenta dla prób niezależnych algorytm 1. postawienie hipotez 2. w celu wyznaczenia wartoÅ›ci funkcji testu t, konieczne jest dokonanie niezbÄ™dnych obliczeÅ„, tzn. obliczenie osobno dla każdej zmiennej Å›redniej arytmetycznej i wariancji. 3. z tablicy rozkÅ‚adu t-Studenta przy zaÅ‚ożonym z góry poziomie istotnoÅ›ci alfa oraz przy df=N1 +N2 2 stopniach swobody nastÄ™puje odczytanie wartoÅ›ci krytycznej talfa1df 4. porównanie obliczonej wartoÅ›ci funkcji testu z wartoÅ›ciÄ… krytycznÄ… oraz podjÄ™cia decyzji o przyjÄ™ciu lub odrzuceniu hipotezy zerowej. Test t- studenta dla prób zależnych (skorelowanych, powiÄ…zanych) Porównanie Å›rednich arytmetycznych w dwóch próbach zależnych. Próby skorelowane (zależne), to dwie próby pochodzÄ…ce od tych samych badanych, badane w różnych warunkach, różnymi metodami lub w różnych odstÄ™pach czasu. Interesuje nas wielkość zmiany. Np. wyniki testu przed rozpoczÄ™ciem zajęć z terapii pedagogicznej i po jej zakoÅ„czeniu. Grupa uczniów zbadana dwoma różnymi testami 13 Test t- studenta dla prób zależnych algorytm 1. Postawienie hipotez 2. Zestawienie uzyskanych wyników w tabeli, w pary 3. Obliczanie różnicy w poszczególnych parach 4. Obliczanie Å›redniej różnic (suma różnic podzielona przez N) 5. Obliczanie odchylenia standardowego każdej z różnic di od Å›redniej różnicy d z daszkiem 6. Podniesienie do kwadratu obliczonej wartoÅ›ci w punkcie 5 7. Podstawienie do wzoru na obliczenie wartoÅ›ci funkcji t 8. Z tablicy rozkÅ‚adu t-studenta przy zaÅ‚ożonym z góry poziomie istotnoÅ›ci alfa oraz przy df=N-1 stopniach swobody odczytanie wartoÅ›ci krytycznej talfa,df 9. Porównanie obliczonej wartoÅ›ci funkcji testu z wartoÅ›ciÄ… krytycznÄ… oraz podjÄ™cie decyzji o przyjÄ™ciu lub odrzuceniu hipotezy zerowej. 19.03.2015 (w.4) * Istotność różnicy miÄ™dzy wariancjami: żð Test F-Fishera (próby niezależne, nieskorelowane) żð Test Fishera sÅ‚uży ocenie, czy wariancje dwóch prób sÄ… równe (homogeniczne), a zatem czy można zastosować test t-Studenta dla prób niezależnych. żð Badamy hipotezÄ™ o równoÅ›ci wariancji (o braku istotnych różnic pomiÄ™dzy nimi), tzn. * Test F-Fishera: Statystyka F przy zaÅ‚ożeniu prawdziwoÅ›ci H0 ma rozkÅ‚ad F-Snedecora ze stopniami swobody Decyzja o przyjÄ™ciu lub odrzuceniu hipotezy zerowej Odczytana z tablicy rozkÅ‚adu F (Tablicy rozkÅ‚ad Snedecora) wartość krytyczna F alfa,df1,df2 porównywana jest z obliczonÄ… wartoÅ›ciÄ… F: to odrzucamy H0 to zostawiamy H0 Obliczamy wariancje dla obu prob. NastÄ™pnie obliczamy estymatory wariancji stosujÄ…c wzór; NastÄ™pnie obliczone estymatory wariancji z obu prób podstawiamy do wzor na F tak, aby w liczniku znajdowaÅ‚a siÄ™ wiÄ™ksza wartość estymatora!!! Estymatory wariancji: żð pierwszym estymatorem jest ten o wiÄ™kszej wariancji (!!!) * Istotność różnic miar współzależnoÅ›ci Istotność współczynnika korelacji Istotność współczynnika korelacji, gÅ‚ownie dla maÅ‚ej próby, można sprawdzić testem t-Studenta. (!!!) Test stosowany jest dla zależnych współczynników korelacji (Pearsona i Spearmana) w celu dokonania oceny ich istotnoÅ›ci. Pozwala ustalić czy otrzymana wartość jest istotna, czy też powstaÅ‚a w sposób przypadkowy. Hipoteza zerowa ma postać: H0: g =0 współczynnik korelacji jest nieistotny (zwiÄ…zku miÄ™dzy zmiennymi jest przypadkowy) Hipoteza alternatywna: 14 H1: g `" 0 Korelacja miÄ™dzy zmiennymi jest istotna Istotność współczynnika korelacji - wzór * TESTY NIEPARAMETRYCZNE żð To testy dotyczÄ…ce caÅ‚ej badanej zbiorowoÅ›ci, a nie tylko okreÅ›lonych jej parametrów. Testy te nie wymagajÄ… żadnych zaÅ‚ożeÅ„ co do rozkÅ‚adu. Można je stosować wobec zmiennych wyrażonych a wszystkich skalach pomiarowych. żð MajÄ… one szerokie zastosowanie w badaniach pedagogicznych, stosuje siÄ™ je wtedy, gdy mamy do dyspozycji niewiele danych bÄ…dz takie dane, w stosunku, do których nie możemy sprawdzić czy speÅ‚niajÄ… zaÅ‚ożenia wymagane przy użyciu testów parametrycznych. * Test CHI KWADRAT Najczęściej stosowany tet nieparametryczny w badaniach statystycznych w pedagogice. Nie wymaga żadnych zaÅ‚ożeÅ„ o normalnoÅ›ci rozkÅ‚adu, ale liczebność badanej próby powinna być stosunkowo duża (nie może być mniejsza niż 5 jednostek). Test CHI jest testem jednostronnym. Stosuje siÄ™ go czÄ™sto dla obserwacji ujÄ™tych na skalach nominalnych lub silniejszych porzÄ…dkowych bÄ…dz przedziaÅ‚owych. Stosowany jest do żð Badania zgodnoÅ›ci rozkÅ‚ad empirycznego z teoretycznym, (czyli zgodnoÅ›ci cech zaobserwowanych i oczekiwanych) test zgodnoÅ›ci żð Sprawdzania niezależnoÅ›ci dwóch cech (zmiennych) test niezależnoÅ›ci Test niezależnoÅ›ci jest szczególnym przypadkiem testu zgodnoÅ›ci!! * Test niezależnoÅ›ci CHI Test niezależnoÅ›ci CHI ma zastosowanie do sprawdzania niezależnoÅ›ci cech dla: żð Dwóch zmiennych dychotomicznych, inaczej dwudzielnych (tablice czteropolowe), zazwyczaj nominalnych żð Dwóch zmiennych wielodzielnych (tablice wielopolowe), przy czym zmienne te sÄ… najczęściej zmiennymi jakoÅ›ciowymi (niemierzalnymi) Ocena niezależnoÅ›ci miÄ™dzy badanymi cechami jakoÅ›ciowymi jest niezbÄ™dna do badania współzależnoÅ›ci pomiÄ™dzy nimi. Stosowanie tego testu wymaga próby o dużej liczebnoÅ›ci (N>30) Test niezależnoÅ›ci CHI Wartość liczby stopni swobody wynosi k liczba kolumn tabeli zależnoÅ›ciowej Df=(k-1)(w-1) w - liczba wierszy H0: badane cechy sÄ… niezależne (!!!) H1: badane cechy sÄ… zależne Aby wyznaczyć wartość CHI wymagane jest sporzÄ…dzenie tablicy kombinowanej (tablicy zależnoÅ›ciowej (!!!) lub tablicy mieszanej) czteropolowej lub wielopolowej. 15 * Poprawka Yatesa na ciÄ…gÅ‚ość polega na zmniejszeniu o 0,5 każdej zaobserwowanej liczebnoÅ›ci (Fe) wiÄ™kszej od spodziewanej (F0) i na zwiÄ™kszeniu o 0,5 każdej zaobserwowanej liczebnoÅ›ci mniejszej od spodziewanej. Powoduje to zmniejszenie wartoÅ›ci x2, co ma istotne znaczenie przy podejmowaniu decyzji o przyjÄ™ciu lub odrzuceniu H0. Stosujemy, gdy: żð oczekiwanie liczebnoÅ›ci sÄ… mniejsze niż 10 (w dowolnym polu) (!!!) żð próba losowa zawiera mniej niż 40 obserwacji Stosujemy do: żð tablic typu 2x2 oraz 2x1 (gdy liczba swobody df=1) żð tablic z niskimi liczebnoÅ›ciami zaobserwowanymi (nie oczekiwanymi) żð wszystkich klas w tablicy, nawet gdy tylko jedna liczebność jest maÅ‚a * Algorytm testu niezależnoÅ›ci CHI 1. MateriaÅ‚ empiryczny ujmujemy w tablice czteropolowe lub wielopolowe 2. Stawiamy hipotezÄ™ zerowÄ…: H0: nie wystÄ™puje zależność pomiÄ™dzy badanymi zmiennymi lub badane zmienne sa niezależne 3. Ustalamy poziom istotnoÅ›ci oraz obliczamy liczbÄ™ stopni swobody 4. Obliczamy wartość empirycznÄ… testu 5. Z tablicy rozkÅ‚adu CHI odczytujemy (przy uwzglÄ™dnieniu odpowiedniego poziomu istotnoÅ›ci i liczby stopni swobody) wartość krytycznÄ… (teoretycznÄ…) testu - 6. W celu odrzucenia lub przyjÄ™cia hipotezy zerowej stosujemy nastÄ™pujÄ…ce kryterium: (!!!) - jeżeli to hipotezÄ™ zerowÄ… H0 należy odzrucić - jeżeli to nie ma podstaw do odrzucenia H0 należy jÄ… przyjąć Wartość statystyki CHI zależy od trzech czynników: żð Od siÅ‚y zwiÄ…zku badanych zmiennych (im wiÄ™ksze różnice miÄ™dzy liczebnoÅ›ciami empirycznymi i teoretycznymi tym wartość statystyki wiÄ™ksza) żð Od wielkoÅ›ci próby (im wiÄ™ksza próba tym wartość statystyki wiÄ™ksza) żð Od szczegółowoÅ›ci grupowania danych (im bardziej szczegółowo tym wartość statystyki wiÄ™ksza). Wymaga siÄ™, by w jednej kratce tabeli korelacyjnej byÅ‚o przynajmniej 8 obserwacji * Analiza współzależnoÅ›ci: Na podstawie wielkoÅ›ci CHI można wnioskować tylko i wyÅ‚Ä…cznie o niezależnoÅ›ci badanych zmiennych na okreÅ›lonym poziomie. Stwierdzenie wystÄ™powania zwiÄ…zku (odrzucenie hipotezy zerowej) daje podstawÄ™ do obliczenia siÅ‚y tego zwiÄ…zku. SiÅ‚Ä™ zwiÄ…zku pomiÄ™dzy zależnymi zmiennymi jakoÅ›ciowymi badamy za pomocÄ… współczynników kontyngencji. Współczynniki: żð Dla tablic czteropolowych współczynnik (Fi) Yule a żð Dla tablic wielopolowych współczynnik kontyngencji C Pearsona Współczynnik C Pearsona może być stosowany przy obliczaniu siÅ‚y zwiÄ…zku wystÄ™pujÄ…cego w tablicach wielopolowych dowolnej wielkoÅ›ci i dowolnego ksztaÅ‚tu (kwadratowych lub prostokÄ…tnych) (najmniejsza to tablica 2x2) Maksymalna wartość współczynnika C Pearsona zależy od liczby wierszy i kolumn w tabeli. Im wiÄ™ksza jest liczna tych pól, tym bardziej osiÄ…galna jest maksymalna wartość tego współczynnika tym bardziej 16 współczynnik Cmax zbliża siÄ™ do +1 i jednoczeÅ›nie, im mniejsza liczba tych pól, tym niższa jest maksymalnie osiÄ…gana wartość C. Zatem wartość współczynnika C należy rozpatrywać w zależnoÅ›ci od wartoÅ›ci maksymalnej możliwej dla danej tabeli. DysponujÄ…c wartoÅ›ciÄ… współczynnika C obliczonÄ… dla konkretnego przykÅ‚adu oraz Cmax należy obliczyć wartość skorygowanÄ… współczynnika kontyngencji Ckor: (!!!) W każdym przypadku Ckor prowadzi do podwyższenia wartoÅ›ci współczynnika C * Interpretacja współczynników kontyngencji: Współczynnik kontyngencji mogÄ… przyjmować tylko wartoÅ›ci dodatnie (od 0 do 1), zatem pokazujÄ… (okreÅ›lajÄ…) one tylko siÅ‚Ä™ zależnoÅ›ci, nie ukazujÄ… (opisujÄ…) natomiast kierunku tej zależnoÅ›ci (tendencji). 17