Stat
ystyka w badaniach. Pojęcia wstępne
Urszula
Augustyńska
Pojęcia wstępne
Statystyka jest pomocną towarzyszką tam, gdzie jest różnorodność, a my chcemy tę różnorodność w krótkich słowach opisać, gdy chcemy wykryć ogólne prawidłowości, kierunki zmian, zależności. Z punktu widzenia badacza zjawisk społecznych metody statystyczne mają zatem zastosowanie wówczas, gdy celem badania jest analiza i opis zbiorowości różnorodnych przypadków, a także wówczas, gdy celem badania jest wykrycie ogólnych prawidłowości, tendencji, zależności.
Statystyka, jak każda nauka, posiada właściwą sobie terminologię. Zacznijmy zatem od przybliżenia podstawowych pojęć, którymi będziemy się posługiwali przy omawianiu podstawowych zagadnień związanych z prowadzeniem statystycznych analiz.
Populacja (zbiorowość generalna), próbka populacji (zbiorowość próbna)
Populacja, to zbiorowość jednostek (osób, organizmów, przedmiotów, wytworów) posiadających co najmniej jedną własność wspólną i różniących się jednocześnie pod innymi względami. Przed przystąpieniem do badań należy zdefiniować populację tak, aby jednoznacznie można było stwierdzić, czy dana jednostka jest elementem badanej zbiorowości, czy nie. W badaniach pedagogicznych mogą to być na przykład populacje: uczniów gimnazjum (własność wspólna: bycie uczniem gimnazjum); szkół podstawowych; nauczycieli uczących na wsi; wyników wykonania zadania (przez jednego lub wielu uczniów); zadań zamieszczonych w podręcznikach do matematyki dla klasy 5; rysunków wykonanych przez uczniów na zadany temat.
Populacja może być ograniczona, wówczas dookreśla się ją czasowo i przestrzennie, np. nauczyciele szkół
podstawowych województwa śląskiego w roku szkolnym 2000/2002. Wnioski z badań odnoszą się wówczas tylko do tak dookreślonej zbiorowości. Populacja może być nieograniczona, wówczas określona jest tylko przez wspólne własności jednostek ją tworzących, np. uczniowie z trudnościami w uczeniu się matematyki, nauczyciele z syndromem „wypalenia zawodowego”, itp. Wnioski z badań odnoszą się wówczas do jednostek o tych własnościach lub ich zbiorowości. Na przykład do dowolnego ucznia, który aktualnie ma trudności w uczeniu się matematyki, ale również do takiego dziecka, które, gdy zacznie naukę szkolną będzie, być może, miało takie trudności, jak i do takiego, które miało kiedyś takie trudności. O takich populacjach mówi się czasem
„populacje hipotetyczne” w takim sensie, że definiuje się je wówczas, gdy celem badań jest zweryfikowanie pewnej wyprowadzonej z ogólnej teorii hipotezy.
Populacje ograniczone mają skończoną, choćby i bardzo dużą liczebność. Statystyczne badania populacji o skończonej liczebności to badania reprezentacyjne.
Populacje nieograniczone, „hipotetyczne”, traktowane są zawsze jako nieskończone. Statystyczne badania takich populacji mają charakter badań eksperymentalnych (w szerokim rozumieniu).
Podlegający badaniu element zbiorowości, to jednostka badania. Jednostką badania może być zatem uczeń, klasa szkolna, podręcznik, zadanie, wynik wykonania zadania, itd.
Badania statystyczne mogą być całościowe (wyczerpujące, pełne) lub częściowe. Badanie jest całościowe, jeżeli obserwacji został poddany każdy element populacji. W badaniu częściowym ze zbiorowości generalnej wybiera się pewien podzbiór nazywany próbką populacji lub zbiorowością próbną. Zasadnie orzekać o populacji, gdy badaniu nie jest dostępny każdy jej element, można na podstawie reprezentatywnej próbki tej populacji. Próbka reprezentatywna to taka, która odzwierciedla strukturę populacji pod interesującymi badacza względami. Reprezentatywność jest zawsze odniesiona do pewnych wybranych cech elementów populacji, tych mianowicie, które podlegają badaniu oraz tych, które mogą być skorelowane ze zmiennymi badanymi. Tak więc próbka, która może być próbką reprezentatywną w jednym badaniu, może nie być taką w innym badaniu, w którym cel badań jest inny. Nie ma „przepisu” na pobieranie próbek reprezentatywnych. Można jednak wskazać sposoby, które sprzyjają tworzeniu próbek reprezentatywnych.
Rodzaje metod statystycznych
Rozróżniamy metody opisu statystycznego oraz metody wnioskowania statystycznego. Opis statystyczny jest ilościowym opisem struktury zbiorowości próbnej (próbki) i dotyczy tylko tej zbiorowości, ale jeżeli badania są całościowe jest opisem ilościowym zbiorowości generalnej (populacji).
Metody wnioskowania statystycznego znajdują zastosowanie w badaniach, których celem jest orzekanie o populacji w sytuacji, gdy dysponujemy tylko informacją z pewnej próbki tej populacji, a więc informacją niepełną. Rozróżniamy tu metody estymacji parametrów populacji (szacowania) oraz metody weryfikacji hipotez statystycznych.
Przypuśćmy, że chcemy poznać jaki procent dzieci wykazuje niedostateczną dojrzałość do podjęcia nauki szkolnej. Przeprowadzenie odpowiedniego badania z udziałem wszystkich dzieci choćby tylko zamieszkujących Stat
ystyka w badaniach. Pojęcia wstępne
Urszula
Augustyńska
na terenie jednego województwa, może być zadaniem organizacyjnie karkołomnym, kosztownym i tak czasochłonnym, że wynik badania mógłby stać się już nieaktualny (gdyby trzeba było, na przykład, podjąć decyzje dotyczące zapewnienia odpowiedniej pomocy dzieciom tej pomocy potrzebującym). Wyjściem jest oszacowanie procentu dzieci wykazujących niedojrzałość szkolną na podstawie przeprowadzenia badania na reprezentatywnej próbce dzieci mających rozpocząć naukę. Znajdą tu zastosowanie metody estymacji (szacowania) parametrów populacji.
Przypuśćmy, że chcemy sprawdzić skuteczność, opracowanej na bazie nowej teorii, metody nauki czytania.
Przeprowadzamy w tym celu eksperyment – reprezentatywną próbkę sześciolatków dzielimy losowo na dwie grupy. W jednej grupie, kontrolnej, prowadzimy naukę czytania metodą tradycyjną, w drugiej, eksperymentalnej
– nową metodą. Po pewnym czasie (raczej dłuższym) przeprowadzamy w obu grupach pomiar skuteczności stosowanej metody nauki czytania. Niech wskaźnikiem tej skuteczności będzie liczba przeczytanych poprawnie i ze zrozumieniem w czasie 5 minut zdań. W grupie kontrolnej otrzymaliśmy średni wynik - 10 poprawnie i ze zrozumieniem przeczytane zdania, w grupie eksperymentalnej – średnio 14 zdania. Czy ta różnica upoważnia nas do stwierdzenia, że nowa metoda nauki czytania jest skuteczniejsza? W tym przypadku zastosowanie znajdą metody weryfikacji hipotez.
Zmienna (cecha statystyczna). Mierzenie zmiennych
W badaniu empirycznym obserwacji, mierzeniu podlega właściwość, ze względu na którą jednostki badania różnią się między sobą. W technicznym języku badań ilościowych właściwość ta nazywana jest zmienną lub cechą statystyczną.
Zmiennymi są na przykład takie właściwości ucznia jak: płeć, wzrost, wiek, liczba rodzeństwa, przynależność do organizacji szkolnych lub kółek zainteresowań, poziom lęku, poziom osiągnięć szkolnych, miejsce zamieszkania, czas wykonania zadania, itp.. Takie właściwości szkoły (jako jednostki organizacyjnej) jak: liczba zatrudnionych nauczycieli, liczba uczniów, wielość i wielkość oddziałów klasowych, itp. Jednak określenie zmiennej to nie tyle podanie jej nazwy, co ustalenie jej wartości, czyli własności jakie mogą przybierać jednostki badania ze względu na badaną właściwość. I tak wartości zmiennej płeć, to płeć męska -
mężczyzna i płeć żeńska - kobieta.
Badacz społeczny mierzy interesujące go zmienne poprzez, na przykład, obserwację, ankietowanie, testowanie. Wynikiem mierzenia jest przypisanie jednostce badania pewnej wartości mierzonej zmiennej. I tak, wynikiem mierzenia zmiennej płeć, jest przypisanie osobie jednej z wartości płeć męska albo płeć żeńska, zgodnie ze stanem rzeczy. Wynikiem mierzenia zmiennej wzrost, jest przypisanie osobie odpowiedniej wartości tej zmiennej np. 120cm.
W poprawnie prowadzonej analizie statystycznej metoda analizy musi być odpowiednio dobrana do charakteru badanej zmiennej. Z tego punktu widzenia znaczenie ma podział zmiennych na zmienne jakościowe i ilościowe (podział ten ma również znaczenie ze względu na sposób wprowadzania danych do bazy danych w programie komputerowym).
Zmiennymi jakościowymi (opisowymi, tekstowymi) będziemy nazywać zmienne, których wartości zostały ustalone poprzez wyróżnienie pewnych kategorii opisowych, według których określane są jednostki badania.
Zmienną jakościową jest, na przykład, zmienna płeć. Osoby rozróżniane są ze względu na płeć według dwu kategorii opisowych charakteryzujących płeć męską i płeć żeńską. Zmienną jakościową będzie zmienna miejsce zamieszkania, z wyróżnionymi kategoriami (wartościami tej zmiennej) miasto, wieś. Zmienną jakościową będzie zmienna preferowany sposób spędzania czasu wolnego z określonymi przez badacza przed lub po badaniu kategoriami określającymi możliwe sposoby spędzania wolnego czasu. Przy tej okazji warto wspomnieć, że większość analizowanych w badaniach pedagogicznych właściwości ma charakter zmiennych konstruowanych, tzn. definiowanych przy określaniu i uszczegółowianiu przedmiotu badań i nie będących zmiennymi naturalnymi w takim sensie w jakim zmienną naturalną jest płeć, czy kolor oczu.
Zmiennymi ilościowymi będziemy nazywać zmienne, których wartości mogą być określone liczbowo - jako liczba jednostek miary, np. cm lub liczba punktów (możliwych do uzyskania w teście, dajmy na to, sprawności) lub liczba sztuk (np., liczba izb lekcyjnych, liczba rodzeństwa).
Z punktu widzenia opracowań statystycznych znaczenie ma także podział zmiennych na zmienne ciągłe oraz zmienne dyskretne (skokowe).
Zmienna ciągła, to zmienna, której wartości mogą różnić się dowolnie mało; inaczej: między dwiema dowolnie mało różniącymi się wartościami zmiennej ciągłej możemy zawsze wskazać wartość trzecią. Mówimy, że zbiór wartości zmiennej ciągłej stanowi kontinuum, z czego wynika, że wartości zmiennej ciągłej mogą być odwzorowane na wybrany przedział liczb rzeczywistych. Zmiennymi ciągłymi są na przykład takie właściwości fizyczne jak wzrost, masa ciała, siła napięcia mięśni, pojemność płuc, czas (dojazdu do szkoły, wykonania Stat
ystyka w badaniach. Pojęcia wstępne
Urszula
Augustyńska
zadania, itp.), a także, z założenia, takie właściwości psychologiczne jak poziom inteligencji, poziom lęku, poziom neurotyzmu, poziom motywacji.
Zmienna dyskretna, to taka zmienna, która nie jest ciągła. Zmienne dyskretne mają przeliczalny zbiór wartości. Zmiennymi dyskretnymi są na przykład: liczba rodzeństwa, liczba dzieci w rodzinie Skale mierzenia
Pomiary (wyniki mierzenia) tworzą zbiór danych surowych. Dane surowe podlegają statystycznemu opracowaniu. Dobór takiej a nie innej, jako właściwej metody statystycznego opracowania danych zależy m.in.
od tego, jaką informację o własnościach jednostek badania uzyskaliśmy, a dokładniej, na jakich skalach zostały zmierzone analizowane zmienne.
Dla potrzeb opracowań statystycznych znaczenie ma następujący podział skal1:
-
skala nominalna (różnościowa);
-
skala porządkowa (rangowa);
-
skala z jednostka miary (różnicowa lub ilorazowa).
Jeżeli możemy jedynie stwierdzić, czy jednostki badania różnią się między sobą ze względu na analizowaną zmienną, czy się nie różnią, mamy pomiary ze skali nominalnej. W zbiorze danych będących wynikiem mierzenia na skali nominalnej określić możemy tylko relację „=”, bądź „≠”. Przykładem skali nominalnej jest dwukategorialny („Tak”, „Nie”) układ odpowiedzi na pytanie stawiane w badaniach np. ankietowych.
Jeżeli możemy określić natężenie badanej właściwości, ale w konsekwencji jedynie uporządkować jednostki badane według relacji „≤”, mamy pomiary ze skali porządkowej. Skalą porządkową jest na przykład skala stopni szkolnych, stosowana do pomiaru osiągnięć szkolnych ucznia. Na podstawie pomiarów można stwierdzić, że np. Staś ma niższe osiągnięcia niż Jaś, a Jaś takie same jak Małgosia, ale już odpowiedź na pytanie o ile większe są te osiągnięcia nie jest, w przypadku stosowania skali stopni szkolnych, możliwa.
Jeżeli możemy stwierdzić, o ile jednostek miary natężenie badanej właściwości jest większe lub mniejsze, albo ponadto, ile razy jest większe lub mniejsze, mamy pomiary ze skali z jednostką miary – skali różnicowej (inaczej: przedziałowej lub interwałowej) w pierwszym przypadku oraz skali ilorazowej (inaczej: stosunkowej) w drugim przypadku.
Przykładem skali różnicowej jest skala czasu kalendarzowego, skala temperatury (Celsjusza, Fahrenheita), a także niektóre skale konstruowane do pomiaru takich właściwości jak poziom inteligencji, poziom uspołecznienia, itp.
Przykładem skal ilorazowych są skale narzędzi pomiaru takich wielkości fizycznych jak czas, długość, siła, itp.
Odpowiednio do zastosowanej skali mierzenia badanej właściwości mówimy o analizowanych zmiennych, jako o zmiennych: nominalnych, porządkowych, różnicowych /przedziałowych, interwałowych/, ilorazowych
/stosunkowych/.
Zmienne ilorazowe i różnicowe mogą być zawsze sprowadzone do zmiennych porządkowych lub nominalnych, gdy taka dokładność jest dla celów badań wystarczająca. Na przykład zmienna wzrost mierzona jest zwykle na skali ilorazowej, a wynik wyrażany w wybranych jednostkach miary długości, np. 128cm. Może być jednak wystarczające określenie wzrostu na skali porządkowej z wyróżnieniem wartości: niski, średni, wysoki. Należy jednak pamiętać, że wówczas dobieramy taką metodę statystyczną, jaka jest odpowiednia dla zmiennych porządkowych, czy nominalnych, a nie taką, jaka byłaby odpowiednia dla zmiennych mierzonych na skalach z jednostką miary.
W tabeli poniżej przedstawione są przykłady prostych zmiennych – nazwa, wartości i odpowiadająca skala mierzenia.
Zmienna
nazwa zmiennej
wartości zmiennej
Skala
mierzenia
płeć
kobieta, mężczyzna
nominalna
wzrost
..., 150cm, 151cm, ...,175cm, ...
z jednostką miary
wzrost
niski, średni, wysoki
porządkowa
liczba dzieci
0 dzieci, 1 dziecko, 2 dzieci, ...
z jednostką miary
uczestnictwo w terapii
uczestniczy, nie uczestniczy
nominalna
poziom wykształcenia
podstawowy, ponadpodstawowy
porządkowa
1 Najnowsze opracowanie dotyczące skal mierzenia i ich klasyfikacji zawarte jest w pozycji: Z.M.Zimny Metodologia badań społecznych, Wyd.WSP, Częstochowa 2000, s.128 – 149.
Stat
ystyka w badaniach. Pojęcia wstępne
Urszula
Augustyńska
Zadania i ćwiczenia
1. Wśród studentów AJD przeprowadzono w 2008 roku badanie ankietowe, którego celem było poznanie opinii na temat oferowanych przez uczelnię warunków studiowania. W badaniu wzięło udział 234 studentów, w tym 134 kobiety i 100 mężczyzn.
Jeżeli podana informacja jest wystarczająca, aby odpowiedzieć na poniższe pytania, to odpowiedz:
•
Jaka populacja podlegała badaniu? Jest to populacja ograniczona, czy nieograniczona?
•
Czy były to badania całościowe, czy może były to badania częściowe?
•
Jeżeli były to badania częściowe, to czy można się spodziewać, że pobrana próbka populacji jest próbką reprezentatywną ze względu na płeć?
2. Z przytoczonego fragmentu kwestionariusza ankiety wypisz:
•
wszystkie zmienne, wskazując na ich treść (długa nazwa zmiennej),
•
każdej zmiennej nadaj krótką nazwę (max. 8 znaków),
•
dla każdej zmiennej wskaż wszystkie jej wartości,
•
przypisz wartościom zmiennej kody numeryczne (tam, gdzie to potrzebne),
•
dla każdej zmiennej określ skalę jej mierzenia.
Zmienna
Skala
Długa nazwa zmiennej
krótka
Wartości zmiennej
kody
mierzenia
nazwa
wartości
zmiennej
zmiennej
Kwestionariusz ankiety – fragment:
.............
4. Jak oceniasz stronę internetową Akademii im. Jana Długosza w Częstochowie?
a) jest bardzo dobra
b) jest dobra
c) jest w porządku
d) jest słaba
..............
6. Jesteś zadowolony(a) z zaproponowanego dla Twojej specjalności planu zajęć?
a) nie, plan zupełnie mi nie odpowiada
b) raczej nie, ale mogło być gorzej
c) raczej tak, ale mogło być lepiej
d) tak, plan w zupełności mi odpowiada
.............
10. Czy, Twoim zdaniem, ........
a) tak
b) nie
c) nie mam zdania
Metryczka:
Płeć:
Wiek (kalendarzowy):
Rok studiów:
Zatrudnienie:
kobieta
I, II, III, IV, V
pracuje na etacie
mężczyzna
.......................
pracuje dorywczo
nie pracuje