niezbednik statystyczny, Materiały dydaktyczne EFS


Polubić statystykę

ale…

jej nie przeceniać!!!

czyli

„niezbędnik statystyczny i nie tylko”

S t a t y s t y k a

Podstawowe pojęcia statystyczne

Zbiorowość statystyczna - zbiór dowolnych elementów (osób, przedmiotów, faktów) podobnych - ale nie identycznych - pod względem określonych właściwości i poddanych badaniom statystycznym. Zbiorowości statystyczne powinny być ściśle określone pod względem rzeczowym (kto lub co jest przedmiotem badania), przestrzennym (gdzie się znajduje zbiorowość) oraz czasowym (jakiego momentu czy okresu dotyczy badanie).

Jednostka statystyczna - element składowy zbiorowości poddana bezpośredniej obserwacji lub pomiarowi.

Cechy stałe - właściwości jednakowe dla wszystkich jednostek statystycznych. Nie podlegają badaniu, jedynie decydują o zaliczeniu jednostki do określonej zbiorowości (są nimi np. wiek, płeć, kolor włosów itd.).

Cechy zmienne - właściwości różnicujące poszczególne elementy zbiorowości. Podlegają badaniu statystycznemu (są nimi np. liczba osób piszących test, liczba zadań w teście, osiągnięte punkty itd.)

Skale pomiarowe - Badaniu statystycznemu podlegają cechy zmienne, różnicujące jednostki statystyczne. Wielkość badanej cechy określana jest w procesie pomiaru. Pomiar polega na przyporządkowaniu cechom statystycznym określonych symboli, którymi mogą być liczby, litery alfabetu, opis słowny i inne. Wyróżnia się różne poziomy pomiarów, którym odpowiadają 4 skale pomiarowe: nominalna, porządkowa (rangowa), przedziałowa (interwałowa), stosunkowa (ilorazowa). Nominalna i porządkowa są niemetryczne (jakościowe), przedziałowa i stosunkowa - metryczne (ilościowe).

Skala nominalna - jest najmniej precyzyjna. Liczby pełnią tu jedynie rolę umownych symboli służących do identyfikacji jednostek statystycznych i ich klasyfikacji do wyróżnionych kategorii. Jedyną operacją matematyczną jest zliczanie jednostek należących do określonej kategorii danej cechy i obliczanie na ich podstawie proporcji, odsetek, procentów. Np. wynik pomiarów jednostek w IV grupie pod względem cechy jakościowej „płeć” można przedstawić w skali nominalnej: kobiety - mężczyźni. Można obliczyć, że w grupie 15 - osobowej znajduje się 14 kobiet i 1 mężczyzna, który stanowi 7% populacji.

Skala porządkowa (rangowa) - posiada wszystkie cechy skali nominalnej, dodatkowo pozwala na porządkowanie jednostek w ramach wyróżnionych kategorii pod względem natężenia badanej cechy. Możliwe są więc stwierdzenia, że coś jest mniejsze niż, lub większe niż Przykładem jest np. 9 stopniowa skala Richtera, stopnie wojskowe, miejsca zajęte przez zawodników itd. Nie wolno na tej skali dokonywać działań dodawania, odejmowania, dzielenia, mnożenia idt.

Skala przedziałowa (interwałowa) - zachowuje własności skali porządkowej, a oprócz tego umożliwia określenie odległości między jednostkami. Np. w skali temperatury Celsjusza zero ustalono jako punkt, w którym zamarza woda, temperaturę mierzy się więc w odniesieniu do tego zera: poniżej zera i powyżej zera. Tak samo wzrost, czy wzrost danej osoby mieści się w skali przyjętej dla danego wieku i płci, o ile jest wyższa/niższa od innych osób. Na liczba w skali przedziałowej nie można dzielić. Wyniki testu wyrażane w punktach jest to pomiar w skali przedziałowej.

Skala stosunkowa (ilorazowa) - jej cechą charakterystyczną jest posiadanie punktu zerowego, który oznacza brak danej cechy. Umożliwia to dokonywanie wszelkich działań matematycznych. Oceny to skala stosunkowa.

Nazwa skali

Własności

Przykład dydaktyczny

Przykład spoza dydaktyki

Nominalna

Klasy jakościowe

Deklaracje zainteresowań

Numery linii autobusowych

Porządkowa

j. w. + hierarchia klas

Skala stopni szkolnych

Przemysłowe klasy jakości

Przedziałowa

j. w. + jednostka pomiaru

Skala znormalizowana

Lata kalendarzowe

Stosunkowa

j. w. + zero bezwzględne

Wyniki testów szybkości

Długość odcinka

Tablice statystyczne - zawierają liczbowy opis zbiorowości statystycznych według jednej (tablice proste) lub większej liczby cech (tablice złożone). Pełnią one główną formę zbiorowego prezentowania danych liczbowych. Tablice powinny zawierać: tytuł, nazwy wierszy (boczek), nazwy kolumn (główka), źródła danych, ewentualne uwagi wyjaśniające, np.

Tabela 1 Umiejętności związane z czytaniem, analizowaniem, interpretacją i refleksją teoretycznoliteracką.

Nr zadania

1

2

4

Poziom P

3

Poziom PP

Poziom wymagań

P

PP

Łatwość %

84

80

76

80

52

52

Źródło: Badania własne

Tabela 2 Ogólne wyniki testowania - analiza ilościowa.

Lp.

Wskaźnik statystyczny

Użyty skrót

Wynik

1.

Liczba testowanych

N

2.

Średnia arytmetyczna

x

3.

Odchylenie standardowe wyników

S

4.

Rozstęp

R

5.

Współczynnik zmienności

V

6.

Mediana

Me

7.

Modalna

Mo

8.

Łatwość zadań

p

9.

Łatwość zadań w górnej połowie

P/L

10.

Łatwość zadań w dolnej połowie

P/S

11.

Moc różnicująca

D 50

12.

Wariancja średnia zadań

Wśr.z.

13.

Wariancja testu

W

14.

Rzetelność testu (wzór KR20)

KR20

15.

Frakcja opuszczeń

fśr.

16.

Błąd standardowy pomiaru

Bs

Wykresy statystyczne - to wizualna forma prezentacji danych statystycznych oraz wyników analizy statystycznej. Z punktu widzenia form graficznych można wyróżnić wykresy liniowe (wielkości statystyczne przedstawione w postaci pionowych lub poziomych odcinków) oraz powierzchniowe (służące do prezentacji wielkości statystycznych za pomocą powierzchni figur płaskich, np. wykresy słupkowe, kołowe). Każdy wykres powinien mieć: tytuł, źródło danych oraz legendę, czyli wyjaśnienie zastosowanych symboli, znaków, barw czy przyjętej skali. Przykład:

0x08 graphic
0x08 graphic
0x01 graphic

Źródło: Badania własne

Histogram - zbiór przylegających prostokątów, których podstawy - równe interwałom klasowym - spoczywają na osi odciętych, a wysokości są liczebnościami odpowiadającymi poszczególnym przedziałom klasowym.

Diagram (wielobok liczebności) - jest łamaną powstałą przez połączenie punktów o współrzędnych: środki przedziałów klasowych i odpowiadające im liczebności.

Hierarchia niezbędnych własności pomiaru dydaktycznego

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

Niezależność Dokładne Rzetelność Trafność Obiektywizm

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
sytuacji punktowanie pomiaru pomiaru pomiaru

pomiarowej zadań

I. Zaczynając od wzorów, które są konieczne do analizy ilościowej i obliczenia współczynnika rzetelności.

średnia artytmetyczna: 0x01 graphic

to miara tendencji centralnej, specyficzna dla skali przedziałowej

0x01 graphic

gdzie:

0x01 graphic
- suma poszczególnych wyników

N - liczba badanych

np.

0x01 graphic
= 0x01 graphic
=0x01 graphic

mediana: Me (0x01 graphic
)

jest to wynik środkowy w uporządkowanym zbiorze wyników, przyjmuje się, że w przypadku nieparzystej liczby tych wartości medianę stanowi wartość środkowa, a w przypadku parzystej liczby wartości - średnia arytmetyczna dwu wartości środkowych, aby odnaleźć medianę należy uporządkować wyniki od najwyższego do najniższego lub odwrotnie

np.

8, 7, 6, 5, 5, 4, 3, 2 11, 9, 10, 7, 6, 5, 3 9, 7, 6, 5, 4,3

Me=5 Me=7 Me=(6+5): 2=5,5

________________________________________________________________

modalna: Mo

(inaczej: dominanta, moda) jest to wynik najczęściej występujący, wynik modalny może być nazwany „wynikiem typowym” określonego zbioru wyników testowania (układ dwumodalny mamy wówczas, gdy dwa wyniki tak samo często występują np. 8,7,7,5,4,4,3; Mo= 7 i 5)

np.

8, 7, 6, 5, 5, 4, 3, 2

Mo=5

rozrzut:

(inaczej: dyspersja, zmienność, rozsiew, rozproszenie) to zróżnicowanie zaobserwowanych wartości zmiennej, dostarcza nam informacji jak bardzo wyniki odchylają się od tendencji centralnej.

Podstawowymi miarami rozrzutu są: wariancja i odchylenie standardowe

________________________________________________________________

rozstęp (rozpiętość) R

jest prostą miarą rozrzutu, opiera się na dwóch krańcowych wynikach, jego wadą jest brak precyzji

R= xmax - xmin

np.

8, 7, 6, 5, 5, 4, 3, 2

R= 8 - 2=6

Wariancja testu: S2

to średnia arytmetyczna kwadratów odchyleń tych wyników od ich średniej arytmetycznej, służy do analizy rozrzutu.

S2 = 0x01 graphic

Gdzie:

=znak sumowania

x = wynik w teście

0x01 graphic
= średnia artymetyczna

x - 0x01 graphic
= odchylenie zaobserwowanej wartości zmiennej (danego wyniku od średniej arytmetycznej)

N - liczba badanych (wyników)

Np.

wynik

x-0x01 graphic

0x01 graphic
(x-0x01 graphic
)2

8

(8-5)=3

9

7

(7-5)=2

4

6

(6-5)=1

1

5

(5-5)=0

0

5

(5-5)=0

0

4

(4-5)=-1

1

3

(3-5)=-2

4

2

(2-5)=-3

9

0

0x01 graphic

S2= 0x01 graphic
= 0x01 graphic
=3,5

Wariancja zadania punktowanego 0 - 1: W

W= p x q

p - łatwość zadania p=0x01 graphic

q - trudność zadania q=1 - p

Odchylenie standardowe: S

Jest to dodatni pierwiastek kwadratowy z wariancji, służy do przedstawiania wyników badań (np. czy test dobrze różnicuje - pomiar różnicujący)

S=0x01 graphic

Np.

S=0x01 graphic
= 1,87

Im większe (S) odchylenie, tym większe zróżnicowanie!!!

Im mniejsze (S) odchylenie, tym mniejsze zróżnicowanie!!!

Łatwość zadania: p

Jest stosunkiem liczby punktów uzyskanych za rozwiąznie tego zadania przez uczniów biorących udział w testowaniu do maksymalnej liczby punktów możliwej do uzyskania przez tę liczbę uczniów.

P0x01 graphic
0x01 graphic
=0x01 graphic
0x01 graphic

gdzie:

p - łatwość zadania

0x01 graphic
- suma punktów uzyskanych za roziwązanie zadania przez „n” uczniów

n - liczba uczniów testowanych

k - maksymalna liczba punktów możliwych do uzyskania przez jednego ucznia za rozwiązanie zadania

0x08 graphic
Łatwość zadania punktowanego 0-1

p=0x01 graphic

p- łatwość zadania punktowanego 0-1

np- liczba uczniów, którzy rozwiązali zadanie

n- liczba uczniów testowanych

Dla różnych celów (np. promowania, diagnozy niepowodzeń, selekcji najlepszych) i w różnych częściach testu wielostopniowego potrzebujemy zadań o różnej trudności dla ucznia. Ze względu na motywację uczenia się najbardziej pożądane są zadania średnio trudne i łatwe, a zadania przewidywane jako trudne i bardzo trudne powinny być odpowiednio oznaczone. Nieoczekiwana trudność lub łatwość zadania może być sygnałem braku jego poprawności dydaktycznej!!!

Trudność zadania: q

Wskaźnik ten stosuje się do testu złożonego z zadań punktowanych 0-1, jest to stosunek liczby uczniów, którzy nie rozwiązali prawidłowo zadania ( podali błędną odpowiedź, opuścili zadanie lub nie doszli do niego), do liczby uczniów biorących udział w testowaniu.

q =1 - p

q - trudność zadania punktowanego 0 - 1

p-łatwość zadania punktowanego 0 - 1

Współczynnik zmienności: V

to stosunek odchylenia standardowego do średniej

V=0x01 graphic
100%

S = odchylenie standardowe

0x01 graphic
= średnia arytmetyczna

np. V= 0x01 graphic
100%= 37,4%

Frakcja opuszczeń zadania: f

W teście pisemnym za zadanie opuszczone przez danego ucznia uważamy każde zadanie pozostawione bez odpowiedzi, jeżeli na którekolwiek z zadań o wyższej numeracji (późniejsze w teście) podał on odpowiedź prawidłową lub błędną, całkowitą lub częściową.

Frakcja opuszczeń jest stosunkiem liczby uczniów, którzy je opuścili do liczby uczniów biorących w testowaniu.

f =0x01 graphic

gdzie:

f - frakcja opuszczeń

n0- liczba uczniów, którzy opuścili zadanie

n- liczba uczniów testowanych

Łatwość w górnej i dolnej połowie: P/L, P/S

Wskaźniki te są pomocne w obliczaniu mocy różnicującej zadania i testu. Jest to stosunek liczby uczniów, którzy rozwiązali poprawnie zadanie do liczby uczniów w połowie. Górna połowa - inaczej lepsza połowa, dolna połowa - inaczej słabsze wyniki

P/L= 0x01 graphic

P/L- łatwość w górnej połowie

np- liczba uczniów, którzy rozwiązali zadanie w górnej połowie

n- liczba uczniów testowanych w górnej połowie

P/S= 0x01 graphic

P/S- łatwość w dolnej połowie

np- liczba uczniów, którzy rozwiązali zadanie w dolnej połowie

n- liczba uczniów testowanych w dolnej połowie

Moc różnicująca zadania testowego punktowanego 0-1: rpb (współczynnik korelacji punktowo - dwuseryjnej)

Jest to korelacja wyników zadania z wynikami testu, w którym mieści się to zadanie, porównywane są dwie serie wyników: tych uczniów, którzy rozwiązali zadanie (p) i tych uczniów, którzy go nie rozwiązali (q)

rpb== 0x01 graphic

gdzie:

0x01 graphic
p - średnia wyników testu w serii p (uczniów, którzy rozwiązali zadanie)

0x01 graphic
- średnia wyników testu ( ogólna)

p - łatwość zadania pu ktowanego 0 - 1

q - trudność zadania

n - liczba uczniów testowanych

Moc różnicująca zadania testowego: D50 ( wskaźnik zastępczy, dla zadań punktowanych 0-1)

0x08 graphic
D50 = P/L - P/S

D50 - moc różnicująca zadanie punktowane 0-1

P/L - łatwość w górnej połowie

P/S - łatwość w dolnej połowie

Moc różnicująca zadania testowego: rix

(jest korelacją wyników zadania z wynikami

testu, w którym mieści się to zadanie)

rix= 0x01 graphic
0x01 graphic

gdzie:

rix - moc różnicująca zadanie, współczynnik korelacji (r Pearsona, pozwala liczyć zależności dla skali przedziałowej: jak mocno wyniki zgadzają się ze sobą),

i - wynik zadania ucznia

x - wynik testu ucznia

n - liczba uczniów testowanych

Wskaźnik rix jest trudno obliczyć na zwykłym kalkulatorze, najlepiej używać tak zwanego kalkulatora „naukowego” (statystycznego) wyposażonego w program uruchamiany klawiszem „r” lub „corr”. Albo wykorzystywać specjalne programy komputerowe. (np. ITEMAN, TESTY)

W teście sprawdzającym są potrzebne zadania o małej mocy różnicującej!!!

Dla testu różnicującego moc różnicująca zadań powinna być wysoka!!!

Tylko zadania umiarkowanie trudne i trudne mogą dobrze różnicować uczniów. Zadnia b. łatwe i b. trudne mają niską (do zerowej, gdy wszyscy uczniowie rozwiązali zadanie lub wszyscy go nie rozwiązali) moc różnicującą. Dlatego musimy interpretować wartość wskaźników mocy różnicującej łącznie ze wskaźnikami łatwości zadania. W innym przypadku odrzucilibyśmy wszystkie zadania bardzo łatwe i bardzo trudne. Mając jednak zadania o podobnej stosowności i poprawności dydaktycznej, w tym - łatwości, a nierówne pod względem mocy różnicującej, powinniśmy wybrać zadania o wyższych wskaźnikach mocy różnicującej.

Współczynnik rzetelności testu (rzetelność-dokładność pomiaru)

Jest to współczynnik pokazujący wewnętrzną zgodność testu osiągnięć szkolnych, czyli stopień, w jakim wszystkie zadania testu mierzą te same osiagnięcia uczniów (inaczej: jest to zgodność planu testu z tym jak uczniowie go rozwiązują).

Im większa jest liczba testowanych, tym bardziej pewne staje się oszacowanie rzetelności.

Współczynnik może przybierać wartości w przedziale {0,1}. Wartość 0 oznacza, iż cała zmienność wyników pochodzi z błędów pomiaru, to znaczy, iż różnice między wynikami uczniów w dowolnym testowaniu są wyłącznie losowe, a test niczego systematycznie nie mierzy. Wartość 1 oznacza, iż wyniki testowania są całkowicie wolne od błędów pomiaru określonych jako czynniki swoiste dla danej wersji testu lub indywidualne dla danego punktującego. Każda wartość współczynnika pokazuje proporcję między czynnikami systematycznymi i losowymi, np. współczynnik 0,50 pokazuje, że ich udział jest równy.

Rzetelność jest wyższa, gdy w teście są zadania umiarkowane, niższa, gdy znajdują się w nim zadania bardzo łatwe i bardzo trudne.

Aby rzetelność była wysoka, wysokie muszą być moce różnicujące poszczególnych zadań.

Jeżeli rośnie wariancja, to rośnie rzetelność testu.

Jest miarą „złudną”, ponieważ można „sztucznie” ją podnosić: im większa liczba zadań w teście, tym wyższa rzetelność.

Jest uzależniona od czynników zewnętrznych np. organizacji testowania, kompetencji sprawdzającego, „obycia testowego uczniów”.

Uniwersalnym wzorem na oszacowanie wewnętrznej zgodności wyników jest alfa Cronbacha - 0x01 graphic

0x01 graphic
= 0x01 graphic

gdzie:

k- liczba zadań w teście

0x01 graphic
-suma wariancji wyników poszczególnych zadań

S2x - wariancja wyników testowania

0x08 graphic
Dla zadań punktowanych 0-1 stosuje się współczynnik rzetelności testu KR20

rtt=0x01 graphic

rtt - współczynnik rzetelności KR20

m - liczba zadań w teście

p - łatwość zadań

q - trudność zadań

s2 - wariancja wyników testowania

Błąd standardowy pomiaru: 0x01 graphic

Służy do interpretacji statystycznej współczynnika rzetelności pomiaru (np. w testach wielokrotnego wyboru „poprawka na zgadywanie”)

0x01 graphic
= S0x01 graphic

S - odchylenie standardowe wyników

Rtt - współczynnik rzetelności pomiaru

Trafność pomiaru

jest stopniem, w jakim jego wyniki są użyteczne, to jest przynoszą informację, która może być odpowiednio wykorzystana, to możliwość zasadnego wnioskowania o osiągnięciach uczniów i podejmowania skutecznych działań na podstawie wyników tego pomiaru. Obejmuje ona praktyczną użyteczność pomiaru i długofalowe skutki jego dokonywania, m. in. wpływ testowania na postawy uczniów i nauczycieli. Podstawą analiz jest zgodność intencji i wyników pomiaru.

Analizy trafności pomiaru dydaktycznego mają zapobiec:

  1. błędom w doborze treści testów (np. przeładowanie testu wiedzą)

  2. nadużyciom w interpretacji wyników testowania (np. kategorycznego wyrokowania o nakładzie pracy uczniów i nauczycieli).

Tradycyjna typologia trafności

Mody-

fikacja

Trafność pomiaru sprawdzającego

0x08 graphic
Wewnętrzna: porównanie testu

z programem, zadań testowych z planem testu

Opisowa: zgodność treści zadań danego testu z opisem osiągnięć, które miały być objęte sprawdzaniem

0x08 graphic
Kryterialna: porównanie wyników pomiaru z wynikami innego pomiaru tych samych lub podobnych osiągnięć uczniów

Funkcjonalna: zgodność funkcji spełnianych przez pomiar z funkcjami zamierzonymi dla tego pomiaru.

0x08 graphic
Teoretyczna: zgodność treści i wyników pomiaru dydaktycznego z wybranymi założeniami teorii psychologicznej i pedagogicznej

Np. jeżeli test miał mierzyć daną umiejętność, to trzeba udowodnić, że jego treść reprezentuje zakres tej umiejętności w większym stopniu niż innych, a wyniki pozwolą na przewidywanie jakości działań obecnych i przyszłych.

Wyboru dziedziny: sprawdzenie zasadności wyboru dziedziny czynności uczniów.

Ponieważ nie możemy mierzyć wszystkiego, musimy dokonywać wyborów, kierując się celami kształcenia jeżeli chcemy kształcić i czytanie ze zrozumieniem, musimy dobrać odpowiednie zadania sprawdzające tę umiejętność.

Trafność teoretyczna pomiaru:

zintegrowany sąd wartościujący na temat stopnia, w jakim dane empiryczne i uzasadnienia teoretyczne stanowią o tym, że wnioski i działania oparte na wynikach testowania i innych sposobach oceniania są odpowiednie i właściwe.

Zakres analiz trafności teoretycznej jest bardzo szeroki, gdyż obejmuje nie tylko testowanie, lecz także na przykład arkusze obserwacji, materiały z teczek ucznia, osiągnięcia praktyczne, itd.

Rozszerzone pojęcie trafności teoretycznej może być przedstawione w postaci macierzy postępującej, to jest tabeli, w której wartości kolejnych pól kumulują się w wierszach i kolumnach.

0x08 graphic
Funkcje oceny trafności

Uzasadnienie trafności

Interpretacja testu

Zastosowanie testu

Na podstawie zebranych dowodów

A

Trafność teoretyczna

B Trafność teoretyczna

+

stosowność i użyteczność

Na podstawie przewidywanych konsekwencji

C Trafność teoretyczna

+

kształtowanie wartości

D Trafność teoretyczna

+ stosowność i użyteczność

+ kształtowanie wartości

+ skutki społeczne

Pytania, jakie powinny być postawione w poszczególnych zakresach

trafności pomiaru dydaktycznego:

A Jak mogę udowodnić, że zmierzono wszystko to i tylko to, co należało zmierzyć?

B Jak mogę udowodnić, że zmierzono to zgodnie z obowiązującymi przepisami i programami kształcenia oraz korzystnie ze względu na poniesione nakłady?

C Jakie będą zapewne konsekwencje dokonania pomiaru lub ewentualnego zaniechania pomiaru dla przekonań i postaw uczniów wobec świata, wobec uczenia się i wobec samych siebie?

D Jakie będą zapewne długofalowe skutki pomiaru lub zaniechania pomiaru dla społeczeństwa jako całości i dla poszczególnych uczniów?

Zasady ustalania trafności pomiaru dydaktycznego

  1. Ustalanie trafności pomiaru dydaktycznego jest procesem ciągłym i nieograniczonym.

  2. Wszystkie dane dotyczące założeń, planów, przebiegu, wyników i skutków testowania powinny być wykorzystane do oceny trafności pomiaru dydaktycznego.

  3. Dane potwierdzające i dane zaprzeczające trafność pomiaru są równie cenne.

  4. Pomiar nie jest trafny, gdy uczniowie nie wiedzą, co jest mierzone, lub nie aprobują tego.

  5. Pomiar nie jest trafny, gdy nauczyciele nie wiedzą, co jest mierzone, lub nie aprobują tego.

  6. Nie tyle wyniki pomiaru, ile decyzje podjęte na ich podstawie podlegają analizie i ocenie pod względem trafności.

  7. Wszelkiego rodzaju skutki pomiaru dydaktycznego - dla uczniów, ich rodziców, nauczycieli, szkół i społeczeństwa - mają znaczenie dla trafności.

  8. Im głębsze i bardziej odroczone są skutki pomiaru, tym maja znaczenie dla jego trafności.

  9. Budując test, należy równolegle tworzyć program analiz jego trafności.

  10. Każdy nowy rodzaj zastosowania pomiaru wymaga nowego ustalenia jego trafności.

  11. Im test dłuższy, tym rzetelniejszy, ale niekoniecznie bardziej trafny.

  12. Bez trafnych narzędzi pomiaru osiągnięć uczniów standardy edukacyjne są niewiele więcej niż dekoracją systemu edukacyjnego.

Obiektywizm pomiaru sprawdzającego

to dokładność, z jaką wyniki pomiaru są wyznaczone wymaganiami programowymi. Gdy wyniki pomiaru dokładnie odpowiadają na pytanie o spełnienie założonych wymagań przez uczniów, są obiektywne w sensie pomiaru sprawdzającego osiągnięcia uczniów.

Opis statystyczny - ma charakter sumaryczny i dotyczy tylko i wyłącznie danej zbiorowości statystycznej.

Wnioskowanie statystyczne - ma miejsce wówczas, kiedy badanie jest reprezentatywne, a jego wyniki są uogólniane na całą populację generalną, z której pochodzi próba.

Zestawienie statystycznych miar opisowych

Rodzaj miary

Miara

nazwa

znaczenie

nazwa

symbol

Zastosowanie

Tendencja centralna

Punkt skupienia zaobserwowanych wartości na skali

  • średnia arytmetyczna

_

x

Wskazuje wartość przeciętną

  • mediana

x

Wskazuje wartość środkową

  • modalna

mo

Wskazuje wartość typową

Rozrzut

Rozproszenie zaobserwowanych wartości zmiennych

  • rozstęp

-

Do wstępnej oceny wielkości rozrzutu

  • wariancja

S2

Do analizy rozrzutu

  • odchylenie standardowe

S

Do przedstawiania wyników badania

Korelacja

Współzależność zaobserwowanych wartości dwu zmiennych

  • współczynnik korelacji Pearsona

r

Obie zmienne mają po wiele klas ilościowych

  • punktowo - dwuseryjny

rpb

Jedna ze zmiennych ma tylko dwie klasy jakościowe

  • dwuseryjny

rb

Jedna ze zmiennych ma tylko dwie klasy ilościowe

  • Yule`a

rφ

Obie zmienne mają po dwie klasy jakościowe

  • tetrachoryczny

rt

Obie zmienne mają po dwie klasy ilościowe

1

1

16

Niezbędnik statystyczny dla polonisty

Opracowały na podstawie literatury przedmiotu M. Latoch - Zielińska, Renata Bryzek i Wioletta Kozak

Interpertacja wskaźnika łatwości zadań

0-0,19 - b. trudne

0,2-0,49 - trudne

0,5-0,69 - śr. trudne

0,7-0,89 - łatwe

0,9-1 - b. łatwe

Interpretacja mocy różnicującej zadania

Liczba zadań w teście

Minimalna rzeczywista moc różnicująca zadań

Zadowalająca moc różnicująca zadań

100

0,10

0,22

25

0,20

0,42

10

0,32

0,60

5

0,45

0,75

Umowne normy wielkości współczynników rzetelności ( interpretacja nieformalna współczynnika rzetelności)

Wielkość współczynnika

Ocena pomiaru

Dopuszczalne decyzje na podstawie wyników pomiaru

0,00-0,49

nierzetelny

Niedotyczące różnic osiągnięć między uczniami

0,50-0,79

mało rzetelny

Dotyczące różnic osiągnięć między grupami uczniów

0,80-0,89

rzetelny

Dotyczące różnic osiągnięć między uczniami w jednym zakresie treści kształcenia (przedmiocie)

0,90-1,00

bardzo rzetelny

Dotyczące różnic osiągnięć jednego ucznia między wybranymi zakresami treści ksztalcenia (przedmiotami)

- % zadań zaliczonych

- % zadań niezaliczonych

Wykres 1

Rozkład opanowanych umiejętności

w zakresie czytania, rozumienia, analizy i interpretacji przeczytanego tekstu



Wyszukiwarka

Podobne podstrony:
Arkusz odpowiedzi do karty zainteresowan, Materiały dydaktyczne EFS
ankieta badanie postaw, Materiały dydaktyczne EFS
poprawiony program wychowawczy, Materiały dydaktyczne EFS
Wykorzystanie wynikow egzaminu maturalnego w roku szkolnym 2004, Materiały dydaktyczne EFS
RAPORT Z PROFIL., Materiały dydaktyczne EFS
Kwestionariusz ankiety dotyczacej zainteresowan, Materiały dydaktyczne EFS
TYPOLOGIA PISEMNYCH ZADAN TESTOWYCH, Materiały dydaktyczne EFS
Ankieta dla rodzicow jaka jest nasza szkola, Materiały dydaktyczne EFS
ARKUSZ ODPOWIEDZI KANH, Materiały dydaktyczne EFS
Analiza wynikow egzaminu maturalnego z jezyka polskiego w roku szkolnym 2005, Materiały dydaktyczne
Ankieta dla nauczyciela na temat procesu dydaktycznego, Materiały dydaktyczne EFS
projekt, Materiały dydaktyczne EFS
Program Rozwoju Szkoly 2006-7 , Materiały dydaktyczne EFS
ankieta dla nauczycieli, Materiały dydaktyczne EFS
Budowanie wewnetrznego systemu, Materiały dydaktyczne EFS
typy sensoryczne i typy inteligencji, Materiały dydaktyczne EFS
ankieta do stylow myslenia, Materiały dydaktyczne EFS
ankieta-naucz, Materiały dydaktyczne EFS
Z POMOCA NIESMIALYM - program, Materiały dydaktyczne EFS

więcej podobnych podstron