EWD Jak wykorzystywa脛鈥膭 wyniki egzamin膫艂w zewn脛鈩rznych


EWD - Edukacyjna Warto艣膰 Dodana
EWD, czyli jak wykorzystywa膰 wyniki egzamin贸w zewn臋trznych do
oceny efektywno艣ci nauczania
Wprowadzony w 2002 roku system egzamin贸w zewn臋trznych dostarcza obiektywnych danych o
osi膮gni臋ciach szkolnych. Dane te mog膮 by膰 wykorzystywane do oceny efektywno艣ci nauczania.
Jednak by oceny efektywno艣ci nauczania formu艂owane na podstawie wynik贸w egzamin贸w by艂y
adekwatne, nale偶y uwzgl臋dni膰 fakt, 偶e osi膮gni臋cia szkolne ucznia nie zale偶膮 tylko od jako艣ci pracy
szko艂y. Wynik egzaminu jest uwarunkowany trzema grupami czynnik贸w:
1. indywidualnych, takich jak zdolno艣ci i uprzednie osi膮gni臋cia szkolne,
2. spo艂ecznych, takich jak kapita艂 kulturowy i spo艂eczny rodziny czy wp艂yw grupy r贸wie艣niczej,
3. szkolnych, takich jak kwalifikacje i zaanga偶owanie nauczycieli, metody nauczania czy
warunki nauczania.
Je偶eli chcemy przeci臋tny wynik egzaminu dla danej szko艂y interpretowa膰 jako miar臋 efektywno艣ci
nauczania, musimy wytr膮ci膰 z wyniku wp艂yw tych czynnik贸w, kt贸rych szko艂a nie mo偶e skutecznie
kszta艂towa膰. Powy偶szy wykres pozwala prze艣ledzi膰, na jaki b艂膮d nara偶amy si臋 por贸wnuj膮c szko艂y
ze wzgl臋du na nieprzetworzony wynik egzaminu zewn臋trznego.
Wykres 1. Czynniki wp艂ywaj膮ce na wyniki egzaminu a ocena efektywno艣ci nauczania
W hipotetycznym por贸wnaniu na powy偶szym wykresie przewaga szko艂y A nad szko艂膮 B wynika z
bardziej korzystnego uk艂adu czynnik贸w indywidualnych i 艣rodowiskowych. Je偶eli z wyniku
"wyjmiemy" to, co zale偶y od zdolno艣ci i spo艂ecznego 艣rodowiska, ocena musi ulec zmianie - to
szko艂a B lepiej uczy w zakresie sprawdzanym przez egzamin. Metod膮, kt贸ra pozwala tak
przetworzy膰 wyniki egzamin贸w, by wyeliminowa膰, a w ka偶dym razie znacz膮co ograniczy膰 wp艂yw
czynnik贸w indywidualnych i spo艂ecznych, jest edukacyjna warto艣膰 dodana.
1
Poj臋cie edukacyjnej warto艣ci dodanej
Metoda edukacyjnej warto艣ci dodanej (EWD) pozwala w znacznym stopniu "oczyszcza膰" wynik
egzaminacyjny z wp艂ywu czynnik贸w indywidualnych i 艣rodowiskowych, na kt贸re szko艂a nie ma
skutecznego wp艂ywu.
Poj臋cie EWD wywodzi si臋 z ekonomii, gdzie - w pewnym uproszczeniu - warto艣膰 dodana to tyle co,
przyrost warto艣ci d贸br w wyniku danego procesu produkcyjnego. Analogicznie edukacyjn膮 warto艣膰
dodan膮 mo偶na zdefiniowa膰 jako przyrost wiedzy uczni贸w w wyniku danego procesu edukacyjnego.
Prawdopodobnie po raz pierwszy poj臋cie edukacyjnej warto艣ci dodanej pojawi艂o si臋 w po艂owie lat
70. jako krytyczna kontynuacja idei rozliczalno艣ci szk贸艂 (school accountability). Z perspektywy
czasu niekt贸rzy badacze uwa偶aj膮 poj臋cie edukacyjnej warto艣ci dodanej za najwa偶niejsze
narz臋dzie analityczne, jakie w naukach pedagogicznych pojawi艂o si臋 w ostatnich 20 latach
(Schagen, Hutchison 2003).
Og贸lna idea edukacyjnej warto艣ci dodanej by艂a konkretyzowana na wiele sposob贸w. Wydaje si臋,
偶e mo偶na wyr贸偶ni膰 dwa podstawowe rozumienia. Proste rozumienie warto艣ci dodanej odnosi si臋
do idei post臋pu uczni贸w w nauce, czyli uwzgl臋dniania w szacunkach efektywno艣ci szko艂y
pocz膮tkowego stanu osi膮gni臋膰 szkolnych uczni贸w. Rozbudowane rozumienie nie zadawala si臋
kontrol膮 stanu pocz膮tkowego osi膮gni臋膰 i si臋ga do koncepcji wykorzystania zasob贸w, kt贸rymi
dysponuje szko艂a.
Zacznijmy od prostego rozumienia edukacyjnej warto艣ci dodanej (Dolata 2005). Mo偶na wyr贸偶ni膰
dwa typy prostych wskaznik贸w warto艣ci dodanej. Pierwszy typ to wskazniki bezwzgl臋dne.
Wymagaj膮 one, by pomiar osi膮gni臋膰 na r贸偶nych etapach kszta艂cenia by艂 wykonywany za pomoc膮
tych samych skal pomiarowych. Je偶eli na przyk艂ad dysponowaliby艣my skal膮 do pomiaru
rozumienia czytanych tekst贸w, kt贸ra umo偶liwia艂aby pomiar w grupie uczni贸w od I do X klasy, to w
dowolnym momencie tego przedzia艂u mogliby艣my szacowa膰 warto艣膰 dodan膮 w tam zakresie.
Wynikami takich pomiar贸w w Polsce nie dysponujemy.
Drugi typ to wskazniki wzgl臋dne. Je偶eli pomiary osi膮gni臋膰 szkolnych nie s膮 dokonywane na
ujednoliconych skalach, mo偶emy jedynie przyj膮膰, 偶e wynik na egzaminie na ni偶szym szczeblu jest
og贸ln膮 miar膮 potencja艂u edukacyjnego. W nast臋pnym kroku u偶ywamy tej miary jako prognostyka
wyniku na egzaminie kolejnego szczebla. Prognoza ta ma charakter statystyczny i polega - na
przyk艂ad - na oszacowaniu, jaki przeci臋tnie wynik na egzaminie gimnazjalnym uzyskuje ucze艅,
kt贸ry trzy lata wcze艣niej uzyska艂 okre艣lony wynik na sprawdzianie. Faktycznie uzyskany przez
ucznia wynik odnosimy do warto艣ci oczekiwanej i w ten spos贸b otrzymujemy oszacowanie
warto艣ci dodanej na danym szczeblu kszta艂cenia. 艢rednia tak obliczonych wskaznik贸w dla danej
szko艂y jest wskaznikiem efektywno艣ci nauczania w zakresie sprawdzanym przez egzamin.
Wzgl臋dny charakter wskaznika sprawia, 偶e poprawa jako艣ci nauczania jest gr膮 o sumie zerowej:
moja szko艂a mo偶e uzyska膰 wy偶szy wynik mierzony warto艣ci膮 dodan膮 tylko o tyle, o ile inne
szko艂y/szko艂a uzyskaj膮 ni偶sze wyniki. Teoretycznie mo偶e si臋 zdarzy膰, 偶e szko艂a podejmuje
skuteczne dzia艂ania naprawcze, ale wynik w kolejnej edycji egzaminu jest ni偶szy, bo inne szko艂y
postara艂y si臋 bardziej.
Cho膰 w prostych wskaznikach EWD explicite uwzgl臋dnia si臋 tylko uprzednie osi膮gni臋cia szkolne,
to implicite model uwzgl臋dnia te偶 zdolno艣ci i czynniki 艣rodowiskowe. Dzieje si臋 tak, poniewa偶
uprzednie osi膮gni臋cia szkolne s膮 przecie偶 uwarunkowane tymi samymi czynnikami, co wynik
ko艅cowy. Uwzgl臋dnienie wi臋c uprzednich osi膮gni臋膰 oznacza po艣redni膮 kontrol臋 pozosta艂ych
czynnik贸w indywidualnych i czynnik贸w 艣rodowiskowych. Nie jest to jednak kontrola w pe艂ni
efektywna, poniewa偶 czynniki te w dalszym ci膮gu dzia艂aj膮, stanowi膮c wyznaczniki post臋pu.
Przejdzmy do rozbudowanego rozumienia edukacyjnej warto艣ci dodanej. W tym wypadku nie
zadawalamy si臋 tylko informacj膮 o poziomie osi膮gni臋膰 poszczeg贸lnych uczni贸w na progu szko艂y,
ale rozszerzamy horyzont analizy wprowadzaj膮c poj臋cie zasob贸w szko艂y. Rozbudowane
2
rozumienie edukacyjnej warto艣ci dodanej odwo艂uje si臋 do tradycji badawczej znanej pod nazw膮
education production functions a 艂膮czonej z nazwiskiem E. Hanusheka (1986). Schemat
rozumowania przedstawia poni偶szy rysunek.
Rysunek 1. Rozbudowane rozumienie edukacyjnej warto艣ci dodanej
Najwa偶niejsz膮 klasyfikacj膮 zasob贸w jest podzia艂 na zasoby dane i wypracowane. Te pierwsze
rzutuj膮 na ko艅cowy poziom osi膮gni臋膰 szkolnych, ale znajduj膮 si臋 poza kontrol膮 szko艂y (艣rodki
finansowe, infrastruktura) lub nie chcemy, by szko艂a je kontrolowa艂a (kontrola zasob贸w
indywidualnych uczni贸w przez ich selekcj臋 na wej艣ciu). Lista sk艂adnik贸w zasob贸w danych mo偶e
wygl膮da膰 nast臋puj膮co:
佛 Zasoby indywidualne uczni贸w: dotychczasowe osi膮gni臋cia szkolne, kapita艂 kulturowy,
ekonomiczny i spo艂eczny rodziny ucznia.
佛 Zasoby grupowe: osi膮gni臋cia szkolne r贸wie艣nik贸w, ich kapita艂 kulturowy, ekonomiczny i
spo艂eczny, cechy kultury szko艂y determinowane jej sk艂adem spo艂ecznym.
佛 Zasoby instytucjonalne: nak艂ady finansowe, infrastruktura.
Zasoby wypracowane to ca艂o艣膰 praktyk edukacyjnych - wychowawczych i dydaktycznych -
sk艂adaj膮cych si臋 na kultur臋 pedagogiczn膮 szko艂y. Oceniaj膮c efektywno艣膰 szko艂y nale偶y wytr膮ci膰
wp艂yw zasob贸w danych tak, by ko艅cowy poziom osi膮gni臋膰 szkolnych m贸g艂 by膰 tylko przypisany
zasobom wypracowanym. Innymi s艂owy wskaznik efektywno艣ci nauczania w danej szkole (lub dla
danego nauczyciela) powinien by膰 tak skonstruowany, by jego warto艣膰 da艂a si臋 interpretowa膰 jako
osi膮gni臋cia szkolne w sytuacji ca艂kowitej r贸wno艣ci po stronie zasob贸w danych szko艂y.
W polskich realiach jeste艣my w stanie szacowa膰 EWD za pomoc膮 prostych modeli
uwzgl臋dniaj膮cych przede wszystkim uprzednie osi膮gni臋cia ucznia. Tworzenie rozbudowanych
modeli szacowania EWD jest - przynajmniej na razie - niemo偶liwe z powodu braku potrzebnych,
wysokiej jako艣ci danych.
Po co nam edukacyjna warto艣膰 dodana?
Metoda edukacyjnej warto艣ci dodanej jest narz臋dziem polityki o艣wiatowej. Mo偶e by膰 rozpatrywana
w og贸lnym kontek艣cie polityki poprawiania jako艣ci o艣wiaty przez mechanizmy rozliczania szko艂y na
podstawie wymiernych wskaznik贸w oraz w bardziej swoistym otoczeniu problem贸w pojawiaj膮cych
si臋 wsz臋dzie tam, gdzie tworzy si臋 rynek us艂ug edukacyjnych i szko艂y zaczynaj膮 ze sob膮
konkurowa膰 o uczni贸w. Zanim przejdziemy do dyskusji nad skuteczno艣ci膮 EWD jako narz臋dzia
polityki o艣wiatowej, przypatrzmy si臋 procesom maj膮cym miejsce w polskiej o艣wiacie.
Osi膮gni臋ciu jakich cel贸w mo偶e s艂u偶y膰 metoda edukacyjnej warto艣ci dodanej? Mo偶na wskaza膰 na
trzy cele:
1. Wyparcie z przestrzeni publicznej wynik贸w surowych jako jedynej miary jako艣ci nauczania.
2. Aagodzenie negatywnych skutk贸w konkurencji mi臋dzy szko艂ami, czyli przeciwdzia艂anie selekcji
3
na progu szko艂y i efektowi zwanemu "spijaniem 艣mietanki".
3. Zmniejszenie poczucia ci膮g艂ej frustracji dobrych nauczycieli pracuj膮cych w trudnych
艣rodowiskach oraz "odci臋cie" s艂abych nauczycieli od obronnej interpretacji niepowodze艅 typu "ale
z kim ja musz臋 pracowa膰".
Cele te s膮 z sob膮 powi膮zane, ale dla uporz膮dkowania wywodu om贸wione zostan膮 oddzielnie.
S艂abo艣膰 polskiej polityki o艣wiatowej sprawia, 偶e rozwa偶ania poni偶sze maj膮 charakter hipotetyczny.
Cel贸w powy偶szych nie znajdziemy w 偶adnych oficjalnych dokumentach. Mo偶na jedynie
domniema膰, 偶e s膮 one dla polityk贸w potencjalnie wa偶ne.
Wyparcie z przestrzeni publicznej wynik贸w surowych jako jedynej miary
jako艣ci nauczania
Ka偶da dojrza艂a polityka doskonalenia o艣wiaty musi wykorzystywa膰 zestaw dobrze zdefiniowanych
wskaznik贸w jako艣ci. Niekt贸re z nich b臋d膮 mia艂y charakter zewn臋trzny oraz ilo艣ciowy i
wykorzystywa膰 wyniki obiektywnych pomiar贸w, inne b臋d膮 mia艂y charakter wewn臋trzny oraz
jako艣ciowy i bazowa膰 na ca艂o艣ciowych, popartych g艂臋bszym wgl膮dem w praktyki edukacyjne danej
szko艂y metodach diagnozy. System egzaminacyjny dostarcza obiektywnych danych ilo艣ciowych o
poziomie osi膮gni臋膰 uczni贸w. Waga tych informacji egzaminacyjnych z perspektywy mechanizm贸w
ewaluacji zewn臋trznej szko艂y ro艣nie. Coraz cz臋艣ciej 艣redni wynik szko艂y uzyskany na egzaminie
staje si臋 kryterium jej oceny przez otoczenie spo艂eczne. Presja na wysokie wyniki ro艣nie.
W poprzednich podrozdzia艂ach wskazano, 偶e traktowanie 艣redniego wyniku szko艂y jako miary
efektywno艣ci nauczania jest b艂臋dem. Poniewa偶 wyniki zale偶膮 r贸wnie偶 od czynnik贸w, kt贸re s膮 poza
kontrol膮 szko艂y, u偶ywanie nieprzetworzonych wynik贸w jako miary efektywno艣ci musi prowadzi膰 do
nieadekwatnych ocen. Je偶eli system o艣wiaty chce skutecznie przeciwdzia艂a膰 stosowaniu tej
nieadekwatnej miary, musi zaproponowa膰 lepsz膮 alternatyw臋. Nie wystarcza komentarz do
wynik贸w egzamin贸w przestrzegaj膮cy przed pochopnym ich wykorzystywaniem do oceny szko艂y
bez rozpoznania kontekst贸w kszta艂cenia. Nale偶y zaproponowa膰 realn膮 alternatyw臋. Edukacyjna
warto艣膰 dodana jest takim rozwi膮zaniem. EWD jest oczywi艣cie niedoskona艂膮, ale zdecydowanie
bardziej warto艣ciow膮 metod膮 oceny efektywno艣ci nauczania. Tylko wprowadzenie do obiegu
informacyjnego konkurencyjnego miernika jako艣ci pozwoli formu艂owa膰 bardziej dojrza艂e oceny i
podejmowa膰 bardziej racjonalne decyzje o艣wiatowe.
Wprowadzenie EWD do zestawu ilo艣ciowych wskaznik贸w jako艣ci pracy szko艂y tworzy szans臋
bardziej celnego ukierunkowania presji, jakiej poddawana jest szko艂a pod wp艂ywem wynik贸w
egzamin贸w zewn臋trznych. Oczywi艣cie jest to tylko szansa, nie mamy 偶adnych gwarancji sukcesu.
EWD realnie zacznie wp艂ywa膰 na o艣wiat臋, gdy b臋dzie kompetentnie wykorzystywane przez
nauczycieli i dyrektor贸w, nadz贸r pedagogiczny, organy prowadz膮ce, media oraz rodzic贸w. To
pokazuje skal臋 niezb臋dnego wysi艂ku szkoleniowego i popularyzatorskiego.
Aagodzenie negatywnych skutk贸w konkurencji mi臋dzy szko艂ami
Badania nad funkcjonowaniem system贸w o艣wiatowych, w kt贸rych szko艂y rywalizuj膮 o uczni贸w i s膮
finansowane zale偶nie od ich liczby (tzw. quasi-rynkowe mechanizmy w o艣wiacie) wskazuj膮, 偶e
poza ewentualnymi korzy艣ciami p艂yn膮cymi z tych rozwi膮za艅, pojawiaj膮 si臋 zagro偶enia. Najcz臋艣ciej
wskazuje si臋 na silne r贸偶nicowanie si臋 systemu szk贸艂. R贸偶nice mi臋dzy szko艂ami zwi臋kszaj膮 si臋.
Najs艂absze - z punktu widzenia wynik贸w uczni贸w na egzaminach ko艅cowych - szko艂y nie s膮
eliminowane, ale z r贸偶nych powod贸w z coraz mniejsz膮 liczb膮 uczni贸w trwaj膮 na rynku. Najlepsze
plac贸wki, wykorzystuj膮c mechanizm zwany przez Anglosas贸w "spijaniem 艣mietanki", umacniaj膮
swoje pozycje. R贸偶nicowanie to owocuje nasileniem segregacji spo艂ecznych w o艣wiacie i zagra偶a
wa偶nemu celowi polityki o艣wiatowej jakim jest r贸wno艣膰 szans edukacyjnych (por. Ball 1993,
4
Gorard, Fitz 2000, Dolata 2002).
Czy w polskim systemie o艣wiaty zachodz膮 takie procesy? Cho膰 w 偶adnych oficjalnych
dokumentach nie znajdziemy deklaracji wprowadzania mechanizm贸w rynkowych do o艣wiaty, to
zjawisko takie zachodzi. Ni偶 demograficzny oraz liberalizacja zasady rejonizacji, szczeg贸lnie w
du偶ych miastach, doprowadzi艂y do uruchomienia konkurencji. Prowadzi to do silnego r贸偶nicowania
si臋 szk贸艂. W du偶ych miastach gimnazja coraz bardziej si臋 polaryzuj膮, r贸偶nice w wynikach
egzamin贸w mi臋dzy szko艂ami rosn膮.
Opisywany proces r贸偶nicowania szk贸艂 wymaga reakcji. Je偶eli zrezygnujemy z restrykcyjnych
narz臋dzi polityki nakazowej - a wydaje si臋, 偶e ten spos贸b uprawiania polityki o艣wiatowej ma
dostatecznie du偶o skutk贸w ubocznych, by go porzuci膰 - parametryczne zarz膮dzanie z u偶yciem
wskaznik贸w edukacyjnej warto艣ci dodanej wydaje si臋 potencjalnie skutecznym instrumentem
os艂abiania proces贸w r贸偶nicowania o艣wiaty i realizacji postulatu dzia艂a艅 na rzecz sp贸jno艣ci
spo艂ecznej. Ocena szko艂y na podstawie edukacyjnej warto艣ci dodanej powinna zmniejszy膰 nacisk
na selekcj臋 na wej艣ciu do szko艂y, za艣 ocena nauczycieli wed艂ug tej miary powinna podnie艣膰
atrakcyjno艣膰 pracy w szko艂ach pracuj膮cych w mniej korzystnych warunkach spo艂ecznych.
Oczywi艣cie EWD z pewno艣ci膮 nie zahamuje w kr贸tkiej perspektywie czasowej segregacji
spo艂ecznych i ekonomicznych w skali makrospo艂ecznej, ale w d艂u偶szej perspektywie mo偶e
przyczyni膰 si臋 do rewitalizacji szk贸艂 pracuj膮cych w spo艂ecznych gettach.
Zmniejszenie poczucia ci膮g艂ej frustracji dobrych nauczycieli pracuj膮cych w
trudnych 艣rodowiskach oraz "odci臋cie" s艂abych nauczycieli od obronnej
interpretacji niepowodze艅 typu "ale z kim ja musz臋 pracowa膰"
Znaczne zr贸偶nicowanie cywilizacyjne Polski, silna segregacja ekonomiczna i id膮ce za tym
zr贸偶nicowanie sk艂adu spo艂ecznego szk贸艂 sprawia, 偶e du偶e grupy nauczycieli pracuj膮 w trudnych
艣rodowiskach spo艂ecznych. Wprowadzenie egzamin贸w zewn臋trznych unaoczni艂o r贸偶nice w
wynikach ko艅cowych szk贸艂. Z pewno艣ci膮 istotnym problemem psychologicznym jest w艂膮czenie
tych wynik贸w w swoisty rachunek sukces贸w i pora偶ek decyduj膮cy o tym, czy nauczyciel
spostrzega swoj膮 prac臋 jako satysfakcjonuj膮c膮. Je偶eli dobry nauczyciel pracuj膮cy w trudnym
艣rodowisku przez kolejne lata dostawa艂 informacj臋 zwrotn膮, 偶e jego uczniowie marnie wypadali na
egzaminach, to z pewno艣ci膮 poczucie satysfakcji - jeden z wa偶nych czynnik贸w zawodowej
efektywno艣ci - musia艂o na tym cierpie膰. Edukacyjna warto艣膰 dodana mo偶e zmieni膰 ten stan rzeczy.
By膰 mo偶e wielu dobrych nauczycieli po raz pierwszy, od kiedy zaistnia艂y egzaminy zewn臋trzne,
otrzyma jednoznaczny komunikat - Dobrze pracuj臋, osi膮gni臋cia moich uczni贸w s膮 na miar臋 ich
mo偶liwo艣ci, wyniki jakie uzyskuj臋 s膮 lepszy, ni偶 innych nauczycieli pracuj膮cych w podobnych
warunkach.
Z drugiej strony s艂aby nauczyciel, kt贸rego uczniowie uzyskuj膮 wyniki poni偶ej ich mo偶liwo艣ci, czyli
edukacyjna dodana jest niska, nie b臋d膮 mogli si臋ga膰 po proste wyja艣nienie - No tak, moi
uczniowie s膮 s艂abi. Nikt by z nimi wi臋cej nie uzyska艂. Odci臋cie od takiego obronnego t艂umaczenia
niskich wynik贸w uczni贸w mo偶e uruchomi膰 zdrow膮 konkurencj臋 i pr贸b臋 poprawy wynik贸w.
R贸wnocze艣nie EWD da mocny argument tym, kt贸rzy nauczycieli oceniaj膮.
Czy edukacyjna warto艣膰 dodana jest niezawodnym panaceum?
Krytyczne argumenty formu艂owane wobec EWD dobrze mo偶na pozna膰 艣ledz膮c dyskusj臋
prowadzon膮 w USA zwi膮zan膮 z jednym z najbardziej rozbudowanych system贸w warto艣ci dodanej
a mianowicie Tennessee Value-Added Assessment System (TVAAS). Za g艂贸wnego tw贸rc臋
systemu uwa偶any jest W. Sanders, statystyk zwi膮zany z naukami rolniczymi. Sanders opracowa艂
metod臋, kt贸ra ideowo pokrewna jest innymi sposobami szacowania warto艣ci dodanej. Autor przyj膮艂
5
za艂o偶enie, 偶e mo偶na oddzieli膰 wp艂yw czynnik贸w pozaszkolnych od wp艂ywu jako艣ci nauczania
艣ledz膮c indywidualne wzory wykonania przez uczni贸w standaryzowanych test贸w osi膮gni臋膰
szkolnych . Na przyk艂ad, je偶eli dany ucze艅 przez kilka kolejnych lat otrzymywa艂a na testach raczej
s艂abe wyniki w okolicy 30 centyla, (skala centylowa informuje nas, jaki procent uczni贸w uzyska艂o
wynik s艂abszy od danego; w tym wypadku 30% uczni贸w wypad艂o s艂abiej, czyli 70% lepiej), by nagle
skoczy膰 do 60 centyla, i ta gwa艂towna zmiana pokrywa si臋 ze zmian膮 nauczyciela, to przyrost ten
mo偶na przypisa膰 efektywno艣ci nauczania.
Nie wdaj膮c si臋 w szczeg贸艂y statystyczne mo偶na powiedzie膰, 偶e w TVAAS oszacowanie warto艣ci
dodanej dokonywane jest na podstawie odchyle艅 od indywidualnych wzor贸w wykonania przez
uczni贸w standaryzowanych test贸w osi膮gni臋膰 szkolnych: odst臋pstwa in plus lub in minus od wzoru
s膮 przepisywane efektywno艣ci nauczyciela (oczywi艣cie taki z艂o偶ony system szacowania EWD
mo偶e istnie膰 tylko wtedy, gdy uczniowie dostatecznie cz臋sto s膮 oceniani przy pomocy
standaryzowanych test贸w - to za艂o偶enie spe艂nione jest w USA).
Na podstawie dokonanych analiz Sanders i wsp贸艂pracownicy doszli do wniosku, 偶e problem
nier贸wno艣ci edukacyjnych da si臋 rozwi膮za膰 metodami czysto edukacyjnymi. Rozumowanie ich
by艂o nast臋puj膮ce. Je偶eli r贸偶nica w przeci臋tnych osi膮gni臋ciach szkolnych mi臋dzy dwoma grupami
spo艂ecznymi, na przyk艂ad grupami uczni贸w z ni偶szej i 艣redniej klasy spo艂ecznej, wynosi 25
punkt贸w testowych, a r贸偶nica mi臋dzy efektywno艣ci膮 nauczycieli o przeci臋tnej efektywno艣ci (50
centyl) i efektywno艣ci wysokiej (np. 90 centyl) wynosi r贸wnie偶 25 punkt贸w testowych, to strategia
kompensacyjna jest bardzo prosta: nale偶y efektywno艣膰 nauczycieli pracuj膮cymi z uczniami z
ni偶szej klasy spo艂ecznej (zak艂adamy, 偶e na wyj艣ciu jest to efektywno艣膰 przeci臋tna,
charakterystyczna dla 50 centyla) podnie艣膰 do poziomu efektywno艣ci charakterystycznego dla 90
centyla. Ten skok efektywno艣ci prze艂o偶y si臋 na zniesienie obserwowanej nier贸wno艣ci edukacyjnej.
Wyobrazmy sobie, 偶e informacje o efektywno艣ci poszczeg贸lnych nauczycieli i przeci臋tnej
efektywno艣ci danej szko艂y s膮 upubliczniane a rodzice zach臋cani do ich wykorzystywania przy
wyborze szko艂y. W takiej sytuacji nale偶a艂oby si臋 spodziewa膰 odp艂ywu uczni贸w z klas i szk贸艂 o
ni偶szej efektywno艣ci do nauczycieli i plac贸wek o wy偶szej efektywno艣ci, co prze艂o偶y si臋 na wzrost
osi膮gni臋膰 ca艂ej populacji. Je偶eli odp艂yw ten dodatkowo uruchomi艂by rywalizacj臋, a wi臋c
doprowadzi艂by do wzrostu zaanga偶owania i podwy偶szenia kwalifikacji przez s艂abszych nauczycieli,
to - w po艂膮czeniu z bonusem mniej licznych klas (efekt odp艂ywu) - mog艂oby to zaowocowa膰
wzrostem efektywno艣ci i odzyskiwaniem rynku przez szko艂y, w kt贸rych notowano odp艂yw uczni贸w.
Przeciw trafno艣ci tego typu argumentacji mo偶na wysun膮膰 wiele argument贸w. R. Rothstein (2004)
zwraca uwag臋 na kilka istotnych problem贸w. Po pierwsze, TVAAS pos艂uguj膮c si臋 poj臋ciem
efektywno艣ci ufundowanym na metodzie warto艣ci dodanej nie dostarcza informacji, jakie praktyki
edukacyjne za t臋 efektywno艣膰 odpowiadaj膮. Efektywno艣膰 to wysokie wyniki w testach, wysokie
wyniki w testach to efektywno艣膰. Co zmieni膰 w swoim dzia艂aniu, by podnie艣膰 sw膮 efektywno艣膰? To
pytanie pozostaje bez odpowiedzi, a nauczycielom pozostaje dzia艂a膰 zgodnie z najprostsz膮 regu艂膮:
je偶eli 10 godzin metody A nie przynosi po偶膮danych wynik贸w, zastosuj臋 . 20 godzin metody A.
Cytowany Rothstein twierdzi, 偶e wiara w mo偶liwo艣膰 dokonania w kr贸tkim czasie znacz膮cego
post臋pu w umiej臋tno艣ciach nauczycieli jest kompletnie nierealistyczna. Naukom pedagogicznym
bardzo daleko do dokonania prze艂omowych odkry膰 w tym zakresie i nie ma 偶adnych podstaw by
wierzy膰, 偶e mo偶na w zakresie efektywno艣ci uzyskiwa膰 spektakularne zmiany w kr贸tkim czasie.
Oczywi艣cie mo偶na twierdzi膰, 偶e post臋p mo偶na dokona膰 przez eliminacj臋 nieefektywnych
nauczycieli i szk贸艂, ale ile偶 szk贸艂 mo偶emy zlikwidowa膰, ilu nauczyciel zwolni膰? Lepsze szko艂y maj膮
sko艅czone zasoby i ich mo偶liwo艣ci absorpcji uczni贸w z gorszych szk贸艂 szybko si臋 wyczerpi膮. A
jaki mechanizm zapewni, 偶e nowe szko艂y, nowi nauczyciele b臋d膮 znacz膮co lepsi, od tych kt贸rych
mechanizm rywalizacji wyrzuci z rynku? Od mieszania herbata robi si臋 s艂odsza tylko wtedy, gdy
przedtem dosypiemy cukru.
Po drugie, i ten argument wydaje si臋 najwa偶niejszy, TVAAS - jak i inne metody szacowania
6
warto艣ci dodanej - opiera si臋 na za艂o偶eniu, 偶e nie ma interakcji mi臋dzy kapita艂em kulturowym
ucznia a skuteczno艣ci膮 r贸偶nych sposob贸w nauczania. Je偶eli co艣 jest dobre dla ucznia X, dobre
b臋dzie dla wszystkich uczni贸w, je偶eli co艣 przynosi owoce w klasie IIIa, to b臋dzie efektywne dla
wszystkich klas. Za艂o偶enie to jest w najwy偶szym stopniu w膮tpliwe. Istnieje wiele dowod贸w na rzecz
hipotezy zgodno艣ci kulturowej, kt贸ra m贸wi, 偶e nauczanie szkolne jest najbardziej efektywne wtedy,
gdy metody oddzia艂ywania stosowane przez nauczyciela s膮 zgodne z wzorcami uczenia si臋
znanymi dziecku z do艣wiadcze艅 kulturowych (Vasta, Haith, Miller 1995). Je偶eli hipoteza zgodno艣ci
kulturowej jest trafna, to zmiana szko艂y przez dziecko z rodziny o innych wzorcach kulturowych ni偶
preferowane w nowej, "bardziej efektywnej" plac贸wki, wcale nie musi przynie艣膰 podwy偶szenia jego
osi膮gni臋膰.
Z powy偶szych rozwa偶a艅 wyraznie wida膰, 偶e EWD nie jest 偶adnym doskona艂ym panaceum na
problemy wsp贸艂czesnej o艣wiaty. Racjonalnie zbudowane wskazniki jako艣ci pracy szko艂y
stosowane przez nadz贸r pedagogiczny mog膮 uruchomi膰 procesy poprawy efektywno艣ci
nauczania. Jednak bez wiedzy nauczycieli, jak skutecznie naucza膰, mo偶e okaza膰 si臋 to
niemo偶liwe. Ocena szk贸艂 ze wzgl臋du na EWD mo偶e os艂abi膰 negatywne skutki rywalizacji mi臋dzy
szko艂ami, ale mo偶e si臋 okaza膰 narz臋dziem zbyt s艂abym.
Zastosowanie edukacyjnej warto艣ci dodanej do oceny efektywno艣ci nauczania w
gimnazjum
W latach 2005-2007 przy Centralnej Komisji Egzaminacyjnej pracowa艂 zesp贸艂 metodologiczny,
kt贸rego zadaniem by艂o przetestowanie metody edukacyjnej warto艣ci dodanej w realiach polskiego
systemu o艣wiaty. W wyniku prac zespo艂u:
- powsta艂 model szacowania EWD dla gimnazj贸w: model zosta艂 doprowadzony do fazy pilota偶u,
przeszkolono du偶e grupy potencjalnych u偶ytkownik贸w;
- zaproponowano alternatywne modele szacowania EWD dla szk贸艂 maturalnych: prace
doprowadzono do fazy symulacyjnego testowania i badania trafno艣ci metody;
- przeanalizowano mo偶liwo艣ci szacowania EWD dla szk贸艂 podstawowych.
Na lata 2007-2013 planowane s膮 prace nad rozwojem metody EWD w Polsce.
W tym tek艣cie skupimy si臋 na najbardziej zawansowanych pracach nad EWD dla gimnazj贸w.
Og贸ln膮 logik臋 szacowania EWD dla gimnazj贸w pokazuje poni偶szy schemat post臋powania:
佛 Na podstawie wyniku ucznia na sprawdzianie szacujemy wynik przewidywany na
egzaminie gimnazjalnym.
佛 Obliczamy r贸偶nic臋 - tzw. reszt臋 - mi臋dzy faktycznym wynikiem ucznia na egzaminie a jego
wynikiem przewidywanym.
佛 Obliczamy 艣redni膮 reszt, czyli EWD dla szko艂y.
佛 Szacujemy przedzia艂 ufno艣ci dla EWD.
Opisz臋 te kroki, a nast臋pnie przedstawi臋 najwa偶niejsze problemy zwi膮zane z szacowaniem EWD:
I. Wynik przewidywany
W uproszczeniu wynik przewidywany mo偶na rozumie膰 jako u艣redniony wynik na egzaminie
gimnazjalnym grupy uczni贸w o tym samym wyniku na sprawdzianie po szkole podstawowej. W
rzeczywisto艣ci model jest bardziej z艂o偶ony, bo wynik przewidywany okre艣lamy za pomoc膮 takiej
zale偶no艣ci funkcyjnej, jaka najlepiej odpowiada rzeczywistym danym uzyskanym na poziomie
kraju, a otrzyman膮 warto艣膰 korygujemy o wp艂yw takich czynnik贸w jak p艂e膰 i dysleksja. Wynik
przewidywany jest szacowany na podstawie zale偶no艣ci mi臋dzy wynikami sprawdzianu a egzaminu
gimnazjalnego dla wszystkich trzecioklasist贸w w kraju.
7
Wynik przewidywany na egzaminie gimnazjalnym uczni贸w na podstawie ich wynik贸w ze
sprawdzianu szacujemy metod膮 regresji. Jest to typowa metoda stosowana w statystyce do oceny
zale偶no艣ci mi臋dzy zmiennymi (w tym przypadku wynikami egzaminu gimnazjalnego oraz
sprawdzianu), kt贸r膮 mo偶na uj膮膰 w postaci funkcji.
Spos贸b wyznaczania warto艣ci przewidywanych prze艣ledzmy na przyk艂adzie danych ze
sprawdzianu 2002 i egzaminu gimnazjalnego w cz臋艣ci matematyczno-przyrodniczej w roku 2005.
Analiza taka jest mo偶liwa, gdy dla ka偶dego ucznia mamy informacje zar贸wno o wyniku
sprawdzianu jak i wyniku egzaminu. Przy aktualnym stanie egzaminacyjnego systemu
informatycznego 艂膮czenie danych z r贸偶nych egzamin贸w dla uczni贸w jest trudne. Pokonanie tej
przeszkody technicznej jest jednym z warunk贸w rozwoju metody EWD.
Wykres 2. Zale偶no艣膰 mi臋dzy wynikami na sprawdzianie 2002 a wynikami tych samych uczni贸w 3 lata
p贸zniej na egzaminie gimnazjalnym w cz臋艣ci matematyczno-przyrodniczej
Na powy偶szym wykresie widzimy kszta艂t zale偶no艣ci mi臋dzy analizowanymi egzaminami. Ma艂e
punkty na wykresie reprezentuj膮 uczni贸w. Po艂o偶enie punktu na wykresie zale偶y od wyniku na
sprawdzianie (o艣 pozioma) i od wyniku na egzaminie gimnazjalnym (o艣 pionowa). Na wykresie
zaznaczono lini臋, kt贸ra najlepiej odzwierciedla kszta艂t zwi膮zku mi臋dzy wynikami. To, jaki b臋dzie
mia艂a kszta艂t, zale偶y od tego, z jakiego rodzaju zale偶no艣ci膮 mi臋dzy wynikami sprawdzianu a
egzaminu gimnazjalnego b臋dziemy mieli do czynienia w danym roku. W kolejnych latach kszta艂t
zale偶no艣ci mo偶e by膰 nieco inny. Linia ta pozwala wyznacza膰 wyniki przewidywane. Mo偶na
powiedzie膰, 偶e linia na wykresie - zwana lini膮 regresji - pozwala w sensie statystycznym
przewidywa膰 wyniki egzaminu gimnazjalnego w zale偶no艣ci od wyniku ucznia na sprawdzianie.
Pojedyncze punkty prezentuj膮ce wyniki poszczeg贸lnych uczni贸w w wi臋kszo艣ci le偶膮 poza lini膮
regresji, a wi臋c r贸偶ni膮 si臋 od przewidywanych warto艣ci. Jest to naturalne i wynika zar贸wno z r贸偶nej
efektywno艣ci nauczania - co oczywi艣cie nas tu najbardziej interesuje - jak i innych czynnik贸w
odpowiedzialnych za wynik testowania, w tym czynnika losowego zwi膮zanego z b艂臋dem pomiaru.
Na podstawie linii regresji wyznaczamy wynik przewidywany egzaminu gimnazjalnego dla uczni贸w
o danym wyniku na sprawdzianie. Na przyk艂ad, je偶eli interesuje nas wynik przewidywany dla
uczni贸w, kt贸rzy na sprawdzanie uzyskali 20 pkt, z wykresu odczytujemy, 偶e wynikowi temu
odpowiada 15 pkt na egzaminie gimnazjalnym w cz臋艣ci matematyczno-przyrodniczej. W praktyce
wynik ten odczytywa膰 b臋dziemy ze specjalnych tabel, jednak wykres w dobry spos贸b pokazuje
sk膮d bierzemy te warto艣ci.
Podstawowym problemem przy wyznaczaniu linii regresji jest wyb贸r postaci funkcyjnej r贸wnania
8
regresji. Wyniki egzaminu tylko w cz臋艣ci humanistycznej pozwalaj膮 opisa膰 zale偶no艣膰 z wynikami
sprawdzianu funkcj膮 prostoliniow膮. W cz臋艣ci matematyczno-przyrodniczej i dla sumy z obu cz臋艣ci
egzaminu trzeba uwzgl臋dni膰 krzywoliniow膮 zale偶no艣膰 mi臋dzy wynikami egzaminu a
sprawdzianem. Przyj臋te kryterium wyboru zale偶no艣ci funkcyjnej odpowiada zasadzie, 偶e EWD
powinna by膰 w pe艂ni neutralna wzgl臋dem potencja艂u uczni贸w z jakimi pracuj膮 szko艂y. Z tego
wzgl臋du niezale偶nie od poziomu wynik贸w sprawdzianu 艣rednia reszt (r贸偶nic mi臋dzy wynikami
uzyskanymi a oczekiwanymi) powinna by膰 bliska zeru, dzi臋ki czemu szko艂y nie b臋d膮 "nagradzane"
lub "karane" ze wzgl臋du na potencja艂 uczni贸w. Inaczej m贸wi膮c, EWD jest w skali ca艂ego kraju takie
same dla uczni贸w o niskich wynikach ze sprawdzianu, jak i dla uczni贸w o wynikach bardzo
wysokich. Dla EWD w cz臋艣ci humanistycznej egzaminu ilustruje to poni偶szy wykres.
Wykres 3. Wynik na sprawdzanie a EWD w cz臋艣ci humanistycznej egzaminu gimnazjalnego. Dane dla
ca艂ego kraju, sprawdzian 2002- GH 2006
Wykres pokazuje, 偶e obserwujemy zaniedbywanie ma艂e odst臋pstwa od warunku neutralno艣ci
EWD.
W szacowaniu wyniku przewidywanego dodatkowo brane s膮 pod uwag臋 tzw. zmienne kontrolne.
W przyj臋tym dla gimnazjum modelu wykorzystywane s膮 informacje o dysleksji i p艂ci. Zmienne te s膮
dost臋pne w bazie danych egzaminacyjnych, a r贸wnocze艣nie s膮 powi膮zane z wynikami
egzamin贸w. Potrzeb臋 u偶ycia zmiennych kontrolnych rozwa偶my na nast臋puj膮cym przyk艂adzie. W
cz臋艣ci humanistycznej w skali kraju lepiej wypadaj膮 dziewcz臋ta. Gdyby艣my nie wzi臋li tego pod
uwag臋 w modelu szacowania EWD, to szko艂a z siln膮 przewag膮 liczby ch艂opc贸w by艂aby tak samo
traktowana w obliczeniach, jak szko艂a z przewag膮 dziewcz膮t. Wprowadzenie do modelu zmiennej
p艂ci pozwala nam por贸wnywa膰 szko艂y, bior膮c pod uwag臋 t臋 cech臋. W ten spos贸b np. szko艂y
偶e艅skie b臋d膮 por贸wnywane z innymi szko艂ami 偶e艅skimi. M贸wi膮c w skr贸cie, zmienne kontrolne
pozwalaj膮 bardziej adekwatnie wyznacza膰 EWD.
II. Reszty
Kolejnym wa偶nym poj臋ciem a r贸wnocze艣nie etapem w obliczaniu EWD jest wspomniana ju偶 reszta
z r贸wnania regresji. Reszta w j臋zyku statystyki oznacza r贸偶nic臋 mi臋dzy warto艣ci膮 faktyczn膮 a
warto艣ci膮 przewidywan膮 na podstawie r贸wnania regresji. W metodzie EWD reszta to r贸偶nica
9
mi臋dzy realnym wynikiem ucznia na egzaminie gimnazjalnym a warto艣ci膮 oczekiwan膮 obliczon膮
na podstawie wyniku na sprawdzianie i warto艣ci zmiennych kontrolnych - p艂ci i dysleksji.
Czym jest reszta, 艂atwo zrozumiemy, gdy wr贸cimy do wykresu 4, kt贸ry ilustrowa艂 obliczanie wyniku
przewidywanego. Przypomnijmy, punkty reprezentuj膮 uczni贸w. Je偶eli jaki艣 punkt znajduje si臋
ponad lini膮 wyniku przewidywanego, reszta jest dodania. Oznacza to, 偶e wynik ucznia na
egzaminie gimnazjalnym jest wy偶szy ni偶 oszacowany, przeci臋tny wynik uzyskany w kraju przez
uczni贸w o tym samym wyniku na sprawdzianie oraz warto艣ci zmiennych kontrolnych. Je偶eli reszta
dla ucznia A wynosi 10 pkt. oznacza to, 偶e na egzaminie gimnazjalnym uzyska艂 o tyle punkt贸w
wi臋cej, ni偶 艣rednio uczniowie o tych samych cechach: wynik na sprawdzianie, dysleksja, p艂e膰.
Je偶eli jaki艣 punkt znajduje si臋 poni偶ej linii wyniku przewidywanego, reszta jest ujemna. Oznacza
to, 偶e wynik ucznia na egzaminie gimnazjalnym jest ni偶szy ni偶 przeci臋tny wynik uzyskany przez
uczni贸w o tych samych cechach. Je偶eli reszta dla ucznia B wynosi -10 pkt. oznacza to, 偶e na
egzaminie gimnazjalnym uzyska艂 o tyle punkt贸w mniej, ni偶 艣rednio r贸wie艣nicy w kraju o tym
samym wyniku na sprawdzianie, dysleksji, p艂ci.
Jak interpretowa膰 warto艣膰 reszty? Na warto艣膰 reszty wp艂ywaj膮 ro偶ne czynniki. Mog膮 to by膰:
- czynniki motywacyjne - wzrost motywacji w por贸wnaniu z ko艅cem szko艂y podstawowej mo偶e da膰
relatywnie wy偶szy wynik,
- czynniki 艣rodowiskowe - poprawa sytuacji materialnej rodziny pozwala na wi臋ksze inwestycje w
edukacj臋 dziecka,
- czynniki biologiczne - zmienne tempo dojrzewania i rozwoju umys艂owego,
- czynniki sytuacyjne czy losowe - lepsze samopoczucie w trakcie pisania testu, wi臋cej szcz臋艣cia
w wskazywaniu poprawnych odpowiedzi w zadaniach zamkni臋tych.
Dla nas jednak najwa偶niejszy jest czynnik zwi膮zany z efektywno艣ci膮 nauczania - za cz臋艣膰 warto艣ci
wskaznika resztowego odpowiada szko艂a i jej efektywno艣膰 nauczania.
Poniewa偶 reszta jest warto艣ci膮 nieprecyzyjn膮, nie nale偶y jej wykorzystywa膰 jako indywidualnej
miary edukacyjnych post臋p贸w ucznia w gimnazjum. Reszty nale偶y u偶ywa膰 jedynie do
analizowania EWD szko艂y lub innej badanej grupy.
III. Wskaznik edukacyjnej warto艣ci dodanej
EWD obliczamy u艣redniaj膮c reszty dla danej szko艂y (lub innej analizowanej grupy uczni贸w np.
klasy, grupy uczni贸w doje偶d偶aj膮cych i niedoje偶d偶aj膮cych itp.). 艢redni膮 t臋 interpretujemy jako
miar臋 efektywno艣ci nauczania w danej szkole lub grupie uczni贸w.
Warto jeszcze raz podkre艣li膰, 偶e EWD szko艂y szacujemy na podstawie reszt wszystkich uczni贸w
danej szko艂y. Przyk艂adowo, niekt贸rzy z nich mog膮 mie膰 reszty ujemne, jednak je艣li wi臋kszo艣膰 ma
reszty dodatnie, to EWD szko艂y b臋dzie tak偶e dodatnia. Obrazowo, je艣li wi臋kszo艣膰 uczni贸w b臋dzie
le偶e膰 nad lini膮 regresji, to szko艂a ma dodatni膮 EWD (wi臋kszo艣膰 uczni贸w uzyskuje wyniki wy偶sze
ni偶 oczekiwane dla przeci臋tnego ucznia w Polsce o podobnym wyniku ze sprawdzianu). Im dalej
nad krzyw膮 le偶y wi臋kszo艣膰 uczni贸w szko艂y, tym wy偶sza jej EWD. Je艣li wi臋kszo艣膰 le偶y pod krzyw膮,
to EWD b臋dzie ujemna (wi臋kszo艣膰 uczni贸w uzyska艂a wyniki poni偶ej oczekiwanego).
Trzeba pami臋ta膰, 偶e 艣rednia reszt wynosi dla wszystkich uczni贸w w kraju zero. EWD jest wi臋c
miar膮 wzgl臋dn膮 - cz臋艣膰 szk贸艂 b臋dzie mia艂a dodatni膮 EWD i podobna liczba - ujemn膮 EWD. Miara
ta pozwala na por贸wnanie szk贸艂 mi臋dzy sob膮 w skali kraju.
EWD dla szko艂y wyra偶ona jest w jednostkach, w kt贸rych odbywa si臋 pomiar na egzaminie
gimnazjalnym, czyli w punktach egzaminacyjnych. Je偶eli w szkole EWD wynosi +3,5 pkt oznacza
to, 偶e uczniowie w tej plac贸wce uzyskali 艣rednio o tyle punkt贸w wi臋cej na egzaminie gimnazjalnym
w por贸wnaniu ze szko艂ami o analogicznym sk艂adzie ze wzgl臋du na wyniki na sprawdzianie, p艂e膰 i
dysleksj臋 w ca艂ym kraju. Natomiast je偶eli w szkole EWD wynosi na przyk艂ad -2,3 pkt oznacza to,
偶e 艣rednio uczniowie uzyskali o tyle punkt贸w mniej na egzaminie gimnazjalnym w por贸wnaniu ze
10
plac贸wkami o analogicznym sk艂adzie uczniowskim.
EWD mo偶na wyra偶a膰 w skali staninowej i centylowej. Przypomnijmy:
佛 skala staninowa to skala 9-stopniowa.
Kolejne stopnie skali to:
1. stanin to przedzia艂 obejmuj膮cy 4% najni偶szych wynik贸w,
2. stanin to przedzia艂 obejmuj膮cy 7% kolejnych wynik贸w,
3. stanin to przedzia艂 obejmuj膮cy 12% kolejnych wynik贸w,
4. stanin to przedzia艂 obejmuj膮cy 17% kolejnych wynik贸w,
5. stanin to przedzia艂 obejmuj膮cy 20% kolejnych wynik贸w,
6. stanin to przedzia艂 obejmuj膮cy 17% kolejnych wynik贸w,
7. stanin to przedzia艂 obejmuj膮cy 12% kolejnych wynik贸w,
8. stanin to przedzia艂 obejmuj膮cy 7% kolejnych wynik贸w,
9. stanin to przedzia艂 obejmuj膮cy 4% najwy偶szych wynik贸w.
Na przyk艂ad, wynik w staninie 8.(tzw. bardzo wysokim) oznacza, 偶e 4% szk贸艂 uzyska艂o wynik
wy偶szy, 7% - por贸wnywalny, a 89% - wynik ni偶szy.
Inna miar膮 pozycyjn膮 - wspomnian膮 ju偶 wczesnej - jest skala centylowa.
佛 Skala 99-stopniowa.
佛 Pozycja centylowa m贸wi o tym, jaki procent szk贸艂 ma wynik ni偶szy, ni偶 uzyskany przez t臋
szko艂臋.
佛 Na przyk艂ad, 45 centyl oznacza, 偶e 45% szk贸艂 uzyska艂o wynik ni偶szy.
Na przyk艂adzie wybranej szko艂y zobaczmy, jak mo偶e wygl膮da膰 relacja mi臋dzy wynikami
egzaminacyjnymi a edukacyjn膮 warto艣ci膮 dodan膮.
GMP=26,45, stanin - wysoki GH=34,97, stanin - wy偶ej 艣redni
EWD =-2,95, stanin - niski, 12 centyl EWD =-2,59, stanin - niski, 14 centyl
Wykres 4. Wynik egzaminu a edukacyjna warto艣膰 dodana dla przyk艂adowego gimnazjum
11
Powy偶sze wykresy przedstawiaj膮 wyniki w przyk艂adowym gimnazjum. Na osi poziomej mamy
wyniki na sprawdzianie, na osi pionowej wyniki na egzaminie gimnazjalnym. Na wykresie
orientacyjne wrysowano linie wyniku przewidywanego. Punkty na wykresie reprezentuj膮 uczni贸w
tej szko艂y. Analiza wykres贸w pozwala zrozumie膰, dlaczego wyniki surowe (podane w punktach)
egzaminu gimnazjalnego lokuj膮 t臋 szko艂臋 wysoko w skali staninowej, a w EWD - nisko. Cho膰
wyniki egzaminacyjne uczni贸w s膮 do艣膰 wysokie, to jednak wi臋kszo艣膰 punkt贸w znajduje si臋 poni偶ej
linii wyniku przewidywanego. Dzieje si臋 tak, poniewa偶 uczniowie legitymowali si臋 w wi臋kszo艣ci
przypadk贸w wysokimi wynikami na sprawdzianie po szkole podstawowej. Innymi s艂owy wysoki
potencja艂 uczni贸w nie zosta艂 przez szko艂臋 wykorzystany.
Nale偶y podkre艣li膰, 偶e w ca艂ej populacji gimnazj贸w dominowa膰 b臋d膮 przypadki niewielkich lub
umiarkowanych r贸偶nic mi臋dzy wynikiem surowym egzaminu a EWD. Jednak dla pewnej grupy
gimnazj贸w notujemy du偶e lub bardzo du偶e rozbie偶no艣ci mi臋dzy wynikiem surowym a EWD.
Precyzja szacowania edukacyjnej warto艣ci dodanej
Wskaznik EWD jak ka偶dy wynik pomiaru nie jest doskonale precyzyjny. Jak oszacowa膰 b艂膮d
pomiaru? S艂u偶y temu statystyczne narz臋dzie zwane przedzia艂em ufno艣ci.
Przedzia艂 ufno艣ci - jest to przedzia艂, kt贸ry z okre艣lonym prawdopodobie艅stwem zawiera prawdziw膮
warto艣膰 interesuj膮cego nas parametru. Przedzia艂 ufno艣ci m贸wi nam, 偶e dany parametr (w naszym
przypadku EWD) z okre艣lonym prawdopodobie艅stwem mie艣ci si臋 mi臋dzy wyznaczonymi
warto艣ciami. W wypadku EWD szacowanie przedzia艂u ufno艣ci jest konieczne, poniewa偶 okre艣lanie
tej warto艣ci obarczone jest dwojakim b艂臋dem. Po pierwsze, b艂臋dem pomiaru na sprawdzianie i
egzaminie gimnazjalnym. Po drugie, b艂臋dem pr贸bkowania - absolwenci danego rocznika s膮 tylko
pr贸b膮 uczni贸w szko艂y, na podstawie kt贸rej wypowiadamy si臋 o efektywno艣ci nauczania w danym
gimnazjum, kt贸ra jest cech膮 charakteryzuj膮c膮 szko艂臋 w d艂u偶szej perspektywie czasowej.
Zauwa偶my przy okazji, 偶e ocena jako艣ci pracy szko艂y - w r贸偶nych jej aspektach, bo przecie偶 EWD
to tylko jeden ze wskaznik贸w tej jako艣ci - wymaga wieloletniej perspektywy. Kto formu艂uje oceny
na podstawie pojedynczego pomiaru, analizy jednego rocznika, post臋puje nieodpowiedzialnie.
Wielko艣膰 przedzia艂u ufno艣ci dla EWD danej szko艂y zale偶y od trzech czynnik贸w. Po pierwsze, im
bardziej zr贸偶nicowane warto艣ci reszt, czyli indywidualnych wskaznik贸w post臋pu, tym szerszy
przedzia艂 ufno艣ci. To intuicyjne zrozumia艂e. Reszty to informacje, na podstawie kt贸rych
wnioskujemy o efektywno艣ci nauczania. Je偶eli ich warto艣ci s膮 bardzo zr贸偶nicowane, trudno o
pewny wniosek co do "wk艂adu" szko艂y w wynik egzaminacyjny ucznia. Po drugie, im mniej uczni贸w
przyst臋puje do egzaminu, tym szerszy przedzia艂 ufno艣ci. Ta zasada jest te偶 艂atwa do zrozumienia -
im mniej uczni贸w, tym mniej informacji o efektywno艣ci, a tym samym mniej pewny wniosek. Po
trzecie, im bardziej nam zale偶y na pewno艣ci, 偶e faktyczna warto艣膰 EWD znajdzie si臋 w
wyznaczonym przedziale ufno艣ci, tym szerszy musimy wyznaczy膰 przedzia艂. Poziom tej pewno艣ci
w statystyce nazywamy poziomem ufno艣ci. Zwykle przyjmujemy 95% poziom ufno艣ci, czyli
zgadzamy si臋 na 5% ryzyko pope艂nienia b艂臋du polegaj膮cego na tym, 偶e prawdziwa warto艣膰 EWD
znajdzie si臋 poza wyznaczonymi warto艣ciami granicznymi. Przydzia艂y ufno艣ci okre艣la si臋 zgodnie z
obowi膮zuj膮cymi w statystyce procedurami.
Wyznaczone dla EWD przedzia艂y ufno艣ci mo偶emy traktowa膰 jako regu艂臋 decyzyjn膮. Je偶eli chcemy
w spos贸b odpowiedzialny formu艂owa膰 na podstawie EWD oceny typu szko艂a A lepiej uczy w
zakresie sprawdzanym przez egzamin gimnazjalnym od szko艂y B, to warto wiedzie膰, jakie jest
ryzyko pope艂nienia b艂臋du. Przydzia艂y ufno艣ci pozwalaj膮 nam to ryzyku oszacowa膰. Je偶eli
wyznaczymy 95% przedzia艂y ufno艣ci EWD dla por贸wnywanych szk贸艂 i przedzia艂y te s膮 roz艂膮czne,
to ryzyko sformu艂owania nietrafnej oceny jest niewielkie - poni偶ej 5%. Gdy przedzia艂y cz臋艣ciowo
pokrywaj膮 si臋, formu艂owanie oceny staje si臋 bardziej ryzykowane. Je偶eli ocena jest donios艂a i
brzemienna w skutki - nale偶y si臋 od niej powstrzyma膰. Je艣li przedzia艂 ufno艣ci EWD dla szko艂y A
12
wynosi (1,05; 3,47) a dla szko艂y B (-1,17; 0,53), to mo偶emy odpowiedzialnie stwierdzi膰, 偶e szko艂a A
ma wy偶sz膮 EWD ni偶 szko艂a B. Natomiast je偶eli dla szko艂y C przedzia艂 wynosi (-1,93; 1,82), to nie
mo偶emy bez du偶ego ryzyka pope艂nienia b艂臋du sformu艂owa膰 oceny, 偶e EWD szko艂y A jest wy偶sze
ni偶 szko艂y C - oba przedzia艂y zawieraj膮 wsp贸lny zakres warto艣ci (od 1,05 do 1,82).
W przypadku szacowania EWD dla szko艂y przyjmujemy 95% poziom ufno艣ci (podobnie jak w
wi臋kszo艣ci bada艅 naukowych), a dla klas lub innych grup uczni贸w por贸wnywanych w obr臋bie
jednej szko艂y mo偶na przyj膮膰 ni偶szy poziom ufno艣ci np. 90%. Ni偶szy poziom ufno艣ci w tym
wypadku wynika z mniejszych koszt贸w sformu艂owania nietrafnej oceny. A nale偶y pami臋ta膰, 偶e w
pewnych sytuacjach wi臋ksze ryzyko wi膮偶e si臋 z niedocenianiem r贸偶nicy ni偶 jej przecenieniem.
Gdy oceniamy szko艂y i za ocen膮 id膮 decyzje wa偶ne dla szko艂y, przede wszystkim nale偶y
wystrzega膰 si臋 ocen pochopnych. Ale gdy analiza wyka偶e na przyk艂ad, 偶e by膰 mo偶e w danej
szkole relatywnie gorzej nauczani s膮 uczniowie zdolni, by膰 mo偶e warto dmucha膰 na zimne i
podejmowa膰 dzia艂ania, nawet gdy diagnozy nie mo偶emy by膰 pewni.
W艂膮czanie do analiz danych z kolejnych edycji egzamin贸w zewn臋trznych poprawi precyzj臋
szacowania EWD dla szko艂y i pozwoli na formu艂owanie odpowiedzialnych ocen nawet przy
mniejszych r贸偶nicach mi臋dzy szko艂ami.
Bardzo ilustratywne jest prezentowanie przedzia艂贸w ufno艣ci w spos贸b graficzny. Poni偶szy wykres
przedstawia oszacowania EWD wraz z przedzia艂ami ufno艣ci dla dw贸ch przyk艂adowych gimnazj贸w.
Wykres 5. EWD wraz z przedzia艂ami ufno艣ci dla dw贸ch gimnazj贸w
Wykres ten w graficzny spos贸b przedstawia przedzia艂y ufno艣ci EWD dla dw贸ch gimnazj贸w i dw贸ch
cz臋艣ci egzaminu. Punkty symbolizuj膮 oszacowania EWD, linie pionowe szeroko艣膰 przedzia艂贸w.
Poprawna interpretacja jest nast臋puj膮ca: w cz臋艣ci humanistycznej obydwa gimnazja
charakteryzuje podobna efektywno艣膰 nauczania (to samo EWD wi臋c i przedzia艂y ufno艣ci si臋
pokrywaj膮). W cz臋艣ci matematyczno-przyrodniczej Gimnazjum 1 ma wy偶sz膮 EWD ni偶 Gimnazjum
2. Co wi臋cej przedzia艂y ufno艣ci tych dw贸ch szk贸艂 nie "zaz臋biaj膮 si臋" - nie maj膮 wsp贸lnej cz臋艣ci, a
to 艣wiadczy, 偶e w pe艂ni uprawiony statystycznie spos贸b mo偶na wnioskowa膰, 偶e efektywno艣膰
nauczania w obszarze sprawdzanym przez egzamin matematyczno-przyrodniczy w tych dw贸ch
szko艂ach jest r贸偶na. Je艣li EWD by艂yby r贸偶ne, ale przedzia艂y ufno艣ci cz臋艣ciowo by si臋 pokrywa艂y, to
takie wnioskowanie by艂oby obarczone du偶ym ryzykiem pope艂nienia b艂臋du.
Warto tak偶e zwr贸ci膰 uwag臋 na znacznie szersze przedzia艂y ufno艣ci Gimnazjum 2. Mo偶e to
wynika膰 z mniejszej liczby uczni贸w w tej szkole. Jednak je艣li liczba uczni贸w jest podobna, to
wynika z wi臋kszego zr贸偶nicowania efekt贸w pracy w Gimnazjum 2, co jest dodatkow膮, interesuj膮c膮
13
informacj膮 o tej szkole.
Problem stabilno艣ci oszacowa艅 edukacyjnej warto艣ci dodanej w czasie
Tak jak zaznaczyli艣my w poprzednim podrozdziale, ocena jako艣ci pracy szko艂y to przedsi臋wzi臋cie
d艂ugofalowe, wymagaj膮ce kolekcjonowana w systematyczny spos贸b informacji przez wiele lat.
Dotyczy to r贸wnie偶 EWD i orzekania o efektywno艣ci nauczania w zakresie sprawdzanym przez
egzaminy zewn臋trzne. Wynik uzyskany przez szko艂臋 w danym roku to tylko pr贸bka efektywno艣ci. Z
pewno艣ci膮 z roku na rok b臋dziemy obserwowa膰 wahania w warto艣ci EWD dla danej szko艂y. Wa偶ne
jest jednak, jak du偶e b臋d膮 te wahania. Je偶eli szacunki EWD dla kolejnych lat nie by艂yby z sob膮
skorelowane, wskazywa艂oby to na bezu偶yteczno艣膰 metody.
Jak przedstawiaj膮 si臋 fakty? Na razie wiemy niewiele. Zesp贸艂 EWD pracuj膮cy przy CKE
przeanalizowa艂 dane dla dw贸ch edycji egzaminu: panel sprawdzian 2002 - egzamin gimnazjalny
2005 oraz panel sprawdzian 2003 - egzamin gimnazjalny 2006. Gdyby sta艂o艣膰 w czasie EWD dla
szko艂y okre艣la膰 na podstawie tych wynik贸w, to stabilno艣膰 jest umiarkowana. Korelacje mi臋dzy
oszacowaniami EWD dla gimnazj贸w w 2005 i 2006 roku wynosi oko艂o 0,5. Wskazuje to na
konieczno艣膰 - o kt贸rej ju偶 wspominali艣my powy偶ej - opierania szacunk贸w EWD na wynikach
wieloletnich. Prawdopodobnie okres trzyletni zapewni stabilizacj臋 szacunk贸w EWD. Oznacza to,
偶e pierwsze odpowiedzialne, czyli nadaj膮ce si臋 do upublicznienia, szacunki EWD dla szk贸艂 b臋d膮
mog艂y by膰 dokonywane po egzaminie gimnazjalnym AD 2007.
Dlaczego korelacja mi臋dzy szacunkami EWD dla kolejnych lat nie jest zbyt du偶a? Jest
prawdopodobnie kilka tego przyczyn. Po pierwsze, niedoskona艂o艣膰 danych, na kt贸rych opieramy
wyliczenia. Zar贸wno wyniki sprawdzianu jak i egzaminu gimnazjalnego - jak ka偶dego zreszt膮
pomiaru - obarczone s膮 b艂臋dem. Warto podj膮膰 badania nad rzetelno艣ci膮 test贸w i podj膮膰 dzia艂ania
zmierzaj膮ce do ograniczenia takich zr贸de艂 b艂臋du pomiaru jak, na przyk艂ad, efekt egzaminatora czy
efekt 艣ci膮gania. Z pewno艣ci膮 do poprawy rzetelno艣ci przyczyni艂oby si臋 rozbudowanie
sprawdzianu. Na warto艣膰 metody EWD z pewno艣ci膮 rzutuj膮 r贸wnie偶 problemy zwi膮zane z
trafno艣ci膮 test贸w. Po drugie, na zmienno艣膰 oszacowa艅 EWD w kolejnych latach z pewno艣ci膮 ma
wp艂yw czynnik nauczycielski. Wiadomo, 偶e efektywno艣膰 nauczania to przede wszystkim dobrzy
nauczyciele. W wi臋kszych gimnazjach co roku sk艂ad kadry nauczycielskiej "wypuszczaj膮cej"
absolwent贸w jest inny. To z pewno艣ci膮 sprawia, 偶e EWD z roku na rok mo偶e si臋 zmienia膰. Po
trzecie, czynnikiem niestabilno艣ci mo偶e by膰 zmiana w efektywno艣ci nauczania w danej szkole.
Gdyby korelacje mi臋dzy kolejnymi oszacowaniami EWD by艂y doskona艂e, czyli przybiera艂y warto艣膰
1, by艂oby to wynik przygn臋biaj膮cy. Oznacza艂oby to, 偶e efektywno艣膰 jest niezmienna i nie ma
"przestrzeni zmiany" -szko艂y nie mia艂yby szansy na popraw臋.
Problem trafno艣ci metody edukacyjnej warto艣ci dodanej
Je偶eli metoda szacowania EWD jest dobrze skonstruowana, rachunki dobrze przeprowadzone, a
dane wej艣ciowe s膮 w pe艂ni warto艣ciowe, to mo偶na powiedzie膰, 偶e metoda EWD jest niejako
definicyjne trafn膮 miar膮 efektywno艣ci nauczania. Ale przy pewnym wa偶nym zastrze偶eniu -
efektywno艣ci nauczania w zakresie sprawdzanym przez egzaminy zewn臋trzne. 艢wiadomo艣膰
tego ograniczenia podpowiada korekt臋 nazwy metody. Mo偶e nie m贸wi膰 o edukacyjnej warto艣ci
dodanej a o egzaminacyjnej warto艣ci dodanej? Przy obecnym stanie wiedzy o polskiej aplikacji
EWD to zasadna ostro偶no艣膰. Trzeba na ka偶dym kroku podkre艣la膰, 偶e EWD to miara o
ograniczonej warto艣ci i jest tylko sposobem lepszego - co nie znaczy doskona艂ego - wykorzystania
wynik贸w egzaminacyjnych. Jednak z drugiej strony metoda EWD ma szersze ambicje. Chcia艂aby
dostarcza膰 podstaw do uog贸lniania oceny na ca艂y obszar nauczania. Warunkiem jest znalezienie
silnych dowod贸w empirycznych, 偶e EWD jest silnie skorelowana z niekwestionowanymi,
14
bezpo艣rednimi miarami efektywno艣ci nauczania. Innymi s艂owy trzeba dysponowa膰 dowodami
ekologicznej trafno艣ci metody.
Co na ten temat wiemy? Do tej pory przeprowadzono dwie analizy. W obu szukano odpowiedzi na
3 kluczowe dla problemu trafno艣ci pytania.
- Czy EWD jest wolna od wp艂ywu czynnik贸w sk艂adaj膮cych si臋 na zasoby dane szko艂y, g艂贸wnie
czynnik贸w 艣rodowiska rodzinnego?
- Czy EWD jest skorelowana z bezpo艣rednimi miarami efektywno艣ci edukacji?
- Czy EWD nie jest powi膮zana z takimi patologiami szkolnymi jak nauczanie pod testy i
korepetycje?
Je偶eli otrzymaliby艣my trzy przekonuj膮ce odpowiedzi twierdz膮ce, mogliby艣my sformu艂owa膰 tez臋, 偶e
opracowana metoda nie jest tylko "zabaw膮 statystyczn膮" z wynikami egzamin贸w, ale
warto艣ciowym wskaznikiem jako艣ci pracy szko艂y.
Artur Pokropek (2006) wykorzystuj膮c wyniki bada艅 przeprowadzonych przez OKE Krak贸w na
reprezentatywnej pr贸bce gimnazjalist贸w z obszaru dzia艂ania Komisji wykaza艂, 偶e:
1. Jedyne, czego jeste艣my pewni to to, 偶e EWD jest zdecydowanie s艂abiej powi膮zana z
charakterystykami spo艂ecznymi, kulturowymi i ekonomicznymi rodziny ucznia ni偶 nieprzetworzone
(podane w punktach) wyniki egzamin贸w gimnazjalnych.
2. Niestety nie uda艂o si臋 przekonuj膮co pokaza膰, 偶e EWD jest silnie zwi膮zana z tym, co
powszechnie uwa偶amy za wyznaczniki dobrego nauczania. Wymow臋 tego faktu 艂agodzi jednak to,
i偶 praca szko艂y opisywana przez wyznaczone wskazniki nie mia艂a odbicia r贸wnie偶 w wynikach
surowych test贸w.
3. Stwierdzano brak zwi膮zk贸w z nauczaniem pod testy.
Drugie badanie zosta艂o specjalnie zaprojektowane na potrzeby badania trafno艣ci EWD i obj臋艂o
celow膮 pr贸b臋 40 gimnazj贸w. Wyodr臋bniono 4 grupy por贸wnawcze:
A. gimnazja o wysokich wynikach surowych i wysokiej warto艣ci EWD
B. gimnazja o wysokich wynikach surowych i niskiej warto艣ci EWD
C. gimnazja o niskich wynikach surowych i wysokiej warto艣ci EWD
D. gimnazja o niskich wynikach surowych i niskiej warto艣ci EWD
Taki dob贸r pr贸by pozwala to na dokonanie dw贸ch kluczowych dla oceny trafno艣ci EWD por贸wna艅:
1. Por贸wnanie grupy A i B pozwoli艂o oceni膰, czy EWD jest dobr膮 metod膮 r贸偶nicowania szk贸艂
"spijaj膮cych 艣mietank臋" i dochodz膮cych do wysokich wynik贸w dobr膮 prac膮.
2. Por贸wnanie grup C i D pozwoli艂o oceni膰, czy EWD jest dobr膮 metod膮 wy艂awiania tych szk贸艂,
kt贸re ci臋偶ko pracuj膮c w niekorzystnych warunkach spo艂ecznych, uzyskuj膮 relatywnie wysokie
wyniki.
Podstawowe wyniki to:
1. Charakterystyki spo艂eczne, kulturowe i ekonomiczne rodziny ucznia s艂abo r贸偶nicuj膮
por贸wnywane grupy.
2. W grupie szk贸艂 o wysokich wynikach egzaminacyjnych EWD wi膮偶e si臋:
- pozytywnie z rodzicielskimi ocenami wychowania i wsp贸艂pracy szko艂y z rodzicami,
- negatywnie z fluktuacj膮 kadry,
- negatywnie z czasem dojazdu do szko艂y,
- pozytywnie z ocen膮 jako艣ci szkolnych dokument贸w (statut, wewn膮trzszkolny system oceniania
itp.),
- negatywnie z uczniowsk膮 ocen膮 nauczania,
- pozytywnie z nauczaniem pod testy,
- brak zwi膮zku z ocen膮 wizytatora.
Powy偶szy uk艂ad wynik贸w nie pozwala jednoznacznie oceni膰 trafno艣ci EWD w zakresie
r贸偶nicowania szk贸艂 w grupie gimnazj贸w o wysokich wynikach egzaminacyjnych. Opr贸cz wynik贸w
15
oczekiwanych mamy efekty niepokoj膮ce, przede wszystkim zwi膮zki z nauczaniem pod testy i -
negatywne -z uczniowsk膮 ocen膮 nauczania do autonomii.
3. W grupie szk贸艂 o niskich wynikach egzaminacyjnych EWD wi膮偶e si臋:
- pozytywnie ze stosowaniem metod aktywizuj膮cych (wg opisu uczni贸w),
- negatywnie z czasem dojazdu do szko艂y,
- brak zwi膮zku z ocen膮 wizytatora,
- brak zwi膮zku z ocen膮 jako艣ci dokument贸w szkolnych.
W grupie gimnazj贸w o niskich wynikach na egzaminie gimnazjalnym obserwujemy niewiele
znacz膮cych zwi膮zk贸w z EWD. Te, kt贸re s膮, wskazuj膮 na trafno艣膰 metody, ale ich niewielka liczba
nie pozwala na pozytywn膮 konkluzj臋.
Badania nad trafno艣ci膮 nie dostarczaj膮 na razie mocnych argument贸w na rzecz trafno艣ci EWD
jako miary szerzej rozumianej efektywno艣ci nauczania. Przy obecnym stanie wiedzy nale偶y
zachowa膰 ostro偶no艣膰 w interpretacji EWD. Dopiero dalsze badania by膰 mo偶e lepiej udokumentuj膮
trafno艣膰 metody i pozwol膮 na uog贸lniaj膮c膮 interpretacj臋.
Zastosowanie edukacyjnej warto艣ci dodanej do analiz wewn膮trzszkolnych
Do tej pory skupiali艣my si臋 na problemach ewaluacji zewn臋trznej efektywno艣ci nauczania i
szacowaniu edukacyjnej warto艣ci dla ca艂ej szko艂y. Jednak metoda EWD mo偶e i powinna by膰
stosowana te偶 do analiz wewn膮trzszkolnych. Analizy takie mog膮 by膰 wykonywane przez szko艂y na
w艂asne potrzeby, lub przez nadz贸r pedagogiczny, by wspiera膰 szko艂y w poprawie jako艣ci pracy. W
USA, Wielkiej Brytanii, Francji czy Australii wskaznik EWD wykorzystywany jest od wielu lat
zar贸wno w ewaluacji zewn臋trznej jak i w pracy pedagogicznej w szkole. EWD jest warto艣ciowym
wskaznikiem dla wewn膮trzszkolnej oceny i planowania dzia艂a艅 podejmowanych przez szko艂臋 w
celu podniesienia jako艣ci kszta艂cenia. Takie analizy ze wzgl臋du na swoje zastosowanie nie
wymagaj膮 tak du偶ej precyzji jak szacowanie EWD dla szko艂y- przyjmuje si臋, 偶e w tym przypadku
wystarczy rozpatrywa膰 90% przedzia艂y ufno艣ci dla EWD.
W rozdziale tym pokr贸tce om贸wimy typy analiz, jakie mo偶na wykonywa膰 w gimnazjum za pomoc膮
metody EWD (na stronie CKE znajduje si臋 Kalkulator EWD 2006, kt贸ry pozwala obliczy膰 reszty
potrzebne do poni偶szych analiz za rok 2006.
W ramach wewn膮trzszkolnych analiz EWD mo偶na rozwa偶a膰 bardzo wiele problem贸w. Poni偶sza
lista nie jest z pewno艣ci膮 wyczerpuj膮ca. Wszystko zale偶y od potrzeb i pomys艂owo艣ci u偶ytkownik贸w
tej metody.
1. Analiza rozk艂adu reszt
Cho膰 w dotychczasowych rozwa偶aniach EWD definiowali艣my jako 艣redni膮 arytmetyczn膮 reszt, to
pog艂臋biona analiza efektywno艣ci wymaga przyjrzeniu si臋 pe艂nemu rozk艂adowi wynik贸w w szkole.
Za dan膮 艣redni膮 mog膮 si臋 kry膰 bardzo r贸偶ne rozk艂ady reszt, czyli tak naprawd臋 r贸偶ne edukacyjne
warto艣ci dodane. W analizie rozk艂adu bardzo wa偶ne jest te偶 poj臋cie warto艣ci odstaj膮cych, czyli
znacz膮co odbiegaj膮cych od pozosta艂ych warto艣ci w pr贸bie. W wypadku EWD warto艣ci odstaj膮ce to
reszty drastycznie r贸偶ni膮ce si臋 od pozosta艂ych reszt w szkole. Na przyk艂ad, w 56 osobowym
gimnazjum warto艣ci reszt 54 uczni贸w mieszcz膮 si臋 w przedziale (-10 ; +10). Wyniki dwu
pozosta艂ych to +19,5 oraz -21,1. Te warto艣ci uznamy za odstaj膮ce, bo znacznie r贸偶ni膮 si臋 od
pozosta艂ych. Mo偶na przypuszcza膰, 偶e warto艣ci odstaj膮ce s膮 wynikiem dzia艂ania czynnik贸w
losowych, wi臋c wskazane jest minimalizowanie ich wp艂ywu na szacowanie EWD szko艂y.
2. Analiza EWD dla klas lub nauczycieli
Dla szko艂y niezwykle wa偶ne jest szacowanie EWD dla poszczeg贸lnych klas lub nauczycieli.
Pozwala to lepiej pozna膰 czynniki odpowiedzialne za wynik szko艂y, a tym samym trafniej
zaplanowa膰 program naprawczy. Analiza wynik贸w dla klas pozwoli te偶 oceni膰 efekty przyj臋tego w
szkole sposobu dzielenia uczni贸w na klasy.
16
3. Analiza efektu p艂ci
Komu lepiej wiedze si臋 w szkole, dziewcz臋tom, czy ch艂opcom? Oczywi艣cie w skali kraju EWD dla
dziewcz膮t i ch艂opc贸w jest takie samo, ale w danej szkole mog膮 wyst膮pi膰 znacz膮ce r贸偶nice. Cho膰 w
polskiej debacie edukacyjnej problemy r贸wno艣ci szans edukacyjnych ch艂opc贸w i dziewcz膮t s膮
s艂abo jeszcze obecne, z pewno艣ci膮 w najbli偶szych latach problem b臋dzie traktowany coraz
powa偶niej, a tym samym 艣ledzenie r贸偶nic w tym zakresie w efektywno艣ci nauczania nabierze
spo艂ecznego znaczenia.
4. EWD w grupach uczni贸w o r贸偶nym potencjale edukacyjnym
Niezwykle interesuj膮c膮 dla szko艂y analiz膮 mo偶e by膰 przyjrzenie si臋 edukacyjnej warto艣ci dodanej
w grupach uczni贸w lepszych i s艂abszych. Z kim lepiej szko艂a pracuje, dla kogo ma bardziej
efektywn膮 ofert臋? To informacja, kt贸ra pozwoli szkole wiele dowiedzie膰 si臋 o sobie. To r贸wnie偶
bardzo wa偶ny problem z perspektywy polityki r贸wnych szans edukacyjnych.
5. EWD w grupach uczni贸w doje偶d偶aj膮cych do szko艂y
Wprowadzenie gimnazj贸w o偶ywi艂o nie nowy sp贸r o to, co lepsze dla uczni贸w: czy szko艂a ma艂a,
gorzej wyposa偶ona, oddalony od lokalnych centr贸w kulturowych, ale blisko domu dziecka, czy
szko艂a du偶a, lepiej wyposa偶ona, funkcjonuj膮ca w korzystniejszym 艣rodowisku kulturowym, ale
wymagaj膮ca czasoch艂onnego dowo偶enia? Szko艂a lub organ prowadz膮cy mo偶e na bie偶膮co 艣ledzi膰
skutki ro偶nych rozwi膮za艅 organizacyjnych szacuj膮c EWD dla odpowiednich grup uczni贸w.
6. EWD w grupach uczni贸w obj臋tych zaj臋ciami wyr贸wnawczymi
Analiza EWD mo偶e przenosi膰 cenne informacje na temat skuteczno艣ci zaj臋膰 wyr贸wnawczych. Czy
intensyfikacja tych zaj臋膰, nowe rozwi膮zania organizacyjne czy metodyczne przynosz臋 po偶膮dane
efekty? Na takie pytania mo偶e odpowiedzie膰 systematyczne monitorowanie EWD w r贸偶nych
grupach uczni贸w.
7. EWD w grupach uczni贸w pochodz膮cych z r贸偶nych szk贸艂 podstawowych.
To ostatni przyk艂ad problemu, kt贸ry mo偶na o艣wietli膰 za pomoc膮 metody EWD. Dla niekt贸rych
gimnazj贸w mo偶e to by膰 wa偶ne i interesuj膮ce.
Oczywi艣cie ka偶da szko艂a musi samodzielnie okre艣li膰 list臋 kluczowych w swojej plac贸wce
problem贸w. Powy偶sza lista to tylko przyk艂ady mo偶liwych analiz EWD.
Podsumowanie
Najbardziej fundamentalny sp贸r o metod臋 edukacyjnej warto艣ci dodanej wi膮偶e si臋 z pytaniem o
kszta艂t polskiego systemu o艣wiaty. Czy wzmacnia膰 tendencje decentralistyczne, pluralizm
programowy i zakorzenianie si臋 szko艂y w lokalnej spo艂eczno艣ci, czy uruchamia膰 mechanizmy
rynkowe w o艣wiacie, zrezygnowa膰 z rejonizacji, postawi膰 na rywalizacj臋 i regulacj臋 o艣wiaty przez
wybory rodzic贸w - klient贸w, czy te偶 zn贸w centralizowa膰 i wzmacnia膰 tendencje uniformistyczne
przez, na przyk艂ad, wzmacnianie systemu egzamin贸w pa艅stwowych. Z pewno艣ci膮 EWD wpisuje
si臋 raczej w tendencje centralistyczne i cho膰 znalaz艂aby swoje miejsce r贸wnie偶 w liberalnej wizji
o艣wiaty, z pewno艣ci膮 k艂贸ci si臋 ze strategi膮 pierwsz膮. Z jednej strony wizja szko艂y otwartej na
r贸偶norodne, cz臋sto subtelne "impulsy steruj膮ce" p艂yn膮ce od r贸偶nych partner贸w spo艂ecznych szko艂y
w jej lokalnym 艣rodowisku. Z drugiej strony szko艂a poddana jednolitemu, silnemu nadzorowi
pedagogicznemu, kt贸rego or臋偶em staje si臋 nowy wskaznik jako艣ci szko艂y - edukacyjna warto艣膰
dodana. Cho膰 strategia centralistyczna na pierwszy rzut oka wygl膮da odpychaj膮co, pami臋tajmy, 偶e
tak kluczowy cel polityki o艣wiatowej jak podtrzymywanie sp贸jno艣ci spo艂ecznej, a w tym polityka
r贸wnych szans edukacyjnych, nie da si臋 skutecznie realizowa膰 zar贸wno w obr臋bie strategii
wsp贸lnotowej jak i rynkowej. Zar贸wno szko艂a-element wsp贸lnoty lokalnej, jak i szko艂a-dostawca
us艂ug nie gwarantuje realizacji tych cel贸w. To dylematy warte dyskusji.
Metoda edukacyjnej warto艣ci dodanej to instrument polityki o艣wiatowej. Mo偶na ocenia膰 go w
oderwaniu od innych narz臋dzi, ale bardziej racjonalne jest my艣lenie w kategoriach por贸wnawczych
17
- czy instrument X jest lepszy od instrumentu Y? W realiach polskiego systemu o艣wiatowego od
2002 roku zacz膮艂 funkcjonowa膰 system egzamin贸w zewn臋trznych - pot臋偶ne narz臋dzie polityki
o艣wiatowej. Czy wykorzystujemy jego mo偶liwo艣ci? Czy 艣ledzimy realne skutki? To szerszy
kontekst namys艂u nad warto艣ci膮 metody EWD. Z niego wynika pytanie, czy wskazniki EWD s膮
lepsz膮 miar膮 efektywno艣ci nauczania w danej szkole ni偶 艣rednia arytmetyczna wyniku egzaminu?
Dotychczasowe wyniki analiz pozwalaj膮 odpowiedzie膰 twierdz膮co. Dotychczasowe prace nad
EWD w Polsce mo偶na nast臋puj膮co podsumowa膰.
1. Metoda edukacyjnej warto艣ci dodanej mo偶e by膰 z powodzeniem stosowana do oceny
efektywno艣ci nauczania w gimnazjach i szko艂ach maturalnych w zakresie sprawdzanym na
egzaminach zewn臋trznych. Tworzenie modeli szacowania EWD dla gimnazj贸w wesz艂o ju偶 w faz臋
pilota偶ow膮. W wypadku szk贸艂 maturalnych potrzeba jeszcze dalszych prac, by doprowadzi膰
metod臋 do fazy pilota偶owej.
2. Wskazniki EWD wzbogacaj膮 repertuar miar jako艣ci pracy szko艂y i powinny by膰 traktowane jako
komplementarne wobec nich.
3. Dysponujemy bardzo bogatym repertuarem metod statystycznych szacowania EWD - od
najprostszych modeli regresyjnych - przedstawionych w tym tek艣cie - po wyrafinowane modele
hierarchiczne. W praktyce jednak r贸偶nice mi臋dzy oszacowaniami EWD za pomoc膮 r贸偶nych metod
nie s膮 du偶e. Znacznie wa偶niejsza jest dost臋pno艣膰 i jako艣膰 danych - g艂贸wnie egzaminacyjnych -
u偶ytych w modelach szacowania EWD.
4. Wskazniki EWD obliczane na podstawie danych jednorocznych s膮 umiarkowanie stabilne w
czasie. Znacz膮ca zmienno艣膰 EWD szko艂y w kolejnych latach z jednej strony pokazuje konieczno艣膰
szacowania przedzia艂owego tego wskaznika (przedzia艂y ufno艣ci), z drugiej strony wyznacza
kierunek prac nad modelami szacowania. Dla potrzeb ewaluacji wewn膮trzszkolnej powinny by膰
stosowane modele jednoroczne, ale dla ewaluacji zewn臋trznej nale偶y stosowa膰 modele
wieloletnie. Wydaje si臋, 偶e z wielu wzgl臋d贸w optymalna perspektywa czasowa obliczania
wskaznik贸w EWD, to trzy lata.
5. Badania nad trafno艣ci膮 metody EWD w odniesieniu do gimnazj贸w wykaza艂y, 偶e miary
efektywno艣ci nauczania wykorzystuj膮ce metod臋 EWD s膮 zdecydowanie s艂abiej - w stosunku do
nieprzetworzonych wynik贸w egzamin贸w - powi膮zane z uwarunkowaniami 艣rodowiskowymi pracy
szko艂y. Kontrola wp艂ywu czynnik贸w 艣rodowiskowych pozwala traktowa膰 EWD jako zdecydowanie
lepsz膮 miar臋 efektywno艣ci nauczania. Jednak brak mocnych argument贸w na rzecz
prawomocno艣ci uog贸lniania znaczenia wskaznika EWD na ca艂o艣膰 procesu dydaktycznego.
Badania wskaza艂y, 偶e istniej膮 znacz膮ce korelacje EWD z niezale偶nymi miarami jako艣ci nauczania,
ale pokaza艂y r贸wnie偶, 偶e wiele empirycznych wskaznik贸w jako艣ci opartych na opiniach i ocenach
uczni贸w i rodzic贸w nie potwierdza jednoznacznie przewagi miar EWD nad surowymi wynikami
egzamin贸w. Dop贸ki dalsze badania nie dostarcz膮 mocnych przes艂anek dla takich uog贸lnie艅,
nale偶y wskazniki EWD interpretowa膰 jako miar臋 efektywno艣ci nauczania w zakresie sprawdzanym
na egzaminach zewn臋trznych. By podkre艣li膰 t臋 zaw臋偶aj膮c膮 interpretacj臋 warto rozwa偶y膰
zast膮pienie powszechnie na 艣wiecie stosowanej nazwy edukacyjna warto艣膰 dodana terminem
egzaminacyjna warto艣膰 dodana.
6. W ewaluacji zewn臋trznej metoda EWD powinna by膰 u偶ywana przede wszystkim do identyfikacji
szk贸艂 o szczeg贸lnie niskiej efektywno艣ci nauczania oraz szk贸艂 o najwy偶szym poziomie tej cechy.
Identyfikacja tych pierwszych powinna prowadzi膰 do uruchamiania dzia艂a艅 naprawczych ze strony
nadzoru pedagogicznego, rozpoznanie najlepszych plac贸wek pozwala nierbitralnie wybiera膰
szko艂y, kt贸re mog膮 zr贸de艂 inspiracji dla innych.
7. Metoda EWD mo偶e by膰 z powodzeniem stosowana do ewaluacji wewn膮trzszkolnej. EWD
pozwala analizowa膰 takie problemy jak: efektywno艣膰 nauczania w poszczeg贸lnych klasach, skutki
segregacyjnych metod dzielenia uczni贸w na oddzia艂y, problemy r贸wno艣ci szans edukacyjnych
r贸偶nych grup uczni贸w, ocena skuteczno艣ci r贸偶nych dzia艂a艅 zmierzaj膮cych do podniesienia jako艣ci
18
nauczania.
8. Krytyczna analiza metody EWD pozwoli艂a zidentyfikowa膰 kluczowe problemy metody.
a. Jako艣膰 metody edukacyjnej warto艣ci dodanej zale偶y od dw贸ch czynnik贸w, kt贸re s膮 wobec niej
zewn臋trzne. S膮 to program kszta艂cenia i wiedza o czynnikach decyduj膮cych o opanowywaniu
przez uczni贸w cel贸w kszta艂cenia, co 艂膮cznie mo偶na nazwa膰 teori膮 kszta艂cenia. Tylko wtedy, gdy
model szacowania EWD jest zbudowana na dobrej teorii kszta艂cenia, wskazniki mog膮 by膰 pe艂ni
warto艣ciowe. Podstawowe zadanie do wykonania to rozw贸j program贸w nauczania i doskonalenie
test贸w egzaminacyjnych. Obecnie warto艣膰 metody EWD jest ograniczona przez s艂abo艣膰
standard贸w wymaga艅 egzaminacyjnych i - powi膮zan膮 z tym - problematyczn膮 trafno艣膰 narz臋dzi
pomiarowych.
b. Poniewa偶 jest wysoce prawdopodobne, 偶e takie zasoby szko艂y, jak potencja艂 edukacyjny
uczni贸w, wyposa偶enie dydaktyczne czy korzystny sk艂ad spo艂eczny szko艂y s膮 powi膮zane z
efektywno艣ci膮 nauczania, do modeli szacowania EWD nale偶y bardzo ostro偶nie w艂膮cza膰
dodatkowe zmienne. Cho膰 mamy przyk艂ady stosowania tzw. modeli kontekstowych szacowania
EWD (Anglia), to rozwi膮zania takie nale偶y wdra偶a膰 z du偶膮 ostro偶no艣ci膮.
c. Precyzji wskaznik贸w EWD zagra偶a niedostateczna rzetelno艣膰 test贸w. Z punktu widzenia metody
EWD kluczowe s膮 dwa zr贸d艂a b艂臋du pomiaru: efekt egzaminatora i efekt 艣ci膮gania.
d. Ka偶da nowa informacja o jako艣ci nauczania ma szans臋 wp艂ywa膰 na procesy decyzyjne, gdy jest
w艂a艣ciwie rozumiana. Oznacza to, 偶e wdro偶enie metody EWD to wielkie przedsi臋wzi臋cie
szkoleniowe. Bardzo du偶o ju偶 w tym zakresie zrobiono, jeszcze wi臋cej jest do wykonania.
Bibliografia
Ball, S., J. (1993) Education Markets, Choice and Social Class: The Market as a Class Strategy in the UK
and USA. British Journal of Sociology of Education, Vol. 14, Issue 1, pp. 3-20.
Dolata R. (2002) Procedury rekrutacji i dzielenia uczni贸w na oddzia艂y w gimnazjach - pr贸ba oceny z
perspektywy nier贸wno艣ci spo艂ecznych w edukacji. W: Zmiany w systemie o艣wiaty. Wyniki bada艅
empirycznych. Instytut Spraw Publicznych, Warszawa.
Dolata R. (2006) Edukacyjna warto艣膰 dodana w komunikowaniu wynik贸w egzamin贸w zewn臋trznych.
Egzamin. Biuletyn Badawczy CKE, 8, s. 9-20.
Dolata R. (2006) Efektywno艣膰 nauczania w gimnazjach miasta X. Analiza edukacyjnej warto艣ci dodanej.
Egzamin. Biuletyn Badawczy CKE, 8, s. 28-37.
Dolata R., Murawsk膮 B., Putkiewicz E., 呕ytko M. (1997) Monitorowanie osi膮gni臋膰 szkolnych jako metoda
doskonalenia edukacji. Zarys metody oraz przyk艂ady zastosowa艅 w edukacji pocz膮tkowej. Warszawa,
Wydawnictwo 呕ak.
Hanushek E., A. (1986) The economics of schooling: production and efficiency in public schools. Journal of
Economic Literature, vol. 24, pp. 1141-1177.
Jakubowski M. (2006) Empiryczna analiza metod szacowania edukacyjnej warto艣ci dodanej. Egzamin.
Biuletyn Badawczy CKE, 8, s. 83-112.
Jakubowski M. (2006) Metody szacowania edukacyjnej warto艣ci dodanej. Egzamin. Biuletyn Badawczy CKE,
8, s. 67-82.
Pokropek A. (2006) Analiza trafno艣ci wskaznika edukacyjnej warto艣ci dodanej. Egzamin. Biuletyn Badawczy
CKE, 8, s. 113-136.
Rothstein R. (2004) Class and schools. Using social, economic, and educational reform to close the Black-
White achievement gap. Washington, Teachers College, Columbia University.
Schagen I., Hutchinson D. (2003) Adding value in educational research - the marriage of data and analitical
power. British Educational Research Journal, vol. 29, no. 5.
Vasta R., Haith M., M., Miller S., A. (1995) Psychologia dziecka. Warszawa. WSiP.
Gorard S., Fitz J. (2000) Markets and stratification: a view from England and Wales. Educational Policy, vol.
14, no. 3, pp. 405-428.
19


Wyszukiwarka

Podobne podstrony:
Jak w praktyce wykorzystywa膰 wyniki analiz Activity Based Costing
Wyniki Egzaminu z Metod i Algorytm贸w Sterowania Cyfrowego
Jak wykorzysta膰 metod臋 FIFO do wyceny rozchodu zapas贸w i walut
Jak zda膰 ka偶dy egzamin MATURA 2008 Jak uczy膰 si臋 do egzaminu! Wej艣膰 na sal臋 i opanowa膰 nerwy!
Jak wykorzystac adaptogeny Owoc Noni
Wyniki Egzaminu z Metod i Algorytm贸w Sterowania Cyfrowego 1
Jak wykorzysta膰 dobr膮 reputacj臋
Jak wykorzystywa膰 energi臋 promieniowania
Wyniki egzaminu z Chemii (12 02 06)
alicja arndt goldenline jak wykorzysta media spolecznosciowe w rekrutacji
wyniki egzaminu
jak analizowa膰 wyniki pomiar贸w fizyka
Jak podej艣膰 do egzaminu

wi臋cej podobnych podstron