WYKŁADY 1,2,3. 06.10., 13.10., 20.10.
CO TO JEST WSAŹNIK?
Wskaźnikiem jakiegoś zjawiska/cechy obserwowalnego/nieobserwowalnego nazywamy inne względnie łatwo obserwowalne zjawisko/cechę, którego zaobserwowanie pozwala określić z wystarczająco wysokim prawdopodobieństwem o wystąpieniu badanego zjawiska/posiadaniu określonej cechy.
Performance indicator - ocena sprawności realizacji przedsięwzięć
wskaźnik wykonania dynamika procesu
nacisk na efekty
key performance indicator - wpływ podjętych działań na sytuację przedsięwzięć/organizacji
Wskaźniki polityk społecznych - jak działania oddziałują na rozwiązanie problemu
decyzje w zakresie sposobu/zakresów działania
policy makers - decydent publiczny - alokacja zasobów
reguluje
jak oszacować efekt netto - czy to jest efekt działania
wskaźnik wykonania - przełożenie celów na mierzalne wskaźniki wykonania -> kwantyfikacja celów
powstają w procesie konceptualizacji i operacjonalizacji
zwymiarowanie zdefiniowanych i wyeksplikowanych pojęć
problemów
nie można brać wskaźników fasadowych, które pasują tylko semantycznie
wskaźnik musi zostać dobrany do celu polityki społecznej
wskaźnik musi spełniać kryteria trafności
konsekwencje społeczne jego zastosowania nie mogą odbiegać od założonych celów
wskaźnik jest kwestią publiczną
Wskaźnik relatywny - odnosi się do ogólnego poziomu danego społeczeństwa
np. 60% mediany dochodów
absolutny - niezależna podstawa wyliczenia
Wskaźnik to zmienna - cecha, która może przybierać różne wartości
nie jest liczbą - liczba to jego wartość
to zmienna obserwowalna i mierzalna
to nie konstrukt (np. poziom zadowolenia)
Wskaźnik nie musi definiować zjawiska - może być korelatem zjawiska -
wskaźnik empiryczny - aspekt zjawiska - część definiensu (wyposażenie wskaźnik statusu)
- empiryczny korelat - wskaźnik korelacyjny zewnętrzny (wykształcenie wskaźnikiem pozycji społecznej)
wskaźnik inferencyjny - zjawisko wskaźnikowane nieobserwowalne - z zajścia wskaźnika wnioskujemy o zajściu zjawiska wskaźnikowanego (wskaźniki postaw)
Wskaźniki SMART - performance indicator
Specific Konkretne-w jasny,niewątpliwy sposób odzwierciedlające cel
Measureable Mierzalne- da się ustalić wartości - ilościowy
Agreed Upon Uzgodnione- zgoda - jednakowe rozumienie
Realistic & sensitive Realistyczne i czułe- rozsądne z pkt. widzenia zasobów, wrażliwe na zmiany
Time bound & cost effective Określone w czasie i ekonomiczne
Cele SMART
Specific Konkretne
Measureable Mierzalne
Achievable Osiągalne
Realistic Realistyczne przy istniejących zasobach
Time-bounded Określone w czasie
Wskaźniki powinny ujmować istotę problemu oraz posiadać jasną oraz normatywnie
akceptowalną interpretację
- zadaniem wskaźników nie jest podsumowanie całej rzeczywistości, ale wychwycenie esencji problemu
- odbiorca powinien by pewien, jak ocenia kierunek zmian reprezentowanych przez dany wskaźnik
- wskaźniki powinny by uznawane za sensowne przez opinię publiczną (postulowana partycypacja przy ustanawianiu wskaźników)
- powinny charakteryzować się intuicyjną trafnością
- wskaźniki powinny korespondować z konkretnymi celami polityk i programów
- wskaźniki powinny mieć postać pozwalającą na ustanawianie planowanych wartości docelowych i ocenę stopnia ich realizacji
Wskaźniki powinny być odporne na zniekształcenia i sprawdzone pod względem statystycznym
- powinny być oparte na wiarygodnych danych nie poddanych arbitralnym korektom
- jeśli dane pochodzą z sondaży, to tylko z reprezentatywnych i spełniających najwyższe standardy metodologicznie pod względem doboru próby, konstrukcji kwestionariuszy, realizacji badań, obróbki danych i analizy wyników
- należy dążyć do minimalizacji błędu badania, a zwłaszcza do unikania obciążenia wyników błędem systematycznym
- powinno się unikać wskaźników, które podlegaj silnie wpływowi nieprzewidywalnych (np. pogoda) i niewyjaśnialnych czynników
- należy zachować ostrożność wobec wskaźników, których wartość w znacznym stopniu nie zależy od polityk publicznych, lecz od czynników niezależnych, np. cyklu koniunkturalnego
Wskaźnik powinien odzwierciedlać oddziaływanie interwencji publicznych, ale nie może być łatwym przedmiotem manipulacji politycznych
- wskaźnik powinien zmieniać wartość, jeśli interwencja przynosi efekty
- wskaźniki powinny dać się powiązać z działaniami
- wskaźniki nie powinny pozwalać na manifestowanie pozornych efektów (np. proporcję podmiotów objętych świadczeniem można łatwo zwiększyć przyznając na szeroką skalę minimalne świadczenia)
Wskaźnik powinien być w zbliżony sposób mierzony i porównywalny dla państw członkowskich UE (względnie regionów), oraz w takim stopniu, jak jest to możliwe, porównywalny z międzynarodowymi standardami (np. ze standardami ONZ czy OECD)
Wskaźnik powinien być aktualny oraz umożliwiać niezbędne korekty
- podstawowe dane makroekonomiczne są na ogół dość aktualne, natomiast inne dane często nie spełniaj postulatu wystarczającej aktualności
- bardzo ważne jest zbudowanie odpowiedniego potencjału statystycznego w kraju, który będzie zdolny do dostarczania na czas właściwych informacji
- jeśli następuje zmiana w definicji celów polityk lub postęp w rozumieniu sensu zjawisk, powinno to znaleźć odzwierciedlenie w konstrukcji wskaźników
Pomiar wskaźnika nie powinien być zbyt dużym obciążeniem dla państwa, dla krajowych przedsiębiorstw, ani na obywateli - stąd potrzebna jest kreatywność w używaniu danych administracyjnych i już dostępnych danych statystycznych
Zasady dotyczące konstrukcji portfela wskaźników
- portfel wskaźników powinien być rozsądny pod względem liczby obejmowanych przez siebie wymiarów, ale powinien ujmować możliwie wszystkie kluczowe obszary problemowe danego zagadnienia społecznego
- wskaźniki powinny się wzajemnie uzupełniać, a waga każdego wskaźnika w portfelu powinna być jasno określona, pozwalając na odróżnienie wskaźników o kluczowym znaczeniu od tych, które są pomocnicze
- portfel wskaźników powinien być jak najbardziej przejrzysty, zrozumiały i dostępny dla obywateli UE, tak aby opinia publiczna była w stanie zrozumieć znaczenie wskaźników
Poziom pierwszy - wskaźniki podstawowe (primary indicators), obejmują małą grupę głównych wskaźników, które dotyczą najistotniejszych czynników;
Poziom drugi - wskaźniki pomocnicze (secondary indicators) stanowią uzupełnienie wskaźników wiodących, gdy opisują dodatkowe wymiary problemu;
Wskaźniki pierwszego jak i drugiego poziomu powinny być obliczane z uwzględnieniem dezagregacji według różnych cech (geograficznych, społeczno - demograficznych, wynikających z kryteriów horyzontalnych)
Poziom trzeci - (a third level of indicators), do tego poziomu zalicza się dodatkowe wskaźniki, które poszczególne państwa członkowskie mogą stosować w swoich Krajowych Planach Działania w celu uwzględnienia specyfiki krajowej oraz aby ułatwić właściwą interpretację wskaźników dwóch pierwszych grup. Wskaźniki trzeciej grupy nie są harmonizowane na poziomie unijnym.
Ogólna Metoda Koordynacji Programów Regionalnych?
Cztery filary OMK:
- System wskaźników
- Plany działania
- Partnerskie recenzje (ewaluacje ex-ante)
- Wspólne raporty
Koncepcja systemu wskaźników związana z Ogólną Metod Koordynacji Polityk Społecznych
może być zaadaptowana do budowy Ogólnej Metody Koordynacji Programów Rozwoju Regionalnego
Np. wskaźniki z poziomu I
- wskaźnik zagrożenia ubóstwem (wg typów aktywności ekonomicznej, typów gospodarstwa domowego, typu własności mieszkania)
- wskaźnik kwintylowego zróżnicowania dochodów (stosunek dochodów na poziomie 1kwintyla i 4kwintyla)
LOGIKA PROGRAMU
Wkład - zasoby wydatkowanie w ramach reguł
- rzeczywiste wydatki są źródłem rzeczowych wyników, pokazujących poczyniony postęp we wdrażaniu danego działania (działania są wdrażane za pomocą zasobów)
Wyniki - pierwszy skutek działań - produkt (output)
Rezultaty - zaobserwowana zmiana w stosunku do podmiotu działania (beneficjenta)
- bezpośrednie efekty, wyrażone w kategoriach wpływu (oddziaływania) na osiągnięcie ogólnych/szczegółowych celów programu
- stanowią główną podstawę dla uznania, że dana pomoc zakończyła się sukcesem/porażką
Wpływ -oddziaływanie rezultatów na otoczenie społeczeństwa i sytuację beneficjenta w aspekcie globalnym i lokalnym
Cele operacyjne - stan rzeczy w przyszłości - ten, który chcemy osiągnąć
Program - składa się z projektów
wpływ i rezultat
Projekty - definują produkty - wskaźniki i monitorowanie postępu rezultaty
Wskaźniki programu: wkład, wyniki, rezultaty i wpływ
W celu monitorowania wdrażania programu i oceny jego efektywności w stosunku do ustalonych celów, konieczne jest ustalenie zestawu wskaźników. Decyzje w tej sprawie powinny być podejmowane jeszcze przed rozpoczęciem wdrażania programu lub we wczesnej fazie jego realizacji tak, aby odpowiednie dane mogły zostać zebrane. W większości
przypadków można im przypisać poziomy celów, które ogólnie odpowiadają celom programu.
Możemy więc wyróżnić następujące poziomy wskaźników:
wskaźniki wkładu dotyczą przyznanego budżetu na każdym poziomie pomocy. Wskaźniki finansowe są wykorzystywane do monitorowania postępów w ramach (rocznych) zobowiązań i wypłat funduszy dostępnych dla danego działania lub programu w stosunku do jego dopuszczalnych kosztów. Monitorowanie nakładu - stopnia jego wykorzystania.
Wskaźniki wyników odnoszą się do działalności. Są one mierzalne w jednostkach fizycznych lub monetarnych (np. długość zbudowanej drogi, liczba przedsiębiorstw, które otrzymały wsparcie finansowe).
Wskaźniki rezultatu odnoszą się do bezpośredniego efektu spowodowanego przez program. Dostarczają one informacji o zmianach np. w zachowaniu, zdolności i efektywności bezpośrednich beneficjentów. Wskaźniki te mogą być wyrażane w jednostkach fizycznych (np. skrócenie czasu podróży, liczba uczestników, którzy ukończyli szkolenie, liczba wypadków drogowych, etc.) lub finansowych (wzrost zasobów sektora prywatnego, obniżenie kosztów transportu).
Wskaźniki wpływu odnoszą się od konsekwencji programu wykraczających poza jego bezpośrednich beneficjentów - odsunięty w czasie. Można zdefiniować dwa typy wpływu: wpływ bezpośredni, to te efekty, które występują po upływie pewnego czasu, ale bezpośrednio wiążą się z podjętymi działaniami; wpływ globalny to efekty w długim okresie, oddziałujące na szerszą populację. Badanie tego wpływu jest złożone, a określenie przejrzystych relacji przyczynowo-skutkowych często bardzo trudne.
Może być też efekt przewrotny - negatywny, nieprzewidziany.
EWALUACJA
Zagadnienia specyficzne dla ewaluacji
- Odpowiedniość (adekwatność): Do jakiego stopnia cele programu są odpowiednie do zmieniających się potrzeb i priorytetów na poziomie krajowym i ewolucyjnym?
- Efektywność: W jaki sposób zasoby (wkład) zostały przetworzone na wyniki i rezultaty?
- Skuteczność: Do jakiego stopnia program przyczynił się do osiągnięcia jego szczegółowych i ogólnych celów?
- Użyteczność: Czy program przyczynił się do zaspokojenia potrzeb grup docelowych lub społecznych?
- Trwałość: Jakie są szanse, że zmiany (lub wytworzone dobra) będą trwały po zakończeniu programu?
Ewaluacja mid-term w trakcie, jak program już trwa
ex-post
ex-ante ocena szacunkowa wpływu/oddziaływania/wyrażalności - trafność, rzetelność i spójność celów działania
WYKŁAD 4, 27.10.
ANALIZA CZYNNIKOWA
Pomiar
Rodzaje skal
Trafność - błąd trafności (błąd systematyczny); trafianie w istotę rzeczy
Rzetelność - spójność uzyskiwanych wyników (w kolejnych pomiarach)
Wariancja - miara zmienności; jak są obiekty zróżnicowane pod względem jakiejś cechy
Σ (x - x )²
s² = n-1
Rzetelność - stosunek wariancji prawdziwych wyników do wariancji całkowitej uzyskanych rzeczywistych wyników;
Najlepiej jak sp²/sc²=1, a jak jest <1 to rzetelność nie jest doskonała
Badacz dysponuje pewną liczbą wzajemnie zastępowalnych podobnych, skorelowanych wskaźników.
Cecha ukryta przejawia się w uniwersum wskaźników wtedy zjawisko można mierzyć równolegle (wskaźniki równoległe).
Jedno pytanie/wskaźnik nie jest doskonale skorelowane z przedmiotem badań
Błąd losowy - niekontrolowany czynnik
Błąd systematyczny
SKALOWANIE
W jaki sposób można konstruować w oparciu o szereg wskaźników pomiar, który jest wystarczająco rzetelny, trafny i jest syntetycznym połączeniem wskaźników
SKALA - zjawisko ukryte oddziałuje na szereg zmiennych obserwowalnych
INDEKS - pierwotny wobec skali
arytmetyczne podsumowanie pomiarów wartości
szereg obserwowalnych zmiennych mający swój udział w zaistnieniu zjawiska
wskaźniki kompozytowe
WYKŁAD 5, 10.11.
ZJAWISKO KORELACJI
Współczynnik korelacji Pearsona (w kontekście modeli regresji liniowej)
Pojawia się kiedy mierzymy związek dwóch zmiennych (ilościowych) - regresja
korelacja
MODEL REGRESJI
y = a + bixi (b nachylenie prostej)
ustalenie siły związku
współczynnik korelacji Pearsona - zależność liniowa, związek liniowy
model - idealny kształt zależności, która faktycznie nie występuje
współczynnik regresji (b) - mierzy siłę wpływu
o ile przeciętnie zmienia się wartość y przy zmianie wartości x, przy związku liniowym
współczynnik determinacji R² - w jakim stopniu wariancja zmiennej zależnej y jest określona przez model liniowy można wyliczyć wartość przewidywaną przez model
rozrzut punktów wzdłuż modelu regresji
wariancja - różnica wartości rzeczywistej, obserwowalnej i wartości przewidywanej
yi - yiˆ ≠ 0
kowariancja - sxy = Σ (x - x )(yi - y) ∑ (zix-ziy)
n-1 n-1
koncepcja standaryzacji
odchylenie standardowe
Współczynnik korelacji - współczynnik kowariancji dla obserwacji standaryzowanych, zmienia się od -1 do 1.
Stopień dopasowania liniowego a nie wpływ zmiennej x na y
r=b dla zmiennych standaryzowanych
Σ (x - x )(yi - y)
b=
Σ (x i- x )² wariancja zmiennej niezależnej
Ssx
r= b przy uwzględnieniu odchyleń standardowych
Sy
Zależna wartość od stosunku odchyleń standardowych zmiennej od rozproszenia wzdłuż modelu liniowego
Jaka część wariancji zmiennej stanowi to, co ona podziela z drugą zmienną
Stopień dopasowania modelu do modelu regresji
Im większa część wariancji zmiennej zawiera błąd, wówczas współczynnik korelacji nie może osiągnąć wartości graniczniej
KORELACJA
Zależność musi być liniowa
Poziom dopasowania modelu liniowego do danych
Przekształcenie współczynnika regresji z uwzględnieniem stosunku odchylenia standardowego między zmiennymi
WYKŁAD 6, 17.11.2006
ANALIZA GŁÓWNYCH SKŁADOWYCH. ANALIZA CZYNNIKOWA - technika dekompozycji macierzy
Zapewnienie jednowymiarowości skali
PO CO? - zmierzenie optymizmu ekonomicznego (pozytywne ocenianie sytuacji) - korelacja poziomu optymizmu własnego i kraju
2 komponenty:
Teoria zjawiska - struktura zależności między elementami modelu związki między elementami
nieobserwowalne postawy pytania o kwestie stanowiące ekspresję tych postaw (wskaźniki inferencyjne)
Teoria pomiaru - każda ze zmiennych ma swoje wskaźniki
Założenie, że dany konstrukt jest dobrze mierzony przez określone wskaźniki
Na obserwowalne korelacje wpływa jakaś cecha, którą możemy zmierzyć
Związek między zjawiskami a ich wskaźnikami
Wskaźniki formatywne - cechy, które to zjawisko wskaźnikowane kształtuje
PODEJŚCIE KONFIRMACYJNE - KONFIRMACYJNA ANALIZA CZYNNIKOWA
sprawdzenie czy układ współzmienności cech obserwowalnych „usprawiedliwia” istnienie danego modelu pomiarowego (zestaw wskaźników - kwestionariusz)
1 jest czynnik
2 jest zbiór wskaźników mierzących czynnik
3 testujemy model
EKSPLORACYJNA
Zbiór wzajemnie skorelowanych wskaźników, które są efektem oddziaływania czynnika
Dopuszczamy, że każdy czynnik jest związany z każdym wskaźnikiem
Z danym czynnikiem będzie związany ten wskaźnik, który jest z nim silnie skorelowany silna zmiana pod wpływem silnej zmiany czynnika
ładunki czynnikowe - standaryzowany współczynnik regresji
potwierdzenie trafności konstruktowej pewna grupa wskaźników mierzy zasadniczo jeden czynnik; wskaźniki mają wysoki ładunek tylko z 1 czynnikiem; wskaźniki wyraźnie się grupują
WYKŁAD 8, 01.12.2006
Spośród wielu zmiennych chcemy wybrać te wskaźniki (inferencyjne), które najlepiej mierzą daną cechę ukrytą chcemy stworzyć skalę, która zmierzy dany czynnik
czy pytania grupują się w zestawy, które mierzą dany czynnik wyraźne, wyodrębnione cechy, raczej nieskorelowane
ANALIZA CZYNNIKOWA - EKSPLORACYJNA
W SPSS
Analiza redukcja danych analiza czynnikowa wsadzamy pytania, które naszym zdaniem kojarzą się z daną cechą, którą chcemy mierzyć
Zmienne ilościowe - co najmniej przedziałowe
Rotacja ortogonalna - założenie: czynniki (cechy) nie są skorelowane
Wartość własna - jaka jest wariancja danej składowej >1 powinna być - kryterium Kaisera
wariancja składowej jest większa niż pojedynczej zmiennej, reprezentuje więcej niż pojedyncza zmienna
po wyodrębnieniu - jaką część zróżnicowana danej składowej wyjaśnia dana zmienna
Wykres osypiska - Katel - ile czynników leży u podstaw korelacji między zmiennymi
Macierz rotowanych składowych -
Ładunki czynnikowe - współczynnik korelacji
Standaryzowane współczynniki regresji
Ładunek² - jaka część wariancji zmiennej jest związana z danym czynnikiem
0,5/ 0,6 - kwalifikowanie do danego czynnika
Rotacja skośna - dopuszcza korelację składowych => 3 macierze modelowe (wzoru czynników)
< 0,3 - korelacja mała
WYKŁAD 9. 8.12.2006
Skala sumowanych ocen, opartych na czynniku sumowanie wartości
W SPSS: przekształcenia oblicz wartość zmiennej
sum (zmienna1, zmienna2, ..)/ n =valid (zmienna1, zmienna2…) - liczba pozycji skali
uśrednia wynik
mean (zmienna1, zmienna2, …)
analiza rzetelności
w SPSS: skalowanie analiza rzetelności
α Crombacha średnia wartość wszystkich wartości połówkowych α Crombacha
α Crombacha zależy od:
poziomu skorelowania pozycji (pytania)
liczby pozycji
im więcej pozycji tym większa rzetelność
korelacja - zmienność wspólna ma być jak największa
kumulacja korelacji
indywidualna rzetelność wskaźnika
>0,7 wystarczająca rzetelność
α if item deleted - przy wykluczeniu pozycji: w jaki sposób indywidualna pozycja składa się na rzetelność skali
w SPSS
STATYSTYKI
pozycja testowa
skala
skala przy wykluczeniu pozycji
wartość własna jest monotonicznie związana z α Crombacha
im wyższa (>1) wartość własna tym wyższa α => ale to nie zależność liniowa
Alfa
Wartość własna
Eliminowanie ze skali pozycji, które nie wnoszą nic nowego, a obciążają narzędzie badawcze
Lepsze skale z mniejszą liczbą pytań
5cio punktowe skale bardziej rzetelne
Skalowanie kumulatywne - Gutmana - współczynniki odtwarzalności
WYKŁAD 10, 11, 12 05.01.2007 - 19.01.2007
RODZAJE BŁĘDÓW W SONDAŹU
Błąd losowy
Błędy nielosowe:
Błąd w definicji populacji, błędy w operacie, zła próba
Błędy pomiarowe - złe pytania, błędy w konstrukcji kwestionariusza, błędy respondenta
Błędy braków odpowiedzi - respondenci nie są reprezentatywną próbą populacji
Błędy w kodowaniu - błędy w kodowaniu i wprowadzaniu danych
Błędy nielosowe trudno oszacować - konieczna większa ostrożność we wnioskowaniu
Błąd standardowy - przedział ufności - miara rozrzutu
Błąd standardowy mierzy błąd losowy próby
Rozkład z próby - rozkład statystyki z nieskończonej liczby prób
średnia wyliczona ze średnich prób
Estymator - wzór wg którego wyliczamy wartości w próbie
Udział błędu systematycznego rośnie wraz z liczebnością próby
Losowanie warstwowe - dzielę próbę wg jakichś cech i z każdej grupy losuję kogoś
Zapewnienie reprezentacji każdej warstwy w próbie - nadreprezentacja małych warstw
Zapewnienie niezbędnej liczebności do porównań między warstwami
Zwiększenie precyzji oszacowań, gdy warstwy są względnie jednorodne wewnętrznie
Losowanie zespołowe - dzielę na grupy i tylko z kilku grup losuję
Losowanie wielostopniowe
Losujemy zespoły (np. jednostki terytorialne, szkoły)
Ewentualnie losujemy zespoły wewnątrz zespołów (np. ulice, klasy)
Losujemy ostateczne jednostki wewnątrz zespołów (np. uczniów)
Przykład: losujemy kwartały budynków i wybieramy do badania co k-te mieszkanie wg określonej kolejności
Zawsze staramy się stosować warstwowanie, jeśli tylko jest to możliwe
Próba kwotowa
Nielosowy wybór osób tak, by ze względu na wybrane cechy uzyskać strukturę próby odpowiadającą populacji
Proporcjonalna próba kwotowa
Nieproporcjonalna próba kwotowa
Redukcja błędu nielosowego
Uważna definicja problemu
Szkolenie i kontrola ankieterów
Pilotaż narzędzia badawczego
Wykonaj próbną analizę
Wdrożenie procedur kodowania i czyszczenia danych
Weryfikacja i komputerowe czyszczenie danych
Działania na rzecz zwiększenia poziomu realizacji
Korekta ze względu na braki realizacji (ważenie i imputacja)
KONSEKWENCJE BRAKÓW DANYCH
Zniekształcenie ocen populacji na podstawie statystyk z próby
zależy od mechanizmu generującego
losowy - zmniejsza liczebność próby ale nie ma błędu systematycznego
nielosowy
Rodzaje braków danych
Całkowity brak danych o wylosowanej jednostce, wynikający z niepowodzenia w uzyskaniu od niej odpowiedzi na cały kwestionariusz
Brak odpowiedzi na pojedyncze pytania kwestionariusza w przypadku osób, które zgodziły się wziąć udział w badaniu
Rodzaje mechanizmów generujących braki danych
MCAR (Missing Completely At Random) - gdy brak danych jest całkowicie losowy;
MAR (Missing At Random) - gdy brak danych jest losowy - w obrębie kategorii wyznaczonych przez inne cechy objęte badaniem;
NMAR (Not Missing At Random) - nielosowe braki danych - gdy prawdopodobieństwo wystąpienia braku w przypadku danej zmiennej jest związane z poziomem tej zmiennej; zwane również nieignorowalnymi brakami danych.
Sposoby postępowania z brakami danych
Wykluczanie obserwacji z brakami danych - analiza kompletnych obserwacji (MCAR) - nie ma problemu tylko, jeśli to jest losowe
Zastępowanie braków danych - imputacja (MAR) - brak danych na konkretne pytania; narzucanie wartości - np. średnia arytmetyczna ze zmiennej, dominanta
Ważenie - kompletne braki danych
Wykluczanie obserwacji
Usuwanie obserwacjami (casewise)
Usuwanie parami (pairwise)
Problem - dany wskaźnik nie będzie się składał z takiej samej liczby obserwacji - jak porównywać?
Zastępowanie braków danych - zalety
Ułatwia pracę analitykowi
Analizy są spójne, gdyż nie ma potrzeby usuwania obserwacji
Upraszcza prezentację wyników sondażu
Zachowuje wszystkie dostępne dane, co może pozwolić na uzyskanie bardziej precyzyjnych ocen parametrów w modelach wielowymiarowych.
Zastępowanie braków danych - wady
Niektóre formy imputacji zniekształcają rozkład (średnią, wariancję) zmiennych poddanych imputacji i tłumią współzależności. Dotyczy to zwłaszcza mechanicznego zastępowania przez średnią.
Imputacja prowadzi do niedoszacowania wariancji estymatorów, gdyż podstawiane wartości traktowane są przez program statystyczny tak samo jak pełnowartościowe dane - niedoszacowanie błędu standardowego - poczucie nadmiaru precyzji
Trudno jest przekonać analityków do stosowania imputacji. Analitycy wolą nie używać „sfabrykowanych” danych.
Metody imputacji
Podstawianie średniej
Średnia ogólna plus błąd losowy
Średnia grupowa (plus błąd losowy)
„Hot deck”
Metoda regresyjna
Sekwencyjne metody regresyjne
Metoda EM (expectation-maximization)
Imputacja wielokrotna
Podstawianie średniej
Średnia ogólna
średnia jest zachowana
odchylenie standardowe jest niedoszacowane
liczebność próby jest zawyżona
Średnia plus błąd losowy
zachowuje średnią i zmienność
zaniża błąd standardowy
tłumi korelacje
dwie metody:
losowa reszta
wariata z rozkładu normalnego
Średnia grupowa (plus błąd losowy)
Hot deck („gorąca karta”)
Odmiany:
sekwencyjna
hierarchiczna (losowy dobór w klasach)
Problemy:
wielokrotni dawcy
problem z granicami przy sortowaniu
słaba korelacja wewnątrz grup
Zalety:
prostota
skuteczność
dla danych jakościowych
sortujemy zbiór danych z punktu widzenia danych, co do których dysponujemy kompletami danych (np. płeć, wykształcenie) - obok siebie w zbiorze danych występują podobne osoby - zastępuję brak daną z przypadku poprzedniego
Metoda regresyjna
Deterministyczna - w oparciu o wartości teoretyczne
Z błędem losowym - wartości teoretyczne + losowy błąd
Sekwencyjna
Mamy p zmiennych y = (y1, y2, ..., yp)', w których chcemy wykonać imputację b.d. i q pomocniczych zmiennych z=(z1, z2, ..., zq).
Zmienne należy uporządkować od tej, która wymaga najmniej imputacji, do tej, która wymaga ich najwięcej.
Wykonaj imputację y1 na podstawie predyktorów z.
Wykonaj imputację zmiennej y2 na podstawie zmiennych z oraz uzupełnionej zmiennej y1, itd., aż do yp.
Wykonaj ponownie imputację każdej zmiennej yp używając wszystkich predyktorów ze zbioru z i y (uzupełnionych o imputowane wartości).
Powtarzaj ten proces aż do ustabilizowania imputowanych wartości.
Metoda E-M expectation-maximalization - na zmianę szacuje kowariancję i korelację i imputuje zmienne
E - expectation, w którym następuje imputacja braków danych w oparciu o regresję
M - maximization, w którym metodą największej wiarygodności szacowana jest średnia i macierz kowariancji na postawie uzupełnionych danych .
Etapy te powtarzane są aż do osiągnięcia zbieżności.
Użycie metody największej wiarygodności wymaga przyjęcia założenia o rozkładzie zmiennych w populacji
Imputacja wielokrotna
Technika, która pozwala oszacować dodatkowy przyrost wariancji estymatora spowodowany imputacją. Polega ona na wykonaniu imputacji m razy, stosując tę samą lub odmienne techniki imputacji
W SPSS:
Analiza analiza braków danych
Jakie zmienne poddajemy analizie: jakościowe - wprowadzenie tych danych nie służy imputacji, tylko analizie - do diagnostyki braków danych
ilościowe
STATYSTYKI - opisowe: dla zmiennych ilościowych (średnia, odchylenie, liczba obserwacji ekstremalnych)
Braki danych dla wszystkich zmiennych
i procent
procent niedopasowań zmiennych wskaźnikowych
jakie będą konsekwencje usuwania pojedynczych zmiennych w przypadku porównywania parami
jaki będzie procent braków danych jak będą dwie zmienne badane razem (zetknięte razem)
UKŁADY - jakie są wzory braków danych
jak często występują braki w bazie
odrzucamy hipotezę jak p dwustronne jest <0,5 (alfa, KMO, etc.)
=>wtedy braki danych w jednej kategorii spowoduje systematyczne obciążenie innych zmiennych
Imputacja:
metoda regresyjna imputacji
metoda E-M
Regresja - zapisz kompletne dane- utworzenie nowego zbioru
braki danych zostaną zastąpione przez dane oszacowane na podstawie tej metody
odchyle nie standardowe jest większe przy metodzie regresyjnej, bo tam dodajemy do szacowanej wartości losowo wybraną resztę
odtwarza się odchylenie standardowe tych przypadków, które mają kompletne dane
zachowane są informacje o odchyleniu standardowym
TABELE: analiza- tabele specjalne - tabele użytkownika
WAŻENIE
W SPSS: dane - ważenie obserwacji
Dane z próby, które są poddane ważeniu, ale zastosowane wagi są dla całej populacji
czyli, że np. 250 osób reprezentuje 3 mln rzeczywistych
Suma wag jest równa liczebności próby - waga populacyjna - waga odwrotnością prawdopodobieństwa znalezienia się w próbie
Ważenie modyfikuje
To są estymacje uogólnione i oszacowane
Ważenie próby jest istotnym elementem precyzyjnie realizowanych badań sondażowych. Ważenie wykonujemy (o ile wymaga tego sytuacja) z trzech podstawowych powodów, a są to:
kompensacja skutków niejednakowego prawdopodobieństwa dostania się do próby; ważenie ze względu na źródło odrzutu z próby - wynika ze schematu losowania. Ma na celu doprowadzenie próby do takiej struktury jaką ma populacja
kompensacja skutków nieuzyskania danych o część osób (elementów) wylosowanych do próby;
chęć lepszego dostosowania rozkładu próby do znanego rozkładu wybranych cech w populacji.
Poststratyfikacja - zakłada, że znamy rozkład populacji
Ważenie a precyzja estymacji
Ważenie zmniejsza błąd systematyczny
Ważenie zwiększa błąd losowy
15
Ii
Potencjalne źródła błędu w sondażu
Całkowity błąd
Losowy błąd próby
Błąd nielosowy
Błąd pomiaru
Błąd nie zw. z pom.
Błędy badacza
Błędy ankietera
Błędy respondenta
Błędy informacji zastępczej
Błędy pomiarowe
Błędy definicji populacji/operatu
Błędy analizy danych
Błędy informacji zastępczej
Błędy pomiarowe
Błędy definicji populacji/operatu
Błędy analizy danych
Błędy informacji zastępczej
Błędy pomiarowe
Błędy definicji populacji/operatu
Błędy analizy danych