Rozdział 6
MODELE ZMIENNEJ JAKOŚCIOWEJ Wprowadzenie
W tym rozdziale zajmiemy się modelami dla zmiennych jakościowych jako zmiennych objaśnianych w jednorównaniowym modelu. To są takie zmienne Y, których wartości mają postać niemierzalnych „kategorii”, na przykład: „zatrudniony” i „bezrobotny” albo: „bankrut” i „nie-bankrut” czy też: wykształcenie „podstawowe”, „średnie”, „studia licencjackie”, „studia magisterskie” i „inne”. W tej sytuacji klasyczny model regresji nie jest specjalnie użyteczny.
Jeśli chodzi o zmienne objaśniające (X), to nadal warto posługiwać się ich kombinacją liniową, jak w klasycznym jednorównaniowym modelu. Jednak obecnie ta liniowa kombinacja powinna być powiązana ze zmienną objaśnianą za pomocą pewnej funkcji o postaci nieliniowej. Dlaczego? Z tego powodu, że „kategorie” zmiennej Y nie dają się sensownie wyrazić liczbowo, można jedynie mówić o prawdopodobieństwie, że dla pewnej kombinacji zmiennych X zmienna Y znajdzie się w pewnej „kategorii”. Przyjęty w modelu rozkład prawdopodobieństwa decyduje właśnie o postaci wspomnianej nieliniowej funkcji.
Modele zmiennych jakościowych należą do mikroekonometrii. A to dlatego, że są zazwyczaj stosowane do mikrodanych czyli danych indywidualnych: o pracownikach, o bezrobotnych, o klientach banku, o firmach, o obywatelach, o osobach ankietowanych itd. Mikro-dane gromadzone są w urzędach statystycznych, urzędach rejestracyjnych, biurach badania opinii, agencjach ratingowych, biurach marketingowych itd. To są zwykle dane przekrojowe, czasem też można mieć do czynienia z danymi panelowymi
Mikrodane często powstają jako wynik badania ankietowego: osób, konsumentów, firm, inwestorów itd. Jeśli w drugiej turze wyborów prezydenckich w Polsce ankieter pyta przed lokalem wyborczym: „na kogo pani/ pan głosowała”, to otrzymuje odpowiedź: „na A” lub „na B” (pomijając odpowiedzi „nie głosowałam”, „skreśliłam obu”, „oddałam głos nieważny”). Dla analityka ważne byłoby powiązanie takich wyników (zmienna Y) ze zmiennymi charakteryzującymi daną osobę (zmienne X). Jako wartości zmiennych X ankieter może podać płeć oraz przybliżony przedział wieku respondenta. Jeśli zada mu dodatkowe pytania, to otrzyma dalsze informacje (wartości kolejnych zmiennych A). Tak czy inaczej, na tej podstawie można próbować wyświetlić związek zmiennych X ze zmienną Y przy użyciu pojęcia prawdopodobieństwa. Warunkiem jest odpowiednio duża liczba obserwacji.
Rozdział 6