przewodnikPoPakiecieR 2

przewodnikPoPakiecieR 2



Kii-ńIu jaki wpływ na ocenę współczynników(] ma obserwacja V

zo różnili się oceny współczynników dla modelu z tą obserwa.

Wiele ciekawych wykresów diagnostycznych jest dostępnych w pakiecie asuR. Li. ula wybranych wykresów diagnostycznych z tego pakietu przedstawiona jest w tabeli .3.8. Cechą wszystkich tych wykresów, jest możliwość interaktywnego wskazania interesujących nas obserwacji, których indeksy zostaną wypisane na ekranie. W ten sposób możemy identyfikować przypadki, które wydają nam się podejrzane.


i dla a 11 m lidu licz lej obserwacji. W adekwatnym modelu pojedyncza obserwa. c,|a uli powinna mice znacząco silniejszego wpływu na ocenę współczynników an u li la ni pozostałe. Wartości residuów również nie powinny być znacznie i i ii. ml /era. Obserwacje można uznać za nietypową, jeżeli /i, > 2p/n, gdzje n to liczba obserwacji, a p to liczba elementów wektora X,.

I inni miarą wpływu obserwacji X, jest odległość Cooka. Jeżeli dla jakiejś obserwacji odległość jest. większa od 1, to jest sygnał, że dana obserwacja zashiguje na bliższe przyjrzenie się jej. Taka obserwacja może być błędem pomiarowym ale może być też poprawna i wskazywać na złe określenie modelu.


Tabela 3.8: Wybrane wykresy diagnostyczne z pakietu asuli


inspect(asuR)


Wyświetla wskazany wykres diagnostyczny lub sekwencje wszyst-; kich dostępnych wykr esów diagnostycznych. Argumentem może j


dep(asuR) hnp (asuR)



irp(asuR)


ilp(asuR)


ihp(asuR) rpp(asuR) ryp (asuR) xxp(asuR)


być obiekt klasy lm lub glm.

Ola modelu glm wyświetla wartości residuów na jednej osi a na drugiej wartości wyznaczone przed wyliczeniem funkcji wiążącej. Dla modelu glm wyświetla bezwzględną wartość studentyzowanych residuów na jednej osi, a na drugiej kwantyle połowicznego rozkła. du normalnego (uciętego do dodatnich wartości).

Wyświetla wartość residuów na jednej osi, a na drugiej indeks odpowiadającej im obserwacji.


Wyświetla siłę wpływu obsei-wacji na jednej osi, a na drugiej i u deks obserwacji.


Wyświetla index Hadiego na jednej osi, a na drugiej index obserwacji.

Wyświetla wartości residuów na jednej osi, a na drugiej wartości dopasowane przez model.

Wyświetla wartości studentyzowanych residuów na jednej osi, a na drugiej wartości dopasowane przez model.


-ra



Wyświetla wykresy rozrzutu dla wszystkich par zmiennych, norm. test (asuR) Wykonywany jest dosyć zabawny test normalności. Na 9 panelach rysownne są wykresy kwantylowe. Na jednym (losowym) jest to wykres dla residuów z dopasowanego modelu, na pozostałych ; 8 są to wykresy kwantylowe dla losowych próbek pochodzących z rozkładu normalnego. Następnie konsola pyta o to, który z 9 paneli przedstawia rzeczywiste dane. Jeżeli użytkownik odgadnie, oznacza to, że odstępstwo od normalności jest wyraźne, model jest więc źle dopasowany. Jeżeli użytkownik nie odgadnie, to oznacza, | że analizowane dane są podobne do rozkładu normalnego, można więc uznać, że model jest dobrze dopasowany (test na poziomie istotności 11% ;-)).


I


\V regresji zmienne objaśniające (niezależne) nie muszą mieć ciągłego charaktc-rll W modelu możemy również umieszczać zmienne jakościowe. Aby takie zmienne mogły być użyte, należy poziomy zmiennej zamienić na wartości liczbowe (mówimy że poziomy zmiennej muszą zostać, odpowiednio zakodowane). Domyślnie jeden (zazwyczaj pierwszy) poziom danej zmiennej uznawany jest za poziom referencyjny. Ole pozostałych czynników wprowadza się tzw. atrapy (ang. dummy variables), czyli imienne binarne przyjmujące wartość 1 gdy dany czynnik występuje na określonym poziomie i 0 w przypadku przeciwnym. Przykładowo, jeżeli zmienna występuje na czterech poziomach, to pierwszy poziom staje się poziomem referencyjnym, a pozostałe trzy poziomy zamienia się na atrapy w opisany sposób.

( ^ Domyślnie poziomy czynników uporządkowane są w kolejności leksyko " graficznej. Pierwszym (referencyjnym) poziomem będzie więc ten o unj cl    mniejszej wartości w porządku leksykograficznym. Jednak na kolej noś.

3JI poziomów można wpływać funkcjami levels() lub reorderO W ten sposób możemy wybrać, któiy poziom będzie poziomem referencyjnym.

Zmienne jakościowe można również kodować inaczej. Aby zmienić sposób kodo wania należy w funkcji lmO zmienić argument- contrasts. Więcej informacji o sposobach kodowania zastało przedstawionych przy okazji analizy kontrastów (patrz rozdział li.4.2.1). W zmiennych jakościowych uporządkowanych (zmienne o klasach factor i ordered) poziomy można kodować nadając im różne wagi. Przykładowo zmienną o poziomach: niski, średni, wysoki można przekształcić na zmienną numeryczną o wartościach odpowiednio 0, 1 i 2. W przypadku takiego kodowania wartości kodów powinny odpowiadać zależnościom pomiędzy uporządkowanymi poziomami.

Poniżej przykład analizy modelu liniowego wykonanej dla zmiennej dzielnica, powierzchnia i pokoi. Wartości efektów dla zmiennej jakościowej są wyznaczano w odniesieniu do pierwszego poziomu. Dla zmiennej dzielnica poziomem referencyjnym jest Biskupin. Wartość efektu 3 przedstawionego w kolumnie Eatimate dla wiersza dzielnicaKrzyki wynosi —20934.86, czyli o tyle jest średnio tańsze mieszkanie na Krzykach w porównaniu z podobnym mieszkaniem na Biskupinie.

li.summary(lm(cena~powierzchnia+pokoi+dzielnica, data « mieszkania)) Eesiduals:

Min    1Q    Median    3Q    Max

-30501.4 -8480.2    -144.1    7346.0 35729.6

| Coefficients:

Estimate Std. Error t value Pr(>ltl)

(Intercept)

94222.02

2320.36

40.607

< 2e-16

***

jwwierzchnia

2022.99

116.31

17.393

< 2e-16

ijfókoi

34.36

2157.52

0.016

0.987

dzielnicaKrzyki

-20934.86

1842.79 -11.360

< 2e-16

i^dzielnicaSrodmiescie

-12722.60

2008.03 -6.336

1.60e-09

Ślgnif. codes: 0 '***’ 0.001 '**

0.01 ■

*’ 0.05

0.1 *

» 1

kesidual standard error: 11000 on 195 degrees of freedom kultiple R-Squared: 0.9362, Adjusted R-squared: 0.9348 f-atatistic: 714.8 on 4 and 195 DF, p-value: < 2.2e-16


Wyszukiwarka

Podobne podstrony:
Załączniki: Najważniejsze to myśleć pozytywnie! Czy zastanawiałeś się jaki wpływ na twoje życie ma
20090912045[1] 1.    Co to jest i do czego służy lista Verleta? Jaki wpływ na czas ob
img203 (5) Elementa 197 Tak się jednak dzieje w każdej sieci z samouczeniem, jaki wobec tego wpływ n
Forma dokumentacji osiągniętych efektów kształcenia 2Q :_ Elementy i wagi mające wpływ na ocenę
WPLV W TECHNOLOGII HSC NA OBRABIARKĘ Technologią która wywiera największy wpływ na rozwój współczesn
Przetwarzanie obrazu i dźwięku■    Wpływ na ocenę końcową■
Elementy i wagi mające wpływ na ocenę końcową: •    Aktywne i sumienne uczestnictwo w
Cechy geologiczno-inżynierskie skal nazywamy ich właściwości, które mają wpływ na ocenę przydatności
Obecność na wykładach ma wpływ na ocenę końcową z uwagi na pytania kolokwialne i egzaminacyjne dotyc
O Rozwiąż krzyżówkę. Następnie wyjaśnij, jaki wpływ na nastroje społeczeństwa polskiego w latach 70.
Środki masowego przekazu to pomioty, które mają wpływ na ocenę efektów działalności firmy.
16 Jaki wpływ na komunikację ma niepoprawne skonfigurowanie bramy domyślnej? O Host nie może komunik
Elementy i wagi mające wpływ na ocenę końcową: Ocena końcowa jest wynikiem stopnia realizacji efektó

więcej podobnych podstron