wykład 8 regresja, Statystyka opisowa


Model regresji liniowej dwóch zmiennych

Model ten ma postać:

0x01 graphic
(1)

gdzie:

Y - zmienna objaśniana,

X - zmienna objaśniająca,

0x01 graphic
- parametry funkcji regresji,

U - składnik losowy, który w modelu jest jedynym źródłem losowości Y.

Prosty model regresji liniowej składa się ze składnika nielosowego (systematycznego) i błędu losowego.

Składnik systematyczny przedstawia średnie warunkowe wartości zmiennej Y przy danym X, co można zapisać następująco:

0x01 graphic

Jest to tzw. funkcja regresji pierwszego rodzaju.

Można również zdefiniować funkcję regresji pierwszego rodzaju w postaci:

0x01 graphic

Ogólnie biorąc prosty model regresji liniowej „funkcjonuje” przy kilku założeniach.

  1. Związek między zmiennymi X i Y jest liniowy.

  2. Wartości zmiennej objaśniającej X są ustalone, czyli nielosowe.

  3. Losowość wartości zmiennej Y pochodzi tylko i wyłącznie ze składnika losowego.

  4. Składnik losowy ma rozkład normalny (jakkolwiek nie jest to konieczne) o średniej 0 i stałej wariancji.

  5. Realizacje składnika losowego nie są ze sobą wzajemnie skorelowane.

W rezultacie oszacowaną funkcją regresji Y względem X jest funkcja:

0x01 graphic
(2)

gdzie:

0x01 graphic
− oceny parametrów funkcji regresji typu (1),

U − reszty modelu regresji (2), które reprezentują realizacje składnika losowego modelu (1).

Funkcję regresji typu (2) określa się mianem funkcji regresji drugiego rodzaju.

Estymacja parametrów funkcji regresji

Parametry funkcji regresji muszą zostać oszacowane. W tym celu trzeba zastosować określoną metodę estymacji.

W praktyce najczęściej stosowaną metodą jest klasyczna metoda najmniejszych kwadratów. Metoda ta pozwala na „znalezienie” takiej funkcji regresji, która jest możliwie najlepiej dopasowana do wyników obserwacji. Wynika to z faktu, że parametry funkcji regresji są szacowane tak, by spełniony był warunek:

0x01 graphic

gdzie:

− wartości empiryczne zmiennej objaśnianej,

0x01 graphic
− wartości teoretyczne zmiennej objaśnianej, tj. obliczone na podstawie funkcji regresji.

Łatwo zauważyć, że kryterium najmniejszych kwadratów (KKMNK) wymaga, by suma kwadratów odchyleń wartości empirycznych zmiennej objaśnianej od wartości teoretycznych tej zmiennej była najmniejsza.

1



Wyszukiwarka

Podobne podstrony:
wyklad 4 PODSTAWY STATYSTYKI OPISOWEJ
korelacja Wykład 4, Nauka, Statystyka Opisowa
Wykłady ze statystyki opisowej dla psychologów
Analiza korelacji i regresji, Statystyka opisowa i matematyczna
wyklad 2a STATYSTYKA OPISOWA
Statystyka opisowa wykład interpretacje
Statystyka opisowa, Wykład 9, 4
Wyklad statystyka opisowa 03 10 2010
wyklad 4aa PODSTAWY STATYSTYKI OPISOWEJ
Statystyka opisowa, Wykład 10, 4
STATYSTYKA OPISOWA 4 WYKŁAD 29.03.2009 doc, STATYSTYKA OPISOWA 4 WYKŁAD 29
wyklad2 STATYSTYKA OPISOWA

więcej podobnych podstron