Wykład 23.04.2006 Statystyka GWSH
Wartość średniej cechy y
Reszta yi ŷi
Zmienność wyjaśniona regresją -
Zmienność ogólna - jest to suma dwóch składników wyjaśniona regresją.
-
Y - ŷ =
Wartość teoretyczna reszta ( wartość empiryczna - wartość teoretyczna)
Metoda najmniejszych kwadratów - polega na …………. a obliczaniu sumy kwadratów reszt.
Dla opisu wpływy zmian wartości cechy x na zmiany wartości cechy y w przypadku zależności korelacyjnej liniowej wyznaczamy równanie regresji:
Ŷ=
W=
( niewidome w tym zadaniu są współczynniki równania regresji a1 i a0, które wyznaczamy rozwiązując następujący układ równań
Układ równań normalnych
N·a0 +a1·Σ = Σ
a 0 = Σ
W wyznaczonym równaniu regresję interpretujemy; wartość współczynnika a1 ( współczynnika kierunkowego), który informuje jak średnio zmienia się wartość cechy y jeżeli cecha x wzrośnie o jedną jednostkę.
Dla opisu wpływu zmian wartości cechy y na zmiany wartości cechy x w przypadku zależności korelacyjnej liniowej wyznaczamy równanie regresji , wyznaczając minimum następujących funkcji:
W = Σ
Układ równań normalnych (rozwiązujemy b i a)
Interpretacja: W wyznaczonym równaniu interpretujemy wartości współczynnika kierunkowego ( b1), który informuje jak średnio zmienia się wartość cechy x, jeżeli cecha rośnie o jedną jednostkę.
Na przykład, zadanie:
Wyznaczanie parametrów regresji funkcji regresji, opisując wpływ liczby zatrudnionych osób (xi) na obroty w tys. zł. ( yi) w sklepach branży spożywczej.
(x ma mieć wpływ na y to wynika z pierwszego rodzaju równań!!!)
N
Równanie regresji ŷ = 6,91xi + 1,99
Komentarz: współczynnik regresji informuje że wraz ze zwiększeniem zatrudnienia o jedną osobę, wielkość obrotów rośnie średnio o 6, 91 tys. zł.
Zadanie ( symetryczne)
Wyznaczenie parametrów funkcji regresji opisującej wpływ wielkości obrotów na liczbę zatrudnionych osób.
N
Równanie regresji x - 0,124 yi + 1,33
Interpretacja: Za y wstawiamy 10. współczynnik regresji informuje że wraz ze wzrostem obrotó o 10.000 tys. zł. Zatrudnienie rośnie o jedną osobę.
ZWIĄZKI WSPÓŁCZYNNIKÓW REGRESJI I WSPÓŁCZYNNIKÓW KORELACJI
Z powyższych równań wynika że:
- dla zależności korelacyjnej dotatniej pomiędzy badanymi zmiennymi r>0
-dla zależności korelacyjnej ujemnej pomiędzy badanymi zmiennymi r
-brak zależności korelacyjnej
Komentarz wynikający z tych rysunków - siłę zależności korelacyjnej liniowej można odnieść do wielkości kąta pomiędzy funkcjami regresji. Im większy kont pomiędzy funkcjami regresji tym słabsza zależność korelacyjna.
MIARY DOPASOWANIA LINI REGRESJI DO DANYCH ( Tu wyznaczamy błąd)
Wyznaczamy go poprzez:
- współczynnik determinacji
- współczynnik zbieżności ( Współczynnik zbieżności informuje, jaka część wartości zmiennej objaśnionej nie została wyjaśniona zmianami wartości zmiennej objaśniającej)
- wariancję resztową ( dotyczy zmiennej objaśnionej dla funkcji regresji względem x. Wariancję resztową określamy wzorem . Dla funkcji regresji x względem y S2 = (z)
Zmienność ogólna = zmienność wyjaśniona + zmienność nie wyjaśniona
Interpretujemy odchylenie standardowe reszt, które ma zawsze jednostkę taką jak zmienna objaśniona. Im mniejsza wartość wariancji resztowej tym mniejszy błąd przeprowadzonej analizy regresji.
Zadania ( wyznaczamy wariancję resztową)
Obliczanie odchylenia standardowego składnika resztowego w funkcji regresji opisującej wpływ liczby zatrudnionych osób na obroty.
Wartości teoretyczne zmiennej objaśnionej wyznaczamy wykorzystując wyznaczone wcześniej równanie
S(U) =
(komentarz) odchylenie standardowe reszt oznacza że faktycznie zaobserwowane obroty różnią się od poziomu szacowanego za pomocą funkcji regresji o 22,5 tys. zł.
S(Z) =2,998 =3
(komentarz) ta wartość oznacza że faktyczna liczba zatrudnionych osób różni się od poziomu szacowanego za pomocą funkcji regresji średnio o 3 osboby.
Następnie wykonujemy do tego rysunek
ANALIZA REGRESJI SŁUŻY DO WYZNACZANIA PROGNOZ!!!!
ANALIZA DYNAMIKI
(ZMIANY ZJAWISK W CZASIE)
1. Indeksy proste
Szereg czasowy
Tn yn
Informacje codzienne jest to szereg okresu
PROSTE MIARY OPISU DYNAMIKI
Wyznaczamy trzy grupy mierników:
a) przyrosty absolutne
b) przyrosty względne
c) indeksy indywidualne
ad a) ciąg przyrostów o podstawie stałej.- Za podstawę porównań przyjmujemy wartość z okresu K.
(interpretacja przyrosty absolutne) - o podstawei stałej informują o ile zmieniła się wartość badanej cechy w porównaniu z wartością z okresu K.
Ciąg przyrostów o podstawie łańcuchowej - ( interpretacja) Informuje o ile zmieniła się wartość badanej cechy w porównaniu z wartością w okresie poprzednim.
Przyrosty absolutne są to mierniki mające jednostkę taką jak badana cecha y.
b) przrosty względne
przyrosty względne o podstawie stałej - za podstawę porównań przyjmujemy wartość z okresu K.
(interpretacja) przyrosty względne o podstawie stałej informują o ile zmieniła się wartość badanej cechy w stosunku do wartośći z okresu K.
Przyrosty względne o podstawie łańcuchowej -
(Interpretacja) informują o ile zmieniła się wartość badanej cechy w stosunku do wartości w okresie poprzednim
Przyrosty względne są to liczby niemianowane które interpretujemy zamieniając na procenty
Stałe
Łańcuchowee
c) indeksy indywidualne - ciąg o podstawie stałej. Za podstawę porównań przyjmujemy wartość z okresu K
( interpretacja) Indeksy o podstawie stałej informują o ile razy zmieniła się wartość badanej cechy w stosunku do wartości z okresu k.
Indeksy indywidualne - ciąg o podstawie łańcuchowej.
(interpretacja) Informują nas o ile razy zmieniła się wartość badanej cechy w stosunku do wartości w okresie poprzednim
Indeksy indywidualne są miarami niemianowanymi, które dla interpretacji zamieniamy na procenty.
∆ - „ o ile”
P - „ o ile w stosunku do”
( interpretacja w odniesieniu do 100%)
( interpretacja w odniesieniu do 0%)
Zależności pomiędzy przyrostami względnymi a indeksami
Na przykład:
Ludność województwa śląskiego w tys. osób
1. wyznaczamy przyrosty absolutne o podstawie stałej z roku 90
2. wyznaczamy przyrosty absolutne o podstawie łańcuchowej
3. wyznaczamy przyrosty względne o podstawie stałej z roku 98 ( w procentach!!!!!!!)
4. wyznaczamy przyrosty względne o podstawie łańcuchowej
5. wyznaczamy indeksy o podstawie stałej z roku 98
6. wyznaczamy indeksy łańcuchowe
Operacje w szeregach indeksów:
a) zamiana indeksów o podstawie stałej na łańcuchową
b) zamiana indeksów łańcuchowych na indeksy o podstawie słałej K=3
c) zamiana podstawy indeksów o podstawie stałej
Średnie tempo zmian - dla wyznaczania średniego poziomu zmian wartości badanej cechy statystyczne w badanym czasie rzeczywistym , wyznaczamy średni indeks zmian czyli średnią geometryczną obliczoną w ciągu indeksów łańcuchowych
( interpretacja) - średnie tempo zmian informuje nas jak zmienia się badana cecha średnio z okresu na okres.
Na przykład:
Wskaźniki cen towarów i usług konsumpcyjnych w Polsce w latach 1993-1996
1. wyznaczamy indeksy o podstawie stałej:
a) 92
b)95
2. wyznaczamy średnie tempo zmian
a) wyznaczamy indeksy o podstawie stałej z roku 1992
(interpretacja) - ceny towarów w roku 96 w stosunku do roku 92 wzrosły o około 2, 745
b)wyznaczamy indeksy o podstawie stałej z roku 1995
Ceny towarów konsumpcyjnych i usług były o 56,3% niższe w porównaniu z rokiem 95
c) średnie tempo zmian
( interpretacja) - ceny towarów i usług w latach 92-96 przeciętnie z roku na rok rosły około o 28,7 %
Komentarz: odchylenie standardowe reszt oznacza że faktyczne zaobserwowane obroty różnią się od poziomu szacowanego za pomocą funkcji regresji o 22,5 tys. złotych.
Komentarz: ta wartość oznacza że faktyczna liczba zatrudnionych osób różni się od poziomu szacowanego za pomocą funkcji regresji średnio o 3 osoby. ( rysunek do tego musimy wykonać)
ANALIZA REGRESJI SŁUŻY DO WYZNACZANIA PROGNOZ!!!!!!
ANALIZA DYNAMIKI ( Zmiany zjawisk w czasie)
1. Indeksy proste
Szereg czasowy
Informacje codzienne jest to szereg okresu
PROSTE MIARY OPISU DYNAMIKI
Wyróżniamy trzy grupy mierników:
a) przyrosty absolutne
b) przyrosty względne
c) indeksy indywidualne
ad a) Ciąg przyrostów o podstawie stałej. Za podstawę porównań przyjmujemy wartość z okresu K.
interpretacja: przyrosty absolutne o podstawie stałej informu