IS 4


Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
W sytuacji, gdy obserwowana jest zmienna dwuwymiarowa (X,Y) stawiamy pytanie, czy
występuje związek prostoliniowy pomiędzy tymi zmiennymi, czy jedna z nich jest zmienną
zależną, a druga zmienną niezależną. Zatem na podstawie obserwacji (x1y1), (x2y2), & , (xnyn)
wyznaczana jest wartość współczynnika korelacji Pearsona rxy (wzory na końcu materiałów).
Stawiamy hipotezę H0 : r = 0,
H1 : r ą 0
i na przyjętym poziomie istotności sprawdzamy, czy badane zmienne są skorelowane.
Odrzucenie hipotezy zerowej implikuje wyznaczenie prostej regresji. Jeżeli dla każdej wartości x
zmienna Y ma rozkład normalny z jednakową (nieznaną) wariancją to prostą regresji można
zapisać w postaci
Ć Ć
y = b0 + b1x
przedstawiającej związek między badanymi zmiennymi. Możemy też zweryfikować hipotezę dla
współczynnika regresji, wyznaczyć krzywe ufności, obliczyć wartość miary dopasowania prostej
regresji do punktów eksperymentalnych jaką jest współczynnik determinacji R2 (wzory na końcu
opracowania).
Przykład 1.
Badając zanieczyszczenie terenów wokół pewnego obiektu przemysłowego, odsłonięto siedem
profili glebowych. W powierzchniowej warstwie badanych profili zawartości ołowiu i cynku
(w mg/kg) przedstawiały się następująco:
ołów (X) 355 190 345 316 269 210 275
cynk (Y) 82 53 93 82 67 46 80
Przy prawdziwości założeń analizy regresji:
a) Oblicz i zinterpretuj współczynnik korelacji między cechami X i Y.
b) Sprawdz hipotezę o braku korelacji między zawartością ołowiu i cynku w powierzchniowej
warstwie badanych profili. Przyjmij poziom istotności 0,05.
c) Wyznacz równanie regresji liniowej zawartości cynku względem zawartości ołowiu
w powierzchniowej warstwie badanych profili. Zinterpretuj współczynnik regresji.
d) Oblicz i zinterpretuj współczynnik determinacji.
e) Na poziomie istotności a = 0,05 zweryfikuj, za pomocą analizy wariancji, hipotezę o braku
regresji liniowej zawartości cynku względem zawartości ołowiu.
f) Wyznacz przewidywaną zawartość cynku w powierzchniowej warstwie, gdy zawartość ołowiu
wynosi 270 (mg/kg).
g) Zbuduj 95 % przedział ufności dla oczekiwanej zawartości cynku, jeśli zawartość ołowiu
wynosi 270 mg/kg.
Za pomocą programu STATISTICA: Dane należy wpisać w dwóch kolumnach
1 2
x-ołów y-cynk
1 355 82
2 190 53
3 345 93
4 316 82
5 269 67
6 210 46
7 275 80
Zapoznamy się najpierw z wykresem zależności Y (zawartości cynku) od X (zawartości ołowiu).
1
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
Z menu wybieramy Wykresy Wykresy rozrzutu w oknie Zmienne wybieramy
odpowiednie zmienne OK Więcej Dopasuj wybieramy Liniowa oraz R kwadrat,
wsp. korel. i p, równanie regresji OK. Otrzymamy wykres wraz z wynikami.
Odpowiedzi:
a) Współczynnik korelacji r = 0,9189 jest dodatni, czyli korelacja między cechami jest dodatnia:
im większa jest zawartość ołowiu w glebie, tym większa jest zawartość cynku.
b) H0 : r = 0 korelacja między cechami jest nieistotna (nie ma korelacji)
H1 : r ą 0 korelacja między cechami jest istotna (jest korelacja)
Ponieważ p = 0,00344 < a = 0,05, zatem hipotezę H0 odrzucamy na poziomie istotności
a = 0,05 i stwierdzamy, że korelacja między zawartościami ołowiu i cynku w glebie jest istotna.
c) Prosta regresji wyraża się wzorem y = 2,468 + 0,2478x . Jeżeli zawartość ołowiu wzrośnie o
jednostkę, czyli o 1 mg/kg, to przeciętna zawartość cynku wzrośnie o 0,25 mg/kg.
d) Współczynnik determinacji R2 jest równy r2 100% , czyli u nas R2 = 0,8444
100% = 84,44% Oznacza to, że zmienna X w 84% ma wpływ na wartość zmiennej Y.
e) H0 : b1 = 0 regresja liniowa jest nieistotna
H1 : b1 ą 0 regresja liniowa jest istotna
Aby zweryfikować tę hipotezę należy z menu Statystyka wybrać opcję Regresja wieloraka,
wskazać zmienną zależną Y i zmienną niezależną X OK OK. W oknie Wyniki regresji
wielorakiej, należy wybrać przycisk Więcej, a następnie opcję ANOVA (sum. dobroć
dopasow.). Na ekranie pojawi się tabela analizy wariancji i wyniki testu F:
Analiza wariancji ; DV: y-cynk (Arkusz1) Obliczanie wartości (Arkusz1)
zmiennej: y-cynk
Suma df Średnia F poziom p
Efekt kwadrat. kwadrat. Waga B Wartość Waga B
Zmienna *Wartość
Regres. 1491,866 1 1491,866 27,12567 0,003443
x-ołów 0,247818 270,0000 66,91092
Reszta 274,992 5 54,998
W. wolny 2,46804
Razem 1766,857
Przewidyw. 69,37896
-95,0%GU 62,07050
+95,0%GU 76,68742
Ponieważ p = 0,00344 < a = 0,05, to na poziomie
istotności a = 0,05 hipotezę zerową H0 odrzucamy i stwierdzamy, że regresja liniowa
zawartości cynku względem zawartości ołowiu jest istotna.
f) Wracamy do okna Wyniki regresji wielorakiej, wybieramy przycisk Reszty, założenia,
predykcja, a następnie Predykcja zmiennej zależnej (przy aktywnym poleceniu Oblicz
granice ufności).
2
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
W oknie Określ wartości zmiennych niezależnych wpisujemy liczbę 270 i naciskamy OK.
Otrzymujemy ocenę punktową prognozy oraz poszukiwane granice ufności wartości
prognozowanej.
Z tabeli wynika, że jeśli zawartość ołowiu wynosi 270 mg/kg, to przewidywana zawartość cynku
wynosi 69,38 mg/kg.
g) Z tej samej tabeli odczytujemy lewy i prawy kraniec przedziału ufności.
Z prawdopodobieństwem 95 % stwierdzamy, że przedział (62,07; 76,69) pokrywa oczekiwaną
zawartość cynku (w mg/kg) przy zawartości ołowiu 270 mg/kg.
Dodatkowo można wyznaczyć obszar ufności dla oczekiwanej zawartości cynku przy różnych
zawartościach ołowiu i ew. zilustrować ( ręcznie ) przedział ufności dla x = 270. Postępujemy
podobnie jak w punkcie a), dodatkowo zaznaczając Pas regresji ufność.
Zad. 1. Na terenie byłego województwa konińskiego badano zmniejszenie się emisji pyłu
(w t/rok) po zamontowaniu instalacji mokrego odpylania na kominach największych zakładów.
Otrzymano dane:
liczba zamontowanych instalacji odpylania (X) 1 2 3 3 4 5
zmniejszenie emisji pyłu (Y) 5,8 6,1 8,4 9,2 9,3 10,4
Przy prawdziwości założeń analizy regresji:
a) Wyznacz równanie regresji liniowej zmniejszenia emisji pyłów względem liczby instalacji
mokrego odpylania. Zinterpretuj współczynnik regresji.
Odp. y = 4,48 +1,24x;
b) Na poziomie istotności 0,05 zweryfikuj hipotezę o braku regresji liniowej zmniejszenia emisji
pyłów względem liczby instalacji mokrego odpylania.
c) Określ przewidywane zmniejszenie emisji pyłów, gdy liczba instalacji wyniesie 3.
Odp. 8,2
Zad. 2. Dział marketingu pewnej firmy analizował związek między wielkością sprzedaży swych
produktów (w tys. sztuk) a liczbą współpracujących z zakładem hurtowni. Otrzymano dane:
3
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
liczba hurtowni (X) 1 2 3 4 5 6 7 8 9 10
wielkość sprzedaży (Y) 5,8 6,1 8,4 9,2 9,3 10,4 12,9 14,6 19,1 22,8
Przy prawdziwości założeń analizy regresji:
a) Oblicz i zinterpretuj współczynnik korelacji między wielkością sprzedaży produktów a liczbą
współpracujących z zakładem hurtowni. Odp. r = 0,95
b) Wyznacz równanie regresji liniowej wielkości sprzedaży produktów względem liczby
współpracujących z zakładem hurtowni. Zinterpretuj współczynnik regresji.
Odp. y = 2,29 +1,74x
c) Zweryfikuj hipotezę o istotności regresji liniowej wielkości sprzedaży produktów względem
liczby współpracujących z zakładem hurtowni. Przyjmij poziom istotności a = 0.05.
d) Określ przewidywaną wielkość sprzedaży, gdy liczba hurtowni wyniesie 6. Odp. 12,73
Zad. 3. Badano zawartość tlenu rozpuszczonego w wodzie destylowanej (cecha Y w mgO2/dm3)
w zależności od temperatury (cecha X w oC). Uzyskano dane:
temperatura (X) 5 7 8 11 13 14 16 17 20 21
zawartość tlenu (Y) 12,9 13,6 11,9 11 11,2 11,9 10 11,7 8,8 8,9
Przy prawdziwości założeń analizy regresji:
a) Wyznacz równanie regresji liniowej zawartości tlenu rozpuszczonego w wodzie destylowanej
względem temperatury. y = 14,5 - 0,25x
b) Na poziomie istotności 0,05 zweryfikuj hipotezę o braku regresji liniowej zawartości tlenu
rozpuszczonego w wodzie destylowanej względem temperatury.
d) Określ przewidywaną zawartość tlenu, gdy temperatura wynosi 12 oC.
Odp. 11,5
e) Obliczyć i zinterpretować współczynnik determinacji.
f) Zbudować 95 % przedział ufności dla prognozowanej zawartości tlenu przy temperaturze
10 0C.
Zad. 4. Badano zależność między roczną wielkością wytworzonych odpadów w Polsce w mln
ton wg GUS a ilością odpadów wykorzystanych wtórnie w ciągu roku w mln ton. Uzyskano
następujące dane:
Dla X (wytworzone odpady): 120,8 122,7 124,6 124,4 133,2
Dla Y (wykorzystane odpady) : 65,6 66,9 69,5 80,1 91,7
Przy prawdziwości założeń analizy regresji:
a) Oblicz i zinterpretuj współczynnik korelacji między wielkością wykorzystanych odpadów a
ilością wytworzonych odpadów.
Odp. r = 0,92;
b) Oszacuj prostą regresji wielkości wykorzystanych odpadów względem wytworzonych
odpadów.
y = -193,72 + 2,15x
c) Określ przewidywaną wielkość wykorzystanych odpadów, gdy ilość wytworzonych odpadów
wynosi 130 mln ton. Odp. 85,78
d) Zbuduj 95 % przedział ufności dla oczekiwanej wielkości wykorzystanych odpadów, gdy
wielkość wytworzonych odpadów wynosi 125 mln ton.
Zad. 5. Producent napojów gazowanych dla sprawdzenia, czy istnieje związek między
wielkością zamówień hurtowni a temperaturą dobową zgromadził dane dotyczące zamówień i
temperatury dla wybranych 10 dni czerwca:
4
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
Temperatura dobowa (X w C) 18 25 30 34 18 19 21 24 29 17
Zamówienia napojów gazowanych
7,2 12 12 15 9,4 4,5 10 12 13 7
(Y w tys. sztuk)
Przy prawdziwości założeń analizy regresji:
a) Wyznacz równanie regresji liniowej zamówień hurtowni względem temperatury dobowej.
Zinterpretuj współczynnik regresji.
b) Na poziomie istotności a = 0,05 zweryfikuj, za pomocą analizy wariancji, hipotezę o braku
regresji liniowej wielkości zamówień napojów względem temperatury.
Regresja linearyzowana
Model wykładniczy
x
Dla funkcji wykładniczej y
= b0 b
Po obustronnym logarytmowaniu otrzymujemy : lg y = lg b0 + x lg b
Zatem po zastąpieniu logarytmów nowymi zmiennymi i dołączeniu składnika losowego
( (
(
mamy
y = b0 + b1x + e
Można zatem zastosować metodę najmniejszych kwadratów
( (
(

yi = nb0 + b1 x(

i
(
( ż
2
xiyi = b0 xi + b1 xi

Model potęgowy
Dla funkcji potęgowej y = b0 xb1
lg y = lg b0 + b1 lg x
Po obustronnym logarytmowaniu otrzymujemy :
Zatem po zastąpieniu logarytmów nowymi zmiennymi i dołączeniu składnika losowego
(
( (
mamy
y = b0 + b1x + e
Można zatem zastosować metodę najmniejszych kwadratów
(
( (

yi = nb0 + b1 xi

(
( ( ( ( ż
2
xiyi = b0 xi + b1 xi

Model z funkcją hiperboliczną
1
Dla funkcji hiperbolicznej y = b0 + b1
x
(
Po przekształceniu algebraicznym otrzymujemy model liniowy : , gdzie ( 1
y = b0 + b1 x x =
x
Po uzupełnieniu składnika deterministycznego, składnikiem losowym
(
y = b0 + b1 x + e
można zastosować metodę najmniejszych kwadratów.
Model z funkcją logarytmiczną
Dla funkcji regresji typu logarytmicznego mamy
y = b0 + b1 log x
(
(
Po podstawieniu otrzymujemy model liniowy : , gdzie
x = log x
y = b0 + b1 x
5
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
Po uzupełnieniu składnika deterministycznego, składnikiem losowym
(
y = b0 + b1 x + e
można zastosować metodę najmniejszych kwadratów
Model wykładniczy:
Przykład 2
Badano wzrost liczebności koloni glonów w zależności od czasu (x = t). Glony umieszczono w
10 pojemnikach, hodowle przerywano zliczając liczbę osobników w pojemniku (y = Nt) po
kolejno 6, 12, & i 60 godzinach. Uzyskano wyniki:
Czas
6 12 18 24 30 36 42 48 54 60
(w godz.)
Liczebność
60 123 180 270 350 600 1300 1600 2910 4836
koloni glonów
Poniżej przedstawiono diagram korelacyjny, z którego wnioskujemy, że badana zależność nie
jest liniowa (korzystamy w STATISTICE z opcji wykres rozrzutu jak w przykładzie 1, przy
czym w opcji dopasuj wybierz wyłączone).
Wiedząc, że model wzrostu liczebności glonów w zależności od czasu jest wykładniczy, znajdz
oszacowania parametrów modelu korzystając z zasad linearyzacji modelu wykładniczego i oceń
dopasowanie zlinearyzowanego modelu.
Rozwiązanie:
Z ekologii wiadomo, że nieograniczony wzrost liczby osobników populacji jest zgodny z
modelem wykładniczym:
Nt = N0emt lub y = N0emx
gdzie N0 początkowa wielkość populacji, Nt wielkość populacji po upływie t jednostek czasu, m
to parametr opisujący tempo wzrostu nieograniczonego. Po zlogarytmowaniu tego równania
6
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
logarytmem naturalnym, otrzymamy związek liniowy logarytmu naturalnego wzrostu
liczebności (zmienna zależna) od czasu t (zmienna niezależna).
ln Nt = ln N0 + mt lub ln y = ln N0 + mx
Przygotowanie danych :
W celu transformacji zmiennej zależnej Nt klikamy dwa razy nagłówek wolnej kolumny arkusza
danych, w okienku długa nazwa wpisujemy =log(v2) gdzie v2 oznacza zmienną z drugiej
kolumny, przez log w STATISTICE oznaczono logarytm naturalny (o podstawie e), ewentualnie
zmieniamy nazwę zmiennej na ln Nt .
Wykonujemy wykres regresji liniowej zmiennej zależnej ln (Nt) względem czasu t, otrzymując
jednocześnie jej równanie: ln Nt = 3,7017 + 0,0786t .
Widać, że dopasowanie do danych transformowanych jest dobre. Współczynnik determinacji
wynosi 99,23%. Możemy teraz wyznaczyć oszacowanie parametrów modelu wykładniczego.
Z porównania równań ln Nt = ln N0 + mt oraz ln Nt = 3,7017 + 0,0786t otrzymujemy:
ln N0 = 3,7017, stąd N0 = e3,7017 = 40,5161 i m = 0,0786.
Odpowiedz:
Model wykładniczy wzrostu liczby osobników populacji względem czasu jest postaci:
Nt = 40,516 e0,0786t .
Samo oszacowanie modelu bez testowania i oceny dobroci dopasowania w przypadku modelu
wykładniczego z podstawą e można uzyskać również wybierając w opcji wykres rozrzutu
dopasowanie wykładnicze jak poniżej. Widać, że oszacowane parametry, biorąc pod uwagę błąd
zaokrągleń, są takie same.
7
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
Model potęgowy :
Przykład 3
Badano zależność pomiędzy suchą biomasą części nadziemnej drzewa w kg (Y), a jego pierśnicą
w cm (X grubość drzewa na wysokości 1,3 m). Dla 18 drzew uzyskano wyniki:
yi 112 34 29 103 97 20 362 35 211 50 36 50 166 215 368 50 108 178
xi 17,8 11,1 10 17,6 16,9 9,3 27,2 10,9 23,1 12,1 9,6 12,2 19,6 22 27,2 11,9 16,5 20,9
Wiedząc, że szacowany związek przedstawia się za pomocą modelu potęgowego, oszacuj
parametry tego modelu.
Rozwiązanie:
Wiadomo z biologii, że tego typu związek opisują tzw równania allometryczne, czyli model
potęgowy postaci:
y = cxd , gdzie c, d > 0
W celu linearyzacji tego modelu logarytmujemy obustronnie powyższe równanie, otrzymujemy:
ln y = ln c + d ln x
Przygotowanie danych :
Przy tym modelu musimy transformować zarówno obserwacje dla zmiennej niezależnej X jak i
dla zmiennej zależnej Y. Przekształcenie danych wykonujemy tak jak w przykładzie 2.
Poniżej przedstawiono diagram korelacyjny z dopasowaną prostą regresji do danych
stransformowanych (korzystamy w STATISTICE z opcji wykres rozrzutu jak w przykładzie 1),
czyli po zlogarytmowaniu zmiennej X i Y.
8
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
Widać, że dopasowanie do danych transformowanych jest bardzo dobre, współczynnik
determinacji wynosi 98,33%. Możemy teraz podać oszacowanie parametrów modelu
potęgowego. Mamy, z równania regresji liniowej lnc = -2,2718, stąd c= e-2,2718 =0,103126;
d=2,4565. Otrzymaliśmy model potęgowy postaci:
)
y = 0,103126 x2,4565 .
Model z funkcją hiperboliczną
Przykład 4
Dokonano 8 niezależnych pomiarów wielkości drgań pionowych gruntu powstałych w wyniku
trzęsienia ziemi w różnej odległości od ogniska trzęsienia. Otrzymano następujące wyniki
liczbowe (xi odległość od ogniska trzęsienia ziemi w km, yi wielkość drgań pionowych gruntu w
cm):
xi 20 30 40 50 80 140 200 250
yi 4,8 3,2 2,5 2,5 1,5 1,8 1,2 0,8
Wyznaczyć parametry modelu z hiperboliczną funkcją dla wielkości drgań gruntu względem
odległości od ogniska trzęsienia ziemi. Podać współczynnik determinacji.
Rozwiązanie:
Chcemy dopasować model regresji hiperbolicznej postaci:
1
y = b0 + b1
x
(
W celu zamiany zależności na liniową przekształcamy zmienną x na zmienną x , w ten sposób
otrzymujemy :
(
y = b0 + b1x
W celu transformacji zmiennej Nt klikamy dwa razy nagłówek wolnej kolumny arkusza danych,
w okienku  długa nazwa wpisujemy =log(v2) gdzie v2 oznacza zmienną z drugiej kolumny,
9
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
przez log w STATISTICE oznaczono logarytm naturalny (o podstawie e), ewentualnie
zmieniamy nazwę zmiennej na ln Nt .
Przygotowanie danych:
W tym modelu wystarczy przekształcić zmienną X: klikamy dwa razy nagłówek wolnej kolumny
arkusza danych i w okienku  długa nazwa wpisujemy =1/v1. Używając przekształconych
danych z próby szacujemy parametry b0 , b1 regresji liniowej, które są jednocześnie
parametrami modelu. Podobnie jak poprzednio uzyskujemy wykres z równaniem regresji:
Stąd dopasowana do naszych danych funkcja regresji ma postać:
) 1
y = 0,7552 + 78,0908
x
Współczynnik determinacji jest równy 95,77%, co oznacza że odwrotność odległości od ogniska
trzęsienia ziemi ma ponad 95% wpływ na wielkość drgań pionowych gruntu.
Zad. 6. Badano wydajność pracy robotników w zależności od ich stażu pracy (xi staż pracy w
latach, yi wydajność pracy w liczbie sztuk pewnego wyrobu na godzinę). Otrzymano dane:
xi 1 2 4 6 10 16
yi 10 30 35 55 60 70
Wyznacz parametry modelu potęgowego wydajności pracy względem stażu pracy.
)
Odp.: y = 13,7 x0,66
Zad. 7. Badano jak kształtuje się jednostkowy koszt produkcji pewnego artykułu w zależności
od wielkości produkcji. Otrzymano dane (xi wielkość produkcji w setkach sztuk, yi jednostkowy
koszt produkcji wyrobu w zł):
xi 8 15 30 50 70 90 100 120
10
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
yi 150 135 130 120 112 110 105 102
Oszacuj parametry modelu wykładniczego jednostkowego kosztu produkcji względem wielkości
produkcji.
)
Odp.: y = 145,2 0,997x
11
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Inżynieria środowiska Ćwiczenia 4 2012/2013
Regresja liniowa i linearyzowana
ANALIZA KORELACJI I REGRESJI LINIOWEJ
Obserwacje (xi,yi) zmiennej losowej dwuwymiarowej (X,Y)
WSPÓACZYNNIK KORELACJI
n n
%5ńxy
xi yi

rxy =
n
1
%5ńx %5ńy
i=1 i=1
%5ńxy = ( xi yi - )

n -1 n
i=1
n
przy czym
( xi )2

n
1
2 i=1
%5ń2 = ( xi - ) ,

x
-1 Ł rxy Ł 1
n -1 n
i=1
%5ńx = %5ń2
x
n
( yi )2

n
1
2 i=1
%5ń2 = ( yi - )

y
n -1 n
i=1
%5ńy = %5ń2
y
Weryfikacja hipotezy, że zmienne X i Y nie są skorelowane
Stawiamy hipotezę: Statystyka testowa Obszar krytyczny :
rxy
|t|>ta,n-2
t = n - 2
H0 : r = 0, H1 : r ą 0 2
1- rxy
REGRESJA LINIOWA
n n
( xi )( yi )

n
i=1 i=1
Ć Ć
y = b0 + b1x
%5ńxy i=1xi yi -
n
Ć Ć Ć
b1 = = , b0 = y - b1x
n
%5ń2
x
( xi )2
dla
n
2 i=1
xi -

n
i=1
Weryfikacja hipotezy, że dla zmiennych X i Y
związek wyrażony za pomocą prostej regresji nie jest istotny
Stawiamy hipotezę: Statystyka testowa Obszar krytyczny :
Ć
H0: b1 = 0, b1
t = %5ńx n - 2
|t|>ta,n-2
2
H1: b1 ą 0
%5ńy 1- rxy
Miara dopasowania  współczynnik
2 2
R = rxy 100%
determinacji
Krzywe ufności
2
%5ń2 (1- rxy )
y
g1(xi ) = y(xi ) - ta ,n -2 [s2 + (xi - x)2]
x
%5ń2 (n - 2)
x
2
%5ń2 (1- rxy )
y
g2 (xi ) = y(xi ) + ta,n -2 [s2 + (xi - x)2]
x
%5ń2 (n - 2)
x
12
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)


Wyszukiwarka

Podobne podstrony:
IS Multiroom Standard HD
function is numeric
what the hell is a noisegate
Japanese Is Possible Lesson 18
Sutter Sharing is root of all contention
Is The Trinity A Biblical Concept
Accept Wrong Is Right
Love is Triumphant
function is dir
Analiza IS nrB rapkiewicz TUW20120101232111
Japanese Is Possible Lesson 16
FIDE Trainers Surveys 2014 06 29, Susan Polgar The Game Is Not Over Until It Is Over
Cypress Hill Stoned is the way of walk
Przymiotniki –er, is, e; is, is, e; s

więcej podobnych podstron