Estymacja liniowej funkcji regresji wielokrotnej |
|
|
|
|
|
|
Podczas badań populacji generalnej ze względu na cechę wynikową Y i k cech objaśniających (nie- |
|
|
|
|
|
|
zależnych) X1, X2, …, Xk pobieramy z niej n-elementową próbę, której wyniki są łącznymi obserwac- |
|
|
|
|
|
|
jami cechy Y i k cech Xi. Przyjmując przedstawione wcześniej oznaczenia możemy sformułować nastę- |
|
|
|
|
|
|
pujące założenia: |
|
|
|
|
|
|
|
|
|
|
|
|
|
1. y = Xb + e. |
|
|
|
|
|
|
2. Wektor losowy e jest tzw. sferycznym wektorem normalnym, tzn. ma n-wymiarowy rozkład normalny |
|
|
|
|
|
|
N(0, s2I), przy czym funkcja gęstości dana jest wzorem: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a parametry: |
|
|
|
|
|
|
|
|
|
|
|
gdzie I jest macierzą jednostkową stopnia n. |
|
|
|
3. Macierz X jest macierzą o ustalonych elementach i ma rząd r(X) = k + 1 <= n. |
|
|
|
|
|
|
|
|
|
|
|
|
|
Z założenia pierwszego wynika liniowość zależności pomiędzy wartościami cechy wynikowej Y |
|
|
|
|
|
|
i wartościami zmiennych objaśniających Xi z dokładnością do składnika losowego, co w zapisie skalarnym |
|
|
|
|
|
|
można przedstawić jako: |
|
|
|
|
|
|
|
yj = b1xj1 + b2xj2 + … + bkxjk + bk+1xj(k+1) + ej |
|
|
|
|
|
gdzie j = 1, 2, …, n. |
|
|
|
|
|
|
Drugie założenie wyraża fakt, że występujące w powyższym wzorze zakłócenia losowe ej, są niezależny- |
|
|
|
|
|
|
mi zmiennymi losowymi o identycznym rozkładzie normalnym N(0, s). |
|
|
|
|
|
|
Trzecie założenie wskazuje, że macierz X nie jest stochastyczna, a jej kolumny to układ k + 1 liniowo |
|
|
|
|
|
|
niezależnych wektorów, przy czym liczba pomiarów n (liczba wierszy) jest co najmniej równa liczbie |
|
|
|
|
|
|
kolumn, tzn. liczbie współczynników regresji bi. |
|
|
|
|
|
|
Z powyższych założeń wynikają następujące równości: |
|
|
|
|
|
|
|
E(e|X) = 0; |
|
|
|
|
|
|
E(y|X) = Xb (funkcja regresji); |
|
|
|
|
|
|
V(y|X) = s2I; |
|
|
|
|
|
gdzie kreski | oznaczają, że wektory wartości oczekiwanych i macierz kowariancji dotyczą rozkładów |
|
|
|
|
|
|
warunkowych (przy ustalonych wartościach macierzy X). |
|
|
|
|
|
|
|
|
|
|
|
|
|
Wyznaczenie równania regresji wielokrotnej polega na takim oszacowaniu wektora b (na podstawie |
|
|
|
|
|
|
wyników próby, czyli macierzy X i wektora y), aby zminimalizować wartość funkcji S: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
gdzie: |
|
|
|
|
|
|
|
|
|
przy czym b jest estymatorem wektora rzeczywistych współczynników regresji b. |
|
|
|
|
|
|
Efekt ten uzyskuje się stosując metodę najmniejszych kwadratów, zaś nieobciążonym estymatorem |
|
|
|
|
|
|
wektora b współczynników regresji jest wektor b wyznaczony ze wzoru: |
|
|
|
|
|
|
|
b = (XTX)-1XTy |
|
|
|
|
|
Powyższy wzór nazywany bywa ogólnym wzorem analizy regresji, a występująca w nim symetryczna |
|
|
|
|
|
|
macierz odwrotna (XTX)-1 istnieje na mocy założenia 3. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Macierz wariancji i kowariancji estymatora b wyznacza się ze wzoru: |
|
|
|
|
|
|
|
V(b) = s2(XTX)-1 |
|
|
|
|
|
natomiast nieobciążony estymator wariancji s2 składnika losowego, |
|
|
|
|
|
, określony jako: |
|
|
|
|
|
|
|
|
|
|
|
|
|
Test istotności dla współczynników regresji wielokrotnej |
|
|
|
|
|
Poszukując równania regresji wielokrotnej uwzględnia się najczęściej te zmienne niezależne, które mogą |
|
|
|
|
|
mieć wpływ na kształtowanie się wartości cechy wynikowej Y. Dobór tych zmiennych jest arbitralny, choć, |
|
|
|
|
|
co warto podkreślić, należy tu wykorzystać dostępne informacje na temat badanego zjawiska, czy procesu. |
|
|
|
|
|
Dobrane do modelu regresji zmienne mogą, lecz nie muszą odgrywać istotnej roli w równaniu regresji wielo- |
|
|
|
|
|
krotnej, stąd kapitalnego znaczenia nabiera możliwość racjonalnego usunięcia z niego tych zmiennych, które |
|
|
|
|
|
nie mają istotnego znaczenia. Możliwość zredukowania liczby współczynników regresji do tych, które znaj- |
|
|
|
|
|
dują się przy zmiennych istotnie oddziałujących na cechę wynikową daje test istotności dla współczynników |
|
|
|
|
|
regresji wielokrotnej. |
|
|
|
|
|
Test ten przeprowadza się w stosunku do wszystkich współczynników regresji stojących przy zmiennych |
|
|
|
|
|
niezależnych. Hipoteza zerowa zakłada, że weryfikowany współczynnik bi jest równy pewnej hipotetycznej |
|
|
|
|
|
wartości bi0 (H0: bi = bi0), natomiast hipoteza alternatywna przyjmuje, iż współczynnik ten różni się od |
|
|
|
|
|
wartości hipotetycznej (H1: bi<>bi0). Jeżeli wartość hipotetyczna bi0 = 0, to weryfikacja hipotezy zerowej |
|
|
|
|
|
jest sprawdzeniem, czy zmienna Xi istotnie wpływa na wartości cechy wynikowej Y, czyli czy powinna ona |
|
|
|
|
|
pozostać w równaniu regresji? Jak zawsze w takiej sytuacji hipotezę alternatywną można postawić bardziej |
|
|
|
|
|
jednoznacznie, tzn. H1: bi < bi0 bądź H1: bi > bi0, przy czym w pierwszym przypadku wykonuje się test |
|
|
|
|
|
z lewostronnym obszarem krytycznym, natomiast w drugim obszar krytyczny jest obszarem prawostronnym. |
|
|
|
|
|
Przebieg testu jest następujący. Po oszacowaniu wariancji s2 wektora losowego za pomocą wzoru |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
oblicza się wartość statystyki t zgodnie ze wzorem: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
gdzie: bi - i-ta składowa wektora b; |
|
|
|
|
|
bi0 - wartość hipotetyczna współczynnika regresji, |
|
|
|
|
|
natomiast |
|
|
|
|
|
|
|
|
przy czym dii jest i-tym diagonalnym elementem macierzy (XTX)-1. |
|
|
|
|
|
Statystyka t ma przy założeniu prawdziwości hipotezy zerowej rozkład t Studenta o liczbie stopni swo- |
|
|
|
|
|
body wynoszącej n - k - 1. Sposób wyznaczania wartości p i zweryfikowania na jej podstawie hipotezy |
|
|
|
|
|
zerowej jest taki sam jak dla wszystkich testów wykorzystujących tę statystykę. |
|
|
|
|
|
Jeżeli weryfikacja przebiegała z założeniem, że bi0 = 0, to po jej przeprowadzeniu w stosunku do |
|
|
|
|
|
wszystkich współczynników regresji (wszystkich zmiennych niezależnych) dokonuje się redukcji równania |
|
|
|
|
|
regresji wielokrotnej. Polega ona na usunięciu z macierzy wejść X tych kolumn, które odpowiadają |
|
|
|
|
|
zmiennym, znajdującym się przy współczynnikach regresji nie różniących się istotnie od zera. Macierz X |
|
|
|
|
|
ma po takim zabiegu niezmienioną liczbę wierszy, natomiast odpowiednio mniejszą liczbę kolumn. Wszystkie |
|
|
|
|
|
wykonane dotąd obliczenia należy powtórzyć wykorzystując nową postać macierzy X. |
|
|
|
|
|
Przedstawiony tu sposób eliminacji zmiennych nieistotnie oddziałujących na cechę wynikową Y, ma |
|
|
|
|
|
jednak wadę. Może zdarzyć się sytuacja, że etapów eliminacji będzie kilka, a na koniec żadna ze zmiennych |
|
|
|
|
|
nie wytrzyma weryfikacji za pomocą omawianego testu istotności. Oczywiście nie można wykluczyć, że |
|
|
|
|
|
w badanym zjawisku czy procesie cecha wynikowa Y rzeczywiście nie zależy od rozpatrywanych zmien- |
|
|
|
|
|
nych niezależnych. Zdarza się jednak, że brak końcowego równania regresji wielokrotnej jest efektem |
|
|
|
|
|
zbyt radykalnie przeprowadzanej weryfikacji. Można temu częściowo zaradzić stosując następujący |
|
|
|
|
|
schemat postępowania: |
|
|
|
|
|
1. Wyznaczyć wstępne równanie regresji (zawierające wszystkie zmienne niezależne). |
|
|
|
|
|
2. Obliczyć wartość statystyki ti dla wszystkich współczynników regresji. |
|
|
|
|
|
3. Wyznaczyć prawdopodobieństwo pi będące miarą błędu pierwszego rodzaju. |
|
|
|
|
|
4. Ustalić numer zmiennej, dla której wartość pi była największa. |
|
|
|
|
|
5. Usunąć z macierzy X kolumnę odpowiadającą zmiennej, której numer ustalono w kroku 4. |
|
|
|
|
|
6. Przeprowadzić na nowo obliczenia dla zredukowanej o jedną kolumnę macierzy X. Przejść do kroku 2. |
|
|
|
|
|
Przedstawioną tu procedurę postępowania należy kontynuować tak długo, aż w równaniu regresji pozo- |
|
|
|
|
|
staną zmienne spełniające przyjęty poziom wymagań (poziom istotności). Jeżeli jednak, mimo takiego |
|
|
|
|
|
sposobu eliminacji zmiennych niezależnych, nie uda się uzyskać równania, w którym wszystkie zmienne |
|
|
|
|
|
istotnie wpływają na cechę wynikową, to albo jest tak rzeczywiście, albo można podjąć kolejną próbę |
|
|
|
|
|
przyjmując nieco większą wartość poziomu istotności. |
|
|
|
|
|
Estymacja współczynnika korelacji wielokrotnej |
|
|
|
|
|
|
|
|
|
Obok poszukiwania równania regresji wielorakiej, opisującego kształt zależności pomiędzy cechą wyni- |
|
|
|
|
|
|
|
|
|
kową Y i wieloma jednocześnie zmiennymi niezależnymi, ważne jest uzyskanie odpowiedzi na pytanie, |
|
|
|
|
|
|
|
|
|
jaka jest siła tej zależności. Na pytanie to częściowo można udzielić odpowiedzi po oszacowaniu współ- |
|
|
|
|
|
|
|
|
|
czynnika korelacji wielokrotnej. Wartość współczynnika korelacji może jedynie sugerować, jak silna jest |
|
|
|
|
|
|
|
|
|
poszukiwana zależność. Pełnej odpowiedzi udziela dopiero weryfikacja statystyczna za pomocą testu |
|
|
|
|
|
|
|
|
|
istotności dla współczynnika korelacji wielokrotnej. |
|
|
|
|
|
|
|
|
|
Współczynnik korelacji wielokrotnej jest pierwiastkiem kwadratowym obliczonym z wartości tzw. |
|
|
|
|
|
|
|
|
|
stosunku korelacyjnego: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
gdzie 1 - j2 jest wspomnianym stosunkiem korelacyjnym, zaś j2 nosi nazwę współczynnika zbieżności, |
|
|
|
|
|
|
|
|
|
który oblicza się ze wzoru: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
przy czym s2 jest wariancją składnika losowego (tzw. wariancją resztową), a V(Y) jest wariancją zmiennej |
|
|
|
|
|
|
|
|
|
zależnej (cechy wynikowej). |
|
|
|
|
|
|
|
|
|
Współczynnik korelacji wielokrotnej jest oczywiście unormowaną miarą siły zależności między zmienną |
|
|
|
|
|
|
|
|
|
Y i wszystkimi jednocześnie zmiennymi niezależnymi Xi. Oznacza to, że przyjmuje on wartości z przedziału |
|
|
|
|
|
|
|
|
|
0 <= r <= 1, przy czym, w przypadku gdy r = 0, zmienna Y nie jest skorelowana ze zmiennymi Xi, |
|
|
|
|
|
|
|
|
|
natomiast gdy r = 1, zachodzi y = Xb, czyli cecha wynikowa Y zależy ściśle liniowo od zmiennych nie- |
|
|
|
|
|
|
|
|
|
zależnych (objaśniających) Xi. |
|
|
|
|
|
|
|
|
|
Wartość współczynnika korelacji wielokrotnej estymuje się za pomocą estymatora (współczynnika |
|
|
|
|
|
|
|
|
|
korelacji z próby) danego wzorem: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
gdzie 1T jest n-wymiarowym wektorem wierszowym złożonym z samych jedynek. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Przykład |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Wysunięto przypuszczenie, że granica plastyczności stali dwoistofazowych zależy od struktury. Na |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
podstawie pomiarów udziału objętościowego martenzytu VV [%], średniego pola powierzchni wysp |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
martenzytu AM [mm2], średniej drogi swobodnej w martenzycie LM [mm] oraz względnej powierzchni |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
granic ziaren martenzyt-ferryt SMF [mm2/mm3] ustalić kierunek i siłę ich wpływu na granicę plastycz- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ności R0,2 stali dwoistofazowych. Oszacować współczynnik korelacji wielokrotnej i poddać go wery- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
fikacji statystycznej. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Tabela. Wyniki pomiarów wybranych parametrów struktury stali dwoistofazowych |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
VV |
AM |
LM |
SMF |
R0,2 |
|
|
|
|
|
|
|
|
|
|
20,53 |
2,8 |
1,45 |
563,3 |
377 |
|
|
|
|
|
|
|
|
|
|
17,78 |
2,9 |
1,43 |
494,6 |
354 |
|
|
|
|
|
|
|
|
|
|
17,93 |
3,5 |
1,62 |
441,1 |
334 |
|
|
|
|
|
|
|
|
|
|
27,25 |
1,3 |
1,03 |
1060,5 |
624 |
|
|
|
|
|
|
|
|
|
|
39,46 |
2,1 |
1,29 |
1223,1 |
745 |
|
|
|
|
|
|
|
|
|
|
25,83 |
1,3 |
1,06 |
969,3 |
626 |
|
|
|
|
|
|
|
|
|
|
34,81 |
2,0 |
1,33 |
1042,9 |
685 |
|
|
|
|
|
|
|
|
|
|
40,41 |
2,9 |
1,70 |
948,2 |
536 |
|
|
|
|
|
|
|
|
|
|
24,09 |
2,4 |
1,38 |
709,9 |
517 |
|
|
|
|
|
|
|
|
|
|
36,96 |
2,0 |
1,06 |
1390,8 |
847 |
|
|
|
|
|
|
|
|
|
|
20,21 |
0,6 |
0,65 |
1247,9 |
524 |
|
|
|
|
|
|
|
|
|
|
16,43 |
0,5 |
0,50 |
1311,3 |
554 |
|
|
|
|
|
|
|
|
|
|
22,83 |
0,6 |
0,59 |
1539,3 |
468 |
|
|
|
|
|
|
|
|
|
|
21,93 |
0,6 |
0,63 |
1394,4 |
519 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Rozwiązanie |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Przed przystąpieniem do obliczeń mających na celu uzyskanie równania regresji wielorakiej należy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
utworzyć macierz wejść X. Jak wiadomo, macierz ta zawiera jako ostatnią, kolumnę jedynek, dlatego |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
też zbiór danych źródłowych trzeba uzupełnić o dodatkową kolumnę, której elementy będą |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
tożsamościowo równe 1. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X1 |
X2 |
X3 |
X4 |
X5 |
|
Y |
|
|
|
|
|
|
|
|
20,53 |
2,8 |
1,45 |
563,3 |
1 |
|
377 |
|
|
|
|
|
|
|
|
17,78 |
2,9 |
1,43 |
494,6 |
1 |
|
354 |
|
|
|
|
|
|
|
|
17,93 |
3,5 |
1,62 |
441,1 |
1 |
|
334 |
|
|
|
|
|
|
|
|
27,25 |
1,3 |
1,03 |
1060,5 |
1 |
|
624 |
|
|
|
|
|
|
|
|
39,46 |
2,1 |
1,29 |
1223,1 |
1 |
|
745 |
|
|
|
|
|
|
|
|
25,83 |
1,3 |
1,06 |
969,3 |
1 |
|
626 |
|
|
|
|
|
|
|
X = |
34,81 |
2,0 |
1,33 |
1042,9 |
1 |
y = |
685 |
|
|
|
|
|
|
|
|
40,41 |
2,9 |
1,70 |
948,2 |
1 |
|
536 |
|
|
|
|
|
|
|
|
24,09 |
2,4 |
1,38 |
709,9 |
1 |
|
517 |
|
|
|
|
|
|
|
|
36,96 |
2,0 |
1,06 |
1390,8 |
1 |
|
847 |
|
|
|
|
|
|
|
|
20,21 |
0,6 |
0,65 |
1247,9 |
1 |
|
524 |
|
|
|
|
|
|
|
|
16,43 |
0,5 |
0,50 |
1311,3 |
1 |
|
554 |
|
|
|
|
|
|
|
|
22,83 |
0,6 |
0,59 |
1539,3 |
1 |
|
468 |
|
|
|
|
|
|
|
|
21,93 |
0,6 |
0,63 |
1394,4 |
1 |
|
519 |
|
|
|
|
|
|
|
Obliczenia rozpoczynamy od utworzenia macierzy transponowanej XT. Zaznaczamy blok komórek |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
B31:F44, a następnie klikamy przycisk Kopiuj, po czym zaznaczamy komórkę B50. W dalszym ciągu |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
wybieramy opcję Edycja oraz polecenie Wklej specjalnie, by w otwartym oknie tego polecenia kliknąć |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
w polu wyboru Transpozycja. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20,53 |
17,78 |
17,93 |
27,25 |
39,46 |
25,83 |
34,81 |
40,41 |
24,09 |
36,96 |
20,21 |
16,43 |
22,83 |
21,93 |
|
2,8 |
2,9 |
3,5 |
1,3 |
2,1 |
1,3 |
2,0 |
2,9 |
2,4 |
2,0 |
0,6 |
0,5 |
0,6 |
0,6 |
XT = |
1,45 |
1,43 |
1,62 |
1,03 |
1,29 |
1,06 |
1,33 |
1,70 |
1,38 |
1,06 |
0,65 |
0,50 |
0,59 |
0,63 |
|
563,3 |
494,6 |
441,1 |
1060,5 |
1223,1 |
969,3 |
1042,9 |
948,2 |
709,9 |
1390,8 |
1247,9 |
1311,3 |
1539,3 |
1394,4 |
|
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
Mając macierze XT oraz X można obliczyć elementy macierzy (XTX), będącej ich iloczynem. Macierz ta |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
jest, jak wiadomo, symetryczną macierzą rzędu (k + 1), a uzyskamy ją wykorzystując funkcję |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
MACIERZ.ILOCZYN znajdującą się w zestawie funkcji matematycznych. Funkcja MACIERZ.ILOCZYN |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
jest tzw. funkcją tablicową. Najpierw zaznaczamy komórkę B66, która stanowić będzie lewy górny |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
narożnik macierzy (XTX) - element o indeksach 1, 1. Teraz wybieramy w zestawie funkcji matematycz- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
nych funkcję MACIERZ.ILOCZYN, co prowadzi do pojawienia się okna tej funkcji. Ma ono dwa pola |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
nazwane Tablica1 i Tablica2. W polu Tablica1 podajemy blok komórek B50:O54, natomiast w polu |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Tablica2 blok komórek B31:F44 i klikamy przycisk OK. Po tej czynności w komórce B60 widoczna |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
jest wartość 10498. Następnie zaznaczamy blok komórek B66:F70 (5 x 5) i klikamy w pasku formuły |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(w dowolnym miejscu), a następnie naciskamy jednocześnie trzy klawisze: [Shift]+[Ctrl]+[Enter]. W |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
efekcie w zaznaczonych komórkach uzyskujemy wszystkie elementy symetrycznej macierzy (XTX). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10498 |
689 |
427 |
386078 |
366 |
|
|
|
|
|
|
|
|
|
|
689 |
60 |
34 |
22248 |
26 |
|
|
|
|
|
|
|
|
|
XTX = |
427 |
34 |
20 |
14643 |
16 |
|
|
|
|
|
|
|
|
|
|
386078 |
22248 |
14643 |
16332246 |
14337 |
|
|
|
|
|
|
|
|
|
|
366 |
26 |
16 |
14337 |
14 |
|
|
|
|
|
|
|
|
|
W ogólnym wzorze analizy regresji widoczna jest symetryczna macierz odwrotna (XTX)-1, którą uzyskamy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
za pomocą wykorzystania funkcji tablicowej MACIERZ.ODW. W tym celu zaznaczamy komórkę B79 i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
wybieramy w zestawie funkcji matematycznych wspomnianą funkcję. W otwartym w ten sposób oknie |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
funkcji MACIERZ.ODW w polu Tablica podajemy blok komórek B66:F70 i klikamy przycisk OK. W |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
zaznaczonej komórce B77 uzyskujemy wartość 0,0266, która stanowi lewy górny element macierzy odwrot- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
nej (indeksy 1, 1). Teraz zaznaczamy blok komórek B79:F83 (5 x 5), klikamy w obrębie paska formuły i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
naciskamy jednocześnie klawisze [Shift]+[Ctrl]+[Enter]. W zaznaczonych komórkach uzyskujemy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
pozostałe elementy macierzy odwrotnej (XTX)-1. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0266 |
0,1465 |
-1,1396 |
-0,0008 |
1,1718 |
|
|
|
|
|
|
|
|
|
|
0,1465 |
2,0221 |
-8,8184 |
-0,0040 |
6,4801 |
|
|
|
|
|
|
|
|
|
(XTX)-1 = |
-1,1396 |
-8,8184 |
55,3716 |
0,0356 |
-52,7765 |
|
|
|
|
|
|
|
|
|
|
-0,0008 |
-0,0040 |
0,0356 |
0,0000 |
-0,0397 |
|
|
|
|
|
|
|
|
|
|
1,1718 |
6,4801 |
-52,7765 |
-0,0397 |
57,4629 |
|
|
|
|
|
|
|
|
|
W ogólnym wzorze analizy regresji (b = (XTX)-1XTy) oprócz macierzy odwrotnej występuje iloczyn |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
XTy. Elementy tego wektora kolumnowego o wymiarach 5 x 1 uzyskamy wykorzystując ponownie funkcję |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
MACIERZ.ILOCZYN. Zaznaczamy w tym celu komórkę B92 i uaktywniamy tę funkcję, po czym w polu |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Tablica1 podajemy blok komórek B50:O54, a w polu Tablica2 blok komórek H31:H44 zawierających |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
elementy wektora cechy wynikowej y. po zamknięciu okna funkcji MACIERZ.ILOCZYN uzyskujemy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
w komórce B92 pierwszy element wyznaczonego wektora XTy. Pozostałe jego elementy obliczamy za- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
znaczając najpierw komórki B92:B96, a następnie powtarzając czynności finalizujące wykorzystanie funkcji |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
tablicowej. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
213616 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
13483,5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
XTy = |
8515,5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8306616,6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7710 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Estymator współczynników regresji b jest wektorem będącym iloczynem macierzy (XTX)-1 i wektora |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
XTy. Współczynniki regresji stanowiące elementy tego wektora uzyskamy za pomocą opisanej już funkcji |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
MACIERZ.ILOCZYN, przy czym umiejscowimy je w komórkach B99:B103. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
50,1 |
b1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
202,8 |
b2 |
|
|
|
|
|
|
|
|
|
|
|
|
b = |
-1712 |
b3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
-1,114 |
b4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
1932,5 |
b0 |
|
|
|
|
|
|
|
|
|
|
|
|
Aby uzyskać odpowiedź na pytanie o siłę oddziaływania poszczególnych zmiennych niezależnych, należy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
je zweryfikować. Przyjmiemy klasyczną wartość poziomu istotności a = |
|
|
|
|
|
0,05 |
i następujące posta- |
|
|
|
|
|
|
|
cie hipotez: H0: bi = 0; H1: bi <> 0. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
W pierwszej kolejności niezbędne jest oszacowanie wariancji resztowej (składnika losowego) za pomocą |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
wzoru |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
W wersji macierzowej tego wzoru należy odjąć od iloczynu yTy iloczyn bTXTy. Aby uniknąć koniecznej |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
transpozycji wektorów y i b, wykorzystamy dla obliczenia yTy funkcję SUMA.KWADRATÓW a dla |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
obliczenia bTXTy funkcję SUMA.ILOCZYNÓW. Argumentem pierwszej z nich jest blok komórek H31:H44, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
natomiast pierwszym argumentem funkcji SUMA.ILOCZYNÓW jest blok komórek B99:B103 (współczynniki |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
regresji), a drugim blok komórek B91:B95 (elementy wektora XTy). Wartości obydwu iloczynów wyzna- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
czymy odpowiednio w komórkach B120 i B121. Przed obliczeniem wartości estymatora wariancji resztowej |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
konieczne jest ustalenie liczby wierszy n i kolumn k macierzy wejść X, co uzyskujemy w komórce B122 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(=ILE.LICZB(H31:H44)) oraz w komórce B123 (=ILE.NIEPUSTYCH(B30:E30)). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
yTy = |
4526374,0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
bTXT = |
4508737,5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
n = |
14 |
|
|
|
|
|
|
|
|
|
|
|
|
|
k = |
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Teraz za pomocą formuły w postaci: =(B120-B121)/(B122-B123-1) uzyskujemy w komórce B126 po- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
szukiwaną wartość. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
S2e = |
1959,6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Aby przeprowadzić weryfikację istotności statystycznej współczynników regresji i współczynnika korelacji |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
wielokrotnej obliczono w pierwszej kolejności wartość statystyki t dla zweryfikowania hipotezy o istotności |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
współczynnika znajdującego się w równaniu regresji przy zmiennej VV (komórka B148). Widoczną w tej |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
komórce wartość uzyskano za pomocą formuły o postaci: =B99/PIERWIASTEK($B$126*B78), zgodnie ze |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
wzorem |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
z jednoczesnym uwzględnieniem wzoru |
|
|
|
|
|
|
|
|
|
|
|
|
Powielając zawartość komórki B148 do komórki B149 i zmieniając w powstałej tam formule adres komórki |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
B79 na C79 obliczono wartość statystyki t dla współczynnika stojącego w równaniu regresji przy zmiennej |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
AM. Powielając komórkę B149 do B150 (zamiana w adresie C80 litery C na D) oraz komórkę B150 do |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
B151 (zamiana w adresie D81 litery D na E) uzyskujemy wartości statystyki t dla dwóch pozostałych współ- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
czynników regresji. Odpowiadające wartościom t prawdopodobieństwa p obliczono w komórkach |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
D148:D151. W tym celu do komórki D148 wprowadzono formułę następującej postaci: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
=ROZKŁAD.T(MODUŁ>LICZBY(B148);B$122-B$123-1;2). |
|
|
|
|
|
|
|
|
|
|
|
|
Zagnieżdżoną w tej formule funkcję MODUŁ.LICZBY zastosowano w celu uniknięcia problemów, jakie |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
pojawią się, gdy wartość pierwszego argumentu funkcji ROZKŁAD.T jest ujemna. Jako ostatni argument |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
funkcji ROZKŁAD.T przyjęto wartość 2, bowiem postać hipotezy alternatywnej wskazuje na weryfikację |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
z dwustronnym obszarem krytycznym. Tak skonstruowaną formułę powielono do pozostałych trzech |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
komórek D149:D151 otrzymując w ten sposób wartości p pozwalające zweryfikować współczynniki regresji |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
przy zmiennych AM, LM i SFM. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t1 = |
6,935 |
p1 = |
0,0001 |
|
|
|
|
|
|
|
|
|
|
|
t2 = |
3,222 |
p2 = |
0,0105 |
|
|
|
|
|
|
|
|
|
|
|
t3 = |
-5,197 |
p3 = |
0,0006 |
|
|
|
|
|
|
|
|
|
|
|
t4 = |
-4,742 |
p4 = |
0,0011 |
|
|
|
|
|
|
|
|
|
|
|
Ostatnim elementem obliczeń było wyznaczenie wartości współczynnika korelacji wielokrotnej oraz |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
poddanie go weryfikacji statystycznej. Uwzględniając wzór |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
wprowadzono do komórki B167 formułę: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
=PIERWIASTEK(1-(B120-B121)/(WARIANCJA(H31:H44)*(B122-1))). |
|
|
|
|
|
|
|
|
|
|
|
|
|
Wartość statystyki F obliczono w komórce B167 za pomocą formuły: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
=(B122-B123-1)*B167^2/(B123*(1-B167^2)), |
|
|
|
|
|
|
|
|
|
|
|
|
|
natomiast odpowiadającą jej wartość prawdopodobieństwa p w komórce B169 wykorzystując funkcję |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ROZKŁAD.F, której kolejnymi argumentami były: F (komórka B168), k (komórka B123) oraz n - k - 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(zapis B122-123-1). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
rw = |
0,9680 |
|
|
|
|
|
|
|
|
|
|
|
|
|
F = |
33,518 |
|
|
|
|
|
|
|
|
|
|
|
|
|
p = |
0,00002 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Odpowiedź: Po przeprowadzeniu niezbędnych obliczeń uzyskano równanie regresji wielokrotnej, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
które po uwzględnieniu nazw zmiennych niezależnych i cechy wynikowej przyjmuje postać: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
R0,2 = 50,1*VV + 202,8*AM - 1712,0*LM - 1,114*SMF + 1932,5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Przeprowadzona weryfikacja współczynników regresji wykazała, że są one (wszystkie) istotne na |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
poziomie a = 0,05, a co za tym idzie nie ma powodów do przeprowadzania procesu eliminacji (redukcji |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
równania regresji). Weryfikacja współczynnika korelacji wielokrotnej przebiegła również pomyślnie |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(p < 0,05), co oznacza, że równanie jako całość ma praktyczną przydatność do przewidywania wartości |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
w zależności od wartości analizowanych parametrów (stereologicznych) ich struktury. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Odpowiedź na pytanie o siłę oddziaływania poszczególnych zmiennych niezależnych (parametrów |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
struktury) można uzyskać po uszeregowaniu w rosnącej kolejności wartości pi. Prowadzi to do wniosku, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
że najsilniej wpływa na granicę plastyczności udział objętościowy martenzytu (VV), a w dalszej kolejności |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
średnia droga swobodna w martenzycie (LM), względna powierzchnia granic ziaren martenzyt-ferryt (SMF) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i wreszcie średnie pole powierzchni wysp martenzytu (AM). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Odpowiedź na pytanie o kierunek oddziaływania analizowanych parametrów struktury jest bardzo |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
prosta. Kierunek ten pokazuje znak poszczególnych współczynników regresji. I tak zwiększenie zarówno |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
udziału objętościowego martenzytu, jak i średniego pola powierzchni wysp martenzytu podnosi granicę |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
plastyczności stali dwoistofazowych. Zwiększanie wartości dwóch pozostałych parametrów struktury, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
tj. średniej drogi swobodnej w martenzycie oraz względnej powierzchni granic ziaren martenzyt-ferryt |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
wpływa na obniżenie badanej cechy wytrzymałościowej. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|