SI 11 wielowymiarowa analiza regresji liniowej


Overview

Oznaczenia
Estymacja funkcji
Test istotności
Współczynnik korelacji
Test rw
Przykład
Zadanie 1
Zadanie 2
Zadanie 3
Zadanie 4
Zadanie 5
Zadanie 6


Sheet 1: Oznaczenia

Wielowymiarowa analiza regresji liniowej








Badając populację generalną ze względu na więcej niż dwie cechy mierzalne, posługujemy się pojęciem








regresji wielokrotnej (wielorakiej). W takim przypadku najczęściej interesuje nas związek pomiędzy








jedną zmienną (zależną), zwaną zazwyczaj cechą wynikową, a wieloma (jednocześnie) zmiennymi nie-








zależnymi - objaśniającymi domniemany związek. Wyniki pomiarów są realizacją wielowymiarowej zmien-








nej losowej, czyli tzw. wektora losowego, a funkcja przyporządkowująca wartościom wielu zmiennych








objaśniających średnie wartości cechy wynikowej nosi nazwę funkcji regresji wielokrotnej.








W wielu praktycznych zastosowaniach zupełnie wystarczająca jest liniowa postać regresji wielokrotnej,








której wykres nosi nazwę hiperpłaszczyzny regresji. Przyjmowanie modelu liniowego związane jest z








prostotą rachunków mających na celu uzyskanie równania regresji wielorakiej, którego współczynniki








wyznacza się metodą najmniejszych kwadratów. Realizację niezbędnych obliczeń najwygodniej prze-








prowadza się stosując zapis macierzowy.








Niezbędne jest wprowadzenie następujących oznaczeń.








Niech X oznacza (n x (k + 1))-wymiarową macierz wejść, złożoną z wartości zaobserwowanych w








n-elementowej próbie na k + 1 zmiennych objaśniających X1, X2, …, Xk, Xk+1, gdzie Xk+1 jest








zmienną tożsamościowo równą 1, występującą przy wyrazie wolnym w równaniu regresji wielokrotnej:







































y oznacza n-wymiarowy wektor kolumnowy wartości cechy wynikowej Y:

































































b oznacza (k + 1)-wymiarowy wektor kolumnowy parametrów (współczynników) regresji wielokrotnej:

































































natomiast e oznacza n-wymiarowy wektor kolumnowy losowy, złożony z tzw. składników (zakłóceń)








losowych:






















































































































































































































































































































































































































































































































































































































Sheet 2: Estymacja funkcji

Estymacja liniowej funkcji regresji wielokrotnej





Podczas badań populacji generalnej ze względu na cechę wynikową Y i k cech objaśniających (nie-





zależnych) X1, X2, …, Xk pobieramy z niej n-elementową próbę, której wyniki są łącznymi obserwac-





jami cechy Y i k cech Xi. Przyjmując przedstawione wcześniej oznaczenia możemy sformułować nastę-





pujące założenia:












1. y = Xb + e.





2. Wektor losowy e jest tzw. sferycznym wektorem normalnym, tzn. ma n-wymiarowy rozkład normalny





N(0, s2I), przy czym funkcja gęstości dana jest wzorem:















a parametry:










gdzie I jest macierzą jednostkową stopnia n.


3. Macierz X jest macierzą o ustalonych elementach i ma rząd r(X) = k + 1 <= n.












Z założenia pierwszego wynika liniowość zależności pomiędzy wartościami cechy wynikowej Y





i wartościami zmiennych objaśniających Xi z dokładnością do składnika losowego, co w zapisie skalarnym





można przedstawić jako:






yj = b1xj1 + b2xj2 + … + bkxjk + bk+1xj(k+1) + ej




gdzie j = 1, 2, …, n.





Drugie założenie wyraża fakt, że występujące w powyższym wzorze zakłócenia losowe ej, są niezależny-





mi zmiennymi losowymi o identycznym rozkładzie normalnym N(0, s).





Trzecie założenie wskazuje, że macierz X nie jest stochastyczna, a jej kolumny to układ k + 1 liniowo





niezależnych wektorów, przy czym liczba pomiarów n (liczba wierszy) jest co najmniej równa liczbie





kolumn, tzn. liczbie współczynników regresji bi.





Z powyższych założeń wynikają następujące równości:






E(e|X) = 0;





E(y|X) = Xb (funkcja regresji);





V(y|X) = s2I;




gdzie kreski | oznaczają, że wektory wartości oczekiwanych i macierz kowariancji dotyczą rozkładów





warunkowych (przy ustalonych wartościach macierzy X).












Wyznaczenie równania regresji wielokrotnej polega na takim oszacowaniu wektora b (na podstawie





wyników próby, czyli macierzy X i wektora y), aby zminimalizować wartość funkcji S:














gdzie:








przy czym b jest estymatorem wektora rzeczywistych współczynników regresji b.





Efekt ten uzyskuje się stosując metodę najmniejszych kwadratów, zaś nieobciążonym estymatorem





wektora b współczynników regresji jest wektor b wyznaczony ze wzoru:






b = (XTX)-1XTy




Powyższy wzór nazywany bywa ogólnym wzorem analizy regresji, a występująca w nim symetryczna





macierz odwrotna (XTX)-1 istnieje na mocy założenia 3.



















Macierz wariancji i kowariancji estymatora b wyznacza się ze wzoru:






V(b) = s2(XTX)-1




natomiast nieobciążony estymator wariancji s2 składnika losowego,




, określony jako:














Sheet 3: Test istotności

Test istotności dla współczynników regresji wielokrotnej




Poszukując równania regresji wielokrotnej uwzględnia się najczęściej te zmienne niezależne, które mogą




mieć wpływ na kształtowanie się wartości cechy wynikowej Y. Dobór tych zmiennych jest arbitralny, choć,




co warto podkreślić, należy tu wykorzystać dostępne informacje na temat badanego zjawiska, czy procesu.




Dobrane do modelu regresji zmienne mogą, lecz nie muszą odgrywać istotnej roli w równaniu regresji wielo-




krotnej, stąd kapitalnego znaczenia nabiera możliwość racjonalnego usunięcia z niego tych zmiennych, które




nie mają istotnego znaczenia. Możliwość zredukowania liczby współczynników regresji do tych, które znaj-




dują się przy zmiennych istotnie oddziałujących na cechę wynikową daje test istotności dla współczynników




regresji wielokrotnej.




Test ten przeprowadza się w stosunku do wszystkich współczynników regresji stojących przy zmiennych




niezależnych. Hipoteza zerowa zakłada, że weryfikowany współczynnik bi jest równy pewnej hipotetycznej




wartości bi0 (H0: bi = bi0), natomiast hipoteza alternatywna przyjmuje, iż współczynnik ten różni się od




wartości hipotetycznej (H1: bi<>bi0). Jeżeli wartość hipotetyczna bi0 = 0, to weryfikacja hipotezy zerowej




jest sprawdzeniem, czy zmienna Xi istotnie wpływa na wartości cechy wynikowej Y, czyli czy powinna ona




pozostać w równaniu regresji? Jak zawsze w takiej sytuacji hipotezę alternatywną można postawić bardziej




jednoznacznie, tzn. H1: bi < bi0 bądź H1: bi > bi0, przy czym w pierwszym przypadku wykonuje się test




z lewostronnym obszarem krytycznym, natomiast w drugim obszar krytyczny jest obszarem prawostronnym.




Przebieg testu jest następujący. Po oszacowaniu wariancji s2 wektora losowego za pomocą wzoru













oblicza się wartość statystyki t zgodnie ze wzorem:

















gdzie: bi - i-ta składowa wektora b;




bi0 - wartość hipotetyczna współczynnika regresji,




natomiast







przy czym dii jest i-tym diagonalnym elementem macierzy (XTX)-1.




Statystyka t ma przy założeniu prawdziwości hipotezy zerowej rozkład t Studenta o liczbie stopni swo-




body wynoszącej n - k - 1. Sposób wyznaczania wartości p i zweryfikowania na jej podstawie hipotezy




zerowej jest taki sam jak dla wszystkich testów wykorzystujących tę statystykę.




Jeżeli weryfikacja przebiegała z założeniem, że bi0 = 0, to po jej przeprowadzeniu w stosunku do




wszystkich współczynników regresji (wszystkich zmiennych niezależnych) dokonuje się redukcji równania




regresji wielokrotnej. Polega ona na usunięciu z macierzy wejść X tych kolumn, które odpowiadają




zmiennym, znajdującym się przy współczynnikach regresji nie różniących się istotnie od zera. Macierz X




ma po takim zabiegu niezmienioną liczbę wierszy, natomiast odpowiednio mniejszą liczbę kolumn. Wszystkie




wykonane dotąd obliczenia należy powtórzyć wykorzystując nową postać macierzy X.




Przedstawiony tu sposób eliminacji zmiennych nieistotnie oddziałujących na cechę wynikową Y, ma




jednak wadę. Może zdarzyć się sytuacja, że etapów eliminacji będzie kilka, a na koniec żadna ze zmiennych




nie wytrzyma weryfikacji za pomocą omawianego testu istotności. Oczywiście nie można wykluczyć, że




w badanym zjawisku czy procesie cecha wynikowa Y rzeczywiście nie zależy od rozpatrywanych zmien-




nych niezależnych. Zdarza się jednak, że brak końcowego równania regresji wielokrotnej jest efektem




zbyt radykalnie przeprowadzanej weryfikacji. Można temu częściowo zaradzić stosując następujący




schemat postępowania:




1. Wyznaczyć wstępne równanie regresji (zawierające wszystkie zmienne niezależne).




2. Obliczyć wartość statystyki ti dla wszystkich współczynników regresji.




3. Wyznaczyć prawdopodobieństwo pi będące miarą błędu pierwszego rodzaju.




4. Ustalić numer zmiennej, dla której wartość pi była największa.




5. Usunąć z macierzy X kolumnę odpowiadającą zmiennej, której numer ustalono w kroku 4.




6. Przeprowadzić na nowo obliczenia dla zredukowanej o jedną kolumnę macierzy X. Przejść do kroku 2.




Przedstawioną tu procedurę postępowania należy kontynuować tak długo, aż w równaniu regresji pozo-




staną zmienne spełniające przyjęty poziom wymagań (poziom istotności). Jeżeli jednak, mimo takiego




sposobu eliminacji zmiennych niezależnych, nie uda się uzyskać równania, w którym wszystkie zmienne




istotnie wpływają na cechę wynikową, to albo jest tak rzeczywiście, albo można podjąć kolejną próbę




przyjmując nieco większą wartość poziomu istotności.





Sheet 4: Współczynnik korelacji

Estymacja współczynnika korelacji wielokrotnej








Obok poszukiwania równania regresji wielorakiej, opisującego kształt zależności pomiędzy cechą wyni-








kową Y i wieloma jednocześnie zmiennymi niezależnymi, ważne jest uzyskanie odpowiedzi na pytanie,








jaka jest siła tej zależności. Na pytanie to częściowo można udzielić odpowiedzi po oszacowaniu współ-








czynnika korelacji wielokrotnej. Wartość współczynnika korelacji może jedynie sugerować, jak silna jest








poszukiwana zależność. Pełnej odpowiedzi udziela dopiero weryfikacja statystyczna za pomocą testu








istotności dla współczynnika korelacji wielokrotnej.








Współczynnik korelacji wielokrotnej jest pierwiastkiem kwadratowym obliczonym z wartości tzw.








stosunku korelacyjnego:















gdzie 1 - j2 jest wspomnianym stosunkiem korelacyjnym, zaś j2 nosi nazwę współczynnika zbieżności,








który oblicza się ze wzoru:























przy czym s2 jest wariancją składnika losowego (tzw. wariancją resztową), a V(Y) jest wariancją zmiennej








zależnej (cechy wynikowej).








Współczynnik korelacji wielokrotnej jest oczywiście unormowaną miarą siły zależności między zmienną








Y i wszystkimi jednocześnie zmiennymi niezależnymi Xi. Oznacza to, że przyjmuje on wartości z przedziału








0 <= r <= 1, przy czym, w przypadku gdy r = 0, zmienna Y nie jest skorelowana ze zmiennymi Xi,








natomiast gdy r = 1, zachodzi y = Xb, czyli cecha wynikowa Y zależy ściśle liniowo od zmiennych nie-








zależnych (objaśniających) Xi.








Wartość współczynnika korelacji wielokrotnej estymuje się za pomocą estymatora (współczynnika








korelacji z próby) danego wzorem:


































gdzie 1T jest n-wymiarowym wektorem wierszowym złożonym z samych jedynek.



























































































































































































































































































































































































































































































































































































































































































































Sheet 5: Test rw

Test istotności współczynnika korelacji wielokrotnej








Jak wspomniano, sama wartość współczynnika korelacji z próby nie może być jednoznacznie podstawą








oceny siły zależności pomiędzy cechą wynikową Y i zmiennymi niezależnymi Xi. Aby ocenić tę siłę, należy








przeprowadzić weryfikację współczynnika korelacji wielokrotnej za pomocą testu istotności. W teście tym








stawia się hipotezę zerową, która zakłada brak korelacji pomiędzy zmienną Y i wszystkimi zmiennymi nie-








zależnymi Xi (H0: r = 0), wobec hipotezy alternatywnej wyrażającej przypuszczenie, że współczynnik ko-








relacji wielorakiej jest istotnie większy od zera (H1: r > 0). Test wykorzystuje statystykę:






























która przy założeniu prawdziwości hipotezy zerowej ma rozkład F Snedecora o k i n - k - 1 stopniach








swobody.








Uwzględniając wymienione liczby stopni swobody i wartość statystyki F wyznacza się za pomocą tablic








rozkładu F Snedecora wartość p wyrażającą prawdopodobieństwo popełnienia błędu pierwszego rodzaju.








Wartość tę porównuje się z przyjętym z góry poziomem istotności a i podejmuje decyzję o odrzuceniu








hipotezy zerowej (gdy p <= a) lub braku podstaw do jej odrzucenia (gdy p > a).







































































































































































































































































































































































































































































































































































































































































































































































































































































Sheet 6: Przykład

Przykład













Wysunięto przypuszczenie, że granica plastyczności stali dwoistofazowych zależy od struktury. Na













podstawie pomiarów udziału objętościowego martenzytu VV [%], średniego pola powierzchni wysp













martenzytu AM [mm2], średniej drogi swobodnej w martenzycie LM [mm] oraz względnej powierzchni













granic ziaren martenzyt-ferryt SMF [mm2/mm3] ustalić kierunek i siłę ich wpływu na granicę plastycz-













ności R0,2 stali dwoistofazowych. Oszacować współczynnik korelacji wielokrotnej i poddać go wery-













fikacji statystycznej.













Tabela. Wyniki pomiarów wybranych parametrów struktury stali dwoistofazowych














VV AM LM SMF R0,2









20,53 2,8 1,45 563,3 377









17,78 2,9 1,43 494,6 354









17,93 3,5 1,62 441,1 334









27,25 1,3 1,03 1060,5 624









39,46 2,1 1,29 1223,1 745









25,83 1,3 1,06 969,3 626









34,81 2,0 1,33 1042,9 685









40,41 2,9 1,70 948,2 536









24,09 2,4 1,38 709,9 517









36,96 2,0 1,06 1390,8 847









20,21 0,6 0,65 1247,9 524









16,43 0,5 0,50 1311,3 554









22,83 0,6 0,59 1539,3 468









21,93 0,6 0,63 1394,4 519























Rozwiązanie













Przed przystąpieniem do obliczeń mających na celu uzyskanie równania regresji wielorakiej należy













utworzyć macierz wejść X. Jak wiadomo, macierz ta zawiera jako ostatnią, kolumnę jedynek, dlatego













też zbiór danych źródłowych trzeba uzupełnić o dodatkową kolumnę, której elementy będą













tożsamościowo równe 1.














X1 X2 X3 X4 X5
Y







20,53 2,8 1,45 563,3 1
377







17,78 2,9 1,43 494,6 1
354







17,93 3,5 1,62 441,1 1
334







27,25 1,3 1,03 1060,5 1
624







39,46 2,1 1,29 1223,1 1
745







25,83 1,3 1,06 969,3 1
626






X = 34,81 2,0 1,33 1042,9 1 y = 685







40,41 2,9 1,70 948,2 1
536







24,09 2,4 1,38 709,9 1
517







36,96 2,0 1,06 1390,8 1
847







20,21 0,6 0,65 1247,9 1
524







16,43 0,5 0,50 1311,3 1
554







22,83 0,6 0,59 1539,3 1
468







21,93 0,6 0,63 1394,4 1
519






Obliczenia rozpoczynamy od utworzenia macierzy transponowanej XT. Zaznaczamy blok komórek













B31:F44, a następnie klikamy przycisk Kopiuj, po czym zaznaczamy komórkę B50. W dalszym ciągu













wybieramy opcję Edycja oraz polecenie Wklej specjalnie, by w otwartym oknie tego polecenia kliknąć













w polu wyboru Transpozycja.














20,53 17,78 17,93 27,25 39,46 25,83 34,81 40,41 24,09 36,96 20,21 16,43 22,83 21,93

2,8 2,9 3,5 1,3 2,1 1,3 2,0 2,9 2,4 2,0 0,6 0,5 0,6 0,6
XT = 1,45 1,43 1,62 1,03 1,29 1,06 1,33 1,70 1,38 1,06 0,65 0,50 0,59 0,63

563,3 494,6 441,1 1060,5 1223,1 969,3 1042,9 948,2 709,9 1390,8 1247,9 1311,3 1539,3 1394,4

1 1 1 1 1 1 1 1 1 1 1 1 1 1
Mając macierze XT oraz X można obliczyć elementy macierzy (XTX), będącej ich iloczynem. Macierz ta













jest, jak wiadomo, symetryczną macierzą rzędu (k + 1), a uzyskamy ją wykorzystując funkcję













MACIERZ.ILOCZYN znajdującą się w zestawie funkcji matematycznych. Funkcja MACIERZ.ILOCZYN













jest tzw. funkcją tablicową. Najpierw zaznaczamy komórkę B66, która stanowić będzie lewy górny













narożnik macierzy (XTX) - element o indeksach 1, 1. Teraz wybieramy w zestawie funkcji matematycz-













nych funkcję MACIERZ.ILOCZYN, co prowadzi do pojawienia się okna tej funkcji. Ma ono dwa pola













nazwane Tablica1 i Tablica2. W polu Tablica1 podajemy blok komórek B50:O54, natomiast w polu













Tablica2 blok komórek B31:F44 i klikamy przycisk OK. Po tej czynności w komórce B60 widoczna













jest wartość 10498. Następnie zaznaczamy blok komórek B66:F70 (5 x 5) i klikamy w pasku formuły













(w dowolnym miejscu), a następnie naciskamy jednocześnie trzy klawisze: [Shift]+[Ctrl]+[Enter]. W













efekcie w zaznaczonych komórkach uzyskujemy wszystkie elementy symetrycznej macierzy (XTX).














10498 689 427 386078 366









689 60 34 22248 26








XTX = 427 34 20 14643 16









386078 22248 14643 16332246 14337









366 26 16 14337 14








W ogólnym wzorze analizy regresji widoczna jest symetryczna macierz odwrotna (XTX)-1, którą uzyskamy













za pomocą wykorzystania funkcji tablicowej MACIERZ.ODW. W tym celu zaznaczamy komórkę B79 i













wybieramy w zestawie funkcji matematycznych wspomnianą funkcję. W otwartym w ten sposób oknie













funkcji MACIERZ.ODW w polu Tablica podajemy blok komórek B66:F70 i klikamy przycisk OK. W













zaznaczonej komórce B77 uzyskujemy wartość 0,0266, która stanowi lewy górny element macierzy odwrot-













nej (indeksy 1, 1). Teraz zaznaczamy blok komórek B79:F83 (5 x 5), klikamy w obrębie paska formuły i













naciskamy jednocześnie klawisze [Shift]+[Ctrl]+[Enter]. W zaznaczonych komórkach uzyskujemy













pozostałe elementy macierzy odwrotnej (XTX)-1.














0,0266 0,1465 -1,1396 -0,0008 1,1718









0,1465 2,0221 -8,8184 -0,0040 6,4801








(XTX)-1 = -1,1396 -8,8184 55,3716 0,0356 -52,7765









-0,0008 -0,0040 0,0356 0,0000 -0,0397









1,1718 6,4801 -52,7765 -0,0397 57,4629








W ogólnym wzorze analizy regresji (b = (XTX)-1XTy) oprócz macierzy odwrotnej występuje iloczyn













XTy. Elementy tego wektora kolumnowego o wymiarach 5 x 1 uzyskamy wykorzystując ponownie funkcję













MACIERZ.ILOCZYN. Zaznaczamy w tym celu komórkę B92 i uaktywniamy tę funkcję, po czym w polu













Tablica1 podajemy blok komórek B50:O54, a w polu Tablica2 blok komórek H31:H44 zawierających













elementy wektora cechy wynikowej y. po zamknięciu okna funkcji MACIERZ.ILOCZYN uzyskujemy













w komórce B92 pierwszy element wyznaczonego wektora XTy. Pozostałe jego elementy obliczamy za-













znaczając najpierw komórki B92:B96, a następnie powtarzając czynności finalizujące wykorzystanie funkcji













tablicowej.














213616













13483,5












XTy = 8515,5













8306616,6













7710












Estymator współczynników regresji b jest wektorem będącym iloczynem macierzy (XTX)-1 i wektora













XTy. Współczynniki regresji stanowiące elementy tego wektora uzyskamy za pomocą opisanej już funkcji













MACIERZ.ILOCZYN, przy czym umiejscowimy je w komórkach B99:B103.














50,1 b1












202,8 b2











b = -1712 b3












-1,114 b4












1932,5 b0











Aby uzyskać odpowiedź na pytanie o siłę oddziaływania poszczególnych zmiennych niezależnych, należy













je zweryfikować. Przyjmiemy klasyczną wartość poziomu istotności a =




0,05 i następujące posta-






cie hipotez: H0: bi = 0; H1: bi <> 0.













W pierwszej kolejności niezbędne jest oszacowanie wariancji resztowej (składnika losowego) za pomocą













wzoru











































W wersji macierzowej tego wzoru należy odjąć od iloczynu yTy iloczyn bTXTy. Aby uniknąć koniecznej













transpozycji wektorów y i b, wykorzystamy dla obliczenia yTy funkcję SUMA.KWADRATÓW a dla













obliczenia bTXTy funkcję SUMA.ILOCZYNÓW. Argumentem pierwszej z nich jest blok komórek H31:H44,













natomiast pierwszym argumentem funkcji SUMA.ILOCZYNÓW jest blok komórek B99:B103 (współczynniki













regresji), a drugim blok komórek B91:B95 (elementy wektora XTy). Wartości obydwu iloczynów wyzna-













czymy odpowiednio w komórkach B120 i B121. Przed obliczeniem wartości estymatora wariancji resztowej













konieczne jest ustalenie liczby wierszy n i kolumn k macierzy wejść X, co uzyskujemy w komórce B122













(=ILE.LICZB(H31:H44)) oraz w komórce B123 (=ILE.NIEPUSTYCH(B30:E30)).













yTy = 4526374,0












bTXT = 4508737,5












n = 14












k = 4












Teraz za pomocą formuły w postaci: =(B120-B121)/(B122-B123-1) uzyskujemy w komórce B126 po-













szukiwaną wartość.













S2e = 1959,6












Aby przeprowadzić weryfikację istotności statystycznej współczynników regresji i współczynnika korelacji













wielokrotnej obliczono w pierwszej kolejności wartość statystyki t dla zweryfikowania hipotezy o istotności













współczynnika znajdującego się w równaniu regresji przy zmiennej VV (komórka B148). Widoczną w tej













komórce wartość uzyskano za pomocą formuły o postaci: =B99/PIERWIASTEK($B$126*B78), zgodnie ze













wzorem





































z jednoczesnym uwzględnieniem wzoru











Powielając zawartość komórki B148 do komórki B149 i zmieniając w powstałej tam formule adres komórki













B79 na C79 obliczono wartość statystyki t dla współczynnika stojącego w równaniu regresji przy zmiennej













AM. Powielając komórkę B149 do B150 (zamiana w adresie C80 litery C na D) oraz komórkę B150 do













B151 (zamiana w adresie D81 litery D na E) uzyskujemy wartości statystyki t dla dwóch pozostałych współ-













czynników regresji. Odpowiadające wartościom t prawdopodobieństwa p obliczono w komórkach













D148:D151. W tym celu do komórki D148 wprowadzono formułę następującej postaci:















=ROZKŁAD.T(MODUŁ>LICZBY(B148);B$122-B$123-1;2).











Zagnieżdżoną w tej formule funkcję MODUŁ.LICZBY zastosowano w celu uniknięcia problemów, jakie













pojawią się, gdy wartość pierwszego argumentu funkcji ROZKŁAD.T jest ujemna. Jako ostatni argument













funkcji ROZKŁAD.T przyjęto wartość 2, bowiem postać hipotezy alternatywnej wskazuje na weryfikację













z dwustronnym obszarem krytycznym. Tak skonstruowaną formułę powielono do pozostałych trzech













komórek D149:D151 otrzymując w ten sposób wartości p pozwalające zweryfikować współczynniki regresji













przy zmiennych AM, LM i SFM.













t1 = 6,935 p1 = 0,0001










t2 = 3,222 p2 = 0,0105










t3 = -5,197 p3 = 0,0006










t4 = -4,742 p4 = 0,0011










Ostatnim elementem obliczeń było wyznaczenie wartości współczynnika korelacji wielokrotnej oraz













poddanie go weryfikacji statystycznej. Uwzględniając wzór




















































































wprowadzono do komórki B167 formułę:














=PIERWIASTEK(1-(B120-B121)/(WARIANCJA(H31:H44)*(B122-1))).












Wartość statystyki F obliczono w komórce B167 za pomocą formuły:














=(B122-B123-1)*B167^2/(B123*(1-B167^2)),












natomiast odpowiadającą jej wartość prawdopodobieństwa p w komórce B169 wykorzystując funkcję













ROZKŁAD.F, której kolejnymi argumentami były: F (komórka B168), k (komórka B123) oraz n - k - 1













(zapis B122-123-1).













rw = 0,9680












F = 33,518












p = 0,00002












Odpowiedź: Po przeprowadzeniu niezbędnych obliczeń uzyskano równanie regresji wielokrotnej,













które po uwzględnieniu nazw zmiennych niezależnych i cechy wynikowej przyjmuje postać:














R0,2 = 50,1*VV + 202,8*AM - 1712,0*LM - 1,114*SMF + 1932,5












Przeprowadzona weryfikacja współczynników regresji wykazała, że są one (wszystkie) istotne na













poziomie a = 0,05, a co za tym idzie nie ma powodów do przeprowadzania procesu eliminacji (redukcji













równania regresji). Weryfikacja współczynnika korelacji wielokrotnej przebiegła również pomyślnie













(p < 0,05), co oznacza, że równanie jako całość ma praktyczną przydatność do przewidywania wartości













w zależności od wartości analizowanych parametrów (stereologicznych) ich struktury.













Odpowiedź na pytanie o siłę oddziaływania poszczególnych zmiennych niezależnych (parametrów













struktury) można uzyskać po uszeregowaniu w rosnącej kolejności wartości pi. Prowadzi to do wniosku,













że najsilniej wpływa na granicę plastyczności udział objętościowy martenzytu (VV), a w dalszej kolejności













średnia droga swobodna w martenzycie (LM), względna powierzchnia granic ziaren martenzyt-ferryt (SMF)













i wreszcie średnie pole powierzchni wysp martenzytu (AM).













Odpowiedź na pytanie o kierunek oddziaływania analizowanych parametrów struktury jest bardzo













prosta. Kierunek ten pokazuje znak poszczególnych współczynników regresji. I tak zwiększenie zarówno













udziału objętościowego martenzytu, jak i średniego pola powierzchni wysp martenzytu podnosi granicę













plastyczności stali dwoistofazowych. Zwiększanie wartości dwóch pozostałych parametrów struktury,













tj. średniej drogi swobodnej w martenzycie oraz względnej powierzchni granic ziaren martenzyt-ferryt













wpływa na obniżenie badanej cechy wytrzymałościowej.


























































































































































































































































































































































































































































































































































































































































































































































































































Sheet 7: Zadanie 1

Zadanie 1







Kwartalne obserwacje obrotów w sklepach odzieżowych i tekstylnych (Y) oraz udziałów procentowych







w ogólnej masie towarowej artykułów wykonanych z tkanin laminatowych i ortalionu (X1), artykułów







wykonanych z elany i terylenu (X2) wreszcie artykułów wykonanych z modylenu i tkanin podobnych (X3)







dały następujące wyniki:







X1 10 11 10 11 15 12 16 16
X2 9 7 10 8 7 15 20 15
X3 4 4 4 5 5 4 8 9
Y 2 3 4 6 10 12 20 25
Czy istnieje związek pomiędzy udziałami procentowymi badanych rodzajów tkanin a obrotami w sklepach







odzieżowych i tekstylnych? Jaka jest siła tej zależności?








Sheet 8: Zadanie 2

Zadanie 2



















W oparciu o wyniki pomiarów ustalić zależności temperatur w komorze silnikowej t [°C] autobusu



















w zależności od liczby obrotów silnika ns [min-1], ciśnienia w komorze silnikowej p [mm H2O] i natężenia



















przepływu wody w chłodnicy Gw [kg/s].




















ns
[1/min]
p
[mm H2O]
Gw
[kg/s]
t
[°C]

















750 1,0 1,445 60
















1000 1,9 1,901 64
















1250 2,4 2,404 73
















1650 4,1 3,123 84
















760 1,1 1,424 59
















1005 2,1 1,944 65
















1245 2,3 2,435 74
















1645 3,9 3,223 86
















760 1,2 1,400 62
















995 2,0 1,935 66
















1255 2,2 2,422 75
















1655 4,0 3,155 85
















Sheet 9: Zadanie 3

Zadanie 3


Badano koszt strat ciepła (Y) powstające w wymienniku ciepła w zależności od liczby rur (X1)


oraz ich powierzchni (X2). Otrzymane dane zebrano w tabeli.



X1 [szt.] X2 [m2] Y [zł]

550 120 310

600 130 300

520 108 275

420 110 250

400 84 220

300 90 200

230 80 190

120 55 150

190 64 140

100 50 100
Oszacować współczynnik korelacji wielokrotnej i poddać go weryfikacji statystycznej.



Sheet 10: Zadanie 4

Zadanie 4


Badano wpływ procesów nawęglania (X1) oraz odpuszczania (X2) w temperaturze 620 K na wytrzymałość


zmęczeniową (Y) stali E2. Otrzymano następujące wyniki (1 oznacza zastosowanie zabiegu, 0 jego brak):



X1 X2 Y
[102 MPa]

0 0 3,4

0 1 4,8

1 0 6,9

1 1 5,1

Sheet 11: Zadanie 5

Zadanie 5



Mamy następujące dane o produkcji dwu różnych wyrobów w sztukach oraz zużycie energii na tę



produkcję za sześć okresów:




Okres Produkcja Zużycie energii
w kWh

L K

1 2 3 12

2 4 2 14

3 3 1 11

4 5 3 15

5 2 2 14

6 2 1 6
Ustalić siłę związku korelacyjnego pomiędzy zużyciem energii elektrycznej a wielkością produkcji wyrobów



L i K. Oszacować za pomocą metody najmniejszych kwadratów parametry funkcji regresji typu



Y = b1*X1 + b2*X2 + b0, gdzie Y oznacza zużycie energii elektrycznej, X1 - produkcję wyrobu L,



X2 - produkcję wyrobu K.




Sheet 12: Zadanie 6

Zadanie 6













v [km/h] m [kg] p [bar] [l/100 km]


X1 X2 X3 Y
Y = b0 + b1 * X1 + b2 * X2 + b3 * X3

47 58 2,2 5,19
Y = b0 + b1 * v + b2 * m + b3 * p

47 117 2,2 5,20


51 122 2,1 5,27


57 124 2,1 5,37


57 126 2,1 5,95


60 128 2,1 6,08


65 148 2,0 6,25


66 193 2,0 6,43


69 200 2,0 6,53


75 285 2,0 6,56


78 326 2,0 6,57


79 353 2,0 6,58


81 357 2,0 6,67


85 364 1,9 6,85


86 369 1,9 6,92


87 375 1,9 6,98


89 387 1,9 7,29


91 459 1,9 7,37


92 460 1,9 7,70


92 487 1,8 7,79


Wyszukiwarka

Podobne podstrony:
Analiza regresji liniowej
11 regresja liniowa bis, Wariancja empirycznych współczynników a i b regresji liniowej
Metody porzadkowani liniowego, Wielowymiarowa analiza statystyczna, Panek, wap
Algorytm analizy korelacji i regresji liniowej, Statystyka opisowa
Metody porzadkowania liniowego p, Wielowymiarowa analiza statystyczna, Panek, wap
zadanie 2- regresja liniowa, Statyst. zadania
06.regresja liniowa, STATYSTYKA
Analiza regresji ostatnie notaki z wykladu
L4 regresja liniowa klucz (2)
3 Istotność parametrów modelu regresji liniowej
analiza regresji
Analiza i Algebra liniowa semestr 2 Politechnika koszalińska kierunek informmatyka
3-Estymacja parametrów modelu regresji liniowej, # Studia #, Ekonometria
Analiza regresji, Statystyka - ćwiczenia - Rumiana Górska
ANALIZA REGRESJI WIELOKROTN, Zarządzanie projektami, Zarządzanie(1)

więcej podobnych podstron