2 10 03 09


Overview

korelacje1
korelacje2
WYKLAD H I N
Hellwig1
Hellwig2
Nowak1
Nowak2
wykladM
Momenty


Sheet 1: korelacje1

Współczynnik korelacji Pearsona




Współczynnik zmienności






















jeżeli mamy 2 dane to stawiamy pytania



charaktez zmiennej determinuje wybór metody.








czy isnieje zależność



dla2 zienych losowych liczymy wspołczynnik korelacji

czy




jej zakles ilościowy



dla 1 losowej i jednej deterministycznej liczymy







zastosowanie w praktyce

















urzywany dla całej populacji gdy jest rozkład normalny



















































































Numer Y X Z












1 83 112 9 9 -9,91666666666667 1,08333333333333 -89,25 9,75 -10,7430555555556 81 98,3402777777779 1,17361111111111






2 77 135 6 3 13,0833333333333 -1,91666666666667 39,25 -5,75 -25,0763888888889 9 171,173611111111 3,67361111111111






3 95 129 14 21 7,08333333333333 6,08333333333333 148,75 127,75 43,0902777777778 441 50,173611111111 37,0069444444444






4 49 103 4 -25 -18,9166666666667 -3,91666666666667 472,916666666667 97,9166666666667 74,0902777777778 625 357,840277777778 15,3402777777778






5 63 127 8 -11 5,08333333333333 0,083333333333333 -55,9166666666666 -0,916666666666663 0,423611111111109 121 25,8402777777777 0,006944444444444






6 80 115 12 6 -6,91666666666667 4,08333333333333 -41,5 24,5 -28,2430555555556 36 47,8402777777778 16,6736111111111






7 91 124 10 17 2,08333333333333 2,08333333333333 35,4166666666666 35,4166666666667 4,34027777777777 289 4,34027777777776 4,34027777777778






8 79 143 9 5 21,0833333333333 1,08333333333333 105,416666666667 5,41666666666667 22,8402777777778 25 444,506944444444 1,17361111111111






9 36 98 5 -38 -23,9166666666667 -2,91666666666667 908,833333333334 110,833333333333 69,7569444444445 1444 572,006944444445 8,50694444444445






10 58 114 7 -16 -7,91666666666667 -0,916666666666667 126,666666666667 14,6666666666667 7,25694444444445 256 62,6736111111112 0,840277777777778






11 93 136 8 19 14,0833333333333 0,083333333333333 267,583333333333 1,58333333333333 1,17361111111111 361 198,340277777778 0,006944444444444






12 84 127 3 10 5,08333333333333 -4,91666666666667 50,8333333333333 -49,1666666666667 -24,9930555555555 100 25,8402777777777 24,1736111111111






Średnia 74 121,916666666667 7,91666666666667


1969 372 133,916666666667 3788 2058,91666666667 112,916666666667






Odchylenie standardowe 18,5570373811025 13,6811637817929 3,20392751402892


Sumy


























Współcz. zmienności 0,250770775420304 0,112217337923114 0,404706633351021



































Oblicz współczynniki korelacji na podstawie tabelki






































0,705052320634549

















im większy współczynnik korelacji tym bardziej skorelowane'


























0,568799138752341












































0,277738586905201
















































Oblicz współczynniki korelacji z funkcji Excela WSP.KORELACJI


























































0,705052320634549
























































0,568799138752341
























































0,277738586905201





































Sheet 2: korelacje2

Wykorzystaj narzędzie KORELACJE

























z meny NARZĘDZIA|ANALIZA DANYCH|KORELACJE




















































Numer Y X Z

y x z

















1 83 112 9
y 1



















2 77 135 6
x 0,705052320634549 1


















3 95 129 14
z 0,568799138752341 0,277738586905201 1

















4 49 103 4






















5 63 127 8






















6 80 115 12






















7 91 124 10






















8 79 143 9






















9 36 98 5






















10 58 114 7






















11 93 136 8






















12 84 127 3







































































































Wykorzystaj program STATGRAPHICS do obliczenia współczynników korelacji.




















































1. Skopuj tabele z danymi (B5:D16)

























2. Otwórz program STATGRAPHICS (bez StatWizarda)

























3. Wklej dane i zmień nazwy kolumn (menu podręczne Modify Column)

























4. Wyznacz macierz korelacji


























a. Discribe|Numeric Data|Multiple-Varable Analysis

























b. Dodaj wszystkie zmienne

























c.Wywołaj Tabular Options (drugi przycisk) i zaznacz Korelacje OK.









































































































Analysis Summary




















































Data variables:

























x

























y

























z




















































There are 12 complete cases for use in the calculations.


































































The StatAdvisor


















---------------


















This procedure is designed to summarize several columns of


















quantitative data. It will calculate various statistics, including


















correlations, covariances, and partial correlations. Also included in


















the procedure are a number of multivariate graphs, which give


















interesting views into the data. Use the Tabular Options and


















Graphical Options buttons on the analysis toolbar to access these


















different procedures.






































After this procedure, you may wish to select another procedure to


















build a statistical model for your data. Depending on your goal, one


















of several procedures may be appropriate. Following is a list of









goals with an indication of which procedure would be appropriate:


















GOAL: build a model for predicting one variable given values of one of








more other variables.








PROCEDURE: Relate - Multiple regression


















GOAL: group rows of data with similar characteristics.








PROCEDURE: Special - Multivariate Methods - Cluster Analysis


















GOAL: develop a method for predicting which of several groups new rows





opis tego co jest w tabelce

belong to.





1 korelacja

PROCEDURE: Special - Multivariate Methods - Discriminant Analysis





2 liczba obserwacji








3 pozion krytyczny
rzeczywiste ryzyko popełnienia błędu
GOAL: reduce the number of columns to a small set of meaningful







jeżeli jest mniejsze niż przez nas przyjęte to odrzucamy
measures.







jeżeli większe to nieodrzucamy
PROCEDURE: Special - Multivariate Methods - Factor Analysis


















GOAL: determine which combinations of the columns determine most of








the variability in your data.








PROCEDURE: Special - Multivariate Methods - Principal Components


















GOAL: find combinations of the columns which are strongly related to








each other.








PROCEDURE: Special - Multivariate Methods - Canonical Correlations



























































































































































































































Sheet 3: WYKLAD H I N

Dzichciarz 48










Metoda Nowaka











Zebrano dane o wielkości produkcji w pewnym przedsiębiorstwie z 28 lat.










Zaproponowano 5 zmiennych objaśniających. Przeprowadź eliminację cech zbędnych metodą Nowaka.













X1 X2 X3 X4 X5



0,58 X1
1,00 0,79 0,26 0,64 0,10
dene muszą być

0,86 X2
0,79 1,00 0,33 0,86 0,59
1. silnie skorelowane z y więc ich Rj musi byś większy od r*
Rj= 0,34 X3 Rjm= 0,26 0,33 1,00 0,17 0,51
2. słabo skorelowane midzy sobią więc ich współczynniki korelacji Rjm muszą być mniejsze od r*

0,87 X4
0,64 0,86 0,17 1,00 0,62



0,83 X5
0,10 0,59 0,51 0,62 1,00














I= 2,779 ROZKŁAD.T.ODW(0,01;28-2)


wartość statystyki t-studenta dla założenego poziomu istotności alfa i n-2 poziomami istotności












r*= 0,479 wartość krytyczna współczynnika korelacji











1. Eliminujemy zmienną X3, poniewż jest za słabo skorelowana ze zmienną Y








X1 X2 X4 X5




0,58 X1
1,00 0,79 0,64 0,10




0,86 X2
0,79 1,00 0,86 0,59



Rj= 0,87 X4 Rjm= 0,64 0,86 1,00 0,62




0,83 X5
0,10 0,59 0,62 1,00
















2. Do modelu wprowadzamy zmienną X4, ponieważ jest najsilniej skorelowana ze zmienną Y






















3. Eliminujemy zmienne X1, X2 i X5, ponieważ są silnie skorelowane z X4






















Wniosek: W modelu należy uwzględnić jedynie zmienną X4

























































Metoda Hellwiga











Zebrano dane o wielkości produkcji w pewnym przedsiębiorstwie z 28 lat.










Zaproponowano 3 zmienne objaśniające. Przeprowadź eliminację cech zbędnych metodą Hellwiga













X1 X2 X3





0,58 X1
1,00 0,79 0,64




Rj= 0,86 X2 Rjm= 0,79 1,00 0,86





0,87 X3
0,64 0,86 1,00





Pojemności indywidualne


Pojemności Integralne





{X1} 0,34


0,34

















{X2} 0,74


0,74














wybieramy to gdzie jest największa pojemność integralna

{X3} 0,76


0,76

















{X1,X2} 0,19 0,41

0,60

















{X1,X3} 0,21 0,46

0,67

















{X2,X3} 0,40 0,41

0,80















{X1,X2,X3} 0,14 0,28 0,30
0,72






Sheet 4: Hellwig1









Uwagi prowadzącego:








Metoda Hellwiga może prowadzić do doboru zmiennych silnie skorelowanych.
Lata Y X1 X2 X3 X4

Jest uciążliwa, dla dużego wymiaru zadania.
1991 10 6 8 14 12


1992 10 6 8 14 12


1993 16 10 12 18 12


1994 16 10 12 18 12


1995 12 8 8 18 10


1996 14 10 8 18 12


1997 20 12 14 24 10


1998 20 12 16 24 12


1999 20 12 16 26 12


2000 22 14 18 26 10


średnie 16 10 12 20 11,4


odch.stand 4,422 2,667 3,887 4,619 0,966


wsp. zmienności 0,276 0,267 0,324 0,231 0,085 odchylenie standardowe/średnia







x4 jest mniejsze od 0,1

wsp. korelacji








0,980 0,957 0,957













macierz korelacji zmiennych objaśniających








x1 x2 x3




x1 1,000 0,900 0,938




x2 0,900 1,000 0,916




x3 0,938 0,916 1,000













Kombinacja 1 x1 x2 x3





2,839 2,816 2,854




Indywidualne wskaźniki pojemności informacyjnej 0,338 0,325 0,321 0,984 Pojemność integralna











Kombinacja 2 x1 x2






1,900 1,900





Indywidualne wskaźniki pojemności informacyjnej 0,505 0,482 0,987 Pojemność integralna

kombinacja 2 ma największą pojemność integralną więc wybieramy te zmienne opisujące









Kombinacja 3 x2 x3






1,916 1,916





Indywidualne wskaźniki pojemności informacyjnej 0,478 0,478 0,956 Pojemność integralna












Kombinacja 4 x1 x3






1,938 1,938





Indywidualne wskaźniki pojemności informacyjnej 0,495 0,473 0,968 Pojemność integralna












Kombinacja 5 x1






Indywidualne wskaźniki pojemności informacyjnej 0,960 Pojemność integralna














Kombinacja 6 x2






Indywidualne wskaźniki pojemności informacyjnej 0,915 Pojemność integralna














Kombinacja 7 x3






Indywidualne wskaźniki pojemności informacyjnej 0,917 Pojemność integralna






Sheet 5: Hellwig2

Nr Y X1 X2 X3 X4


2 18,3 28 11 157 112


1 19 36 12 167 130


3 22 20 10 111 125


4 25 22 8 107 110


5 26,5 18 4 100 119


6 27 21 7 110 117


7 27 20 4,5 170 122


8 28 19 5 109 114


9 31 20 6,5 138 128


10 32,5 23 6 142 123


11 34 27 6 149 113


12 35 28 5 128 111


13 35 25 3,5 139 118


14 36,5 31 3 115 121


15 38 33 3 141 110


17 42,5 38 3,5 150 115


18 43 26 2,5 170 116


16 44 37 2,5 121 125


19 44 38 1 149 119


20 44 41 2 165 130











średnie 32,615 27,55 5,3 136,9 118,9


odch.stand 8,389 7,402 3,050 22,992 6,447


wsp. zmienności 0,257 0,269 0,575 0,168 0,054 <0,1 x4 odpada ponieważ jest mniejsze od 0,1









wsp. korelacji









0,59 0,89 0,22












macierz korelacji zmiennych objaśniających








x1 x2 x3




x1 1,000 0,327 0,458




x2 0,327 1,000 0,049




x3 0,458 0,049 1,000













Kombinacja 1 x1 x2 x3





1,785 1,376 1,507




Indywidualne wskaźniki pojemności informacyjnej 0,194 0,573 0,032 0,800 Pojemność integralna











Kombinacja 2 x1 x2






1,327 1,327





Indywidualne wskaźniki pojemności informacyjnej 0,261 0,594 0,855 Pojemność integralna

wybieramy kombinację 2 ponieważ ma największą pojemność integralną









Kombinacja 3 x2 x3






1,049 1,049





Indywidualne wskaźniki pojemności informacyjnej 0,752 0,047 0,798 Pojemność integralna












Kombinacja 4 x1 x3






1,458 1,458





Indywidualne wskaźniki pojemności informacyjnej 0,238 0,033 0,271 Pojemność integralna












Kombinacja 5 x1






Indywidualne wskaźniki pojemności informacyjnej 0,347 Pojemność integralna














Kombinacja 6 x2






Indywidualne wskaźniki pojemności informacyjnej 0,789 Pojemność integralna














Kombinacja 7 x3






Indywidualne wskaźniki pojemności informacyjnej 0,049 Pojemność integralna






Sheet 6: Nowak1

Na podstawie danych o 28 obiektach wyznaczono wszystkie korelacje. Przyjmująć poziom istotności a=0,1 dokonaj redukcji zmiennych objaśnianych.




























Macierz korelacji

Korelacje ze zmienną objaśnianą

1 2 3 4 5 6 7 8



krok 1
1 1 -0,90 0,35 -0,17 -0,62 -0,40 -0,16 -0,55
1 -0,59 0,59 przyjąć
2 -0,90 1 -0,06 -0,38 0,00 0,15 0,22 0,11
2 -0,06 0,06 odrzucić
3 0,35 -0,06 1 0,33 -0,11 -0,20 -0,45 -0,02
3 -0,08 0,08 odrzucić
4 -0,17 -0,38 0,33 1 0,20 -0,07 -0,44 0,07
4 0,13 0,13 odrzucić
5 -0,62 0,00 -0,11 0,20 1 0,22 0,17 -0,11
5 0,54 0,54 przyjąć
6 -0,40 0,15 -0,20 -0,07 0,22 1 -0,19 0,47
6 -0,15 0,15 odrzucić
7 -0,16 0,22 -0,45 -0,44 0,17 -0,19 1 0,05
7 -0,10 0,1 odrzucić
8 -0,55 0,11 -0,02 0,07 -0,11 0,47 0,05 1
8 0,72 0,72 przyjąć
















ROZKŁAD.T.ODW(F17;F19)








I 1,706
a 0,1














r* 0,317
n-2 26

















1. Należy pominąć zmienne 2,3,4,6,7




1. należy pominąć zmienne

2,3,4,6,7
|ri*|<r*
2. p=8




2. przyjęta zmienna

8


3. Pominąć zmienną 1




3. pominięte zmienne

1
|rim*|<r*
2. p=5




4. przyjąć zmienne

5,8
silnie skorelowane z y a słabo poiędzy sobą
3. Nie pomijać żadnej zmiennej











4. Wszystkie zmienne pominięte lub uwzględnine.



























W modelu należy uwzględnić zmienne 5 i 8.












Sheet 7: Nowak2


0,43
1 0,4 0,25 0,26 -0,49 -0,28 0,08






0,53
0,4 1 0,74 0,62 -0,84 0,31 0,62






-0,28
0,25 0,74 1 0,53 -0,64 0,14 0,41





R0 = 0,54 R = 0,26 0,62 0,53 1 -0,69 0,16 0,38






-0,58
-0,49 -0,84 -0,64 -0,69 1 -0,13 -0,55






0,04
-0,28 0,31 0,14 0,16 -0,13 1 -0,03






0,59
0,08 0,62 0,41 0,38 -0,55 -0,03 1





















Stosując metodę analizy macierzy współczynników korelacji wybrać do modelu ekonometrycznego optymalną kombinację zmiennych objaśniających.















Przyjąć poziom istotności równy 0,05.














Wielkość próby n równe 30.






























Podać: a) które zmienne zostały wyeliminowane w kroku 1., b) która zmienna została wybrana w kroku 2., c) które zmienne zostały wyeliminowane w kroku 3 oraz d) które zmienne wchodzą do modelu ekonometrycznego.







































ROZWIĄZANIE




























R0T = 0,43 0,53 -0,28 0,54 -0,58 0,04 0,59

poziom istotności 0,05













wielkośc próby (n) 30




1 0,4 0,25 0,26 -0,49 -0,28 0,08

stopnie swobody (n-2) 28




0,4 1 0,74 0,62 -0,84 0,31 0,62








0,25 0,74 1 0,53 -0,64 0,14 0,41




R = 0,26 0,62 0,53 1 -0,69 0,16 0,38
t* 2,04840714179525 z funkcji excela

-0,49 -0,84 -0,64 -0,69 1 -0,13 -0,55
(t*)2 4,19597181855777

-0,28 0,31 0,14 0,16 -0,13 1 -0,03
r*2 0,1303

0,08 0,62 0,41 0,38 -0,55 -0,03 1
r* 0,3610

































1 2 3 4 5 6 7







R0T = 0,43 0,53 0,28 0,54 0,58 0,04 0,59







































1 1 0,4 0,25 0,26 0,49 0,28 0,08







2 0,4 1 0,74 0,62 0,84 0,31 0,62







3 0,25 0,74 1 0,53 0,64 0,14 0,41







R = 0,26 0,62 0,53 1 0,69 0,16 0,38







5 0,49 0,84 0,64 0,69 1 0,13 0,55







6 0,28 0,31 0,14 0,16 0,13 1 0,03







7 0,08 0,62 0,41 0,38 0,55 0,03 1
























































































a) zmienne wyeliminowane w kroku 1




3,6








b)zmienna wybrana




7








c)zmienne wyeliminowane krok 2:




2,4,5








d) zmienne wchodzące do modelu ekonometrycznego




1,7 silnie skorelowane z y a słabo pomiedzy sobą







Sheet 8: wykladM


Przykład do wykładu
























y x x2 xy



b0+b1×xi ei


3 2 4 6



3,5 -0,5 0,2

6 4 16 24



5,0 1,0 1,0

5 6 36 30



6,6 -1,6 2,4

10 8 64 80



8,1 1,9 3,6

9 10 100 90



9,6 -0,6 0,4

11 12 144 132



11,2 -0,2 0,0
å 44 42 364 362



å 0,0 7,7

















Układ równań względem b0 i b1:






















44 = 6 b0 + 42 b1












362 = 42 b0 + 364 b1






















b0 = 1,933333






















b1 = 0,771429







Sheet 9: Momenty

Miesiąc y (przychody ze sprzedaży) x (wydatki na reklamę) x2 xy



b0+b1×xi ei
1 3 1 1 3



2 0,8 0,6
2 4 2 4 8



3 0,6 0,4
3 2 3 9 6



5 -2,6 6,8
4 6 4 16 24



6 0,2 0,0
5 8 5 25 40



7 1,0 1,0
sumy 23 15 55 81



suma 0,0 8,8
















Układ równań względem b0 i b1:




















23 = 5 b0 + 15 b1










81 = 15 b0 + 55 b1



















b0 = 1





n - liczba obserwacji

wyraz wolny










b1 = 1,2 przy x więc x rośnie lub maleje z wależności czy jest minus czy plus







współczynnik kierunkowy






























































Wyszukiwarka

Podobne podstrony:
10. 03.09 urazy kl.piers Chirurgia by shu, Uniwersytet Medyczny Łodz Ratownictwo, ratownictwo r
0 Program szkolenia na SJ (10 03 09)
TI 10 03 10 09 B pl
chemia lato 03 09 10
Wyklad 2 TM 07 03 09
1998 10 03 prawdopodobie stwo i statystykaid 18585
Gnozja 05.03.09 Irydoidy, farmacja
10 02 09
TPL 03 09 Proszki
POM wyklad z 03 09 serwerix
daily technical report 2012 10 03
10 03 2013 Wid 10701 Nieznany
Podstawy turystyki 10.03.12, II semestr, Podstawy turystyki
Podstawy turystyki 10.03.12, II semestr, Podstawy turystyki
Temat 9-10 ISPS 09-2009, Zarządzanie bezpieczną eksploatacją statku -Zdanowicz
NOTATKI WYKLAD2 2013 03 09
0656PWeUT Rysunek 03 09

więcej podobnych podstron