Wykład z metodologii - 29 maja 2006-05-29
W analizie czynnikowej niezbędne jest podejmowanie różnego rodzaju decyzji. Nie jest ona w stanie określić jakie.
Rotacja jest niezbędna w analizie czynnikowej. Dwie metody rotacji istotne dla nas. VARIMAX (czynniki nieskorelowanych) i OBLIMIN (skorelowanych lub nie). Arbitralne jest, której rotacji użyjemy.
Próg .
Ładunek czynnikowy- korelacja czynnika z czynnikiem. Jesli korelacja jest silna to wchodzi w skład tego czynnika, a jeśli jest słaba to nie wchodzi. Od jakiego progu tak będzie?
To też jest decyzja arbitralna. Typ rotacji i próg są najważniejsze i dużo z nich wynika.
Inteligencja ogólna - przykład.
Czy inteligencja składa się z cech ze sobą skorelowanych czy nieskorelowanych. (okazywało się, że było tak lub inaczej w zależności od metody jaką sięposłużymy).
Dotej pory była eksploracyjna
Konfirmacyjna analiza czynnikowa (CFA)
Jest techniką, która jest całkowicie różna od tej poprzedniej.
Eksploracyjna - eksploruje rzeczyw.- co by było gdyby.
Konfirmacyjna służy do weryfikacji hipotez, z góry istniejących modeli.
W eksploracyjnej osoby wypełniły dany test, a my wnioskujemy czy to się rozkłada na jakieś czynniki
W konfirmacyjnej potrzebny jest model - hipoteza badawcza, która określa:
- ile powinno być czynników
- jakie pytania wchodzą w skład jakiego czynnika, a jakie w skład innego czynnika
- czy czynniki mają być ze sobą skorelowane i które z którymi .
Model się raczej potwierdza lub raczej niepotwierdza.
W eksploracyjnej nie ma hipotez, więc ich nie sprawdzamy.
W analizie konfirmacyjnej używamy poziomu prawdopodobieństwa p (w eksploracyjnej tego nie było).
Jeśli poziom p nie przekracza pewnej wartości (0,05) to hipoteza się potwierdziła. \
W konfirmacyjnej jeśli poziom p<= 0,05 to znaczy, że nasz model istotnie statystycznie odbiega od rzeczywistości empirycznej. Jest to technika literacyjna, czyli wymaga bardzo dużej mocy komputera.
Wielkość efektu
Istotność statystyczna a wielkość efektu
Czy efekt w ogóle istnieje? (jest istotny statystycznie)
Jak duży jest to efekt??
Możliwości:
1.BS i BIS
2. BS i Nie istotny
3. Bsłaby i BIS
4. Bsłaby i Nie istotny
Istotność zależy w dużej mierze od wielkości próby.
4 elementy w statystyce, które są ściśle ze sobą powiązane:
- wielkość efektu.
- Liczba osób badanych
- Moc testu statystycznego - zdolność do wykrycia rzeczywiście istniejącego efektu.
- poziom istotności alfa
Są powiązane. Zmienienie jednej powoduje zmiane innych.
Siła efektu- siła związku jednej zmiennej z drugą, jeśli zmienimy a to zmienia się b . Jeśli się mniej zmienia to jest słabsza siła efektu.
Moc testu stat. Jest tym większa im więcej jest osób jest osób badanych i wyższy poziom alfa (mniej restrykcyjny), i większa jest wilekość efektu.
Jeśli efekt jest silny i dużo osób badanych i 0,05 to jest efekt istotny.
Mała wielkość efektu, ale dużo osób badanych to efekt jest istotny...(bardziej prawdopodobnie).
Jest tak, że im większa jest wielkość tym większa moc testu.
Ale co do poziomu istotności to jest 0,5 .
Moc testu to prawdopodobienstwo wykrycia istniejącego efektu. Inaczej jest to szansa, że nasze p jest mniejsze niż 0,05 wtedy jest istotne. Z tego wynika, że poziom istotności p jest im niższy im więcej osób badanych i im większa wielkość efektu.
Np.
R=0,4 - korelacja; p=0,09, N=10
R=0,4; p<0,000001, N=1000
Efekt w prawdzie jest słaby, lecz bardzo istotny - głupota. Jeśli efekt jest słaby to jest do dupy, nawet jak jest bardzo istotny
Nie wolno ignorować zjawiska wielkości efektu.
Przedział ufności
Jest to przedział taki, że istnieje 95 szans na sto, że zawiera on parametr populacji
X-1,96s<u<x+1,96
Interesuje nas tylko to czy efekt istnieje w populacji. Używamy do tego wszystkie te analizy, by mówić o tym, że efekt istnieje w pop.
Z wielkością efektu jest podobnie. Wszystkich bardzo obchodzi jaki ten efekt jest w populacji. SZACUJEMY to.
Przedział ufności mówi nam jaki ten efekt jest w populacji.
Podajemy np. przedziały, żę jest 95%, że korelacja 0,3-0,9 występuje w populacji.
Chcemy znać właściwości populacji. Parametr w populacji. - oszacowujemy
!!!!!!!Przedziały ufności zawierają info na temat istotności statystycznej!!!!!!!!!!!!!!!
APA zalecił stosowanie jednych i drugich (i p i przedziału ufności).
P<0,05 = zero leży poza przedziałem ufności.
Jeśli przedział ufności zawiera zero to wynik jest nieistotny statystycznie.
WSKAŹNIKI WIELKOŚCI EFEKTU:
Korelacje liniowe:
R-korelacja
R^2-determinacja
R^2*100%- procent wariancji wyjaśnionej
Korelacje nieparametryczne:
-rho Spearmana
-tau Kendalla
(tego się nie podnosi do kwadratu!)
W analizie regresji wielokrotnej
R, R^2, R^2adj (adjusted)*100%
Dla poszczególnych predyktorów
- kwadrat współczynnika korelaci semicząstkowej *100% (ile zmienności ZZ objaśnia dany predyktor)
Dla ANOVY
Wielkość F nie jest wskaźnikiem wielkości efektu.
-Eta ^2
Cząstkowe eta-kwadrat
N2=SSbetween/Sstotal - proporcja wariancji wyjaśnionej
0,4 - 40% wariancji jest wyjaśnione
Wskaźniki wielkości efektu dla cech nominalnych
Współczynnik phi (dla 2*2)
Współczynnik kontyngencji i V Cramera dla innych tabel (niż 2*2)
Algorytm wyboru