STATYSYTKA - NOTATKI Z ĆWICZEŃ
12.03.2010
Średnia.A bierze pod uwagę, jak w polach sa teksty albo tylko spacja i zamienia je na 0 (przez co zmienia się średnia)
A zwykła średnia nie uwzględnia tekstów i liczy tylko z liczb
ROBIENIE SELEKCJI
a) ODRZUCANIE WARTOŚCI SKRAJNYCH:
Wyznacza się zakres rozkładu normalnego danych
- policzyć sigme (odchylenie standardowe)
- 3 sigma
- srednia
- średnia-3sigma
- średnia+3sigma
Jeśli sigma i średnia są podobne, to znaczy, ze dane są bardzo rozrzucone i nie nadają się do obrobki statystycznej
b) ODRZUCANIE NP. WARTOŚCI MNIEJSZYCH NIŻ 10:
- przez funkcję JEŻELI
1) test logiczny: a1>10
2) wartość jeśli prawda: A1
3) nic nie wpisywac
Słowo FAŁSZ jest ignorowane w obróbkach statystycznych (np. przy liczeniu średniej po dokonaniu tej selekcji)
c) ODRZUCANIE NP. MNIEJSZE OD 10 I WIĘKSZE OD 40
Najpierw jak pierwsza selekcja, a potem druga selekcja z tego, co już nam sprawdził (najpierw wybrał większe od 10 i spośród nich szukamy mniejsze od 40)
26.03.2010
Robienie histogramów:
Liczby 0-20 w komórkach A1-C3
Tabelka:
- lata A6
- ilości B6
pod lata:
'0,5
'6-10
'11-15
'16-20
W ilości: funkcja licz.jeżeli, zakres musi byc cały z dolarami, a kryterium >=0. Wyskakuje ta funkcja, za nia piszemy minus i wrzucamy druga funckje, ten sam zakres, ale kryterium >=5. Potem przeciagamy funckje w dol zmieniamy te 0 i 5 na 6 i 10 itp.
Robimy histogram:
zaznaczamy cala tabelke z naglowkiem --> wstawianie --> wykres kolumnowy --> W2 pierwszy
Potem wrzucamy do nowego arkusza ten wykres, robimy w układzie tytuły osi itp., upiększamy histogram
Układ --> obszar kreslenia --> wiecej opcji --> krawedz --> linia ciagla --> czarny kolor
STATISTICA
Wstaw --> dodaj przypadki
Statystyka --> stat podstawowe i tabele --> stat opisowe
Tabela liczności --> kryteria: Wiek
Histogramy ->wyskakuje histogram
W statystykach opisowych mozna w normalnosci zmieniac liczbe przedzialow (tylko nie wiem po co :P)
na histogramie: dolne wartości i można wybrać skalowanie, zakres 0-20
W opcjach słupka można zmienić mu szerokośc i kolor wypelnienia
9.04.2010
Rozkład normalny standaryzowany - w ktorym zamiast wartosci sredniej jest 0, a srednia-sigma lub srednia+sigma tez sa zastapione jakimis wartosciami
u - zmienna losowa normalna standaryzowana
u= x-średnia / sigma
Dystrybuanta - dla dowolnej wartosci u oznacza prawdopodobienstwo przyjecia przez ceche wartosci mniejszej niz u
dystrybuanta rozkładu normalnego ma tylko wartosci dodatkie w tych wszystkich tabelkach
Dla wartosci ujemnych robimy tak, ze jak np. dla 0,61 jest dystrybuanta 0,729, to dla -0,61 bedzie 1-0,729
PRZYKŁAD
jakie jest prawdopodobienstwo ze losowo wybrana osoba bedzie miala temp.
a) mniejsza niz 36,4?
b) wieksza niz 37,5
c) wstrzeli sie w zakres temp. 37,8 i 38,1
srednia = 36,6
sigma = 0,5
a) U= 36,4 - 36,6 / 0,5 = -0,4
Dla tego u dystrybuanta jest 0,3446, czyli takie jest prawdopodobienstwo
b) u=37,5-36,6 / 0,5 = 1,8
dystrybuanta = 0,964
Dystrybuanta pokazuje, ze tyle ludzi ma temp nizsza nic 37,5 !! tak jest wedlug definicji. Czyli zeby poznac odp. odejmujemy to od jednego i wychodzi 0,036
c) u=38,1-36,6 / 0,5 = 3,2
dystrybuanta = 0,9993129
u= 37,8-36,6 / 0,5 = 2,4
dystrybuanta = 0,991802
Nie wiem dlaczego, ale teraz liczymy z ta dystrybuanta, a nie dla -2,4....
0,9993129-0,991802 = 0,006848 i to jest nasze prawdpopodobienstwo
TEST T-STUDENTA
W Excelu wypisujemy cisnienie przed i po podaniu leku, liczymy roznice, potem srednia i odchylenie standardowe z tych roznic
Dla testu T-studenta potrzeba obliczyc wspolczynnik t:
t = srednia x pierwiastek (n-1/sigma kwadrat)
n - liczba pomiarow
n-1 - ilosc stopni swobody
Wariancja nie zawsze jest sigma kwadrat! Ale dla uproszczenia my sobie spierwiastkujemy ta sigme i wychodzi wzor:
t= srednia/sigma x pierwiastek (n-1)
A u nas n-1=9, wiec pierwiastek jest 3 i bedzie sie latwo liczylo
Moduł t czyli :
|t| < t krytyczne <-- jest to przypadkowa zmiana
|t| > t krytyczne <-- jest tutaj istotnosc
Poziom istotnosci alfa =0,05 i dla ilosci stopni swobody = 9 to mamy z tabelki t krytyczne = 2,262
Dla roznych poziomow alfa mozemy sprawdzac czy t wyliczone jest wieksze, czy mniejsze od t krytycznego
Musimy wybrac poziom isotnosci 0,02, bo juz dla 0,01 wychodzi nam t krytyczne wieksze od |t| i wtedy jest to przypadkowa zmiana. Czyli to znaczy ze na 98% populacji dziala, ale juz na 99% nie
Dlatego najlepiej zawsze wybierac lek o jak najmniejszym p (to jest poziom istotnosci)!
16.04.2010
n czasami jest od razu liczba stopni swobody,
dla okreslonego poziomu istotnosci sprawdzamy, w jakiej zaleznosci nasz modul t jest do modulu t krytycznego. Musi byc on wiekszy od wartosci krytycznej, zeby oznaczalo, ze dziala.
Jesli w statistice nie chca sie robic jakies statystyki i tabele, to trzeba sprawdzic, czy moze nie wstawilo sie zamiast cyfr komorek jako tekstu,bo wtedy nie zadziala!
Robimy to wszystko, co tydzien temu, tylko w Statistice
Wstawiamy liczby z A i B z Excela
Statystyka -> satystyki podst i tabele --> test t dla grup zaleznych
Zmienne: pierwsza - przed ; druga - po
Więcej: ustawiamy poziom istotnosci, ale tego nie robimy, bo nie potrzeba
Robimy podsumowanie, wychodzi jakas tabelka z czerwonymi liczbami
df - ilosc stopni swobody
EXCEL - nieparametryczne analizy statystyczne
Metoda srednich nieskorelowanych!
Liczymy srednie i wariancje dla 2 kolumn, a F=wariancja 1/wariancja 2
(sigma)kwadrat = (srednia kwadrat) - (srednia)kwadrat
Uzywa sie nieobciazone estymatory wariancji: wariancja przemnozona przez stosunek ilsoci pomiarow przez ilosc stopni swobody
Przy liczeniu tego u gory, komputer by dal wyniki: 0,000818 oraz 0,000656.
Pierwsze mnozymy razy 8/8-1 i daje nam to 0,000935
Drugie mnozymy razy 6/6-1 i daje nam to 0,000787
teraz liczymy t nieskorelowane (czy cos takiego): wzor do tego jest na kartce
s - nieobciazony estymator wariancji.
Do tego wzoru z kartki jak bysmy wstawili srednie obliczone w Excelu, to nam wychodzi t= -2,506 (t krytyczne!)
Suma stopni swobody: (8-1) + (6-1)= 12
Okazuje sie, ze wymiary sa niezalezne (bo w tabelce rozkkladu studenta nic nie znajdziemy przy n=12). Wiec wyliczamy F (juz jest w Excelu).
W F zawsze w liczniku jest wieksza wariancja!!
I teraz sprawdzamy rozklad F Sendecora: porownujemy F z Fkrytycznym:
W V1 szukamy liczbe swobody dla wariancji wiekszej (nie tam, gdzie jest wiecej pomiarow!). U nas dla peirwszej wariancji jest 7 stopni swobody, wiec w V1 znajdujemy 7.
V2 to ilosc stopni swobody dla wartosci mniejszej - u nas 5.
Na skrzyzowaniu wychodzi w tabelce 4,88
Dalej mozemy dzialac, jesli nasza wyliczona F jest mniejsza od Fkrytycznej (znalezionej w tabelce sendecora). Taki stan nazywamy rownoscia wariancji.
teraz dopiero siegamy po tabele t-studenta i szukamy doa sumy stopnii swobody (12) i dla 0,05 (bo dla takich jest tablica Sendecora) i nam wychodzi 2,179.
Jezeli modul naszego t jest wiekszy od t krytycznego (-2,506), to znaczy, ze jest roznica
To znaczy, ze dla ponad 95% ludzi bedize w innym czasie reagowal na dzwiek niz na swiatlo.
takie wyliczenia jak teraz robimy, to mozemy robic dla np. dobrego leku i placebo
W STATISTICE:
Statystyka --> statystyki podstawowe i tabele --> test t dla prob niezaleznych wzgl zmn.