LEKCJA 2 wzorki-potworki ;)
Tym razem nauczymy się najważniejszych wzorów, z którymi możesz się spotkać :) . Pamiętaj o
repetycji ;) . Oprócz wzorów zaczniemy powtarzać (albo uczyć się od nowa) teorii, która może
pojawiać się wraz z danym wzorem. Wzory są poukładane według częstości występowania na
egzaminie.
Zaczniemy od najprostszego i najważniejszego wzoru.
1. Dystrybuanta :)
Jeśli p.Aranowska poprosi nas o podanie wzoru na dystrybuantę, wystarczy, że napiszemy:
F(x) = P(Xd"x)
Krótkie wytłumaczenie, czym jest dystrybuanta, gdyby pani spytała o definicję:
Dystrybuanta to prawdopodobieństwo (!) tego, że X przyjmie wartość mniejszą lub równą
założonej przez nas wartości (x).
Graficznie można zobrazować dystrybuantę tak:
A teraz przykład z życia ;)
Jeśli napiszemy na kartce dowolny wymyślony wynik IQ (np. 123), wyjdziemy na ulicę i złapiemy
za rękę pierwszą zobaczoną przez nas osobę, to dystrybuanta, to prawdopodobieństwo, z jakim ta
osoba ma wynik IQ mniejszy lub równy temu, który sobie założyliśmy (123). Dystrybuantę wyraża
się w procentach!
Na powyższym wykresie, niebieskie pole (albo szare, jeśli ktoś tak sobie wydrukował ;) ), to
zaznaczony % prawdopodobieństwa. Im dalej przesuniemy naszą szukaną wartość x (kropkę), tym
pole będzie większe. To logiczne jeśli szukalibyśmy kogoś, kto ma IQ równe 200 lub mniej, to
niemalże każdy znalazłby się w kręgu naszych zainteresowań, a więc dystrybuanta byłaby bardzo
duża. Jeśli szukalibyśmy kogoś, kto ma IQ=60 lub mniej, wtedy musielibyśmy się niezle postarać.
Dystrybuanta jest mała, a więc prawdopodobieństwo, że znajdziemy kogoś takiego jest małe :) .
Pod całym wykresem znajduje się 100%. Od minus nieskończoności do naszej kropki mamy jakąś
część pola, którą stanowi dystrybuanta.
Teraz pytanie dlaczego w poprzednim pliku dystrybuanta miała kształt wężyka, a teraz
pojawił się wykres z jakimś zakreskowanym polem?
1 / 10
Odp: Poprzednio uczyliśmy się wykresu, który trzeba zaprezentować, gdy p.Aranowska poprosi nas
o narysowanie wykresu dystrybuanty. Jest to wykres tego, w jaki sposób zmieni się zakreskowane
pole, gdy będziemy przesuwać kropkę w prawo, a wartość dystrybuanty (tego pola) nałożymy na
wykres. W dzisiejszym przykładzie próbujemy zrozumieć, czym dystrybuanta właściwie jest, więc
nasz dzisiejszy wykres jest tylko pomocą naukową. Staramy się go nie ryzować na egzaminie ;)
Jeśli czegoś nie zrozumiałaś/nie zrozumiałeś nie przejmuj się, przeczytaj powoli jeszcze raz, w
razie czego pytaj, spróbuję wyjaśnić łatwiej :) . Najważniejsze, aby znać definicję (podana na
pierwszej stronie, kursywą) i umieć narysować wężyk z poprzedniej lekcji. Jeśli rozumiesz, czym
jest dystrybuanta, to świetnie najlepiej powiedzieć to własnymi słowami, bo wtedy p.Aranowska
wie, że umiesz i nie ciśnie za bardzo tego tematu, a Ty dostajesz dużą kropkę :) .
*** Dla bardzo ambitnych:
Jeśli chcesz, możesz użyć pełnej matematycznej definicji dystrybuanty:
lub prościej:
f(x)dx
Jest to całka oznaczona od minus nieskończoności do x. Pani Aranowska bardzo się ucieszy, jeśli
ktoś użyje słowa całka, ale jest to rozwiązanie dla osób najbardziej ambitnych, gotowych na
zmierzenie się z pytaniami o taki wzór.
2. r-Pearsona
To jedno z ulubionych pytań egzaminacyjnych. Jest ono dla nas o tyle trudniejsze, że na
ćwiczeniach używa się innego wzoru, natomiast podczas egzaminu część osób dowiaduje się o
istnieniu jedynej poprawnej wersji tego wzoru ;) . Poniżej właśnie ta wersja zaakceptowana przez
prowadzącą:
najlepiej napisać od razu to co jest po ostatnim = i pominąć część, gdzie występuje cov. Jest to po
prostu inny wzór na to samo, ale może być trudniejszy do objaśnienia w razie pytań. Jeśli ktoś
chce, może nauczyć się obu wariantów, ale jeśli jest mało czasu, albo boisz się, że Ci się pomyli,
naucz się tylko ostatniego i będzie dobrze :) .
cov oznacza kowariancję, czyli uśrednioną współzależność pomiędzy X i Y.
xy
Pytaniem, które też często pada jest:
- Jakie wartości przyjmuje współczynnik r?
2 / 10
Odp: Od -1 do 1 (łącznie). Pamiętajcie o tym, bo to bardzo ważne. To totalna podstawa. Gdy ktoś
to pomyli, to p.Aranowska się nie złości, tylko śmieje :) . Jeśli ktoś chce jej poprawić humor to
może spróbować tej metody Kamikadze, ale nie polecam ;)
W dalszych częściach szerzej omówimy gdzie i kiedy się stosuje r-Pearsona (i po co ;) ). Na razie
uczymy się wzorów :)
A to wzór z ćwiczeń, którego nie używamy na egzaminie:
n n n
n* xi yi - ( xi )( yi )
" " "
i= 1 i= 1 i= 1
r =
n n n n
ł łł ł łł
n* xi2 - ( xi )2 śł ł n* yi2 - ( yi )2 śł
" " " "
ł
ł i= 1 i= 1 ł ł i= 1 i= 1 ł
3. C-Pearsona
C-Pearsona to drugi z podchwytliwych zestawów pytań. Na szczęście wiedząc o tym, możemy
zawczasu się przygotować :) .
C-Pearsona występuje w dwóch wariantach skorygowanym i nieskorygowanym. Pamiętając o
tym, należy się dopytać o który wzór chodzi. Jeśli nie zostało to uściślone, a nie chcemy się
dopytywać, wtedy piszemy ten, który nam bardziej pasuje :)
Wzór na C-Pearsona (nieskorygowany):
Wzór na C-Pearsona (skorygowany):
Pamiętaj, że C przyjmuje wartości mniejsze lub równe 1
4. Ć Yula (czyt. fi Jula )
Pytanie o ten wzór najczęściej pojawia się wraz z pytaniem o c-Pearsona. Jednocześnie dość
dziwne jest to, że bardzo wiele osób nie przerabiało tego na ćwiczeniach. Nie ważne, czy
miałaś/miałeś ten wzór wcześniej, powtórz go i zapamiętaj dobrze.
3 / 10
!!! Teraz bardzo istotna sprawa.
Pani Aranowska często zadaje pytanie Wymień miary kontyngencji .
Odpowiedz jest bardzo prosta:
- c-Pearsona oraz fi Jula .
Następnie możesz napisać wzory, których właśnie się nauczyliśmy.
5. k-Pearsona
To podchwytliwe pytanie. Każdy to przerabiał na ćwiczeniach, mało osób wie, że to się tak nazywa.
Jest to zwykłe pytanie o wzór na skośność rozkładu napisany dziwnie ;). Przypomnijmy go sobie:
3(X-me)
k =
S
to k to takie k z daszkiem , ale nie znalazłem takiego znaczka. W każdym razie, możemy jeszcze
dodać, że:
- gdy k jest mniejsze od zera rozkład jest lewoskośny
- gdy k jest większe od zera rozkład jest prawoskośny
6. Centralne Twierdzenie Graniczne
To częste pytanie na trójkę :) . Centralne Twierdzenie Graniczne (lub CTG) jest bardzo proste.
Zacznijmy jednak od definicji, którą trzeba zaprezentować:
Jeśli z populacji o dowolnym rozkładzie będziemy pobierać nieskończoną ilość równolicznych prób i
wyciągać średnią z wartości w tych próbach, to te średnie nałożone na wykres ułożą się w rozkład
normalny. Im mniejsza ilość elementów próby, tym rozkład będzie bardziej rozpłaszczony, im
większa, tym bardziej będzie dążył do rozkładu normalnego.
A teraz ta sama definicja na luzie:
Załóżmy, że naszą populacją są rybki:
4 / 10
Teraz zaczniemy wybierać z populacji np. po 4 rybki, mierzyć każdą i uśredniać wartości
(i wypuszczać rybki z powrotem!) :) . Otrzymamy jakieś średnie:
Pierwsza czwórka 20,01cm
Druga czwórka 17,59cm
Trzecia czwórka 20,52cm
&
(ponieważ mamy nieskończenie dużo czasu, a ryb jest również nieskończenie dużo, robimy to do
oporu)
Trzysta siedemdziesiąt dwutysięczna czwórka 18,75cm
Teraz wszystkie te średnie układamy na wykresie i uzyskujemy:
Rozkład normalny!
Cała sztuka polega na tym, że nie ważne, czy rozkład długości ryb w całej ich populacji był
lewoskośny (czyli dużo dużych ryb), czy prawoskośny (dużo małych ryb), platykurtyczny
(rozpłaszczony, czyli dużo ryb każdej długości), czy leptokurtyczny (wszystkie ryby mają zbliżoną
długość do średniej, mało ryb nitypowych). Rozkład średnich, który uzyskamy zawsze będzie
zbliżony do rozkładu normalnego (a przy robieniu pomiarów nieskończenie długo będzie idealnym
rozkładem normalnym). I rzeczywiście tak jest :)
Im mniej rybek będziemy brać do próby (np. 4) tym rozkład średnich będzie bardziej
rozpłaszczony. Im większe próby (10 000 rybek), tym będzie bardziej zbliżony do idealnego
rozkładu normalnego.
Nie znalazłem wzoru, ale to częste pytanie na egzaminie, więc wrzuciłem je już teraz :) .
7. Analiza wariancji (rozkład F-Fishera)
Pod szczęśliwym numerem 7 znajduje się pytanie, które w ciągu jednego dnia może dostać 5 osób,
a drugiego dnia nikt. Nie mniej warto je znać i wiedzieć jak z niego wybrnąć. Pani Aranowska
zadaje to pytanie w różny sposób, dobrze być na to przygotowanym. W 99% przypadków jeśli w
pytaniu padnie słowo: wzór, Fisher, anova, albo jednoczynnikowa analiza wariancji, to chodzi
właśnie o to :) . Czasami pada pytanie o miks tego wszystkiego np. Jakie założenia
jednoczynnikowej analizy wariancji znalazły zastosowanie w konstrukcji licznika wzoru na test F-
Fishera? (to jest pytanie na 5, ale wzór ten sam ;) ).
Zaczynamy od najprostszej postaci wzoru i w razie silnej konieczności będziemy go rozwijać dalej
u kilku osób wystarczył ten wzór i pani widząc, że umiesz stawia kropkę. Czasem (najczęściej na
wyższe oceny) dopytuje dalej.
Najprostsza postać:
2
wariancja międzygrupowa
Sb =
F =
wariancja wewnątrzgrupowa
2
Sw
5 / 10
Zamiast literki S możesz napisać (mała sigma) wyjdzie na to samo, a będzie mądrzej
wyglądać ;)
Pełna postać wzoru:
Nawiasy kwadratowe są nadobowiązkowe. Z nimi wzór ładniej wygląda w tym wypadku nie
spełniają żadnej innej funkcji.
Warto wiedzieć:
Jak zauważyliście i góra (licznik) i dół (mianownik) wzoru składa się z ułamków. Dół każdego z tych
ułamków to wzór na stopnie swobody. Jeśli będziecie poproszeni o podanie wzoru na
międzygrupowe stopnie swobody - piszecie mianownik górnej części wzoru Fishera (k-1).
Wewnątrzgrupowe stopnie swobody - mianownik dolnej części wzoru (n-k). Proste :) .
Analogicznie górna część (licznik) każdej z tych części nazywa się fachowo sumą kwadratów .
Czyli międzygrupowa suma kwadratów to to:
a wewnątrzgrupowa suma kwadratów to to:
6 / 10
W ten sposób jeśli porządnie nauczycie się tego kosmatego wzoru, znajdziecie w nim odpowiedz
na 6 różnych pytań :) .
!!! Bardzo ważne
Jeśli padnie pytanie o estymator łączny, to trzeba wiedzieć, że estymatorem łącznym nazywamy
tę część wzoru:
To ważne i znajomość tego bardzo plusuje :)
*** Dla chętnych:
Jeśli ktoś chce, może użyć też takiego wzoru na F, ale moim zdaniem jest mniej wygodny ;)
Wzór w dokładnie takiej postaci pojawił się na foliach. Wzór w postaci, którą podałem, użyłem
(z powodzeniem) na egzaminie, więc oba są ok :)
8. 2 (Chi-kwadrat)
Pamiętając z poprzedniej lekcji, że nie wolno powiedzieć czi kwadrat (trzeba mówić hi
kwadrat ), przejdzmy do wzoru. Osoby, które miały ćwiczenia z panem Styłą miały użyteczny wzór,
który na egzaminie jest zakazany (pani krzyczy). Osoby, które miały ćwiczenia z p.Zajenkowskim w
ogóle nie miały tego wzoru, więc nie muszą się niczego oduczać ;). Poprawny wzór, który trzeba
napisać na kartce w razie takiej potrzeby, wygląda dokładnie tak:
7 / 10
Jeśli ktoś z Was uczy się z notatek znanych jako statystyka.rar, to bardzo dobrze. To super
notatki :). Ale wkradło się tam kilka elementów, których nie wolno mówić na egzaminie. Pamiętaj,
aby nie powiedzieć tego:
Kilka osób to powiedziało i p.Aranowska byłą szczerze zdziwiona i pytała dlaczego tak, i skąd takie
założenie. Lepiej tego uniknąć :) . Być może taka informacja obowiązywała na ćwiczeniach, ale
postarajcie się nie powiedzieć tego na egzaminie :)
Również wzór, który był na ćwiczeniach u p.Styły jest zupełnie zakazany (chociaż działa całkiem
niezle ;) ).
Nie miejcie w tym miejscu niepozytywnych myśli dotyczących p.Aranowskiej i tego, że jednego
wzoru trzeba się uczyć, a drugiego nie i w ogóle nie wiadomo już o co chodzi, i... ;) . Pomyśl, że
to tylko egzamin i na tę jedną chwilę w życiu możesz się nauczyć wzorów selektywnie :) . A poza
tym to dobrze, że dzięki doświadczeniu innych ludzi wiemy już, które wzory są dobre , a które
nie :) . Dzięki temu nie dowiesz się nagle na egzaminie, że Twój wzór jest zły. Odetchnij :) .
Wszystko jest ok :)
9. Wzór na test t-Studenta
Sporadycznie pada pytanie o ten wzór. Wtedy trzeba pamiętać, że jest jego kilka rodzajów i w
zależności od rodzaju piszemy kompletnie inny wzór ;)
Test t dla jednej średniej
x -
t =
Sx
8 / 10
Dla grup niezależnych
x - x
1 2
t =
s2 s2
+
n1 n2
Dolna część wzoru nazywa się wspólnym błędem standardowym. Można uprościć wzór i zamiast
dołu (pierwiastka i wszystkiego co pod nim) napisać tylko S . Pamiętając, że wzór na S to:
x 2 x 2
1-x 1-x
s2 s2
sx - x2 = +
1
N1 N2
Dla grup zależnych (albo skorelowanych):
Ł d n - 1
t =
2
nŁ d - (Ł d)2
Pamiętaj o tym, co to jest d:
d=X -X
1 2
Jeśli nie pamiętasz wzorów na Sx i X, nie martw się są na końcu, czyli już :)
10. Podstawowe wzory
Teoria następnym razem, tym razem tylko wzory do nauczenia:
Średnia arytmetyczna:
(czyli sumujemy wszystko i dzielimy przez ilość elementów np. sumujemy oceny końcowe w
indeksie, dzielimy przez ilość przedmiotów i otrzymujemy średnią 5.0 ;) )
9 / 10
Wynik wystandaryzowany:
x -
z =
Sx
Błąd standardowy (średniej):
S
Sx =
śr
N
Wariancja:
(x - x)2
"
s2 =
n - 1
Zapisujemy to jako S2 gdybyśmy wyciągnęli pierwiastek z wariancji otrzymujemy odchylenie
standardowe :)
Na tym zakończymy tę lekcję. Do katalogu wgrałem też fragment prezentacji p.Styły gdzie znajduje się
opis skal pomiarowych. Dobrze je sobie przypomnieć, tak na wszelki wypadek.
Oprócz tego kilka słów w temacie folii z wykładów... Jeśli ktoś odczuwa dużą potrzebę, to oczywiście
możecie się z nich uczyć, ale moim zdaniem są napisane zbyt fachowo i tylko Ci się pokręci ;) . Wiele
osób zaliczyło egzamin (nawet na 5) nie zaglądając ani razu do folii.
W następnym pliku zajmiemy się testami (tym kiedy jakiego używamy), założeniami i hipotezami
zerowymi. Część z tych rzeczy będzie ważna, część to tylko doszlifowywanie wiedzy.
Póki co bardzo dobrze naucz się tej lekcji, powtórz poprzednią nie ma tego dużo, a wzory są
spoko :) . Aby dobrze się nauczyć trzeba pozbyć się z głowy głosu, który mówi to bez sensu , albo ale
to głupie . Nie trzeba niczego wymyślać, ani kombinować. Wystarczy zapamiętać i wszystko będzie
dobrze :) . Do tego momentu przerobiliśmy już mniej więcej 80-90% tego, co pada na egzaminie, a do
egzaminu jeszcze sporo czasu :) . Jesteś super dasz radę :D
Pozbądz się niechęci i uczciwie się tego naucz :)
W razie pytań pisz: mikolaj@viva.org.pl (albo na Facebooku). Albo przyjdz i pytaj :)
Pozdr!
Miki :)
10 / 10
Wyszukiwarka
Podobne podstrony:
stata lekcja3 part3stata lekcja3 part2stata lekcja1stata lekcja3 part1www livemocha com angielski lekcja audiojezyk ukrainski lekcja 03Lekcja sortowanielekcja12Kris Jamsa Wygraj Z C lekcja32ściąga kol 1 statalekcja1 (2)Lekcja7więcej podobnych podstron