WYKŁAD V (28.03.07)
(wzór 4.9) Standaryzacja wyników - każdy wynik możemy wystandaryzować, czyli sprowadzić do wspólnej jednostki jaką jest wartość odchylenia standardowego. Pozwala porównywać różne wyniki w zbiorach.
Żeby poznać wartość pojedynczej osoby, trzeba do średniej dodać odchylenie i pomnożyć przez z, gdzie „z” to jest umowny wynik standaryzowany (po prostu takie oznaczenie, gdy jednostką jest odchylenie standardowe) czyli x1 = średnia + s x z.
DEFINICJA PRAWDOPODOBIEŃSTWA (Pierre Simon de Laplace)
Mamy zbiór pewnych zdarzeń, np. zbiór omega - to może być zbiór wszystkich ocen rzutów kostką. Ważne jest, że zbiór nie musi być zbiorem liczb, ale zbiorem obiektów. Podzbiór ze zbioru omega, to inaczej podzbiór zdarzeń sprzyjających albo podzbiór sukcesów. Prawdopodobieństwo tego, że ze zbioru omega wylosuje się przypadkiem jedno zdarzenie typu x, oznaczone jest wzorem P(X) = n(X) / n(omega) (wzór jest w e-learningu).
Jakie jest prawdopodobieństwo, że przypadkowy student zda egzamin? Można odwołać się do poprzedniego roku. To jest klasyczna (częstościowa) definicja prawdopodobieństwa.
Prawdopodobieństwo subiektywne to siła przekonania osoby badanej o tym, że wystąpi zdarzenie typu x.
Jakie jest prawdopodobieństwo, że człowiek ulegnie wypadkowi samochodowemu? - odpowiadasz, że 0, bo jesteś świetnym kierowcą. Jednak wyniki pokazują, że prawdopodobieństwo takiego wypadku jest większe. Wystarczy policzyć liczbę samochodów jeżdżących po np. Warszawie oraz ile było wypadków. Prawdopodobieństwo subiektywne jest więc czymś zupełnie innym niż definicja prawdopodobieństwa.
Jakie jest prawdopodobieństwo, że przypadkowe małżeństwo rozwiedzie się w ciągu roku? Inne, gdy podzieli się liczbę rozwodów przez liczbę wszystkich ślubów (prawdopodobieństwo częstościwe) inne, gdy zapyta się świadka na ślubie (prawdopodobieństwo subiektywne).
Aksjomaty rachunku prawdopodobieństwa Kołmogorowa (w e-learningu, nie trzeba umieć).
DEFINICJA ZDARZEŃ NIEZALEŻNYCH
Zdarzenia niezależne - zdarzenia ze zbioru omega mogą być podzielone na różne typy zdarzeń. Jeżeli prawdopodobieństwo wystąpienia zdarzenia typu X jest niezależne od wystąpienia zdarzenia typu Y to mówimy, że zdarzenia X i Y są od siebie niezależne.
Dla zdarzeń niezależnych zachodzi: P(X i Y) = P(X) x P(Y)
Prawdopodobieństwo, że zajdzie równocześnie zdarzenie X i Y, jeżeli zdarzenia te są niezależne równe jest iloczynowi prawdopodobieństwa zdarzenia X i prawdopodobieństwa zdarzenia Y.
Psychologiczny błąd koniunkcji: badanie z Lindą; kim jest Linda? - czy jest kasjerką w banku i działaczką, itp.; mniej prawdopodobne jest, że Linda jest kasjerką w banku i działaczką ruchu feministycznego niż tylko kasjerką. Tak naprawdę wszyscy to badanie znamy :)
Zmienna losowa - mamy z nią do czynienia, gdy wszystkim zdarzeniom ze zbioru omega przypisane są liczby według tej samej zasady. Najważniejsze jest to, że jest jasno określone, jakie zdarzenie jaką ma przypisaną liczbę.
Ze zmiennymi losowymi w eksperymentach psychologicznych mamy do czynienia wtedy, gdy reakcjom osób badanych przypisywane są liczby.
ROZKŁAD ZMIENNEJ DYSKRETNEJ LOSOWEJ
Rozkład dyskretnej zmiennej losowej to zbiór par (wartość zmiennej, prawdopodobieństwo jej uzyskania), czyli zbiór par {(Xi, pi)}
Dyskretna zmienna losowa - nieciągła, zmienna która przyjmuje wartości ze skończonego zbioru, np. odpowiedzi na pytanie: czy podobają ci się wykłady ze statystyki :)
Dla wyników rzutu kostką (zmienna losowa - liczba oczek na górnej ściance).
Dystrybuanta zmiennej losowej (inaczej histogram skumulowany).
Histogram skumulowany to wykres w, którym dla każdej wartości zmiennej losowej na osi OY zaznaczona jest liczba obserwacji mniejszych od tej wartości.
Dystrybuanta zmiennej losowej (definicja uproszczona) to histogram skumulowany w której na osi OY zamiast częstości zaznaczone są prawdopodobieństwa.
ROZKŁAD ZMIENNEJ LOSOWEJ
Empiryczny Teoretyczny
Empiryczny rozkład zmiennej losowej - układ par 'zmienna losowa i prawdopodobieństwo', które zaobserwowaliśmy w doświadczeniu, eksperymencie, badaniu, etc. Rozkład empiryczny - wyniki, jakie uzyskaliśmy w rzeczywistości; rozkład ten nie musi być identyczny z teoretycznym.
Teoretyczny rozkład zmiennej losowej - to rozkład abstrakcyjny, który wynika z częstościowej definicji prawdopodobieństwa, np. każdy wynik LOTTO powinien pojawiać się tak samo często.
Jaki byłby teoretyczny rozkład zmiennej losowej (liczba orłów na monetach, mamy dwie monety). Z jakimi zdarzeniami mamy do czynienia? Orzeł - orzeł, orzeł - reszka, reszka - orzeł, reszka - reszka. W ilu sytuacjach zdarzy mi się, że będę mieć jednego orła w tych 4 kombinacjach? - w dwóch, czyli ½. Jest to rozkład teoretyczny, wynika z częstościowej definicji prawdopodobieństwa. Czyli rozkład teoretyczny wystąpi, kiedy będziemy mieć dwa razy orła i dwa razy reszkę.
Przykład rzucania monetami: gdybyśmy rzucali monetami wiele razy, np. 1000 razy, to jest większa szansa wystąpienia rozkładu, który przewidujemy. Niektóre z tych rozkładów mają swoje nazwy.
Rozkład dwumianowy - mamy do czynienia wtedy, gdy określona jest liczba prób i prawdopodobieństwo pojedynczego sukcesu. Rozkład ten, to rozkład różnych możliwych częstości sukcesu. W przypadku 10 prób, szansa żeby przy jednym rzucie wypadł orzeł jest (prawdopodobieństwo pojedynczego sukcesu) 0,5. Rozkład ten jest bardzo przydatny, możemy policzyć, że np. w grupie ćwiczeniowej w SWPS-ie nie będzie więcej niż 7 kobiet.
Co by było, gdybyśmy w rozkładzie dwumianowym mieli 100 rzutów, a co by było, gdyby tych rzutów było nieskończenie wiele?
Rozkłady ciągłych zmiennych losowych (Zenon z Elei):
czy Achilles dogoni żółwia (żółw startuje pierwszy, a Achilles daje mu fory; błąd - dystans złożony z nieskończonej liczby punktów; czas jest nieskończenie gęsty),
czy strzała może lecieć bez czasu (w jakim czasie strzała przeleci połowę drogi),
czy można trafić z łuku w jeden konkretny punkt na tarczy,
liczby losowe z przedziału 0-1.
Nieskończonością były w matematyce problemy, które zostały rozwiązane. Czas jest nieskończenie gęsty. Z nieskończonością było wiele problemów.
Ciągła losowa zmienna - da się ją dzielić na nieskończenie wiele wartości, czyli dla nieskończenie wielu rzutów.
Iloraz inteligencji - nie jest zmienną ciągłą, ale łatwiej go tak traktować. 100 przy mierzeniu w punktach - oznacza jakiś wynik z pewnego przedziału. Jest to przykład ciągłej zmiennej losowej.
Kiedy zmienna losowa jest dyskretna, a kiedy zmienna losowa jest ciągła, to na wykresie osi OY mamy gęstość prawdopodobieństwa (nic nie znaczącą). Czasami mówi się, że prawdopodobieństwo jest rozmazane.
Najważniejszym dla psychologa ciągłym rozkładem zmiennym losowym jest rozkład normalny, ponieważ wiele zjawisk empirycznych ma rozkład normalny.
Krzywa normalna to inaczej krzywa Gaussa albo dzwonowata (bell curve). Gauss był od dziecka uważany za geniusza. Studiował matematykę, odszedł po 3 latach bez dyplomu, ale uniwersytet chciał go z powrotem. Gauss opracował jak bezbłędnie narysować 17-kąt.
Wzór (5.1) na funkcję gęstości rozkładu normalnego [nie trzeba umieć, trzeba tylko wiedzieć od czego zależą wartości f(X)].
Y = ax + b (a i b - są parametrami równania prostej).
Parametrami jednoznacznie wyznaczającymi kształt rozkładu normalnego są średnia i odchylenie standardowe. Od wartości średniej w rozkładzie normalnym zależy jego położenie względem osi OX.
Od wielkości odchylenia standardowego zależy kształt rozkładu normalnego. Im większe odchylenie standardowe tym bardziej rozkład normalny jest platokurtyczny.
Rozkład normalny standaryzowany - to rozkład o średniej = 0 i odchyleniu standardowym = 1.
Miary skośności i kurtozy są tak opracowane, że dla rozkładu normalnego mają wartość 0. Jeżeli kurtoza jest dodatnia, to wyniki wyskakują powyżej, a jeżeli ujemna, to poniżej.
W rozkładzie normalnym prawdopodobieństwo to jakiś przedział. W rozkładzie normalnym prawdopodobieństwo tego, że wynik będzie należał do przedziału od a do b równe jest polu powierzchni pod krzywą normalną ograniczonemu przez proste prostopadłe przechodzące przez punkty a i b oraz prostopadłe do osi OX.
(!) Ważne: rozkład normalny jest to rozkład symetryczny wg średniej.
4