Specyfika podejścia naukowego
Nauka – autonomiczna część kultury służąca wyjaśnieniu funkcjonowania świata, w którym żyje człowiek.
Jest budowana i rozwijana wyłącznie za pomocą tzw. Metody Naukowej lub metod naukowych poprzez działalność badawczą prowadzącą do publikowania wyników naukowych dociekań.
Proces publikowania i wielokrotne powtarzanie badań w celu weryfikacji ich wyników, prowadzi do powstania wiedzy naukowej dostępnej dla całej ludzkości.
Zarówno ta wiedza jak i sposoby jej gromadzenia określane są razem jako nauka.
Podział nauki:
Psychologia jako nauka:
Psychologia - pozwala na poznanie ludzkich zachowań, wiedzy na temat otaczającego nas świata i jego wpływu na zachowanie się i funkcjonowanie jednostki ludzkiej.
Badania naukowe:
Recenzenci – elita decydująca o sposobie uprawiania badań naukowych w najważniejszych czasopismach.
Cel pracy naukowej – publikowanie artykułów w prasie fachowej
Tematy badawcze
a) Tematy zlecone
b)Tematy odkrywcze
Sposób realizacji badań
a) „Dobre” pytania
b) Uwzględnienie pomyłki
c) Badania powtórzone
d) Znane autorstwo
Międzynarodowa wymiana informacji naukowej
Publikacje naukowe
a) Podręczniki
b) Monografie - praca naukowa omawiająca jakieś zagadnienie w sposób wyczerpujący
c) Artykuły w czasopismach:
- Artykuły przeglądowe – zwierają wyczerpujący przegląd prac dotyczących określonego zagadnienia
- Doniesienia z badań – krótki przegląd wybranych prac, zarysowujący tylko kontekst prac przeprowadzonych przez autora
d) Odbitki („Reprinty”) - powtórne wydanie z możliwie wiernym zachowaniem cech oryginału
e) Maszynopisy („Preprinty”) – nieformalny środek wymiany informacji naukowej
Literatura cytowana
Indeks cytowań (SCI – Scientific Citation Index) - forma bibliografii, polegająca na zbieraniu informacji zarówno na temat artykułów cytujących, jak i powiązanych z nimi artykułów cytowanych, sposób oceniania wartości danej pracy naukowej.
Procent odrzuceń
Artykuły są publikowane w czasopismach psychologicznych oraz w bazach bezpłatnego dostępu w formie katalogów i wyszukiwarek.
Metodologia - nauka o metodach badań naukowych, o skutecznych sposobach dociekania ich wartości poznawczej - zajmuje się zagadnieniami teoriopoznawczymi związanymi z rozwojem danej nauki. Różnice pod względem metodologicznym pomiędzy naukami polegają na innych celach w systematyzacji wykrywanych zależności.
Dzieli się na:
Metodologię ogólną – traktującą o prawidłowościach rządzących procesem poznawczym, wspólnych dla wszystkich nauk (np. klasyfikowanie, definiowanie, wnioskowanie, wyjaśnianie itp.)
Metodologię szczegółową – dotyczącą danej dyscypliny i zajmującą się charakterystycznymi dla niej procedurami poznawczymi (np. planowanie eksperymentów w psychologii czy budowa testów psychologicznych)
Jako metodologia na ćwiczeniach:
metodologia szczegółowa – dotyczy jednej dyscypliny
metodologia normatywna – kształtuje świadomość metodologiczną kandydatów na badaczy, wskazuje wzorcowe rozwiązania warsztatowe, pomagające uniknąć błędów
metodologia badań empirycznych – psychologia jest nauką empiryczną
Cele nauczania metodologii:
Zrozumienie naukowych tekstów, umiejętność ich interpretacji oraz formułowanie opinii na temat wartości poznawczej wyników
Umiejętność:
samodzielnego projektowania badań empirycznych
samodzielnego przeprowadzenia badań empirycznych
samodzielnego zinterpretowania i uogólnienia uzyskanych wyników
Pięć etapów postępowania badawczego w naukach empirycznych (wg M. Bunge’a):
Etap 1: Ujęcie problemu
dokonanie przeglądu faktów (literatura z punktu widzenia problemu badawczego)
rozpoznanie problemu (ocena sytuacji i występujących w danej dziedzinie wiedzy nieadekwatności, luk, niekonsekwencji)
postawienie problemu (sformułowanie pytania)
Etap 2: Zbudowanie modelu teoretycznego
dokonanie selekcji ważnych czynników (wysunięcie założeń o zmiennych potencjalnie istotnych)
wysunięcie centralnych hipotez i pomocniczych założeń (próba sformułowania twierdzeń, które mają wyjaśnić zaobserwowane fakty)
dokonanie przekładu na język matematyki (wyrażenie hipotez w języku matematyki)
Etap 3: Wyprowadzenie szczegółowych konsekwencji
wyszukanie racjonalnych ujęć (uporządkowanie wyników, jakie mogą być zweryfikowane)
wyszukanie podstaw empirycznych (postawienie prognoz – na podstawie modelu i danych empirycznych – z uwzględnieniem dostępnych badaczowi technik ich weryfikacji)
Etap 4: Sprawdzenie hipotez
zaplanowanie sprawdzenia (zaplanowanie różnego typu działań np. obserwacja, pomiary, eksperymenty itp..)
wykonanie sprawdzania (przeprowadzenie odpowiednich działań i zebranie danych)
usystematyzowanie danych (ich klasyfikacja, analiza i ocena ich wartości, wyeliminowanie z pola rozważań danych zbędnych)
wyprowadzenie wniosków (interpretacja danych w terminach przyjętego modelu teoretycznego)
Etap 5: Wprowadzenie do teorii wniosków z badań empirycznych
dokonanie porównania wniosków z prognozami (w jakim stopniu wyniki potwierdzają/obalają model teoretyczny)
zmodyfikowanie modelu (wprowadzenie do modelu zmian lub zastąpienie go innym)
przedstawienie sugestii dla dalszej pracy (wyszukiwanie luk i błędów w całym toku postępowania badawczego, gdy model został obalony, lub poszukiwania możliwości rozszerzenia modelu – jeśli potwierdzony)
Problem badawczy i hipoteza badawcza
Jak organizować to co się wie?
a) Czytać najnowsze opracowania
b) Poradzić się fachowca
c) Robić notatki
d) Analizować słowa tekstu
e) Oceniać to co czytane
f) Zapamiętywać ważne nazwiska
Publikacja – raport z badań:
1) Jasny i przejrzysty układ graficzny
2) Wszystkie części struktury
Wstęp
Problem badawczy oraz hipotezy
Metoda
Osoby badane
Materiały
Procedura
Wyniki – analiza wyników
Dyskusja wyników
Zakończenie
Literatura cytowana
Wyróżnienie najważniejszych części poprzez nagłówki, akapity, podkreślenia
Jednolita numeracja
Część główna zawierająca ważne fakty bez zbędnych informacji
Jasne i logiczne wnioskowanie
Cytowanie – podanie źródeł
Schludne i czytelne schematy, wykresy
Problem badawczy - nie wszystkie pomysły dają się zrealizować, niektórych nie warto. Lepiej porzucić pytania stawiane na początku, gdy w trakcie poszukiwania odpowiedzi natrafimy na zagadnienia dużo ciekawsze. Służy opisaniu zakresu badań, tj. określeniu ich przedmiotu, celu i metod (Co badać? Po co badać? Jak badać?) Problem badawczy formułujemy poprzez pytanie badawcze – musi wyglądać jak konkretne zadanie do rozwiązania. Dobre pytanie nie tylko doprecyzowuje, o co chodzi badaczowi, ale wskazuje również na to, w jakiej formie pytający oczekuje odpowiedzi.
a) Pytanie rozstrzygające (Np. Czy występują różnice w pamięci cen sprzed dwóch lat między krajem, gdzie wprowadzono nową walutę, a krajem, w którym nie została ona wprowadzona?)
b) Pytanie dopełnienia (Np. Jakie występują różnice w pamięci cen sprzed dwóch lat między krajem, gdzie wprowadzono nową walutę, a krajem, w którym nie została ona wprowadzona?)
Rodzaje wyjaśniania:
1)Indukcja – wyjaśnienie przyczyn poprzez odwołanie się do ogólnej prawidłowości
2)Dedukcja – poszukiwanie określonych skutków, jeśli istnieją już przyczyny
Hipoteza badawcza - to zdanie twierdzące, dotyczące przewidywanego wyniku eksperymentu, skonstruowanego w celu uzyskania odpowiedzi na pytanie badawcze. Określa relację między badanymi zmiennymi i jest najbardziej prawdopodobną odpowiedzią na problem badawczy (Np. Osoby z kraju, gdzie wprowadzono nową walutę bardziej zaniżają ceny sprzed dwóch lat niż osoby z kraju, w którym nie zmieniono waluty).
Nie może być zbyt ogólna, nie może być zbyt szczegółowa.
Powinna być weryfikowalna i powinna ją cechować prostota.
Sposoby dobierania próby oraz rodzaje zmiennych
Próba reprezentatywna – charakteryzująca się rozkładem danej cechy nieistotnie różniącym się od rozkładu populacji
Zasady doboru losowego próby
Zadaniem badań empirycznych jest zdobycie liczbowego wyrażenia ujmującego łącznie informację o właściwościach wszystkich elementów populacji, czyli zdobycie parametru charakteryzującego daną populację. Trudno uzyskać dokładną wartość jakiegoś parametru przez obserwację danego elementu. Musimy zadowolić się wyciągiem wniosków z danych które są oparte na próbie.
Co musi zrobić badacz, aby uzyskać wartości charakteryzujące populację?
1. Pobrać próbę.
2. Przeprowadzić obserwację.
3. Obliczyć wyniki oparte na danych z próby (statystyki).
Schemat próby - dwa zadania które powinno traktować się łącznie: dobór próby i proces szacowania.
Sposoby dobierania próby:
a) dobór celowy - badacz sam wybiera osoby badane, lub odwołuje się do opinii eksperta – choroby psychiczne, rzadkie przypadki
b) dobór na podstawie zgłoszonych ochotników – wolontariusze
c) dobór losowy z populacji
Losowość próby – umożliwia wnioskowanie o populacji oparte na gruncie probabilistycznym – możemy ocenić dokładność wnioskowania.
Populacja – podział:
Skończone (dzieci, studenci, mieszkańcy)
Nieskończone (nieskończona ilość powtórzeń)
Schematy losowania:
Niezależne vs zależne (bez zwracania)
Indywidualne vs zespołowe (np. mieszkańcy budynku, uczniowie w klasie)
Jednostopniowe vs wielostopniowe (przynajmniej dwa losowania)
Nieograniczone (z całej populacji) vs ograniczone (losujemy z poszczególnych części populacji)
Odmiany schematów losowych:
Losowanie nieograniczone indywidualne (bez powtórzeń, za pomocą tablic liczb losowych)
Losowanie systematyczne indywidualne (3+10, 3+15, 3+20…)
Losowanie warstwowe (podział populacji na warstwy i losowanie niezależne określonej liczby osób z każdej warstwy)
- Wariant proporcjonalny
- Wariant optymalny
Losowanie grupowe (np. klasa)
Losowanie wielostopniowe (warstwujemy populację -> losujemy grupy -> z każdej grupy losujemy daną liczbę elementów)
Cecha może być:
1) Stała
2)Zmienna (przyjmująca min. 2 wartości np. płeć, nastrój, kierunek studiów)
Zmienna - właściwość obiektu przyjmująca różne wartości (przynajmniej dwie)
Rodzaje zmiennych:
Zmienne dwuwartościowe – dychotomiczne np. płeć
Zmienne wielowartościowe – politomiczne np. stres, ekstrawersja
Zmienne trójwartościowe – trychotomiczne np. system odpowiedzi kwestionariuszowych: tak, nie, nie wiem.
Zmienne zdychotomizowane – podział wieku na do 50 lat i od 51 lat.
Rodzaje zmiennych
Zmienne ciągłe – zbiór wartości tworzy kontinuum, czyli między 2 sąsiednimi zmiennymi zawsze można znaleźć trzecią np. wzrost
Zmienne dyskretne – jeśli między dwoma sąsiednimi zmiennymi nie występuje trzecia zmienna.
Np. płeć, wykształcenie, ilość rodzeństwa
Rodzaje zmiennych
Zmienna ilościowa – przyjmuje wartości liczbowe np. liczba obejrzanych filmów, czas reakcji (m.in. zmienne ciągłe)
Zmienna jakościowa (kategorialne) – przyjmują wartości nominalne np. płeć, rodzaj filmu (dramat, komedia itp.) (m.in. zmienne dychotomiczne)
Rodzaje zmiennych z punktu metodologicznego:
Zmienna zależna – przedmiot badania, której związki z innymi zmiennymi chcemy określić (wyjaśnić) - Y
Zmienna niezależna – które oddziałuje na zmienną zależna – X
Skale pomiarowe i operacjonalizacja oraz określanie zmiennych zależnych i niezależnych
Rodzaje skal:
1) Nominalna – skala nazwy (płeć, kolory włosów, typy osobowości wg Eysenka, zdolności muzyczne)
2) Porządkowa - skala rangi, kolejność – charakteryzuje ją spójność i przechodniość oraz rangowanie (poziom agresji, stopnie w szkole, wynik matury, wykształcenie)
3) Przedziałowa (interwałowa) – skala odległości – posiada jednostkę długości TemperaturaIloraz inteligencji Skala Leitera Wzrost dziecka
4) Stosunkowa (ilorazowa) – skala krotności – ma zero absolutne, czyli nie istnieje ujemy wynik = istnieje wynik minimalny
Prędkość samochodu
Operacjonalizacja - procedura znajdowania empirycznych odpowiedników dla terminów teoretycznych, czynność konieczna do analizy wyników i przeniesienia ich na grunt praktyki.
Plany eksperymentalne
Tworzenie planu eksperymentalnego opiera się na odpowiedzi na trzy pytania:
Co chcę wiedzieć?
Z jaką dokładnością chcę wiedzieć?
O jakiej grupie chcę to wiedzieć?
Plany eksperymentalne:
a) Międzygrupowe – najczęściej spotykany
Porównujemy dwie grupy badawcze
Podział na dwie grupy porównawcze: Grupa eksperymentalna vs Grupa kontrolna, którą się nie manipuluje
Warunki:
- Randomizacja - losowe przydzielenie osób do grup badanych
- Identyczność procedury w obu grupach
Niebezpieczeństwo błędu próbki – czy rozkład cech jest identyczny w 2 grupach.
b)Wewnątrzgrupowe – badanie przeprowadza się dwukrotnie na tych samych osobach - powtarzane pomiary zmiennej zależnej w jednej grupie badanej
Zalety:
- Te same osoby w wyniku manipulacji eksperymentalnej zachowują się inaczej
- Redukcja czynników zakłócających wynikających z cech osób badanych
- Mniejsza liczba potrzebnych osób badanych
Wady:
- „Błąd zakotwiczenia”
- Łatwo domyślić się intencji eksperymentatora
- Świadome modyfikowanie zachowania przez osobę badaną
c) Międzygrupowe z pretestem
d) Międzygrupowe bez pretestu
Pretest – pozwala na precyzyjną ocenę wielkości zmiany wartości zmiennej zależnej pod wpływem zmiennej niezależnej.
Plan eksperymentalny Solomona – model czynnikowy -> mamy dwie zmienne niezależne
Główna
Dodana: (z pretestem i bez pretestu)
|
|
---|---|
Zmienna niezależna | |
Pomiar emocji | Z pretestem |
Bez pretestu |
Eksperyment dwuczynnikowy – manipulujemy dwiema zmiennymi niezależnymi
Eksperyment dwuczynnikowy z wieloma grupami badanych i wieloma poziomami - więcej osób (każda grupa w innej sytuacji) lub powtarzane pomiary (jedna grupa w 3 sytuacjach)
Korelacja, histogram, miary położenia, wariancja
Korelacja – wzajemny związek, pojęcie matematyczne, oznaczające wzajemne powiązanie, współzależność jakichś zjawisk lub obiektów.
Dla zastosowań ważny jest fakt, że w przypadku zmiennych X i Y o rozkładzie normalnym, współczynnik korelacji obu zmiennych jest miarą ich zależności i jest równy zeru wtedy i tylko wtedy, gdy obie zmienne są niezależne.
Związek między dwiema zmiennymi zależnymi ma charakter LINIOWY
Siłę współzależności dwóch zmiennych można wyrazić liczbowo za pomocą wielu mierników.
Najbardziej popularny jest współczynnik korelacji liniowej Pearsona, oznaczony symbolem rXY i przyjmujący wartości z przedziału [-1, 1].
Korelacje przedstawia się na wykresach rozrzutu:
Przy silnie skorelowanych zmiennych odnosimy wrażenie, jakby te punkty równocześnie się poruszały.
Korelacja dodatnia występuje wtedy, gdy wzrostowi wartości jednej zmiennej odpowiada wzrost średnich wartości drugiej zmiennej
Korelacja ujemna występuje wtedy, gdy wzrostowi wartości jednej zmiennej odpowiada spadek średnich wartości drugiej zmiennej
Gdy korelacja staje się coraz słabsza, wówczas punkty zaczynają się rozpraszać i przesuwać, tworząc w pewnym momencie bezkształtną chmurę punktów (brak korelacji).
Inne opcje: korelacja krzywoliniowa
Histogram - to zestawienie danych statystycznych w postaci wykresu powierzchniowego złożonego z przylegających do siebie słupków (prostokątów), których wysokość ilustruje liczebność/częstość występowania badanej cechy w populacji lub jej próbie.
Modalna – moda – dominanta
a) Dla zmiennych o rozkładzie dyskretnym - wartość najczęstsza lub najbardziej prawdopodobna.
b) Dla zmiennych o rozkładzie ciągłym - wartość dla której funkcja gęstości ma wartość największą.
Mediana
Wartość środkowa – powyżej i poniżej tej wartości znajduje się jednakowa liczba obserwacji.
Obserwacja między numerem (n/2) i numerem (n/2 + 1), gdzie n-parzysta
Obserwacja numeru (n+1)/2, gdzie n-nieparzysta
Zmienne porządkowe, przedziałowe i ilorazowe
Przykład:
A) 1, 2, 5, 7, 9 wynik to: 5
B) 3, 7, 15, 26, 51 to: 15
C) 6, 25, 30, 35, 45, 64 to: 32,5
D) 1, 5, 6, 6, 6, 7, 10 to: 6
E) 0, 0, 0, 7, 9, 25, 126 to: 7
Średnia arytmetyczna - wartość średnia pochodzi z sumowania poszczególnych wyników i podzielenie tej sumy przez liczbę naszych obserwacji. Daje nam obraz tego, na ile przeciętnie dana rzecz (zjawisko, czynność, itd.) występowała.
Xi = wartość mierzonej właściwości
n – liczność próbki
Przykład: Zapytano pięć osób, ile razy ciągu ostatniego tygodnia poszukiwali potrzebnych im informacji w Internecie. Uzyskano następujące odpowiedzi:
1, 4, 3, 0 i 2 razy w ciągu ostatniego tygodnia.
i tak:
(1 + 4 + 3 + 0 + 2) / 5 = 2
Wiemy zatem, iż w naszej grupie osób w ostatnim tygodniu potrzebnych informacji wyszukiwano średnio 2 razy.
Wariancja, odchylenie standardowe, rozstęp, rozkład normalny
Wariancja - jest podstawową miarą zmienności obserwowanych wyników. Informuje o tym, jak duże jest zróżnicowanie wyników w danym zbiorze wyników (zmiennej) - inaczej mówiąc, czy wyniki są bardziej skoncentrowane wokół średniej, czy są małe różnice pomiędzy średnią a poszczególnymi wynikami, czy może rozproszenie wyników jest duże, duża jest różnica poszczególnych wyników od średniej.
Przyjmuje wartości od 0 do plus nieskończoności (nie istnieje ujemna wariancja, ponieważ nie może być minusowego zróżnicowania, albo ono jest, albo go nie ma, czyli wszystkie wyniki są takie same).
Jeżeli wariancja równa jest 0, oznacza to, że nasze wyniki są identyczne, np. każdy uczeń dostał 5 z egzaminu.
Często badacze posługują się terminem wariancja do określenia niemocy analitycznej: "Nie ma wariancji" w wynikach, oznacza, że nie ma żadnej różnicy pomiędzy zebranymi wynikami, a to oznacza, że statystyk nie ma praktycznie nic do analizowania.
Przykład: Lekarz zbadał tętno dwóch grup osób: chorujących na chorobę A i chorujących na chorobę B. Uzyskał następujące wyniki:
Choroba A: 60, 60, 60, 60, 70, 70, 70, 80, 80, 80, 80
Choroba B: 50, 50, 50, 50, 70, 70, 70, 90, 90, 90, 90.
1. Ile wynosi średnie tętno osób w grupie A i B?
2. Jaka jest wariancja w grupie A i B?
3. Co z tego wynika?
Odchylenie standardowe - jest podstawową miarą zmienności obserwowanych wyników.
Informuje o tym, na ile wyniki się "zmieniają", tzn. czy rozrzut wyników wokół średniej jest niewielki czy wielki.
Jest obliczane się ze wszystkich wyników. Im zbiorowość jest bardziej zróżnicowana, tym odchylenie standardowe jest większe.
Rozstęp - jest najprostszą miarą rozproszenia (zmienności).
Jest niczym innym jak różnicą między wartością maksymalną a minimalną z naszego zbioru obserwacji. Pokazuje zatem jedynie jaki jest zakres naszych obserwacji - nie informuje w żaden sposób co dzieje się "w środku" tego zakresu np. jaka wartość występowała najczęściej, czy jaka jest średnia dla tego zbioru obserwacji.
Przykład: Dwie grupy osób poproszono o ocenę na dziesięciostopniowej skali. W jednej grupie najniższy wynik wynosił 3, najwyższy 9. W drugiej grupie natomiast wynik najniższy to 1 a najwyższy 9. Tak więc:
R1 = X1 max - X1 min = 9 - 3 = 6
R2 = X2 max - X2 min = 9 - 1 = 8
Gdzie:
R: Rozstęp
X max: najwyższa wartość w zbiorze obserwacji
X min: najniższa wartość w zbiorze obserwacji
Widzimy zatem, że w grupie 2 zakres odpowiedzi był większy niż w grupie 1. Oznacza to, że w grupie 2 udzielano bardziej skrajnych odpowiedzi niż w grupie 1.
Średnia ważona - podaje nam jedną liczbę (średnią) z uwzględnieniem ważności czy też liczebności każdej z uśrednianych wartości.
Oblicza się ją dzieląc sumę iloczynów średniej i liczebności z jakiej ta średnia pochodzi przez sumę liczebności bądź wag (ważności) wszystkich uśrednianych grup.
Przykład: Uczeń ma takie oto oceny: 4, 2, 4, 5, 3, 5
- prace klasowe: 4, 2,
- kartkówki: 4, 3,
- praca domowa: 5, 5
Średnia arytmetyczna tych ocen w przybliżeniu wynosi 3,83, ale uczeń domaga się czwórki. Nauczyciel jednak wprowadził wagi dla ocen i tak za prace klasowe waga wynosi 5, dla kartkówek waga wynosi 3, a dla prac domowych waga wynosi 1.
Podstawiając teraz dane do wzoru na średnią ważoną otrzymujemy:
5·4+5·2+3·4+3·3+1·5+1·5 / (5+5+3+3+1+1) ≈ 3,39
W tej sytuacji oceną końcową jest 3.
Rozkład normalny, zwany też rozkładem Gaussa lub krzywą dzwonową jest jednym z najważniejszych rozkładów prawdopodobieństwa.
Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych itp.
Przykłady: inteligencja, wzrost, natężenie źródła światła
Jeżeli na n osób m jest liczbą kobiet, to możemy powiedzieć, że prawdopodobieństwo że x jest kobietą, co zapiszemy P(x=kobieta) wynosi m/n; 0<=P<=1
W statystyce istnieje wiele rozkładów teoretycznych. Najczęściej występującym jest rozkład normalny.
Zmienna losowa ma rozkład normalny o parametrach µ, σ, co piszemy N(µ, σ).
Parametr µ wyznacza środek symetrii wykresu, a parametr σ decyduje o jego wysokości
Reguła trzech sigm:
Wykres funkcji gęstości rozkładu normalnego dla µ=0 i σ=1
Jeżeli zmienna losowa X ma rozkład normalny N(µ,σ) to:
P(µ - σ<x< µ + σ) =0, 6827 - 68,27 % wyników jest w przedziale (µ -σ, µ + σ)
P(µ -2σ<x< µ +2σ) =0, 9545 - 95,45 % wyników jest w przedziale (µ -2σ, µ +2σ)
P(µ - 3σ<x< µ + 3σ) =0, 9973 - 99,73 % wyników jest w przedziale (µ -3σ, µ + 3σ)
Rozkład normalny:
Jest on określony przez dwa parametry: wartość średnią (oczekiwaną) m i odchylenie standardowe s.
Zapisuje sie go w postaci N(m; s)
Z rozkładem Normalnym związana jest reguła 3 s (sigm) mówiąca, że w przedziałach:
X +/- 3 s mieści się 99,73% obserwacji,
X +/- 2 s mieści się 95,45% obserwacji,
X +/- 1 s mieści się 68,27% obserwacji.
Regresja, skala „z”, szeregi statystyczne
Regresja - wyrażenie zależności wartości jednej zmiennej od drugiej w postaci pewnej prostej funkcji.
Pierwsze wyniki: Sir Francis Galton Regression towards Mediocrity in Hereditary Stature (Regresja w badaniach nad dziedziczeniem niskiego wzrostu), 1885 r.
Teoria została później rozwinięta przez Karla Pearsona.
Współczynnik korelacji liniowej Pearsona – współczynnik określający poziom zależności liniowej między zmiennymi losowymi.
Regresja liniowa
Na wykresach rozrzutu obserwujemy, że „chmura” punktów (xi, yi) układa się wzdłuż prostej, możemy spróbować wyznaczyć jej równanie.
Oceniamy, czy istnieje zależność między zmiennymi, czyli czy te punkty układają się wzdłuż jakiejś prostej.
Model regresji dla próbki:
Naszym celem jest wyznaczyć współczynniki b1 i b0 w układzie równości:
yi = b1xi + b0 + ei, i = 1, . . .N,
tak, aby suma wartości bezwzględnych błędów ei była jak najmniejsza.
Regresja i korelacja
Współczynnik korelacji jest miarą dobroci dopasowania prostej regresji do danych. Im bliższy 1, tym dopasowanie lepsze.
Interpretacja r2 (tzw. współczynnik determinacji): jest to część zmienności zmiennej y, która daje się wyjaśnić regresją, czyli liniową zależnością zmiennej y od zmiennej x.
Zależność słaba, zależność silna - korelacja
Źródła wariancji y (zmienności) - wariancja kontrolowana + wariancja błędu (źródłem są zmienne zakłócające w obiekcie badania, np. narzędzie / warunki).
r - współczynnik korelacji <-1,1>; miernik siły związku zmiennych ciągłych; stosowany, gdy związek dwóch zmiennych wyrażony jest linią prostą lub krzywą (miara rozrzutu wyników wokół linii).
Współczynnik determinacji - wariancja interpretacyjna współczynnika korelacji <0;100> podawany w procentach %, lub <0;1> podawany w wartości liczbowej
WD = r² x 100% - mówi jaki procent wariancji zmienne x i y mają wspólny.
np: r = 0.6 WD = 36%
Zmienność cechy y jest wyjaśniona oddziaływaniem x w 36% (64% poza kontrolą).
Regresja liniowa
Załóżmy, że mamy pięć punktów doświadczalnych danych w tabeli:
i xi yi
1 2 2,5
2 4 10
3 6 32
4 8 40
5 10 60
Skala Z- wyniki standardowe:
Wyniki standaryzowane, w celu porównywania różnych testów/wyników.
Skala w której odchylenie standardowe jest jednostką, a średnia punktem zerowym.
Przykład:
1. Kacper uzyskał 30 punktów w teście X oraz 25 punktów w teście Y.
2. Wiedząc, że rozkład wyników był normalny, oraz średnia wyników w X wynosiła 50 (SD=20), a średnia w teście Y = 20 (SD=5), określ:
jaki wynik osiągnął w poszczególnych testach i w którym wypadł lepiej?
ile % osób miało od niego lepszy wynik w teście X i Y?
Grupowanie materiału statystycznego
Szeregi statystyczne- odpowiednio usystematyzowany i uporządkowany surowy materiał statystyczny; dzielimy na:
a) szczegółowe
b) rozdzielcze (punktowe, przedziałowe)
Przykład: Przedmiotem badania jest wadliwość produkcji na III zmianie w firmie BANANA. Liczba wyprodukowanych wyrobów wynosi 50 (n=50). Cecha badana (X) oznacza liczbę usterek w wyrobie. Surowy materiał statystyczny to ciag 50 liczb oznaczajacy liczbę braków stwierdzonych w kolejnym wyrobie. Ma on postać:
3, 0, 1, 0, 0, 0, 0, 1, 0, 0, 4, 2, 0, 0, 1, 1, 0, 3, 0, 2,
0, 1, 0, 0, 1, 0, 2, 0, 0, 0, 3, 0, 0, 4, 0, 2, 0, 0, 1, 0,
0, 1, 3, 0, 2, 0, 0, 0, 0, 2
Szereg szczegółowy otrzymamy sortujac te liczby rosnaco (najcześciej) lub malejaco (rzadziej). Liczby braków posortowane rosnaco daja nastepujacy ciag {xi} 50 liczb:
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,
2, 2, 2, 2, 3, 3, 3, 3, 4, 4
Liczby te spełniaja warunek definicji szeregu szczegółowego:
x1 < x2 < x3 < . . . < x50