Metodologia notatka

Specyfika podejścia naukowego

Nauka – autonomiczna część kultury służąca wyjaśnieniu funkcjonowania świata, w którym żyje człowiek.
Jest budowana i rozwijana wyłącznie za pomocą tzw. Metody Naukowej lub metod naukowych poprzez działalność badawczą prowadzącą do publikowania wyników naukowych dociekań.
Proces publikowania i wielokrotne powtarzanie badań w celu weryfikacji ich wyników, prowadzi do powstania wiedzy naukowej dostępnej dla całej ludzkości.
Zarówno ta wiedza jak i sposoby jej gromadzenia określane są razem jako nauka.
Podział nauki:

Psychologia jako nauka:
Psychologia - pozwala na poznanie ludzkich zachowań, wiedzy na temat otaczającego nas świata i jego wpływu na zachowanie się i funkcjonowanie jednostki ludzkiej.

Badania naukowe:
Recenzenci – elita decydująca o sposobie uprawiania badań naukowych w najważniejszych czasopismach.

Cel pracy naukowej – publikowanie artykułów w prasie fachowej
Tematy badawcze
a) Tematy zlecone
b)Tematy odkrywcze
Sposób realizacji badań
a) „Dobre” pytania
b) Uwzględnienie pomyłki
c) Badania powtórzone
d) Znane autorstwo
Międzynarodowa wymiana informacji naukowej
Publikacje naukowe
a) Podręczniki
b) Monografie - praca naukowa omawiająca jakieś zagadnienie w sposób wyczerpujący
c) Artykuły w czasopismach:
- Artykuły przeglądowe – zwierają wyczerpujący przegląd prac dotyczących określonego zagadnienia
- Doniesienia z badań – krótki przegląd wybranych prac, zarysowujący tylko kontekst prac przeprowadzonych przez autora
d) Odbitki („Reprinty”) - powtórne wydanie z możliwie wiernym zachowaniem cech oryginału
e) Maszynopisy („Preprinty”) – nieformalny środek wymiany informacji naukowej
Literatura cytowana
Indeks cytowań (SCI – Scientific Citation Index) - forma bibliografii, polegająca na zbieraniu informacji zarówno na temat artykułów cytujących, jak i powiązanych z nimi artykułów cytowanych, sposób oceniania wartości danej pracy naukowej.
Procent odrzuceń

Artykuły są publikowane w czasopismach psychologicznych oraz w bazach bezpłatnego dostępu w formie katalogów i wyszukiwarek.

Metodologia - nauka o metodach badań naukowych, o skutecznych sposobach dociekania ich wartości poznawczej - zajmuje się zagadnieniami teoriopoznawczymi związanymi z rozwojem danej nauki. Różnice pod względem metodologicznym pomiędzy naukami polegają na innych celach w systematyzacji wykrywanych zależności.

Dzieli się na:

Metodologię ogólną – traktującą o prawidłowościach rządzących procesem poznawczym, wspólnych dla wszystkich nauk (np. klasyfikowanie, definiowanie, wnioskowanie, wyjaśnianie itp.)
Metodologię szczegółową – dotyczącą danej dyscypliny i zajmującą się charakterystycznymi dla niej procedurami poznawczymi (np. planowanie eksperymentów w psychologii czy budowa testów psychologicznych)

Jako metodologia na ćwiczeniach:

metodologia szczegółowa – dotyczy jednej dyscypliny
metodologia normatywna – kształtuje świadomość metodologiczną kandydatów na badaczy, wskazuje wzorcowe rozwiązania warsztatowe, pomagające uniknąć błędów
metodologia badań empirycznych – psychologia jest nauką empiryczną

Cele nauczania metodologii:

Zrozumienie naukowych tekstów, umiejętność ich interpretacji oraz formułowanie opinii na temat wartości poznawczej wyników
Umiejętność:

samodzielnego projektowania badań empirycznych
samodzielnego przeprowadzenia badań empirycznych
samodzielnego zinterpretowania i uogólnienia uzyskanych wyników

Pięć etapów postępowania badawczego w naukach empirycznych (wg M. Bunge’a):

Etap 1: Ujęcie problemu

dokonanie przeglądu faktów (literatura z punktu widzenia problemu badawczego)
rozpoznanie problemu (ocena sytuacji i występujących w danej dziedzinie wiedzy nieadekwatności, luk, niekonsekwencji)
postawienie problemu (sformułowanie pytania)

Etap 2: Zbudowanie modelu teoretycznego

dokonanie selekcji ważnych czynników (wysunięcie założeń o zmiennych potencjalnie istotnych)
wysunięcie centralnych hipotez i pomocniczych założeń (próba sformułowania twierdzeń, które mają wyjaśnić zaobserwowane fakty)
dokonanie przekładu na język matematyki (wyrażenie hipotez w języku matematyki)

Etap 3: Wyprowadzenie szczegółowych konsekwencji

wyszukanie racjonalnych ujęć (uporządkowanie wyników, jakie mogą być zweryfikowane)
wyszukanie podstaw empirycznych (postawienie prognoz – na podstawie modelu i danych empirycznych – z uwzględnieniem dostępnych badaczowi technik ich weryfikacji)

Etap 4: Sprawdzenie hipotez

zaplanowanie sprawdzenia (zaplanowanie różnego typu działań np. obserwacja, pomiary, eksperymenty itp..)
wykonanie sprawdzania (przeprowadzenie odpowiednich działań i zebranie danych)
usystematyzowanie danych (ich klasyfikacja, analiza i ocena ich wartości, wyeliminowanie z pola rozważań danych zbędnych)
wyprowadzenie wniosków (interpretacja danych w terminach przyjętego modelu teoretycznego)

Etap 5: Wprowadzenie do teorii wniosków z badań empirycznych

dokonanie porównania wniosków z prognozami (w jakim stopniu wyniki potwierdzają/obalają model teoretyczny)

zmodyfikowanie modelu (wprowadzenie do modelu zmian lub zastąpienie go innym)
przedstawienie sugestii dla dalszej pracy (wyszukiwanie luk i błędów w całym toku postępowania badawczego, gdy model został obalony, lub poszukiwania możliwości rozszerzenia modelu – jeśli potwierdzony)

Problem badawczy i hipoteza badawcza

Jak organizować to co się wie?
a) Czytać najnowsze opracowania
b) Poradzić się fachowca
c) Robić notatki
d) Analizować słowa tekstu
e) Oceniać to co czytane
f) Zapamiętywać ważne nazwiska

Publikacja – raport z badań:

1) Jasny i przejrzysty układ graficzny
2) Wszystkie części struktury

Wstęp
Problem badawczy oraz hipotezy
Metoda
- Osoby badane
- Materiały
- Procedura
Wyniki – analiza wyników
Dyskusja wyników
Zakończenie
Literatura cytowana

Wyróżnienie najważniejszych części poprzez nagłówki, akapity, podkreślenia
Jednolita numeracja
Część główna zawierająca ważne fakty bez zbędnych informacji
Jasne i logiczne wnioskowanie
Cytowanie – podanie źródeł
Schludne i czytelne schematy, wykresy

Problem badawczy - nie wszystkie pomysły dają się zrealizować, niektórych nie warto. Lepiej porzucić pytania stawiane na początku, gdy w trakcie poszukiwania odpowiedzi natrafimy na zagadnienia dużo ciekawsze. Służy opisaniu zakresu badań, tj. określeniu ich przedmiotu, celu i metod (Co badać? Po co badać? Jak badać?) Problem badawczy formułujemy poprzez pytanie badawcze – musi wyglądać jak konkretne zadanie do rozwiązania. Dobre pytanie nie tylko doprecyzowuje, o co chodzi badaczowi, ale wskazuje również na to, w jakiej formie pytający oczekuje odpowiedzi.
a) Pytanie rozstrzygające (Np. Czy występują różnice w pamięci cen sprzed dwóch lat między krajem, gdzie wprowadzono nową walutę, a krajem, w którym nie została ona wprowadzona?)
b) Pytanie dopełnienia (Np. Jakie występują różnice w pamięci cen sprzed dwóch lat między krajem, gdzie wprowadzono nową walutę, a krajem, w którym nie została ona wprowadzona?)

Rodzaje wyjaśniania:
1)Indukcja – wyjaśnienie przyczyn poprzez odwołanie się do ogólnej prawidłowości
2)Dedukcja – poszukiwanie określonych skutków, jeśli istnieją już przyczyny

Hipoteza badawcza - to zdanie twierdzące, dotyczące przewidywanego wyniku eksperymentu, skonstruowanego w celu uzyskania odpowiedzi na pytanie badawcze. Określa relację między badanymi zmiennymi i jest najbardziej prawdopodobną odpowiedzią na problem badawczy (Np. Osoby z kraju, gdzie wprowadzono nową walutę bardziej zaniżają ceny sprzed dwóch lat niż osoby z kraju, w którym nie zmieniono waluty).

Nie może być zbyt ogólna, nie może być zbyt szczegółowa.

Powinna być weryfikowalna i powinna ją cechować prostota.

Sposoby dobierania próby oraz rodzaje zmiennych

Próba reprezentatywna – charakteryzująca się rozkładem danej cechy nieistotnie różniącym się od rozkładu populacji

Zasady doboru losowego próby

Zadaniem badań empirycznych jest zdobycie liczbowego wyrażenia ujmującego łącznie informację o właściwościach wszystkich elementów populacji, czyli zdobycie parametru charakteryzującego daną populację. Trudno uzyskać dokładną wartość jakiegoś parametru przez obserwację danego elementu. Musimy zadowolić się wyciągiem wniosków z danych które są oparte na próbie.

Co musi zrobić badacz, aby uzyskać wartości charakteryzujące populację?

1. Pobrać próbę.

2. Przeprowadzić obserwację.

3. Obliczyć wyniki oparte na danych z próby (statystyki).

Schemat próby - dwa zadania które powinno traktować się łącznie: dobór próby i proces szacowania.

Sposoby dobierania próby:

a) dobór celowy - badacz sam wybiera osoby badane, lub odwołuje się do opinii eksperta – choroby psychiczne, rzadkie przypadki

b) dobór na podstawie zgłoszonych ochotników – wolontariusze

c) dobór losowy z populacji

Losowość próby – umożliwia wnioskowanie o populacji oparte na gruncie probabilistycznym – możemy ocenić dokładność wnioskowania.

Populacja – podział:

Skończone (dzieci, studenci, mieszkańcy)
Nieskończone (nieskończona ilość powtórzeń)

Schematy losowania:

Niezależne vs zależne (bez zwracania)
Indywidualne vs zespołowe (np. mieszkańcy budynku, uczniowie w klasie)
Jednostopniowe vs wielostopniowe (przynajmniej dwa losowania)
Nieograniczone (z całej populacji) vs ograniczone (losujemy z poszczególnych części populacji)

Odmiany schematów losowych:

Losowanie nieograniczone indywidualne (bez powtórzeń, za pomocą tablic liczb losowych)
Losowanie systematyczne indywidualne (3+10, 3+15, 3+20…)
Losowanie warstwowe (podział populacji na warstwy i losowanie niezależne określonej liczby osób z każdej warstwy)
- Wariant proporcjonalny
- Wariant optymalny
Losowanie grupowe (np. klasa)
Losowanie wielostopniowe (warstwujemy populację -> losujemy grupy -> z każdej grupy losujemy daną liczbę elementów)

Cecha może być:

1) Stała
2)Zmienna (przyjmująca min. 2 wartości np. płeć, nastrój, kierunek studiów)

Zmienna - właściwość obiektu przyjmująca różne wartości (przynajmniej dwie)

Rodzaje zmiennych:

Zmienne dwuwartościowe – dychotomiczne np. płeć

Zmienne wielowartościowe – politomiczne np. stres, ekstrawersja

Zmienne trójwartościowe – trychotomiczne np. system odpowiedzi kwestionariuszowych: tak, nie, nie wiem.

Zmienne zdychotomizowane – podział wieku na do 50 lat i od 51 lat.

Rodzaje zmiennych

Zmienne ciągłe – zbiór wartości tworzy kontinuum, czyli między 2 sąsiednimi zmiennymi zawsze można znaleźć trzecią np. wzrost

Zmienne dyskretne – jeśli między dwoma sąsiednimi zmiennymi nie występuje trzecia zmienna.

Np. płeć, wykształcenie, ilość rodzeństwa

Rodzaje zmiennych

Zmienna ilościowa – przyjmuje wartości liczbowe np. liczba obejrzanych filmów, czas reakcji (m.in. zmienne ciągłe)
Zmienna jakościowa (kategorialne) – przyjmują wartości nominalne np. płeć, rodzaj filmu (dramat, komedia itp.) (m.in. zmienne dychotomiczne)

Rodzaje zmiennych z punktu metodologicznego:

Zmienna zależna – przedmiot badania, której związki z innymi zmiennymi chcemy określić (wyjaśnić) - Y
Zmienna niezależna – które oddziałuje na zmienną zależna – X

Skale pomiarowe i operacjonalizacja oraz określanie zmiennych zależnych i niezależnych

Rodzaje skal:

1) Nominalna – skala nazwy (płeć, kolory włosów, typy osobowości wg Eysenka, zdolności muzyczne)

2) Porządkowa - skala rangi, kolejność – charakteryzuje ją spójność i przechodniość oraz rangowanie (poziom agresji, stopnie w szkole, wynik matury, wykształcenie)

3) Przedziałowa (interwałowa) – skala odległości – posiada jednostkę długości TemperaturaIloraz inteligencji Skala Leitera Wzrost dziecka

4) Stosunkowa (ilorazowa) – skala krotności – ma zero absolutne, czyli nie istnieje ujemy wynik = istnieje wynik minimalny
Prędkość samochodu

Operacjonalizacja - procedura znajdowania empirycznych odpowiedników dla terminów teoretycznych, czynność konieczna do analizy wyników i przeniesienia ich na grunt praktyki.

Plany eksperymentalne

Tworzenie planu eksperymentalnego opiera się na odpowiedzi na trzy pytania:

Co chcę wiedzieć?
Z jaką dokładnością chcę wiedzieć?
O jakiej grupie chcę to wiedzieć?

Plany eksperymentalne:

a) Międzygrupowe – najczęściej spotykany

Porównujemy dwie grupy badawcze
Podział na dwie grupy porównawcze: Grupa eksperymentalna vs Grupa kontrolna, którą się nie manipuluje
Warunki:
- Randomizacja - losowe przydzielenie osób do grup badanych
- Identyczność procedury w obu grupach
Niebezpieczeństwo błędu próbki – czy rozkład cech jest identyczny w 2 grupach.

b)Wewnątrzgrupowe – badanie przeprowadza się dwukrotnie na tych samych osobach - powtarzane pomiary zmiennej zależnej w jednej grupie badanej

Zalety:

- Te same osoby w wyniku manipulacji eksperymentalnej zachowują się inaczej

- Redukcja czynników zakłócających wynikających z cech osób badanych

- Mniejsza liczba potrzebnych osób badanych

Wady:

- „Błąd zakotwiczenia”

- Łatwo domyślić się intencji eksperymentatora

- Świadome modyfikowanie zachowania przez osobę badaną

c) Międzygrupowe z pretestem

d) Międzygrupowe bez pretestu

Pretest – pozwala na precyzyjną ocenę wielkości zmiany wartości zmiennej zależnej pod wpływem zmiennej niezależnej.

Plan eksperymentalny Solomona – model czynnikowy -> mamy dwie zmienne niezależne

Główna
Dodana: (z pretestem i bez pretestu)

	Rodzaj zadania
	Zmienna niezależna
Pomiar emocji	Z pretestem
	Bez pretestu

Eksperyment dwuczynnikowy – manipulujemy dwiema zmiennymi niezależnymi

Eksperyment dwuczynnikowy z wieloma grupami badanych i wieloma poziomami - więcej osób (każda grupa w innej sytuacji) lub powtarzane pomiary (jedna grupa w 3 sytuacjach)

Korelacja, histogram, miary położenia, wariancja

Korelacja – wzajemny związek, pojęcie matematyczne, oznaczające wzajemne powiązanie, współzależność jakichś zjawisk lub obiektów.
Dla zastosowań ważny jest fakt, że w przypadku zmiennych X i Y o rozkładzie normalnym, współczynnik korelacji obu zmiennych jest miarą ich zależności i jest równy zeru wtedy i tylko wtedy, gdy obie zmienne są niezależne.
Związek między dwiema zmiennymi zależnymi ma charakter LINIOWY

Siłę współzależności dwóch zmiennych można wyrazić liczbowo za pomocą wielu mierników.

Najbardziej popularny jest współczynnik korelacji liniowej Pearsona, oznaczony symbolem rXY i przyjmujący wartości z przedziału [-1, 1].

Korelacje przedstawia się na wykresach rozrzutu:

Przy silnie skorelowanych zmiennych odnosimy wrażenie, jakby te punkty równocześnie się poruszały.

Korelacja dodatnia występuje wtedy, gdy wzrostowi wartości jednej zmiennej odpowiada wzrost średnich wartości drugiej zmiennej
Korelacja ujemna występuje wtedy, gdy wzrostowi wartości jednej zmiennej odpowiada spadek średnich wartości drugiej zmiennej
Gdy korelacja staje się coraz słabsza, wówczas punkty zaczynają się rozpraszać i przesuwać, tworząc w pewnym momencie bezkształtną chmurę punktów (brak korelacji).
Inne opcje: korelacja krzywoliniowa

Histogram - to zestawienie danych statystycznych w postaci wykresu powierzchniowego złożonego z przylegających do siebie słupków (prostokątów), których wysokość ilustruje liczebność/częstość występowania badanej cechy w populacji lub jej próbie.

Modalna – moda – dominanta

a) Dla zmiennych o rozkładzie dyskretnym - wartość najczęstsza lub najbardziej prawdopodobna.

b) Dla zmiennych o rozkładzie ciągłym - wartość dla której funkcja gęstości ma wartość największą.

Mediana

Wartość środkowa – powyżej i poniżej tej wartości znajduje się jednakowa liczba obserwacji.
Obserwacja między numerem (n/2) i numerem (n/2 + 1), gdzie n-parzysta
Obserwacja numeru (n+1)/2, gdzie n-nieparzysta
Zmienne porządkowe, przedziałowe i ilorazowe

Przykład:

A) 1, 2, 5, 7, 9 wynik to: 5

B) 3, 7, 15, 26, 51 to: 15

C) 6, 25, 30, 35, 45, 64 to: 32,5

D) 1, 5, 6, 6, 6, 7, 10 to: 6

E) 0, 0, 0, 7, 9, 25, 126 to: 7

Średnia arytmetyczna - wartość średnia pochodzi z sumowania poszczególnych wyników i podzielenie tej sumy przez liczbę naszych obserwacji. Daje nam obraz tego, na ile przeciętnie dana rzecz (zjawisko, czynność, itd.) występowała.

X_i = wartość mierzonej właściwości

n – liczność próbki

Przykład: Zapytano pięć osób, ile razy ciągu ostatniego tygodnia poszukiwali potrzebnych im informacji w Internecie. Uzyskano następujące odpowiedzi:
1, 4, 3, 0 i 2 razy w ciągu ostatniego tygodnia.
i tak:

(1 + 4 + 3 + 0 + 2) / 5 = 2
Wiemy zatem, iż w naszej grupie osób w ostatnim tygodniu potrzebnych informacji wyszukiwano średnio 2 razy.

Wariancja, odchylenie standardowe, rozstęp, rozkład normalny

Wariancja - jest podstawową miarą zmienności obserwowanych wyników. Informuje o tym, jak duże jest zróżnicowanie wyników w danym zbiorze wyników (zmiennej) - inaczej mówiąc, czy wyniki są bardziej skoncentrowane wokół średniej, czy są małe różnice pomiędzy średnią a poszczególnymi wynikami, czy może rozproszenie wyników jest duże, duża jest różnica poszczególnych wyników od średniej.
Przyjmuje wartości od 0 do plus nieskończoności (nie istnieje ujemna wariancja, ponieważ nie może być minusowego zróżnicowania, albo ono jest, albo go nie ma, czyli wszystkie wyniki są takie same).

Jeżeli wariancja równa jest 0, oznacza to, że nasze wyniki są identyczne, np. każdy uczeń dostał 5 z egzaminu.

Często badacze posługują się terminem wariancja do określenia niemocy analitycznej: "Nie ma wariancji" w wynikach, oznacza, że nie ma żadnej różnicy pomiędzy zebranymi wynikami, a to oznacza, że statystyk nie ma praktycznie nic do analizowania.

Przykład: Lekarz zbadał tętno dwóch grup osób: chorujących na chorobę A i chorujących na chorobę B. Uzyskał następujące wyniki:
Choroba A: 60, 60, 60, 60, 70, 70, 70, 80, 80, 80, 80
Choroba B: 50, 50, 50, 50, 70, 70, 70, 90, 90, 90, 90.

1. Ile wynosi średnie tętno osób w grupie A i B?

2. Jaka jest wariancja w grupie A i B?

3. Co z tego wynika?

Odchylenie standardowe - jest podstawową miarą zmienności obserwowanych wyników.

Informuje o tym, na ile wyniki się "zmieniają", tzn. czy rozrzut wyników wokół średniej jest niewielki czy wielki.

Jest obliczane się ze wszystkich wyników. Im zbiorowość jest bardziej zróżnicowana, tym odchylenie standardowe jest większe.

Rozstęp - jest najprostszą miarą rozproszenia (zmienności).

Jest niczym innym jak różnicą między wartością maksymalną a minimalną z naszego zbioru obserwacji. Pokazuje zatem jedynie jaki jest zakres naszych obserwacji - nie informuje w żaden sposób co dzieje się "w środku" tego zakresu np. jaka wartość występowała najczęściej, czy jaka jest średnia dla tego zbioru obserwacji.

Przykład: Dwie grupy osób poproszono o ocenę na dziesięciostopniowej skali. W jednej grupie najniższy wynik wynosił 3, najwyższy 9. W drugiej grupie natomiast wynik najniższy to 1 a najwyższy 9. Tak więc:
R1 = X1 max - X1 min = 9 - 3 = 6
R2 = X2 max - X2 min = 9 - 1 = 8
Gdzie:
R: Rozstęp
X max: najwyższa wartość w zbiorze obserwacji
X min: najniższa wartość w zbiorze obserwacji

Widzimy zatem, że w grupie 2 zakres odpowiedzi był większy niż w grupie 1. Oznacza to, że w grupie 2 udzielano bardziej skrajnych odpowiedzi niż w grupie 1.

Średnia ważona - podaje nam jedną liczbę (średnią) z uwzględnieniem ważności czy też liczebności każdej z uśrednianych wartości.

Oblicza się ją dzieląc sumę iloczynów średniej i liczebności z jakiej ta średnia pochodzi przez sumę liczebności bądź wag (ważności) wszystkich uśrednianych grup.

Przykład: Uczeń ma takie oto oceny: 4, 2, 4, 5, 3, 5

- prace klasowe: 4, 2,

- kartkówki: 4, 3,

- praca domowa: 5, 5
Średnia arytmetyczna tych ocen w przybliżeniu wynosi 3,83, ale uczeń domaga się czwórki. Nauczyciel jednak wprowadził wagi dla ocen i tak za prace klasowe waga wynosi 5, dla kartkówek waga wynosi 3, a dla prac domowych waga wynosi 1.

Podstawiając teraz dane do wzoru na średnią ważoną otrzymujemy:

5·4+5·2+3·4+3·3+1·5+1·5 / (5+5+3+3+1+1) ≈ 3,39

W tej sytuacji oceną końcową jest 3.

Rozkład normalny, zwany też rozkładem Gaussa lub krzywą dzwonową jest jednym z najważniejszych rozkładów prawdopodobieństwa.

Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych itp.

Przykłady: inteligencja, wzrost, natężenie źródła światła

Jeżeli na n osób m jest liczbą kobiet, to możemy powiedzieć, że prawdopodobieństwo że x jest kobietą, co zapiszemy P(x=kobieta) wynosi m/n; 0<=P<=1

W statystyce istnieje wiele rozkładów teoretycznych. Najczęściej występującym jest rozkład normalny.

Zmienna losowa ma rozkład normalny o parametrach µ, σ, co piszemy N(µ, σ).
Parametr µ wyznacza środek symetrii wykresu, a parametr σ decyduje o jego wysokości

Reguła trzech sigm:

Wykres funkcji gęstości rozkładu normalnego dla µ=0 i σ=1

Jeżeli zmienna losowa X ma rozkład normalny N(µ,σ) to:
P(µ - σ<x< µ + σ) =0, 6827 - 68,27 % wyników jest w przedziale (µ -σ, µ + σ)
P(µ -2σ<x< µ +2σ) =0, 9545 - 95,45 % wyników jest w przedziale (µ -2σ, µ +2σ)
P(µ - 3σ<x< µ + 3σ) =0, 9973 - 99,73 % wyników jest w przedziale (µ -3σ, µ + 3σ)

Rozkład normalny:

Jest on określony przez dwa parametry: wartość średnią (oczekiwaną) m i odchylenie standardowe s.
Zapisuje sie go w postaci N(m; s)
Z rozkładem Normalnym związana jest reguła 3 s (sigm) mówiąca, że w przedziałach:
X +/- 3 s mieści się 99,73% obserwacji,
X +/- 2 s mieści się 95,45% obserwacji,
X +/- 1 s mieści się 68,27% obserwacji.

Regresja, skala „z”, szeregi statystyczne

Regresja - wyrażenie zależności wartości jednej zmiennej od drugiej w postaci pewnej prostej funkcji.

Pierwsze wyniki: Sir Francis Galton Regression towards Mediocrity in Hereditary Stature (Regresja w badaniach nad dziedziczeniem niskiego wzrostu), 1885 r.

Teoria została później rozwinięta przez Karla Pearsona.

Współczynnik korelacji liniowej Pearsona – współczynnik określający poziom zależności liniowej między zmiennymi losowymi.

Regresja liniowa

Na wykresach rozrzutu obserwujemy, że „chmura” punktów (xi, yi) układa się wzdłuż prostej, możemy spróbować wyznaczyć jej równanie.

Oceniamy, czy istnieje zależność między zmiennymi, czyli czy te punkty układają się wzdłuż jakiejś prostej.

Model regresji dla próbki:

Naszym celem jest wyznaczyć współczynniki b1 i b0 w układzie równości:

yi = b1xi + b0 + ei, i = 1, . . .N,

tak, aby suma wartości bezwzględnych błędów ei była jak najmniejsza.

Regresja i korelacja

Współczynnik korelacji jest miarą dobroci dopasowania prostej regresji do danych. Im bliższy 1, tym dopasowanie lepsze.
Interpretacja r2 (tzw. współczynnik determinacji): jest to część zmienności zmiennej y, która daje się wyjaśnić regresją, czyli liniową zależnością zmiennej y od zmiennej x.

Zależność słaba, zależność silna - korelacja

Źródła wariancji y (zmienności) - wariancja kontrolowana + wariancja błędu (źródłem są zmienne zakłócające w obiekcie badania, np. narzędzie / warunki).
r - współczynnik korelacji <-1,1>; miernik siły związku zmiennych ciągłych; stosowany, gdy związek dwóch zmiennych wyrażony jest linią prostą lub krzywą (miara rozrzutu wyników wokół linii).
Współczynnik determinacji - wariancja interpretacyjna współczynnika korelacji <0;100> podawany w procentach %, lub <0;1> podawany w wartości liczbowej

WD = r² x 100% - mówi jaki procent wariancji zmienne x i y mają wspólny.

np: r = 0.6 WD = 36%

Zmienność cechy y jest wyjaśniona oddziaływaniem x w 36% (64% poza kontrolą).

Regresja liniowa

Załóżmy, że mamy pięć punktów doświadczalnych danych w tabeli:

i xi yi

1 2 2,5

2 4 10

3 6 32

4 8 40

5 10 60

Skala Z- wyniki standardowe:

Wyniki standaryzowane, w celu porównywania różnych testów/wyników.
Skala w której odchylenie standardowe jest jednostką, a średnia punktem zerowym.

Przykład:

1. Kacper uzyskał 30 punktów w teście X oraz 25 punktów w teście Y.

2. Wiedząc, że rozkład wyników był normalny, oraz średnia wyników w X wynosiła 50 (SD=20), a średnia w teście Y = 20 (SD=5), określ:

jaki wynik osiągnął w poszczególnych testach i w którym wypadł lepiej?
ile % osób miało od niego lepszy wynik w teście X i Y?

Grupowanie materiału statystycznego

Szeregi statystyczne- odpowiednio usystematyzowany i uporządkowany surowy materiał statystyczny; dzielimy na:

a) szczegółowe

b) rozdzielcze (punktowe, przedziałowe)

Przykład: Przedmiotem badania jest wadliwość produkcji na III zmianie w firmie BANANA. Liczba wyprodukowanych wyrobów wynosi 50 (n=50). Cecha badana (X) oznacza liczbę usterek w wyrobie. Surowy materiał statystyczny to ciag 50 liczb oznaczajacy liczbę braków stwierdzonych w kolejnym wyrobie. Ma on postać:

3, 0, 1, 0, 0, 0, 0, 1, 0, 0, 4, 2, 0, 0, 1, 1, 0, 3, 0, 2,

0, 1, 0, 0, 1, 0, 2, 0, 0, 0, 3, 0, 0, 4, 0, 2, 0, 0, 1, 0,

0, 1, 3, 0, 2, 0, 0, 0, 0, 2
Szereg szczegółowy otrzymamy sortujac te liczby rosnaco (najcześciej) lub malejaco (rzadziej). Liczby braków posortowane rosnaco daja nastepujacy ciag {xi} 50 liczb:

0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,

0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,

2, 2, 2, 2, 3, 3, 3, 3, 4, 4

Liczby te spełniaja warunek definicji szeregu szczegółowego:

x1 < x2 < x3 < . . . < x50

Wyszukiwarka

Podobne podstrony:
metodologia notatki 1, metodologia historii
Metodologia notatki z wyk┼éad├│w
metodologia notatki 2, metodologia historii
Metodologia notatki
Metodologia notatki z wykładów (Malewski)
metodologia notatki
METODOLOGIA - pedagogika EUHE, notatki z kierunku pedagogiki
Metodologia nauk społecznych notatki skrót 01
Notatki metodologia 2, filologia polska - metodologia badań humanistycznych, Metodologia badań human
notatki-3, Dydaktyka i metodologia
Metodologia badań literackich - Notatki, Literaturoznawstwo, metodologia badan literackich
metoda biograficzna- notatki, METODOLOGIA
JUSZCZYK US-METODOLOGIA BADAŃ, Egzaminy notatki
NOTATKI 1 semestr, Metodologia Historii Sztuki
metodologia ćw4 notatki z literatury, Statystyka i metodologia(1)

więcej podobnych podstron