PRÓBA REPREZENTATYWNA - część populacji pozwalająca w przybliżeniu opisać całość populacji. Próba nie spełniająca tego warunku nazywana jest niereprezentatywną lub obciążoną.
RODZAJE DOBORU PRÓBY; RÓŻNICA MIĘDZY DOBOREM CELOWYM, A LOSOWYM
1) Metody doboru losowego - probabilistyczne
Metody doboru losowego, to procedury oparte na mechanizmach losujących elementy do próby w taki sposób, aby każda jednostka populacji miała jednakową szansę dostania się do próby.
o dobór losowy prosty - jest najprostszym sposobem doboru próby badawczej. Polega on na bezpośrednim i nieograniczonym doborze jednostek badanych do próby statystycznej wprost z populacji generalnej i bez ograniczeń. Istnieją dwa rodzaje doboru losowego prostego: dobór losowy prosty niezależny, czyli ze zwarciem, oraz dobór losowy prosty zależny, czyli bez zwarcia. Wśród technik doboru losowego prostego stosuje się wiele sposobów bezpośredniego i nieograniczonego doboru. Klasycznym sposobem jest losowanie za pomocą urny. Polega ono na zastąpieniu poszczególnych jednostek badanych losami (numerami), które umieszcza się w odpowiedniej urnie, a następnie po dokonaniu wymieszania losuje się, z zachowaniem wszelkich reguł prawdopodobieństwa, odpowiednią liczbę losów niezbędną do badań. Próba tak dobrana ma wszelkie cechy próby reprezentacyjnej. Drugim sposobem doboru jednostek do próby jest losowanie za pomocą tablicy liczb losowych. Polega on na ponumerowaniu wszystkich jednostek populacji generalnej i odczytaniu w ustalonej kolejności liczb z tablic liczb losowych.
o dobór losowy systematyczny - należy również do typu losowania bezpośredniego, ale ograniczonego. Mianowicie, dobór ten jest ograniczony do jednostek z pewnego przedziału liczbowego. Metoda doboru losowego systematycznego polega na wyborze z uporządkowanego zbioru jednostek populacji - odpowiedniej liczby jednostek w równych odstępach (interwałach - k). Np. N=2000, n-200, K=N/n
o dobór losowy warstwowy - polega na podziale całej populacji generalnej na tzw. warstwy i dokonaniu bezpośredniego losowania niezależnych prób w obrębie każdej warstwy. Podział populacji na warstwy musi być przeprowadzony w taki sposób, aby każdy element wchodził tylko do jednej warstwy i znajdował się w któreś z nich. Same warstwy powinny być jednorodne i różnić się między sobą istotnie. Wyróżnia się trzy rodzaje doboru losowania warstwowego: dobór proporcjonalny, dobór nieproporcjonalny i dobór optymalny.
o dobór losowy grupowy (zespołowy) - losuje się bezpośrednio nie jednostki badawcze, lecz ich zespoły, a więc grupy tych jednostek, np. rodziny, klasy szkolne, zakłady pracy, dzielnice itp. Dobór próby w tym schemacie polega na wylosowaniu do próby pewnej liczby grup i badaniu wszystkich jednostek należących do tych grup. Istnieją dwa sposoby doboru losowego grupowego: dobór z jednakowymi prawdopodobieństwami wyboru oraz dobór z różnymi prawdopodobieństwami wyboru.
o dobór losowy wielostopniowy - jest metodą kolejnego losowania zespołów jednostek coraz to niższego stopnia, powstających z podziału zespołów wyższego stopnia. Najpierw wybiera się jednostki losowania pierwszego stopnia, składające się dużych zespołów jednostek badania. Następnie jednostki te dzieli się na mniejsze zespoły, zwane jednostkami losowania drugiego stopnia. Z kolei jednostki te dzieli się na jeszcze mniejsze zespoły, zwane jednostkami losowania trzeciego stopnia, aż w końcu dochodzi się do podstawowych jednostek badania.
o dobór losowy wielofazowy - jest metodą doboru prób losowych w kilku fazach, ale zawsze w obrębie tej samej kategorii jednostek. Dobór wielofazowy polega na wyborze w pierwszej fazie większej próby losowej, a w drugiej (lub dalszej) fazie - na wyborze z niej jednej lub więcej mniejszych prób losowych. Dobór losowy wielofazowy stosuje się w przypadku gdy uzyskanie informacji jest trudne (wywiad głębinowy) lub zbyt kosztowne (eksperyment rynkowy), skutkiem czego należy ograniczyć badania do stosunkowo niewielkiej i dobrze wyselekcjonowanej próby.
Metoda doboru nielosowego - nieprobabilistyczne
Metody doboru nielosowego, to takie techniki wyboru próby, w których nie stosuje się procedur losowania, lecz inne procedury, oparte przede wszystkim na subiektywnych decyzjach, opartych na znanych danych obiektywnych, odnoszących się do znajomości struktury badanej populacji.
o dobór kwotowy - w doborze próby możliwe jest określenie przez badacza, w sposób arbitralny, które z jednostek populacji generalnej znajdują się w próbie. Dobór kwotowy opiera się on na znajomości struktury populacji generalnej. Do próby dobiera się te elementy, które spełniają żądane cechy w taki sposób aby ich rozkład w próbie odpowiadał rozkładowi tych cech w populacji generalnej. Jest to jeden z najbardziej popularnych doborów próby w badaniach marketingowych.
o dobór jednostek typowych - należy do często stosowanych metod doboru nielosowego. Polega on na wyborze najbardziej typowych reprezentantów populacji generalnej przez przyjecie jednostek przeciętnych. Jednostki te przez swą „przeciętność” nie muszą być zbyt liczne.
o dobór przez eliminację - jest w pewnym sensie przeciwieństwem doboru jednostek typowych. Zamiast bowiem dobierać jednostki typowe - eliminuje się wszystkie jednostki nietypowe, odbiegające znacznie od przeciętnych.
o dobór celowy - jest najbardziej typowym przypadkiem doboru nielosowego. Polega on bowiem na całkowicie subiektywnym wyborze jednostek badanych do próby, w nadziei uzyskania najszerszych i najpełniejszych informacji.
o dobór przypadkowy - wbrew jego nazwie jest również doborem nielosowym. Polega on bowiem na przypadkowym (na „chybił - trafił”) doborze pewnych jednostek, które w danej (przypadkowej) sytuacji znalazły się w dogodnym zasięgu. Może to być np. wywiad na ulicy czy w sklepie w czasie przypadkowych sytuacji.
o dobór wygodny - technika doboru nielosowego, polegająca na wyborze osób badanych z grona bliskich krewnych bądź znajomych.
o dobór sieciowy - technika doboru nielosowego polegająca na wyborze respondentów spośród klientów określonej sieci usługowej, np. pacjentów gabinetu dentystycznego.
o dobór kuli śniegowej - dobór polegający na dotarciu do nielicznej grupy badanych, a następnie za ich pośrednictwem do kolejnych znanych im jednostek o podobnych cechach. W ten sposób następuje zwiększenie liczby jednostek w próbie aż do uzyskania zakładanej liczebności próby.
2) Różnice
ISTOTA DOBORU LOSOWEGO
- Przypadek decyduje o tym, które jednostki spośród badanej zbiorowości zostaną wybrane do próby
- Przypadek traktujemy tu jako formę przejawiania się konieczności, której występowanie jest zgodne z istniejącymi prawidłowościami i możliwe do przewidzenia;
Losowości nie należy identyfikować z dowolnością!!!
- Warunkiem możliwości zastosowania jest posiadanie operatu losowania
ISTOTA DOBROU NIELOSOWEGO
- Nie przypadek lecz badacz decyduje o tym, które jednostki spośród badanej zbiorowości zostaną wybrane do próby
- szanse poszczególnych jednostek zbiorowości, iż wybór padnie na nie są z założenia nierówne
- dokładność wyników badania (wielkość błędu) znana dopiero po jego przeprowadzeniu
- dla zastosowania nie ma potrzeby posiadania operatu losowego
- zastosowanie „lepszych” metod nielosowych jest uzależnione od znajomości rozkładów bądź parametrów cech charakteryzujących całą badaną zbiorowość (np. średnia, wariancja, wskaźnik struktury), co wymaga wnikliwej kwerendy
GRUPOWANIE DANYCH:
Szereg rozdzielczy - kategoria np. ile dzieci ------- liczebność
Grupowanie typologiczne - odnosi się do cech jakościowych, polega na wydzielaniu grup względnie jednorodnych z niejednorodnej zbiorowości np. podział ze względu na płeć, pochodzenie
x np. posiada dzieci, nie posiada dzieci-----ilosć
Grupowanie wariancyjne - dot. cech ilościowych, łączy poszczególne jednostki statystyczne wg interesującej badacza; można łączyć ze sobą dwie lub więcej cech
Grupowanie kombinowane- dot. cech ilościowych, lub jakościowych powiązanych ze sobą z punktu widzenia badań; uczhwycenie związków między nimi
x np. 0 - 3 ----------------- f ( częstość) np. 2
ZNAJOMOŚĆ RÓŻNYCH RODZAJÓW WYKRESÓW:
Graficzna prezentacja danych statystycznych oznacza obrazowanie ich za pomocą wykresów.
- liniowe(diagramy)
- powierzchniowe (słupkowe, kołowe, posowe)
- obrazkowe(piktogramy)
- punktowe
- mapowe ( kartogramy)
JAKIE WYKRESY PASUJĄ DO DANEGO RODZAJU SKALI POMIAROWEJ:
dla zmiennych ilościowych ( skrzynkowe, liniowe, histogramy)
dla zm. jakościowych ( powierzchniowe)
SPORZĄDZANIE SZEREGU ROZDZIELCZEGO:
Kolejne kroki podczas wykonywania szeregu rozdzielczego:
porządkowanie (jeśli to możliwe rosnąco) wartości cechy,
zliczenie liczby wystąpień danej cechy w próbie,
obliczenie częstości występowania dla każdej wartości cechy,
prezentacja wyniku w formie tabeli.
Jeśli cecha ma charakter ciągły, wtedy przedział wartości cechy dzieli się na przedziały klasowe. Liczba i rozpiętości przedziałów powinny być tak dobrane, aby dawały przejrzysty obraz rozkładu. Na ogół przyjmuje się, że liczba przedziałów powinna być większa od 5 i mniejsza od 20.
Jeśli cecha ma charakter skokowy, ale liczba możliwych wartości jest bardzo duża, wtedy można postąpić podobnie jak w przypadku cechy o charakterze ciągłym.
CO OZNACZAJĄ MIARY ASYMETRII, UMIEJĘTNOŚĆ PODANIA PRZYKŁADÓW:
Miary asymetrii mówią nam, czy większa część populacji plasuje się powyżej, czy poniżej przeciętnego poziomu badanej cechy X . Asymetrię rozkładu można zbadać porównując modę, medianę i wartość oczekiwaną (średnią). W przypadku rozkładu symetrycznego wszystkie te parametry są równe.
Najprostszym sposobem oceny skośności rozkładu jest porównanie lokalizacji charakterystyk tendencji centralnej:
- rozkład lewoskośny: mediana < średnia arytmetyczna < moda (dominanta, wartość dominująca);
- rozkład prawoskośny: mediana > średnia arytmetyczna > moda;
- rozkład symetryczny: mediana = średnia arytmetyczna = moda.
Rozkłady prawdopodobieństwa można podzielić ze względu na wartość kurtozy na rozkłady:
mezokurtyczne - wartość kurtozy wynosi 0, spłaszczenie rozkładu jest podobne do spłaszczenia rozkładu normalnego (dla którego kurtoza wynosi dokładnie 0)
leptokurtyczne - kurtoza jest dodatnia, wartości cechy bardziej skoncentrowane niż przy rozkładzie normalnym
platokurtyczne - kurtoza jest ujemna, wartości cechy mniej skoncentrowane niż przy rozkładzie normalnym
WŁAŚCIWOŚĆI ROZKŁADU NORMALNEGO, STANDARYZACJA WYNIKÓW
Rozkład normalny jest rozkładem zmiennej losowej ciągłej o kształcie dzwonu. Jest on symetryczny i jednowierzchołkowy (jednomodalny)
- w rozkładzie normalnym większość wartości skupia się wokół jednej centralnej wartości, a średnia, mediana i modalna są sobie równe.
- kształt tego rozkładu zależy od wartości oczekiwanej oraz odchylania standardowego populacji. Im mniejsze odchylenie standardowe tym krzywa rozkładu normalnego jest bardziej wysmukła.
Właściwości :
- najwięcej wyników jest o średnim natężeniu cechy
- rozkład normalny jest w przedziale nieokreślonym
w rozkładzie empircznym zmienność poszczególnych bserwacji występuje w obszarze zmienności
- rozkład normalny jest rozkładem symetrycznym o ścisle oznaczonym kształcie; największą częstotliwość wysępowania maja zdarzenia o sredniej wartości badanej zmiennej; częstotliwość występowania zdarzeń maleje wraz ze wzrostem odchylenia zmiennej losowej od jej średniej arytmetycznej
- wewnątrz przedziału krzywa normalna jest wypukła a na zewnątrz wklęsła
- jeżeli całe pole pod krzywa rozkładu normalnego przyjąć za 100% to wartość odchylenia stand. dzieli je w ściśle określony sposób
standaryzacja - to zmiana wyników surowych rozkładu na taki rozkład w którym średnia = 0 a odchylenie = 1
Z = X - M /s
Klasa - zbiór wszystkich wartości liczbowych leżących wewnątrz przedziału oznaczonego ustalonymi granicami; najniższa wartość liczbowa klasy to jej dolna granica, a najwyższa to górna granica; środek przedziału to średnia arytmetyczna jego dolnej granicy
Zad. Mamy wyniki testów 70 uczniów. Najwyzszy wynik to 58, najniższy to 9. Proszę wyznaczyć optymalna liczbę klas
R (rozpiętość wyników) = X max - X min
58 - 9 = 49
i (długość przedziałów) = R / k (liczba klas, przedziałów)
k mieści się miedzy 10 do 20 - 5 << k << 20
i - zalecane wielkości przedziału : 1,2,3,5,10,20,30,50,100
* dobrze jeżeli długość przedziału jest liczbą nieparzysta, ponieważ ułatwia obliczenie środku przedziłu
i = 49 / 10 = 4,9 = 5