Grażyna Adamczyk-Łojewska
Wykład 6. Zarys metodologii badań nauk.
Metody ilościowe w badaniach naukowych
Cel badań ilościowych
Skale pomiaru i typy wielkości ekonomicznych
Typy badań ze względu na zakres
pełne
niepełne - tzw. reprezentatywne
wtórne
pierwotne- różne metody
Ogólna charakterystyka badań i pytań ankietowych
Procedura badań reprezentatywnych i podstawowe pojęcia (populacja generalna, próba, czynniki określające reprezentatywność, operat losowania, panel)
Metody wyodrębniania próby
Błędy w tego typu badaniach
1. Badania w naukach ekonomicznych mają w dużej części charakter empiryczny, tj. polegają na zbieraniu faktograficznego materiału badawczego, w tym liczbowego, który po analizie służy do formułowania uogólnionych - syntetycznych wniosków oraz weryfikacji wcześniej założonych hipotez.
Analiza materiału badawczego, przy wykorzystaniu metod statystycznych i ekonometrycznych, w tym zestawień tabelarycznych i wykresów, służy do:
syntetycznej (zbiorczej, zagregowanej) charakterystyki badanego zjawiska, opisu i prezentacji danych.
wykrywania i mierzenia zależności - formułowania wniosków
2. W pomiarach ekonomicznych mogą być stosowane różne skale
Charakteryzować zjawiska mogą nie tylko liczby, ale także symbole literowe i słowne, które wyrażają oceny zdarzenia, np. w odpowiedziach tak- nie, oceny pozytywne i negatywne itp.
Rozróżnia się tzw. skale:
Nominalne, które pozwalają na numerowanie jednostek lub wyróżnionych grup, dla ułatwienia ale nie ich szeregowania (porządkowania):
Mogą być liczbowe: 1, 2, 3... lub literowe A, B, C ...
Np. miesiące, kwartały , klasy
skale porządkowe
rangowe, np. w rolnictwie klasy bonitacyjne gleb itp.
skale słowne - czasem b. dokładne, np. przy ocenach towarów czy zjawisk (wysoko użyteczne, średnio użyteczne)
skale przedziałowe - ustala się przedziały intensywności jakiejś cechy, (można je dodawać i odejmować, ale nie mnożyć), np. temperatura w stopniach Celsjusza
skale ilorazowe, np. temperatura w stopniach Kelvina - można na nich wykorzystywać wszystkie działania
W tego typu analizach mamy również do czynienia z różnymi typami wielkości ekonomicznych, charakteryzującymi mierzalne cechy:
wielkościami zasobowymi i strumieniowymi
wielkościami realnymi i nominalnymi
mierzonymi w cenach bieżących i stałych
wielkościami bezwzględnymi i względnymi, tj. relacjami
3. Badania, które umożliwiają zastosowanie metod ilościowych, mogą być:
pełne, gdy obejmujemy badaniem całą badaną zbiorowość, np. gdy mamy pełny materiał statystyczny, np. GUS, ze sprawozdań badanych przedsiębiorstw danej grupy itp.
niepełne - tzw. reprezentatywne
Badania niepełne - tzw. reprezentatywne
mogą to być badania wtórne, np. też GUS-wskie dotyczące badania gospodarstw domowych, BAEL itp.,
lub badania pierwotne, które z uwagi na pracochłonność i koszty mają z reguły charakter niepełny; mogą to być badania typu, np.:
obserwacji kontrolowanej przy pomocy karty obserwacji (por. wykł.4)
wywiadu skategoryzowanego przy wykorzystaniu kwestionariusza (por. wykł.4)
czy badania ankietowego
4. Badanie ankietowe
Ankieta, w odróżnieniu od wywiadu skategoryzowanego (z kwestionariuszem), jest anonimowa - polega na ogół na rozdawaniu respondentom kwestionariuszy z pytaniami
Nazwa ankieta jest jednak wieloznaczna. Pojęcie to używane jest w socjologii na określenie narzędzia badawczego, które wypełnia z reguły sam badany lub w jego imieniu tzw. „ankieter”. W innym znaczeniu ankietą określany jest kwestionariusz, formularz z zestawem pytań do badanego, na które udziela on pisemnej odpowiedzi.
Wyróżnia się różne techniki ankietowe m.in. jest to:
ankieta bezpośrednia
środowiskowa
audytoryjna - przy okazjach
prasowa
opakowaniowa
pocztowa, radiowa (zwrot pocztą)
internetowa, telefoniczna,
panelowa, stale ten sam panel respondentów
Ankiety (mimo, że zawierają pytania o różnym charakterze), są stosowane przede wszystkim w metodach ilościowych
Rodzaje pytań ankietowych w zależności od różnych kryteriów dzieli się na:
Ze względu na formę i rodzaj odpowiedzi (kryterium techniczne):
pytania zamknięte,
półotwarte
lub otwarte,
Ze względu na cel pytania: wprowadzające; o opinię; o fakty; o wiedzę; o źródło informacji; o motywy; o sugestie; uzupełniające.
Ze względu na funkcję pytania: metryczkowe; filtrujące; dotyczące badanej problematyki; wykluczające się; sprawdzające; podchwytliwe
Pytania otwarte umożliwiają respondentowi na samodzielne formułowanie odpowiedzi, nie narzucają wariantów odpowiedzi i dają możliwość poruszania różnych aspektów.
Pytania zamknięte zawierają pytanie i możliwe warianty odpowiedzi (przemyślane wcześniej przez badającego- tak aby wyczerpywały wszystkie możliwe rozwiązania).
Odmianą pytań zamkniętych są pytania:
alternatywne (dychotomiczne), dwie odpowiedzi - TAK, NIE; dobrze, źle;
dysjunktywne - wykluczające się, spośród więcej niż 2 odpowiedzi wybiera jedną
kafeteryjne - wybiera ile chce (suma odpowiedzi różna od liczby ankietowanych)
Pytania półotwarte - zawierają najczęściej warianty odpowiedzi oraz dodatkowo możliwość dodania własnych wariantów i opisu przez ankietowanego (inne warianty, np. przyczyny)
Pytania metryczkowe dotyczą cech respondenta (demograficzne - płeć, grupa wiekowa, społeczno-ekonomiczne - zawód, grupa dochodowa itp.
Pytania filtrujące są zadawane aby wydzielić grupy respondentów, których nie dotyczy jakiś zakres pytać lub w ogóle cała ankieta
Pytania kontrolne, mają na celu stwierdzenie wiarygodności respondenta. Pytamy o tą samą sprawę ale w innej formie
Pytania gdzie wymagane jest podanie oceny w określonej skali ocen (np. 1-5)
Pytania powinny być:
w miarę krótkie, przejrzyste i zrozumiałe
dotyczyć jednej rzeczy, problemu
zawierać powszechnie znane słowa
nie zawierać sugerujących odpowiedzi
kolejność: od ogólnych prostych do bardziej szczegółowych
5. W badaniach reprezentatywnych musimy najpierw:
określić tzw. populację generalną, tj. całą badaną zbiorowość, pod względem czasowym i przestrzennym.
ustalić cechy zbiorowości generalnej, które chcemy badać - informacje na jakich nam zależy
wyodrębnić z populacji generalnej populację próbną - tzw. próbę ,
Reprezentatywność próby zależy od:
stopnia zróżnicowania zbiorowości generalnej, im bardziej zróżnicowana zbiorowość generalna tym większa powinna być próba,
wielkości próby - im większa próba tym wyższa precyzja informacji, tj. mniejszy dopuszczalny błąd szacunkowy (przedział ufności)
metody doboru próby, m.in. od:
zachowania w próbie relacji zbliżonych jak w zbiorowości generalnej,
a niekiedy także odpowiedniego doboru czasu przeprowadzenia badania,
a także właściwego wyboru operatu losowania
Operat losowania - jest to wykaz jednostek do losowania (np. rejestr domów, miejscowości, nr PESEL REGON itp.. Problemem jest często zdobycie takiego operatu danych.
Panel - stała reprezentacja populacji generalnej wybrana do wielokrotnych badań powtarzanych w regularnych odstępach czasu, zwykle o tym samym przedmiotowym programie badań. Panel to również forma badań ciągłych oparta na stałej próbie.
6. Są dwie główne metody wyodrębniania próby :
metody losowe, gdzie tzw. „sierotka” wyciąga n-ry lub funkcja ”Los” w arkuszu kalkulacyjnym Excel
metody doboru nielosowego
Od. b) Metody doboru nielosowego to:
prosty dobór nielosowy (przypadkowy) - występują tu na ogół podświadome tendencje do wybierania jednostek odpowiadających badaczowi i pomijania innych.
metody doboru celowego - polegają na doborze jednostek spełniających określone kryteria, np. typowych dla danej zbiorowości, albo tylko określonych, np. rodzin wielodzietnych itp.
- odmianą doboru celowego jest dobór kwotowy - populacja generalna dzielona jest na warstwy i dla każdej ustala się kwotę jednostek badanych
Możliwy jest tu wprawdzie dobór reprezentatywny, wskazuje się jednak, że zgodność próby pod względem rozkładu wybranych cech kontrolnych nie zapewnia zgodności w zakresie innych cech.
Stąd przyjmuje się, że metody nielosowe nie zapewniają reprezentatywności.
Od. a) Schematy doboru losowego próby to:
prosty dobór losowy
niezależny - prawdopodobieństwo ciągnienia w kolejnych losowaniach nie zmienia się,
zależny - prawdopodobieństw to zmienia się, bo wyciągnięte losy nie są zwracane - jak w TOTOLOTKU;
systematyczny - określamy jaki odsetek populacji chcemy badać, losujemy pierwszy element, a następne ustalenia się co który element wybieramy (co 5, 15 itp.) Wygodna metoda w użycie, konieczne jest jednak uporządkowanie zbiorowości. Wadą może być mała odporność na cykliczność w uporządkowaniu, że stale, czy bardzo często będziemy trafiać na określony ten sam typ obiektu, który się będzie stale powtarzać.
warstwowy
dzielimy populację na warstwy pod względem określonej cechy (podział musi być rozłączny i wyczerpujący), a następnie pobieramy próby proporcjonalnie do udziału warstwy w całej populacji,
lub dodatkowo uwzględniamy jeszcze zróżnicowanie w ramach warstwy, tj. tzw. losowanie warstwowe optymalne.
Losowanie warstwowe jest efektywniejsze od losowania prostego.
Zespołowy (grupowy) - nie losuje się jednostek ale niejednorodne grupy jednostek (np. jednostki przestrzenne, wsie.
Może być to losowanie jednostopniowe lub dwustopniowe.
Np. przy badaniu dochodu rolniczego - nie losuje się gospodarstw z całego województwa, ale wsie, w których bada się wylosowanych rolników lub wszystkich.
Jest tu mniejsza precyzja niż w poprzedniej metodzie. Często jednak stosowana, zwłaszcza w dużych badaniach GUS, ze względu na mniejsze koszty.
7. Błędy w tego typu badaniach, w tym interpretacyjne:
Uogólnianie wniosków na całą zbiorowość w oparciu o próbę dobraną celowo. Tego typu wnioskowanie jest uprawnione tylko przy doborze losowym próby.
Omawiając wyniki trzeba tu co najmniej zaznaczyć, że był to dobór celowy i na jakich zasadach przeprowadzony.
Niewłaściwy operat losowania w danym problemie, np. PESEL nie jest dobrym operatem w badaniach gospodarstw domowych, bo jest różne prawdopodobieństwo wyboru różnych gospodarstw do próby. Większe prawdopodobieństwo wyboru mają gospodarstwa liczniejsze.
3) Mogą się mianowicie zdarzyć tzw. pozorne zależności między badanymi zjawiskami - przypadkowe zależności.
Zdarza się to wbrew pozorom dosyć często. Stąd potrzeba powtarzania badań po pewnym czasie, czy w innych populacjach. W pewnym czasie stwierdzono ujemną korelację m. liczbą dzieci w rodzinie i posiadaniem samochodu. Sformułowano tezę dziecko albo samochód. Później na innych danych zależność ta okazała się nieprawdziwa.
4) Swoistym przypadkiem tego błędu jest tzw. błąd ekologiczny, gdy zależności badane na poziomie bardziej zagregowanym są znacznie silniejsze niż badane na poziomie indywidualnym.
Niewłaściwa definicja jednostki statystycznej, np. regon, województwo wyprodukowało tyle i tyle - jest to jednostka przestrzenna nie produkuje i nie konsumuje, tylko podmioty z tej jednostki
Niewłaściwie zastosowana metoda - np. dodatnie zależności na podstawie szeregów czasowych, najpierw trzeba wyodrębnić trend.
Niespełnienie założeń (procedury) istotnej dla danej metody - może skutkować istotnymi błędami, np. w analizie wariancji sprawdzenie czy rozkład ma charakter normalny.
Klasyczne miary opisu, takie jak średnia arytmetyczna czy odchylenie standardowe, mogą tracić sens poznawczy np. w badaniu tzw. SP3 (tj. przedsiębiorstw zatrudniających do 9 osób), w przypadku których to podmiotów 70% - to podmioty jednoosobowe. Bardziej właściwa jest tu mediana.
Badając na poziomie zagregowanym, np. regionu, sekcji, można otrzymać bardziej jednorodny rozkład. Można tu stosować tzw. „metody odporne” lub inaczej interpretować. Np. zróżnicowanie PKB per capita w układzie 49 małych województw większe niż 16 dużych - pamiętać o nieporównywalności, ze względu na zjawisko uśredniania danych w ramach dużych agregatów.
W tego typu badaniach i analizach należy pamiętać o pewnych zasadach:
np. przy badaniu korelacji, że im większa liczba obserwacji (zmiennych w szeregu), tym mniejsza wartość współczynnika korelacji pozwala uznać zależność za istotną statystycznie, co nie znaczy silną. Np. przy 100 obserwacjach i poziomie istotności 0,05 korelacja między dwiema cechami jest już istotna statystycznie na poziomie >=ok. 0,2 - choć będzie to zależność stosunkowo słaba.
Wartość współczynnika korelacji na ogół wzrasta przy przechodzeniu od danych indywidualnych do bardziej zagregowanych;
Przy agregowaniu danych z jednostek terytorialnych zasadne jest uwzględnianie różnic w wielości tych jednostek, np. przy pomocy tzw. regresji ważonej.
4