25.02.10
WYKAAD 1. WPROWADZENIE DO PRZEDMIOTU.
1. POCZTKI STATYSTYKI, PODSTAWY METODOLOGICZNE:
- Termin statystyka pochodzi od łacioskiego słowa status, czyli paostwo. Pierwotnie oznaczał zbiór
szeroko ujmowanych wiadomości o paostwie (G.Achenwall, 1719 1772).
- Wyniki opisu liczbowego zwykle ujmowano w postaci zestawieo tabelarycznych, które służyły
głównie administracji paostwowej.
- Pierwsze tablice:
·ð Tablica dotyczÄ…ca Rosji z okresu 1726 1727 (J.K. KirgiÅ‚ow),
·ð Tablica dotyczÄ…ca Danii w 1741 r. (Anchersen).
Okres ten można nazwad tabelaryzmem, a przedstawicieli tabelarystami.
- Rozwój statystyki jako nauki wiąże się z działalnością badawczą, tzw. arytmetyków politycznych *J.
Graunt (1620 1674), W. Petty (1623 1687)].
- PodstawÄ™ teoretycznÄ… nowoczesnej statystyki stanowi teoria rachunku prawdopodobieostwa
(początek II poł. XVII w.):
·ð B. Pascal (1623 1662), P. Fernat (1601 1665),
·ð J. Bernouli (1654 1705),
·ð P.S. de Laplace (1749 1835),
·ð K.F. Gaus (1777 1835),
·ð Questele (1796 1874).
- W wyniku dalszego rozwoju statystyki na początku XX w. ukształtowała się metoda
reprezentacyjnych badao statystycznych.
2. PRÓBA DEFINICJI.
W ujęciu szerszym termin statystyka oznacza naukę społeczną, która bada ilościową
stronę zjawisk masowych oraz formułuje prawidłowości rozwoju tych zjawisk.
W węższym ujęciu pojęcie statystyka oznacza zbiór informacji dotyczących zjawisk
gospodarczych, społecznych, przyrodniczych, itp.
3. PRZEDMIOT I ZAKRES BADAO.
Przedmiotem badao statystycznych są zbiorowości osób, rzeczy lub zjawisk. Określenie
przedmiotu i zakresu badao statystycznych polega więc na dokładnym ustaleniu zbiorowości,
jednostki statystycznej oraz cech statystycznych.
4. STATYSTYKA OPISOWA A STATYSTYKA MATEMATYCZNA.
·ð STATYSTYKA OPISOWA obejmuje nastÄ™pujÄ…ce zagadnienia:
1) Badanie zbiorowości ze względu na jedną cechę, np. określenie poziomu średniego
zróżnicowania, asymetrii, rozkładu, konwersacji.
2) Badanie zależności zjawisk masowych, tj.:
- Badanie zbiorowości ze względu na dwie cechy jednocześnie, np. stad pracy i wydajnośd,
kwalifikacje i zarobki, sprzedaż i wydatki na reklamę, wielkośd produkcji i liczba braków.
3) Badanie dynamiki zjawisk masowych, tzn.:
- Badanie przebiegu zjawisk w czasie.
·ð STATYSTYKA MATEMATYCZNA obejmuje nastÄ™pujÄ…ce zagadnienia:
1) W zakresie struktury zjawisk masowych wnioskowanie statystyczne z podziałem na:
- estymację parametrów populacji,
- weryfikację hipotez statystycznych dotyczących parametrów oraz rozkładów cech (zmiennych).
1
2) W zakresie zależności zjawisk masowych wnioskowanie dotyczące:
- korelacji,
- regresji.
3) W zakresie dynamiki zjawisk masowych wnioskowanie statystyczne obejmuje mianem
PROGNOZOWANIA.
5. ETAPY BADANIA STATYSTYCZNEGO:
1) Przygotowanie badania statystycznego:
·ð OkreÅ›lenie celów badania statystycznego:
- cele ogólne,
- szczegółowe hipotezy robocze,
·ð OkreÅ›lenie przedmiotów badania:
- definicja ZBIOROWOŚCI STATYSTYCZNEJ (zbiorowośd statystyczna pewna, zwykle duża, liczba
jednostek osób, rzeczy lub zjawisk posiadających jedną lub kilka cech stałych wspólnych oraz
wiele cech zmiennych, których warianty różnią poszczególne jednostki wchodzące w skład
zbiorowości statystycznej. Kryteria podziału zbiorowości społecznej skooczenie i nieskooczenie
liczne, statyczne i dynamiczne, proste i złożone, jednorodne i niejednorodne) i JEDNOSTKI
STATYSTYCZNEJ (jednostka statystyczna pojedynczy element (osoba, przedmiot, itp.) zbiorowości
statystycznej mający takie same cechy stałe tak, jak wszystkie jednostki zbiorowości statystycznej).
·ð OkreÅ›lenie zakresu badania:
- podstawą określenia zakresu badania statystycznego jest określenie CECH STATYSTYCZNYCH.
CECHY STATYSTYCZNE (właściwości, których odmiany lub wartości (natężenie) wyróżnia jednostki
wchodzące w skład zbiorowości statystycznej).
STAAE ZMIENNE (sÄ… przedmiotem badania)
Określają jednostki Ich wartości lub odmiany różnicują poszczególne jednostki.
pod względem ILOŚCIOWE (wzrost, waga, itp. JAKOŚCIOWE
rzeczowym,
skokowe ciągłe quasi ilościowe nominalne
czasowym i
(porzÄ…dkowe) (mierzone na skali
przestrzennym.
dwudzielnej płed
lub wielodzielnej
wykształcenie)
·ð Wybór metod badania statystycznego:
METODY BADANIA STATYSTYCZNEGO
BADANIE PEANE BADANIE CZÅšCIOWE SZACUNKI
- ciągłe np. ewidencja - ciągłe np. badania budżetów - interpolacyjne,
urodzeo, domowych przez GUS, - ekstrapolacyjne.
- dorazne np. straty - dorazne,
spowodowane wypadkiem, - okresowe:
- okresowe np. spis ludności,
·ð Ankietowe,
spis rolny, inwentaryzacja.
·ð Reprezentacyjne,
·ð Monograficzne.
·ð Wybór metod (technik) obserwacji statystycznej (gromadzenie danych):
- spisy,
- rejestracja bieżąca i sprawozdawczośd,
- inne sposoby.
2) Obserwacja statystyczna:
·ð Kontrola zebranego materiaÅ‚u statystycznego:
- formalna (ilościowa),
2
- merytoryczna (jakościowa).
·ð PorzÄ…dkowanie i grupowanie materiaÅ‚u statystycznego:
- typologiczne w oparciu o cechę jakościową,
- wariancyjne w oparciu o cechę ilościową.
·ð Zliczanie danych statystycznych.
3) Prezentacja MATERIAAU STATYSTYCZNEGO (PIERWOTNY zbieramy informacje do
konkretnego badania, WTÓRNY korzystamy z informacji już zebranych):
·ð Budowa szeregów statystycznych:
- szczegółowe materiał statystyczny uporządkowany według wariantów jednej cechy,
- rozdzielcze,
- kumulacyjne szereg, który powstaje w drodze dodawania kolejnych, cząstkowych liczebności.
·ð Budowa tablic statystycznych:
- proste szereg rozdzielczy (dwie kolumny, warianty i odpowiadające im liczebności),
- złożone zjawisko prezentowane ze względu na dwie cechy X i Y w jednej tablicy przedstawiony
jest rozkład zbiorowości ze względu na te cechy,
- robocze pogrupowany materiał statystyczny,
- wynikowe możliwośd wnioskowania z przygotowanej tablicy.
·ð Budowa wykresów statystycznych:
- powierzchniowe dzięki nim można scharakteryzowad strukturę zbiorowości ze względu na jakąś
cechÄ™,
- punktowe,
- liniowe,
- histogramy,
- pasmowe,
- bryłowe,
- kartogramy,
- kombinowane,
- specjalne.
4) Analiza:
·ð Analiza struktury zbiorowoÅ›ci,
·ð Analiza współzależnoÅ›ci cech,
·ð Analiza dynamiki zbiorowoÅ›ci lub zjawisk.
PRZYKAAD 1.
Wychowanków pewnego Domu Dziecka uciekających z ośrodka zbadano pod względem przyczyn
ucieczek. Wśród przyczyn ucieczek wyodrębniono następujące: presja grupy (18), trudności
adaptacyjne (10), tęsknota za domem (6), włóczęgostwo (4), strach przed karą (2).
Ustalenie wariantów badanej cechy i przyporządkowanie ich uciekającym pozwala na
dokonanie grupowania typologicznego i jednocześnie otrzymanie szeregu statystycznego postaci:
Przyczyny ucieczek Liczba wychowanków
presja grupy 18
trudności adaptacyjne 10
tęsknota za domem 6
włóczęgostwo 4
strach przed karÄ… 2
3
PRZYKAAD 2.
Grupę studentów (122 osoby) zapytano o czas, jaki w ostatnim tygodniu poświęcili na naukę w
bibliotece. 28 studentów odpowiedziało, że nie więcej niż 3 godziny, 42 w granicach: (3,6] godzin,
30 między (6,9+ godzin, 15 powyżej 9, ale nie więcej niż 12 godzin, natomiast 7 osób
poinformowało, że (12,15+ godzin. Informacje te pozwalają na dokonanie grupowania wariancyjnego
i utworzenie szeregu rozdzielczego przedziałowego, tj.
Liczba studentów Czas poświęcony na naukę
28 0-3
42 3-6
30 6-9
15 9-12
9 12-15
4
4.03.10
WYKAAD 2. ROZKAADY EMPIRYCZNE.
1) Pojęcie rozkładu empirycznego (EGZAMIN).
2) Częstośd i dystrybuanta empiryczna.
3) Podstawowe typy rozkładów empirycznych.
4) Badanie własności rozkładów empirycznych.
Rozkłady teoretyczne zmiennych (EGZAMIN) wymienid.
OPIS STATYSTYCZNY (rozważmy cechę X):
Poszczególne warianty cechy X: x1, x2, & , xN
Gdzie:
ROZKAADEM EMPIRYCZNYM cechy nazywamy przyporządkowanie kolejnym wartościom tej cechy
odpowiadających im liczebności lub częstości.
DYSTRYBUANT EMPIRYCZN nazywamy przyporządkowanie kolejnym wartościom tej cechy
odpowiadających im liczebności (częstości) skumulowanych.
Empiryczny rozkład cechy można przedstawid na wykresie otrzymując, tzw. KRZYW LICZEBNOŚCI.
KRZYWA LICZEBNOŚCI jest to linia łącząca punkty o współrzędnych: (xi, ni).
RODZAJE ROZKAADÓW EMPIRYCZNYCH:
·ð Symetryczne i asymetryczne,
·ð Jednomodalne, bimodalne (dwa wierzchoÅ‚ki), wielomodalne (kilka wierzchoÅ‚ków),
·ð SpÅ‚aszczone i wysmukÅ‚e.
Graficzna ilustracja zjawiska asymetrii.
5
Graficzna ilustracja zjawiska koncentracji (kurtozy).
ANALIZA STRUKTURY ZJAWISK MASOWYCH.
·ð Ogólna charakterystyka struktury zjawisk masowych.
Wskazniki struktury i natężenia, tendencja centralna w zakresie kształtowania się wartości zjawiska,
zróżnicowanie wartości, asymetria rozkładu, koncentracja.
EGZAMIN zagadnienia omawiane w analizie struktury zjawisk masowych.
11.03.10
WYKAAD 3. MIARY TENDENCJI CENTRALNEJ.
1) Istota tendencji centralnej.
2) Miary klasyczne.
3) Miary pozycyjne.
4) Wnioski.
TENDENCJA CENTRALNA wzrastanie liczebności w miarę, gdy maleją odległości pomiędzy
konkretnymi wartościami zmiennej, a wartością środkową.
ŚREDNIA ARYTMETYCZNA wartośd przeciętna.
Gdzie:
określona wartośd zmiennej X,
N liczba jednostek w badanej zbiorowości.
Gdzie:
k liczba klas, na które podzielono zbiorowośd.
liczebności.
WAASNOÅšCI ÅšREDNIEJ ARYTMETYCZNEJ:
1) Jako miara klasyczna jest wypadkową wszystkich wartości zmiennej i spełnia nierównośd:
2) Suma odchyleo poszczególnych wartości zmiennej od średniej arytmetycznej jest równa zeru,
tj.:
6
3) Jeżeli wszystkie wartości zmiennej powiększymy (pomniejszymy, podzielimy lub pomnożymy)
o pewną stałą, to średnia arytmetyczna będzie równa sumie (różnicy, ilorazowi, iloczynowi)
średniej arytmetycznej wyjściowych wartości i tej stałej.
4) Jeżeli liczebności poszczególnych wariantów cechy są jednakowe, to średnią arytmetyczną
można obliczyd jako iloraz sumy wartości wariantów i ich liczby.
5) Suma wartości zmiennej jest równa iloczynowi średniej arytmetycznej i liczebności
zbiorowości, tj.:
6) Na poziom średniej arytmetycznej silny wpływ wywierają wartości skrajne. Jeśli występują
one w szeregu i odbiegają od całej reszty to średnia ważona nie będzie przedstawiała
poziomu przeciętnego zjawiska.
ÅšREDNIE POZYCYJNE:
·ð DOMINANTA wartoÅ›d najliczniej reprezentowana w zbiorowoÅ›ci statystycznej,
Gdzie:
11.03.10
·ð Kwartyle (Q1,Q2, Q3) takie wartoÅ›ci zmiennej w rozkÅ‚adzie empirycznym, które dzielÄ…
zbiorowośd na cztery części.
Pozycję kwartyla w szeregu można wyznaczyd według wzoru:
Musimy mied przynajmniej uporządkowany materiał, aby wyznaczyd kwartyle.
KWARTYL PIERWSZY wartośd zmiennej w rozkładzie empirycznym, poniżej której znajduje się 25%
jednostek badanej zbiorowości.
7
KWARTYL DRUGI (mediana) środkowa wartośd cechy, dzieląca zbiorowośd na dwie równe liczebnie
części: częśd wartości mniejszych lub równych medianie oraz częśd wartości większych lub równych
medianie.
KWARTYL TRZECI wartośd zmiennej w rozkładzie empirycznym, poniżej której znajduje się 75%
jednostek badanej zbiorowości.
Wnioski:
1) Mówienie o tendencji centralnej jest uzasadnione w sytuacjach rozkładów symetrycznych
oraz zbliżonych do symetrycznych.
2) Istnieją różne miary tendencji centralnej, mniej lub bardziej odporne na własności rozkładu.
3) Stosowanie odpowiednich miar wymaga spełnienia określonych warunków.
4) Niespełnienie jednych warunków powoduje utratę wartości poznawczej obliczonych miar,
innych zaś uniemożliwia nawet ich obliczenie.
WYKAAD 4. MIARY ZRÓŻNICOWANIA.
1. Do miar zróżnicowania (dyspersji/rozproszenia) należą:
1) OBSZAR ZMIENNOŚCI (tzw. rozstęp) jest to różnica między największą a najmniejszą
wartością zmiennej. Obszar zmienności wyraża się wzorem:
Jest on miarą mało dokładną, uzależnioną w dużym stopniu od wielkości skrajnych. Ograniczenia
stosowania tej miary są następujące:
·ð RozstÄ™pu nie można obliczyd dla szeregów nieskooczonych, a w przypadku przedziaÅ‚owych
szeregów rozdzielczych, gdy klasy są otwarte.
·ð Nie należy porównywad rozproszenia badanej cechy w szeregach o istotnie różnych
liczebnościach oraz, gdy badana cecha mierzona jest w różnych jednostkach miary.
2) ODCHYLENIE DWIARTKOWE wyraża się wzorem:
i mierzy przeciÄ™tnÄ… różnicÄ™ miÄ™dzy wartoÅ›ciÄ… badanej cechy a wartoÅ›ciÄ… Å›rodkowÄ…. Jest to ½ obszaru
zmienności 50% środkowych jednostek zbiorowości, mierzy więc rozstęp pokryty przez połowę
wszystkich obserwacji. Dzięki wyeliminowaniu wpływu na tę miarę zmienności wartości skrajnych (z I
i II dwiartki), odchylenie dwiartkowe jest bardziej precyzyjną miarą niż obszar zmienności.
3) ODCHYLENIE PRZECITNE oblicza się według wzoru:
lub według wzorów:
8
EGZAMIN Ocenid przeciętne zróżnicowanie cechy w zbiorowości.
Jest to średnia arytmetyczna z bezwzględnych wartości odchyleo zmiennej od średniej arytmetycznej.
Interpretacja: odpowiada na pytanie, ile przeciętnie różnią się wartości badanej cechy od wartości
średniej.
4) WARIANCJA I ODCHYLENIE STANDARDOWE.
Średnia arytmetyczna kwadratów odchyleo poszczególnych wartości zmiennej od średniej
arytmetycznej nazywa siÄ™ WARIANCJ tej zmiennej.
Pierwiastek z wariancji zaÅ› nazywa siÄ™ ODCHYLENIEM STANDARDOWYM.
Wzory pozwalające na obliczenie wartości wariancji są następujące:
Zatem odchylenie standardowe, np. z szeregu rozdzielczego przedziałowego obliczymy według
wzoru:
Interpretacja: Podobnie jak odchylenie przeciętne, odchylenie standardowe określa przeciętną
różnicę pomiędzy wartościami poszczególnych jednostek zbiorowości a wartością średnią.
RÓWNOŚD WARIANCYJNA.
Wzór na EGZAMIN!!
Gdzie:
5) WSPÓACZYNNIKI ZMIENNOŚCI są względnymi miarami zróżnicowania. Stosowane są do
oceny zróżnicowania, a także do porównao, gdy badane zjawisko mierzone jest w różnych
jednostkach miary lub kształtuje się na niejednakowym poziomie przeciętnym. W zależności
od zastosowanej miary bezwzględnej zróżnicowania stosuje się odpowiednie współczynniki
zmienności, tj.:
Interpretacja: współczynniki zmienności informują o względnym zróżnicowaniu zbiorowości ze
względu na badaną cechę. Informują zatem jaki jest udział przeciętnego zróżnicowania w wartości
przeciętnej.
18.03.10
WYKAAD 5. MIARY ASYMETRII.
9
Asymetria rozkładu cechy (zmiennej) oznacza przewagę pewnej grupy jednostek w badanej
zbiorowości. Jeśli przeważają jednostki, których wartości przewyższają poziom średni, to mamy do
czynienia z asymetrią lewostronną (ujemną). W sytuacji odwrotnej, tj. gdy przeważają jednostki,
których wartości są niższe od średniej, to taką asymetrię określa się mianem prawostronnej
(dodatniej), np. płace.
Wystąpienie asymetrii rozkładu powoduje określone konsekwencje. W szeregu o skłonności
prawostronnej wartości skrajne położone są z prawej strony średniej. Powoduje to przesunięcie
średniej arytmetycznej w kierunku prawym w stosunku do dominanty i mediany
Odwrotnie jest w przypadku skłonności lewostronnej W rozkładach
symetrycznych
Wniosek: w celu wykrycia i określenia charakteru asymetrii można posłużyd się różnicą pomiędzy
wspomnianymi miarami przeciętnymi.
Najczęściej stosowane miary asymetrii wyrażają się wzorami:
Są to miary bezwzględne, zatem nieprzydatne do porównao i oceny skali zjawiska asymetrii.
Względnymi miarami asymetrii są, tzw. WSPÓACZYNNIKI SKOŚNOŚCI:
Innym sposobem badania asymetrii jest tzw. moment trzeci centralny.
Określenie: dowolnym r-tym momentem rozkładu nazywamy średnią arytmetyczną z odchyleo
poszczególnych wartości zmiennej X od dowolnej liczby q podniesionych r-tej potęgi.
Ogólnie:
Gdy q=0, to otrzymuje się momenty zwykłe
Gdy , to otrzymuje siÄ™ momenty centralne
Do badania asymetrii wykorzystuje siÄ™ moment trzeci centralny:
10
Względną miarą asymetrii jest w tym wypadku moment trzeci centralny wyrażony w jednostkach
odchylenia standardowego:
Miara ta może posłużyd do oceny stopnia (asymetrii) skośności danego rozkładu oraz do
porównao skłonności różnych rozkładów.
WYKAAD 6. MIARY KONCENTRACJI.
1) Koncentracja zbiorowości wokół średniej kurtoza.
Chodzi tu o badanie stopnia skupiania się wartości badanej cechy wokół wartości średniej.
Według tego kryterium wyróżnia się rozkłady wysmukłe i spłaszczone. Podstawą określenia badanego
rozkładu jako smukłego lub też spłaszczonego jest porównanie go z rozkładem normalnym.
Bezwzględną miarą kurtozy jest czwarty moment centralny, tj.:
Odpowiednio, względną miarą współczynnika koncentracji wyrażony wzorem:
2) Nierównomierny rozkład zjawiska w zbiorowości utożsamia się z koncentracją rozkładu jednostek
zbiorowości ( ) z rozkładem cząstkowych wartości ( ). Im większy jest stopieo odmienności
tych rozkładów, tym silniejsza jest koncentracja.
Krzywa Lorentza w badaniu koncentracji. Etapy postępowania:
üð Obliczenie udziałów liczebnoÅ›ci czÄ…stkowych w ogólnej liczbie jednostek zbiorowoÅ›ci:
oraz udziałów wartości cząstkowych w ogólnej sumie wartości zmiennej X, tj.:
üð Obliczenie wielkoÅ›ci skumulowanych:
üð SporzÄ…dzenie wykresu Lorentza.
W kwadracie o boku jeden wykreśla się krzywą o współrzędnych ( , ). Dla = otrzymuje się
tzw. linię równomiernego rozkładu. Jest to przekątna kwadratu. Odpowiada ona sytuacji całkowitego
braku koncentracji.
11
Wniosek: im bardziej od przekÄ…tnej odchyla siÄ™ wyznaczona krzywa, ty, silniejsza jest koncentracja.
Zmierzenie siły koncentracji.
Wykorzystuje się stosunek powierzchni zawartej między krzywą koncentracji, a linią
równomiernego rozkładu od ogólnej powierzchni trójkąta. Otrzymuje się:
Metoda prostokątów w wyznaczeniu współczynnika K. Długośd podstawy prostokąta wynosi wi,
wysokośd wyznacza wzór:
Zatem:
Uwaga:
25.03.10
WYKAAD 7. ANALIZA WSPÓAZALEŻNOŚCI ZJAWISK.
EGZAMIN: Wymienid i scharakteryzowad jedną rzecz z tego zakresu (zagadnienia, które wchodzą w
skład analizy współzależności ze względu na daną cechę). Istota asymetrii, podanie empirycznego
przykładu rozkładu o asymetrii np. prawo/lewostronnie, a w szczególności rozkładu symetrycznego,
dwa rozumienia koncentracji.
1. Charakter związków w przypadku zjawisk ekonomiczno społecznych.
Pomiędzy logicznie powiązanymi cechami mogą zachodzid określone związki (np. związek między
wydajnością pracy a stażem pracy, związek między wynagrodzeniami a kwalifikacjami pracowników,
związek między wydatkami na żywnośd gospodarstwa domowego a liczbą członków rodziny, itp.).
Pytanie: Czy związki pomiędzy zjawiskami ekonomiczno społecznymi mają charakter związków
funkcyjnych?
Istota zależności funkcyjnej związki funkcyjne charakteryzujące się tym, że danej wartości zmiennej
niezależnej odpowiada jedna i tylko jedna wartośd zmiennej zależnej. Fakt ten można wyrazid w
postaci następującej formuły ogólnej: .
Zależności między zjawiskami ekonomiczno społecznymi nie podlegają takiemu schematowi opisu.
Mają one bardziej złożony charakter. Na zmienną zależną wpływa często wiele zmiennych
niezależnych, z różną siłą i w różnych kierunkach, przy czym w danym badaniu uwzględnia się tylko
12
niektóre spośród tych zmiennych niezależnych. Pojawia się potrzeba zdefiniowania tzw. zależności
stochastycznej.
ZALEŻNOŚD STOCHASTYCZN między X i Y można wyrazid w następującej postaci ogólnej:
Szczególnym przypadkiem zależności stochastycznej jest zależnośd korelacyjna.
ZALEŻNOŚD KORELACYJNA charakteryzuje się tym, że określonym wartościom cechy X odpowiadają
różniące się poziomami warunkowe średnie wartości cechy Y.
Wśród związków stochastycznych, w szczególności korelacyjnych, wyróżnia się:
·ð ZwiÄ…zki przyczynowo skutkowe charakteryzujÄ…:
- obiektywny charakter,
- siła sprawcza przyczyny w stosunku do skutku,
- asymetrycznośd to przyczyna wpływa na skutek, a nie odwrotnie;
- odstęp czasowy między przyczyną a skutkiem wcześniej musi zajśd przyczyna, żeby pózniej skutek
mógł się zrealizowad.
Zależności przyczynowo skutkowe mają charakter zależności jednostronnych
·ð ZwiÄ…zki symptomatyczne w ich przypadku zmienne nie sÄ… powiÄ…zane przyczynowo, ale
istnieją wspólne przyczyny kształtowania się obu zmiennych. Zależności mogą mied tutaj
charakter jednokierunkowy lub dwukierunkowy
·ð ZwiÄ…zki pozorne nie majÄ… podstaw teoretycznych i praktycznych istnienia jakiejkolwiek wiÄ™zi
przyczynowo skutkowej. SÄ… przejawem tzw. formalizmu statystycznego w badaniu
zależności.
Ze względu na kierunki zmian w wartościach cechy X i Y wyróżnia się korelację ujemną lub dodatnią.
KORELACJA UJEMNA wzrostom wartości cechy X towarzyszy stały spadek średniej wartości cechy Y
lub wzrostom wartości cechy Y towarzyszy stały spadek średniej wartości cechy X ( w wartościach
obu cech występują różnokierunkowe zmiany).
KORELACJA DODATNIA wzrostom wartości cechy X towarzyszy stały wzrost średniej wartości cechy
Y lub spadkowi wartości cechy X towarzyszy stały spadek średniej wartości cechy Y (W wartościach
obu cech występują jednokierunkowe zmiany).
Ze względu na zmiany wartości cechy X i związane z nimi zmiany w średniej wartości cechy Y (lub
odwrotnie) można mówid również o związkach liniowych i nieliniowych (krzywoliniowych).
ZWIZKI LINIOWE występują wówczas, gdy stałym przyrostom wartości cechy X odpowiadają
względnie stałe przyrosty lub spadki cechy Y (lub odwrotnie).
2. Metody badania zwiÄ…zku cech.
Metody badania zwiÄ…zku cech sÄ… zdeterminowane formÄ… prezentacji danych statystycznych
oraz rodzajami cech statystycznych.
Generalne metody badania związku cech opierają się albo na porównaniu szeregów
empirycznych, albo na analizie tablicy korelacyjnej.
Tabela.1 Metody pomiaru związku cech w zależności od rodzaju cech.
13
cecha zależna cecha niezależna
dane nominalne dane porządkowe dane przedziałowe lub
ilorazowe
dane nominalne współczynnik V współczynnik V
Cramera Cramera
dane porządkowe współczynnik V współczynniki korelacji
Cramera rang
dane przedziałowe lub współczynnik współczynnik współczynniki korelacji
ilorazowe Pearsona.
EGZAMIN jakie sÄ… kryteria wyboru metody badania zwiÄ…zku cech forma prezentacji danych,
mierzalnośd.
W zależności od walorów poznawczych stosowanych metod badania związku cech można mówid o:
üð Metodach umożliwiajÄ…cych wykrycie zależnoÅ›ci i okreÅ›lenie jej kierunku,
üð Metodach pozwalajÄ…cych okreÅ›lid siÅ‚Ä™ zwiÄ…zku,
üð Metodach pozwalajÄ…cych okreÅ›lid siÅ‚Ä™ i kierunek zwiÄ…zku.
1.04.10
W zależności od walorów poznawczych stosowanych metod badania związku cech można mówid o:
- metodach umożliwiających wykrycie zależności i określenie jej kierunku,
- metodach pozwalających określid siłę związku,
- metodach pozwalających określid siłę i kierunek związku.
ANALIZA TABLICY KORELACYJNEJ.
& .
&
&
&
& & & & &
&
&
k warianty x
l warianty y
Określenie 1.
Rozkładem warunkowym zmiennej X nazywamy rozkład, który tworzą jednostki posiadające kolejne
warianty zmiennej X i jeden ustalony wariant zmiennej Y .
Rozkładem warunkowym zmiennej Y nazywamy rozkład, który tworzą jednostki posiadające kolejne
warianty zmiennej Y i jeden ustalony wariant zmiennej X .
Określenie 2.
Rozkładem brzegowym zmiennej X nazywamy rozkład, który tworzą jednostki posiadające kolejne
warianty zmiennej X i odpowiadajÄ…ce im warianty zmiennej Y.
Rozkładem brzegowym zmiennej Y nazywamy rozkład, który tworzą jednostki posiadające kolejne
warianty zmiennej Y i odpowiadajÄ…ce im warianty zmiennej X.
Zachodzą następujące równości:
14
3. Charakterystyki opisowe rozkładów brzegowych i warunkowych parametry rozkładów.
Charakterystyki rozkładów brzegowych wyróżniają się następującymi wzorami:
Dla rozkładów warunkowych otrzymujemy:
Średnia i wariancja to najważniejsze parametry rozkładów!
Warunek stochastycznej niezależności Y od X:
Warunek stochastycznej niezależności X od Y:
15
Niezależnośd korelacyjna wymaga jedynie równości wartości średnich.
Wniosek:
Jeśli zachodzi
Oraz
To zmienne X i Y są stochastycznie zależne.
Podobnie jeżeli:
oraz to zmienne X i Y są korelacyjnie zależne.
4. Wykorzystanie tablicy korelacyjnej do badania zwiÄ…zku cech.
Gdyby badane cechy były niezależne, to liczebności wewnątrz tablicy powinny przyjmowad wartości
wyznaczone według wzoru:
liczebności teoretyczne
Im większa jest rozbieżnośd między rzeczywistymi liczebnościami a liczebnościami
teoretycznymi obliczonymi według przytoczonego wyżej wzoru, tym silniejsza jest zależnośd
badanych cech. Miarą rozbieżności jest statystyka , którą oblicza się według wzoru:
Dla tablicy przedstawiającej rozkład dwóch cech nominalnych dwudzielnych tj.:
schemat tablicy czterodzielnej:
1 2
1 a b a+b
2 c d c+d
a+c b+d n
otrzymuje się wzór następującej postaci:
Wartośd statystyki jest podstawą konstrukcji odpowiednich współczynników służących do badania
zwiÄ…zku cech.
WYKAAD 8. MIARY KORELACJI.
1. Pomiar korelacji w przypadku dwóch cech nominalnych.
Współczynnik zbieżności Czuprowa:
16
Warunki stosowania:
- zależnośd między zmiennymi ma charakter liniowy,
- dane sÄ… ujmowane w tablicy korelacyjnej,
- zmienne mogÄ… nie byd mierzalne sensu stricte.
Własności:
- mierzy siłę zależności,
- przyjmuje wartości z przedziału *0,1+,
- jest symetryczny.
Współczynnik Cramera:
Własności:
- przyjmuje wartości z przedziału *0,1+,
- może byd obliczany na podstawie dowolnej tablicy korelacyjnej (w odróżnieniu od kolejnego)
Współczynnik Yule a:
Własności:
- przyjmuje wartości z przedziału *-1,1],
- stosowany jest dla tablicy czterodzielnej.
Uwaga!
Wartośd 0 omawianego współczynnika oznacza, że cechy są niezależne 1 lub -1 , że istnieje
między nimi zależnośd funkcyjna. Jednak nie należy na podstawie współczynnika znaku wyciągad
wniosku o kierunku zależności. Znak współczynnika zależy tutaj od tego w jaki sposób zostały
uporządkowane warianty rozważanych cech. W tym wypadku interpretuje się jedynie wartośd
bezwzględną.
Współczynnik można też wyrazid wzorem:
8.04.10
WYKAAD 9.
17
Kraocowe wartości współczynnika zależą od uszeregowania liczebności w poszczególnych polach
tablicy korelacyjnej. Dlatego należy znalezd wartości oraz i skorygowad przy ich pomocy
wartośd wyliczoną według wzoru powyżej.
Współczynnik Cole a:
Współczynnik kontyngencji Pearsona:
Własności:
- przyjmuje wartości z przedziału *0,1+,
- wartośd 0 osiąga w przypadku niezależności cech,
- górna wartośd uzależniona jest od liczby wierszy i kolumn w tablicy korelacyjnej (im więcej jest
wierszy o kolumn, tym wartośd C jest większa).
Wniosek: wartośd współczynnika C należy rozpatrywad relatywnie do wartości maksymalnej.
Zatem:
Gdzie l liczba kolumn w tablicy kwadratowej
Lub:
Gdzie k, l odpowiednio: liczba wierszy, liczba kolumn w tablicy korelacyjnej.
Ostatecznie:
2. Pomiar korelacji w przypadku cech uporządkowanych (współczynnik korelacji rang).
Współczynnik Spearmana:
Gdzie:
- różnica rang nadanych poszczególnym cechom.
liczba obserwacji.
Własności:
- stosowany w przypadku uporzÄ…dkowao tzw. mocnych,
18
- przyjmuje wartości z przedziału *-1,1],
- wartośd bezwzględna określa siłę współwystępowania (zgodności) nadanych rang,
- znak współczynnika informuje o zgodności (zbieżności) lub niezgodności (rozbieżności) nadanych
rang (ocen).
Współczynnik Kendalla:
Gdzie:
liczba rang powiązanych w każdej i-tej podgrupie rang w uszeregowaniu odpowiednio
według cechy Xi Y;
w liczba podgrup z rangami powiÄ…zanymi w zbudowanym uporzÄ…dkowaniu;
R liczba par tych rang, które po uporządkowaniu według pierwszej cechy, czyli:
dla zachowujÄ… relacjÄ™: dla dla cechy drugiej, kolejno
dla każdego j=1,2,& ,n;
n liczba kolejnych jednostek objętych badaniem:
Własności:
- stosowany w przypadku uporządkowao tzw. słabych,
- przyjmuje wartości z przedziału *-1,1],
- wartośd bezwzględna określa siłę współwystępowania (zgodności) nadanych rang,
- znak współczynnika informuje o zgodności (zbieżności) lub niezgodności (rozbieżności) nadanych
rang (ocen).
Dla uporządkowao mocnych współczynnik korelacji rang Kendalla przyjmuje postad:
vð PrzykÅ‚ady badania zwiÄ…zku cech:
1) Badanie związku między dwiema cechami nominalnymi.
Badano związek między paleniem papierosów a zachorowalnością na raka w grupie 380 osób.
Poniższa tabela zawiera zestawienie otrzymanych wyników.
Palenie papierosów Zachorowalnośd Ogółem
Chory Zdrowy
pali 240 10 250
nie pali 80 50 130
ogółem 320 60 380
Należy ocenid siłę ewentualnego związku między badanymi cechami.
19
EGZAMIN w jaki sposób rozwiązad to zagadnienie wyżej.
2) Badanie związku między dwiema cechami porządkowymi:
Tabela poniżej przedstawia oceny wystawione przez dział marketingu dotyczące lojalności odbiorców
oraz wizerunku marek konkurujących na pięciu rynkach, na których firma prowadzi działalnośd.
Rynek Ocena lojalności w skali od 1 do 5 Ocena wizerunku marek konkurencyjnych w skali od 1 do 5
A 1 4
B 5 1
C 3 3
D 2 5
E 4 2
Należy ocenid, czy oceny działu marketingu dotyczące lojalności odbiorców oraz wizerunku marek
konkurencyjnych na poszczególnych rynkach wykazują rozbieżnośd? Inaczej mówiąc pytamy, czy
opinia o spadku lojalności odbiorców wiąże się z poprawą wizerunku marek konkurencyjnych?
EGZAMIN wskazad narzędzie, które pozwoli nam ocenid problem wyżej.
3) Badanie związku między dwiema cechami mierzalnymi sensu stricto.
W celu ustalenia zależności między liczbą braków, w sztukach (Y) a wielkością produkcji części
zamiennych (X), w tys. sztuk, w grupie 12 zakładów produkcyjnych wytwarzających takie części
wykorzystano następujące dane.
2,0 1,0 0,8 1,2 3,0 1,6 1,0 2,0 1,8 2,2 2.4 2,0
17 10 6 10 22 12 13 15 15 18 20 16
4) Badanie związku między cechą nominalną a cechą mierzalną sensu stricto.
W firmie oferującej na rynki lokalne soki owocowe przeprowadzono badanie, w którym zestawiono
zaobserwowane w 7 dniach ilości sprzedanych opakowao według kolorów.
kolor opakowania wielkośd sprzedaży
zielony 18 22 22 23 22 23 19
niebieski 20 18 19 21 20 20 18
biały 10 11 12 11 11 11 10
Pytanie: czy kolor opakowania soku ma wpływ na wielkośd sprzedaży?
3. Pomiar korelacji w przypadku cech mierzalnych sensu stricto.
Współczynnik korelacji liniowej Pearsona.
Warunki stosowania:
- badana zależnośd jest liniowa,
- obie cechy sÄ… mierzalne.
Formuła obliczeniowa zależy od układu danych.
żð Dla danych indywidualnych:
20
żð Dla danych w postaci tablicy korelacyjnej:
Własności:
- jest symetryczny,
- mierzy siłę i kierunek zależności,
- przyjmuje wartości z przedziału *-1,1].
4. Pomiar związków krzywoliniowych. Wskazniki korelacyjne Pearsona.
Podstawą do oceny związku bez konieczności zakładania liniowości tego związku jest równośd
wariancyjna. Gdy bada się wpływ zmiennej X na zmienną Y należy rozważyd równośd postaci:
Gdzie:
z tablicy korelacyjnej
- wariacja międzygrupowa, informująca o zróżnicowaniu cechy Y, będącym efektem oddziaływania X,
- wariancja wewnątrz grupowa, określająca zróżnicowanie Y wynikające z oddziaływania innych (poza
X) czynników.
W oparciu o równośd wariancyjną dla zmiennej zależnej wyznacza się wskaznik korelacyjny
Pearsona mierzący siłę zależności Y od X, tj.:
mierzy wpływ x na y.
Wskazniki korelacyjne przyjmują wartości z przedziału *0,1+.
15.04.10
WYKAAD 10. ANALIZA REGRESJI.
Analityczne wyrażenie kształtowania się zmiennej losowej pod wpływem innej zmiennej losowej.
Określenie 1.
21
Przez funkcję regresji dwóch zmiennych rozumie się funkcję opisującą zmiany w wartościach
średnich warunkowych jednej zmiennej wywołane zmianami wartości drugiej zmiennej.
Można mówid o funkcji regresji I rodzaju oraz o funkcji regresji II rodzaju.
Funkcje regresji I rodzaju zmiennej Y względem zmiennej X wyraża się ogólnie w następujący sposób:
Odpowiednio funkcję regresji I rodzaju zmiennej X względem zmiennej Y zapiszemy:
Dokładne postacie tych funkcji nie są znane. Na podstawie badao empirycznych można postawid
odpowiednie hipotezy w tym zakresie (hipotezy modelowe).
Określenie 2.
Regresją empiryczną zmiennej Y względem zmiennej X nazywad będziemy zbiór punktów płaszczyzny
XY o współrzędnych
Odpowiednio zbiór punktów płaszczyzny XY o współrzędnych nazywa się
regresją empiryczną X względem Y.
Wykresy obu zbiorów punktów tworzą, tzw. empiryczne linie regresji.
Zazwyczaj dysponuje się danymi indywidualnymi o wartościach badanych zmiennych, tj. oraz
Np.:
Rozrzut punktów empirycznych wraz z dopasowanymi liniami regresji.
Wykres jest najprostszym sposobem, który można wykorzystad formułując roboczą hipotezę na
temat istniejącej zależności i jej postaci (np. liniowa).
Liniowa funkcja regresji wyraża się wzorem:
Gdzie:
Y zmienna zależna (objaśniana)
X zmienna niezależna (objaśniająca)
resztowa zmienna losowa o własnościach:
odchylenia w regresji=0 wariancja składnika losowego (rozrzut
wokół poziomu średniego)
22
Empiryczne odpowiedniki modeli (1) oraz (2) są następujące:
Albo
Gdzie , są ocenami parametrów , natomiast są to tzw. reszty modelu.
Analogicznie:
Albo
Określenie 3.
Funkcje wyrażone wzorami (3),(3 ) oraz (4), (4 ) przedstawiają funkcję II rodzaju.
Warunki nałożone na funkcję II rodzaju:
1) Wyrażenie:
2) Odchylenia wartości empirycznych od wartości teoretycznych muszą byd losowe.
Wybór postaci liniowej można też oprzed na następującym twierdzeniu:
Jeżeli stałym przyrostom zmiennej X odpowiadają stałe przyrosty zmiennej Y, to odpowiednim
modelem opisującym zależnośd Y od X będzie model liniowy.
Uzasadnienie:
Dla kolejnych obserwacji otrzymamy:
Przyrosty obliczamy następująco:
Wniosek:
Jeżeli są stałe to też będą stałe.
·ð Szacowanie parametrów modelu (1) klasycznÄ… metodÄ… najmniejszych kwadratów.
Parametry szacuje się w taki sposób, aby wyrażenie:
osiągnęło minimum.
23
Procedura minimalizacji polega tutaj na obliczeniu pochodnych cząstkowych względem i
przyrównaniu ich do zera.
Z uwagi na:
można zaproponowad jeszcze jeden wzór na obliczenie współczynnika regresji, a mianowicie:
Z drugiej strony:
Czasami przydatny jest również następujący wzór:
EGZAMIN interpretacja współczynnika regresji jest następująca:
Jeżeli wartośd zmiennej X wzrośnie o jednostkę, to wartośd zmiennej Y wzrośnie lub
spadnie średnio o jednostek (patrz rys.2).
punkty empiryczne
Rys. Rozrzut punktów empirycznych wraz z dopasowaną teoretyczną linią regresji.
29.04.10
OCENA JAKOÅšCI MODELU:
24
Po oszacowaniu parametrów należy:
·ð Znalezd bÅ‚Ä™dy ocen tych parametrów, tj.:
S(u) odchylenie standardowe reszt.
·ð Ocenid stopieo dopasowania modelu do danych empirycznych.
Miarami stosowanymi w tym wypadku są współczynnik determinacji oraz współczynnik
zbieżności , tj.:
EGZAMIN interpretacja współczynników!
Powyższe wzory otrzymuje się w drodze dekompozycji ogólnej zmienności Y na dwie części:
Dzieląc obie strony równania przez:
Otrzymuje siÄ™:
Zatem:
Interpretacja:
- Współczynnik determinacji informuje, jaka częśd zmienności Y została wyjaśniona zmiennością X.
- Współczynnik zbieżności informuje, jaka częśd zmienności Y nie została wyjaśniona zmiennością X a
zatem ma charakter losowy.
·ð Zweryfikowad pewne hipotezy dotyczÄ…ce jakoÅ›ci modelu.
Stosując odpowiednie testy statystyczne należy w szczególności sprawdzid, czy:
a) Rzeczywiście istnieje zależnośd między X i Y (ocena istotności parametru ),
b) Przyjęto właściwą postad modelu (czy zależnośd jest liniowa?),
25
c) Odchylenia sÄ… losowe.
WYKAAD 11. KORELACJA I REGRESJA WIELU ZMIENNYCH.
Rozważamy zależności między zmiennymi:
Określenie 1.
Współczynnik, który mierzy zależnośd korelacyjną między dwiema zmiennymi (i-tą oraz j-tą), przy
wyłączeniu wpływu innych zmiennych (indeksowanych przez: k, l, & ,z) nazywa się współczynnikiem
korelacji cząstkowej. Współczynnik korelacji cząstkowej oznaczamy przez
Współczynnik korelacji cząstkowej dowolnego rzędu można obliczyd według następującego
wzoru:
Gdzie:
jest dopełnieniem algebraicznym macierzy P (macierz współczynników korelacji par zmiennych
włączonych do badania), powstałym przez skreślenie i-tego wiersza oraz j-tej kolumny; jest
dopełnieniem algebraicznym macierzy P, powstałym przez skreślenie i-tego wiersza oraz i-tej
kolumny; jest dopełnieniem algebraicznym macierzy P, powstałym przez skreślenie j-tego wiersza
i j-tej kolumny macierzy P.
vð PrzykÅ‚ad:
Jak wyżej rozważamy zmienne . Macierz P przyjmie postad:
Uwaga: zauważmy, że macierz P jest symetryczna.
Niech K=3
Wtedy:
współczynnik korelacji cząstkowej pomiędzy zmienną i przy wyłączeniu wpływu
zmiennej .
StÄ…d:
26
Analogicznie:
Natomiast:
Omawiane współczynniki przyjmują wartości z przedziału (-1,1). Taki współczynnik może byd większy
lub mniejszy od współczynnika korelacji całkowitej. Może także zmieniad znak w stosunku do
ostatniego.
Określenie 2.
Współczynnik, który mierzy korelację między wartościami jednej zmiennej (objaśnianej), a
wartościami całego kompleksu innych zmiennych (objaśniających) nazywa się współczynnikiem
korelacji wielorakiej.
Współczynnik korelacji wielorakiej wyraża się wzorem:
Gdzie:
06.05.10
WYKAAD 12: ZMIENNE LOSOWE I ICH ROZKAADY.
POJCIA ZDARZENIA LOSOWEGO I ZMIENNEJ LOSOWEJ.
Określenie 1
ZDARZENIEM LOSOWYM nazywa się takie zdarzenie, które przy realizacji danego doświadczenia lub
procesu może w określonym zespole warunków wystąpid lub nie wystąpid.
Z pojęciem zdarzenia losowego łączy się pojęcie prawdopodobieostwa.
Określenie 2 (klasyczna definicja prawdopodobieostwa)
27
PRAWDOPODOBIEOSTWO zdarzenia A jest to stosunek liczby zdarzeo elementarnych, sprzyjajÄ…cych
danemu zdarzeniu A (realizujących zdarzenie A) do ogólnej liczby zdarzeo elementarnych, przy
założeniu, że wszystkie zdarzenia elementarne są jednakowo możliwe. Zatem
Określenie 3 (statystyczna definicja prawdopodobieostwa):
Prawdopodobieostwem danego zdarzenia A nazywa się liczbę, wokół której oscyluje częstośd
względna danego zdarzenia.
Określenie 4 (aksonometryczna definicja prawdopodobieostwa uogólnienie definicji klasycznej i
statystycznej).
Prawdopodobieostwo danego zdarzenie jest pojęciem, które wynika z systemu pewników
(aksjomatów). Są to:
Pewnik 1. Każdemu zdarzeniu, należącemu do danego zbioru zdarzeo, przyporządkowana jest pewna
liczba , która spełnia warunek . Liczba ta jest prawdopodobieostwem zdarzenia A.
Pewnik 2. Prawdopodobieostwo zdarzenia pewnego równa się jedności.
Pewnik 3. Prawdopodobieostwo sumy skooczonej lub przeliczonej liczby parami wyłączających się
zdarzeo równa się sumie prawdopodobieostw poszczególnych zdarzeo, tj.
Na podstawie powyższych pewników formułuje się wnioski:
- prawdopodobieostwo zdarzenia niemożliwego równa się zeru,
- suma prawdopodobieostw zdarzenia danego i przeciwnego równa się jedności,
- jeżeli zdarzenie A pociąga za sobą zdarzenie B to prawdopodobieostwo zdarzenia A jest nie większe
od prawdopodobieostwa zdarzenia B.
- znając prawdopodobieostwo zdarzeo elementarnych możemy obliczyd prawdopodobieostwo
dowolnego zdarzenia losowego. Jeżeli liczba zdarzeo elementarnych zbioru A jest skooczona tj.:
i każdemu z nich przyporządkowano to samo
prawdopodobieostwo wtedy prawdopodobieostwo dowolnego
zdarzenia losowego oblicza się tak samo, niezależenie od tego, czy stosuje się klasyczną, czy
aksjomatycznÄ… definicjÄ™ prawdopodobieostwa.
Uogólnieniem pojęcia zdarzenia losowego jest pojęcie zmiennej losowej.
Określenie 5.
Przez ZMIENN LOSOW rozumiemy taką zmienną, którą w wyniku doświadczenia lub procesu
realizuje różne wartości liczbowe z określonymi prawdopodobieostwami.
Określenie 6.
ZMIENNA LOSOWA jest to funkcja mierzalna, jednoznacznie określona na zbiorze zdarzeo
elementarnych, przyjmująca wartości ze zbioru liczb rzeczywistych.
28
Wśród zmiennych losowych wyróżnia się zmienne skokowe oraz ciągłe.
W przypadku zmiennej losowej skokowej, każdej możliwej wartości tej zmiennej przyporządkowane
jest określone prawdopodobieostwo:
prawdopodobieostwo dla zmiennej skokowej.
W przypadku zmiennej losowej ciągłej mówimy o prawdopodobieostwie przyjęcia przez tą zmienną
wartości z dowolnie małego przedziału liczbowego.
Jeżeli znany jest zbiór możliwych wartości zmiennej losowej oraz prawdopodobieostwa przyjęcia tych
wartości przez zmienną losową (bądz też prawdopodobieostwa, że zmienna przyjmie wartośd z
określonego przedziału), to znany jest rozkład tej zmiennej losowej.
ROZKAAD ZMIENNEJ LOSOWEJ może byd przedstawiony za pomocą szeregu (szczególnie w
przypadku rozkładów empirycznych), wykresu, lub też funkcji formułującej zależnośd pomiędzy
wartościami zmiennej a częstościami lub prawdopodobieostwami ich wystąpienia.
Na przykład:
Określenie 7.
ROZKAAD ZMIENNEJ LOSOWEJ (SKOKOWEJ) nazywa sie przyporzÄ…dkowanie konkretnym wariantom
tej zmiennej odpowiadajÄ…cych im prawdopodobieostw.
Określenie 8.
ROZKAAD ZMIENNEJ LOSOWEJ CIGAEJ jest to przyporządkowanie prawdopodobieostw wartościom
z określonego (dowolnie małego) przedziału otoczenia tych wartości.
Funkcja rozkładu prawdopodobieostwa w przypadku zmiennej losowej ciągłej nazywa się funkcją
gęstości. Wyraża się ona następującym wzorem:
Określenie 9.
DYSTRYBUANTA ZMIENNEJ LOSOWEJ SKOKOWEJ X, oznacza: jest funkcjÄ… opisujÄ…cÄ…
prawdopodobieostwo wystąpienia dowolnych wartości zmiennej mniejszych lub równych , tj.
Określenie 10.
29
DYSTRYBUANTA ZMIENNEJ LOSOWEJ CIGAEJ, oznacza: jest ot funkcja określająca
prawdopodobieostwo, że zmienna X przyjmuje wartośd mniejszą od x, tj.:
PARAMETRY ROZKAADU ZMIENNEJ LOSOWEJ.
ZMIENNA LOSOWA
SKOKOWA CIGAA
Wartośd oczekiwana
Wariancja
Współczynnik zmienności
Moment trzeci centralny
Kwartyl pierwszy
Kwartyl drugi
Kwartyl trzeci
Dominanta wartośd zmiennej, dla której:
PRZYKAADOWE ROZKAADY TEORETYCZNE ZMIENNEJ LOSOWEJ SKOKOWEJ:
·ð RozkÅ‚ad zero-jedynkowy.
Jest rezultatem takiego doświadczenia, w wyniku którego określone zdarzenie A wystąpi lub nie
wystÄ…pi. Zdarzeniom elementarnym realizujÄ…cym zdarzenie A przyporzÄ…dkowania jest liczba 1, a
zdarzeniom elementarnym nie realizujÄ…cym zdarzenia A liczba 0.
Zatem,
30
Inaczej,
Parametry tego rozkładu wyrażają się następującym wzorami:
·ð RozkÅ‚ad dwumianowy.
Przedstawia prawdopodobieostwo k-krotnego wystÄ…pienia zdarzenia losowego A w serii n
niezależnych doświadczeo, gdy prawdopodobieostwo wystąpienia zdarzenia A w pojedynczym
doświadczeniu&
Funkcja rozkładu prawdopodobieostwa wyraża się w tym wypadku wzorem:
Parametry tego rozkładu zapiszemy:
Odpowiednio dystrybuantÄ™ zapiszemy wzorem:
·ð RozkÅ‚ad Poissona.
Jest szczelnym przypadkiem rozkładu dwumianowego. Można powiedzied, że jest to rozkład
graniczny, do którego zmierza rozkład dwumianowy, gdy p jest bardzo małe, natomiast .
Funkcja rozkładu Poissona jest następująca:
Parametry rozkładu:
PRZYKAADOWE ROZKAADY TEORETYCZNE ZMIENNEJ LOSOWEJ CIGAEJ:
·ð RozkÅ‚ad prostokÄ…tny.
Zmienna losowa ma rozkład prostokątny w przedziale *a,b+ jeśli jej funkcja gęstości i dystrybuanta
wyrażają się następującymi wzorami:
Podstawowe parametry omawianego rozkładu są następujące:
31
·ð RozkÅ‚ad normalny.
Rozkład normalny jest opisany funkcją gęstości następującej postaci:
Gdzie:
wartośd oczekiwana rozkładu
odchylenie standardowe
podstawa logarytmu naturalnego
Funkcja gęstości dla zmiennej standaryzowanej wyraża się wzorem:
DZIAA: WNIOSKOWANIE STATYSTYCZNE.
WNIOSKOWANIEM STATYSTYCZNYM nazywamy proces myślowy polegający na formułowaniu
sądów dotyczących całej zbiorowości (populacji generalnej) na podstawie wyników z próby.
13.05.10
WYKAAD 13.
Analiza tendencji rozwojowej w przebiegu zjawisk ekonomicznych.
Niech oznacza zmienną losową, której wartości obserwowane są w kolejnych jednostkach
czasu . Wartości te oznaczamy przez . Zmienna będzie opisywad kształtowanie
siÄ™ w czasie pewnego zjawiska.
Przebieg zjawiska w czasie bada się na podstawie szeregów czasowych.
Określenie 1.
Szeregiem czasowym nazywa się uporządkowany według czasu zbiór wartości .
Szereg czasowy będziemy oznaczad przez
Określenie 2.
Trendem nazywa siÄ™ pewnÄ… tendencjÄ™ rozwojowÄ… w przebiegu analizowanego zjawiska .
Przedstawia on zmiany w czasie wartości średniej tego zjawiska.
W przebiegu zjawisk ekonomicznych oprócz trendu wyróżnid można także:
- wahania okresowe (np. koniunkturalne, sezonowe),
- wahania przypadkowe.
W poznaniu procesu ekonomicznego ważna jest umiejętnośd wyodrębniania wymienionych wahao i
odpowiednie ich modelowanie.
32
Metody wyodrębniania trendu:
·ð Metoda mechaniczna.
Polega ona na obliczeniu na podstawie szeregu czasowego, a zatem na podstawie obserwacji:
(gdzie indeks oznacza kolejne jednostki czasu), tzw. średnich ruchomych k-wyrazowych.
Przykład 1 (zwykła średnia ruchoma) nieparzyste.
Trzywyrazową średnią ruchomą otrzymuje się w następujący sposób:
Przykład 2 (sce& średnia ruchoma)
Efekty zastosowania średniej ruchomej:
- wyrównanie szeregu czasowego (eliminacja wahao przypadkowych i ewentualnie sezonowych),
- uwidacznianie trendu (tendencji rozwojowej).
·ð Metoda analityczna.
Polega ona na aproksymacji (dopasowaniu) odpowiedniej funkcji trendu.
Dopasowanie liniowej funkcji trendu.
Hipoteza trendu liniowego:
zmienna mierzÄ…ca poziom badanego zjawiska w okresie t,
zmienna czasowa,
, parametry strukturalne funkcji trendu,
resztowa zmienna losowa.
Empiryczny model ekonometryczny:
33
Gdzie:
Uproszczone wzory otrzyma się, gdy przyjmie się, że:
wtedy:
Parametry modelu trendu liniowego można obliczyd również według następujących wzorów
macierzowych:
Gdzie:
20.05.10
WYKAAD 14: ANALIZA DYNAMIKI ZJAWISK MASOWYCH.
Dynamikę zjawisk masowych bada się na podstawie szeregów czasowych. Pojęcie szeregu czasowego
patrz poprzedni wykład.
Wyróżnia się szeregi czasowe momentów i szeregi czasowe okresów, np. liczba ludności danego kraju
na dzieo 31 grudnia 2007 r., lub wielkośd PKB per capita w kolejnych latach.
Rodzaj danych ma wpływ na metody analizy zjawisk. Przy analizie szeregów czasowych okresów
pojawia się problem nierówności przedziałów czasowych, np. liczba dni w miesiącach. W takich
sytuacjach należałoby dokonad sprowadzenia wartości zjawisk do okresów porównywalnych
(zawierajÄ…cych jednakowÄ… liczbÄ™ dni).
Proponuje się wykorzystanie następującego przekształcenia:
Gdzie:
wartośd obserwowanego zjawiska przy założeniu, że wszystkie jednostki czasu (miesiące,
kwartały) mają jednakową liczbę dni,
wartośd zjawiska faktycznie zaobserwowana w czasie t,
liczba dni przyjęta za podstawę porównywalności,
rzeczywista liczba dni kalendarzowych w danej jednostce czasu.
34
·ð Ocena przeciÄ™tnego poziomu zjawiska w czasie:
a) Przypadek szeregów czasowych okresów.
Przy założeniu równości przedziałów czasowych, przeciętny poziom zjawiska można ocenid za
pomocą średniej arytmetycznej.
b) Przypadek szeregów czasowych momentów.
Średni poziom zjawiska ocenia się wykorzystując w tym celu średnią chronologiczną.
Średnią chronologiczną oblicza się według wzoru:
·ð Ocena zmian w czasie poziomu jednorodnych zjawisk mierniki dynamiki:
1) Przyrost absolutny:
Jest to różnica pomiędzy poziomem zjawiska w okresie (momencie) badanym a poziomem zjawiska w
okresie (momencie) przyjętym z podstawę porównao.
Jeśli za podstawę porównao przyjmiemy okres (moment) poprzedni, to otrzymamy:
SÄ… to tzw. przyrosty absolutne Å‚aocuchowe.
Przykład 1.
Niech oznacza kolejne wyrazy szeregu czasowego. Ciąg przyrostów absolutnych
łaocuchowych otrzymamy następująco:
Można też rozważad przyrosty obliczane w odniesieniu do jednego okresu (momentu). Będą to
przyrosty absolutne o podstawie stałej.
Interpretacja.
Przyrosty absolutne informują o tym, o ile jednostek wzrósł lub zmalał poziom badanego zjawiska w
okresie (momencie) badanym w porównaniu z okresem (momentem) przyjętym za podstawę.
2) Przyrost względny (tempo wzrostu):
Przyrost względny jest stosunkiem absolutnego przyrostu zjawiska do poziomu zjawiska w okresie
(momencie) przyjętym za podstawę porównao.
Przyrosty względne podobnie jak przyrosty absolutne mogą byd jedno-podstawowe lub łaocuchowe.
Przykład 2.
Ciąg przyrostów względnych łaocuchowych zapiszemy następująco:
Przykład 3.
Ciąg przyrostów względnych o stałej podstawie zapiszemy jako:
35
Interpretacja.
Przyrosty względne odpowiadają na pytanie, o ile wyższych lub niższy jest poziom badanego zjawiska
w danym okresie w stosunku do okresu przyjętego za podstawę.
3) Wskazniki dynamiki (indeksy).
Wskazniki dynamiki są to wielkości otrzymane przez podzielenie wartości danego zjawiska w okresie
badanym przez wartośd zjawiska w okresie podstawowym tj.:
indeks indywidualny (wielkości niemianowane),
poziom zjawiska w okresie badanym,
poziom zjawiska w okresie bazowym.
Interpretacja.
Indeksy są wielkościami niemianowanymi. Wyrażane są w ułamkach albo w procentach (podobnie jak
przyrosty względne). Przyjmują wyłącznie wartości dodatnie (w odróżnieniu od przyrostów
względnych). Jeśli , tzn., że nastąpił spadek poziomu zjawiska w okresie badanym w
stosunku do okresu podstawowego. Jeżeli , to znaczy, że nastąpił wzrost poziomu zjawiska w
okresie badanym w stosunku do okresu podstawowego. Jeżeli z kolei , to oznacza brak zmian
poziomu zjawiska w czasie.
W zależności od przyjętej podstawy porównao, wyróżnia się indeksy łaocuchowe oraz indeksy
jednopodstawowe.
Przykład 4.
CiÄ…g Å‚aocuchowy zapiszemy jako:
Z kolei ciąg indeksów o stałej podstawie:
vð Kilka uwag praktycznych:
üð Indeksy jednopodstawowe można otrzymad z przyrostów wzglÄ™dnych o staÅ‚ej podstawie
przez dodanie 1 (lub 100). W ten sam sposób otrzymamy indeksy łaocuchowe z
przyrostów względnych łaocuchowych. Oczywista jest również operacja odwrotna.
üð Istnieje możliwoÅ›d zamiany indeksów jednopodstawowych na Å‚aocuchowe i odwrotne, a
także zmiany podstawy w szeregu indeksów o podstawie stałej.
36
Zamiany indeksów jednopodstawowych na łaocuchowe można dokonad w drodze
dzielenia indeksów jednopodstawowych przez siebie, tj. wg wzoru:
Natomiast zamiany indeksów łaocuchowych na jednopodstawowe dokonujemy
następująco:
a) Indeks jednopodstawowy w okresie następującym bezpośrednio po okresie
przyjętym za podstawę jest taki sam jak indeks łaocuchowy.
b) Indeks jednopodstawowy w okresie przyjętym za podstawę wynosi 1 (100%).
c) Dalsze indeksy jednopodstawowe po okresie przyjętym za podstawę
otrzymuje się mnożąc w sposób narastający kolejne indeksy łaocuchowe,
licząc od wskaznika łaocuchowego znajdującego się tuż po okresie
podstawowym.
d) Indeksy jednopodstawowe przed okresem podstawowym otrzymuje siÄ™ jako
odwrotnośd narastających iloczynów kolejnych indeksów łaocuchowych,
licząc od okresu przyjętego za podstawę.
EGZAMIN przejście z indeksu jednopodstawowego na indeks łaocuchowy i odwrotnie (prof. coś
wybierze) lub zmiana podstawy ciągu indeksów jednopodstawowych.
·ð Obliczanie Å›redniego tempa zmian zjawiska w czasie.
Średnie tempo zmian zjawiska w czasie można wyznaczyd z indeksów łaocuchowych, jako ich średnią
geometryczną, tj. według wzoru:
Co po uproszczeniu daje:
EGZAMIN!!! oceo średnie tempo zmian zjawiska w czasie.
27.05.10
WYKAAD 15: ANALIZA DYNAMIKI ZJAWISK C.D.
·ð Rodzaje indeksów statystycznych:
1) Indywidualne; indeksy indywidualne znajdujÄ… zastosowanie w przypadku badania
dynamiki zjawisk jednorodnych. Chodzi tutaj o indeksy dotyczÄ…ce indywidualnych
jednostek. Wśród indeksów indywidualnych szczególnie interesujące dla ekonomistów są
indeksy: cen, ilości oraz wartości.
Indywidualny indeks cen można zapisad następująco:
37
Gdzie:
indywidualny indeks cen,
cena jednostkowa wyrobu w okresie badanym,
cena jednostkowa wyrobu w okresie podstawowym.
Indywidualny indeks ilości zapiszemy jako:
Gdzie:
indywidualny indeks ilości,
ilośd wyrobu wyprodukowanego w okresie badanym,
ilośd wyrobu wyprodukowanego w okresie podstawowym.
Indywidualny indeks wartości wyraża wzór:
Gdzie:
wartośd wyrobu w okresie badanym,
wartośd wyrobu w okresie podstawowym.
EGZAMIN jaka zmiana była w danym roku w stosunku do innego roku (wartośd odpowiedniego
indeksu statystycznego)
üð Interpretacja:
Indywidualne indeksy cen, ilości i wartości informują o wzroście lub spadku tych wielkości w okresie
badanym w porównaniu z okresem podstawowym, tj. przyjętym za podstawę porównao.
·ð RównoÅ›d indeksowa.
Jeśli rozważamy indeksy cen, ilości i wartości dla tego samego wyrobu, to możemy zapisad:
2) Zespołowo (agregatowe); indeksy zespołowe wykorzystuje się, gdy bada się dynamikę
zmian odnoście do całego zespołu (agregatu zbioru) jednostek. W zależności od
przedmiotu badao wyróżnia się:
a) Indeksy zespołowe dla wielkości absolutnych:
Wśród zespołowych indeksów wielkości absolutnych wyróżnia się agregatowe indeksy cen, ilości oraz
wartości.
Agregatowy indeks wartości wyraża się wzorem:
38
Gdzie:
agregatowy indeks wartości,
- ilośd w okresie, odpowiednio badanym i podstawowym,
cena jednostkowa w okresie badanym i podstawowym.
EGZAMIN podaj wzory na agregatowe indeksy.
Jest to zatem stosunek wartości pewnego zbioru (agregatu) wyrobów w okresie badanym do wartości
tego zbioru w okresie podstawowym, obliczanej w cenach bieżących.
üð Indeks ten informuje, w jakim stosunku pozostaje wartoÅ›d agregatu z okresu badanego do
wartości agregatu z okresu podstawowego. Wyraża on zmiany, jakie nastąpiły w wartościach
określonego zespołu wyrobów w okresie badanym w porównaniu z okresem podstawowym,
przy czym zmiany te uwarunkowane są zmianami dwóch czynników: ilości i cen. Indeks
wartości przedstawia zmiany wartości będące wypadkową zmian ilości oraz cen i nie
informuje, który z tych czynników odegrał główną rolę we wzroście lub spadku wartości.
Wniosek: należy rozważad także agregatowe indeksy cen oraz agregatowe indeksy ilości (masy
fizycznej).
Agregatowy indeks cen wyraża się wzorem:
Gdzie:
agregatowy indeks cen,
stała ilośd wyrobu,
cena jednostkowa w okresie badanym i podstawowym.
üð Interpretacja:
Określa on średnie względne zmiany w poziomie cen określonego zbioru produktów, zaobserwowane
w dwóch porównywanych ze sobą okresach. Indeks cen oblicza się przy założeniu, że ilości badanych
produktów nie uległy zmianie, a jedynie zmieniły się ich ceny.
EGZAMIN wielkości absolutne, stosunkowe wzory.
Øð Indeks cen typu Laspeyresa:
üð Interpretacja:
39
Odpowiada na pytanie: o ile więcej lub mnie musielibyśmy zapłacid (lub otrzymad) za produkty
nabyte (sprzedane) w okresie podstawowym według cen okresu badanego w stosunku do cen okresu
podstawowego.
Øð Indeks cen typu Paaschego:
EGZAMIN podaj wzór na agregatowy indeks cen (trzeba zaznaczyd, że ceny się zmieniają).
üð Interpretacja:
Informuje o tym, o ile mniej lub więcej musielibyśmy zapłacid (otrzymad) za produkty nabyte
(sprzedane) w okresie badanym według cen okresu badanego w stosunku do cen okresu
podstawowego.
Agregatowy indeks ilości ogólnie zapiszemy następująco:
EGZAMIN podaj wzór na agregatowy indeks ilości.
Gdzie oznaczenia analogicznie jak wcześniej.
üð Interpretacja:
Indeks ten informuje o średnich względnych zmianach w fizycznych rozmiarach określonego zespołu
produktów, które nastąpiły pomiędzy okresem podstawowym i badanym.
Øð Indeks iloÅ›ci typu Laspeyresa:
Øð Indeks iloÅ›ci typu Paaschego:
Różnice występujące pomiędzy tymi formułami mają ten sam charakter, co w przypadku
indeksów cen.
W przypadku, gdy okres podstawowy i badany nie są zbyt odległe, do obliczenie
agregatowych indeksów cen i ilości można też zastosowad formułę Fishera:
·ð RównoÅ›d indeksowa:
10.06.10
40
WYKAAD 16. ANALIZA DYNAMIKI ZJAWISK CD. AGREGATOWE (ZESPOAOWE) INDEKSY WIELKOÅšCI
STOSUNKOWYCH.
Pyt. 1. Co to są wielkości stosunkowe?
WIELKOŚCI STOSUNKOWE wyrażają stosunki dwóch zjawisk logicznie ze sobą powiązanych. Można je
określid mianem wskazników natężenia.
Przykłady:
·ð WydajnoÅ›d pracy (iloraz produkcji i czasu pracy)
·ð Koszt jednostkowy (iloraz nakÅ‚adów i wielkoÅ›ci produkcji),
·ð Åšrednia pÅ‚aca (iloraz funduszu pÅ‚ac i wielkoÅ›ci zatrudnienia).
Wyróżnia się:
a) Wielkości stosunkowe cząstkowe:
Wielkości stosunkowe cząstkowe można zapisad w następującej postaci:
StÄ…d:
b) Wielkości stosunkowe ogólne.
Wielkości stosunkowe ogólne można wyrazid następująco:
Pyt. 2. W jaki sposób bada się dynamikę wielkości stosunkowych?
Do analizy dynamiki wielkości stosunkowych wykorzystuje się indeksy wielkości stosunkowych.
żð Agregatowy indeks wszechstronny (o zmiennej strukturze) można wyrazid wzorami:
Zaprezentowane wzory wykorzystuje się w różnych sytuacjach, zależnie od wyjściowych informacji,
którymi dysponuje badacz.
Wyrażenie (b) można zapisad w innej postaci:
41
Z kolei, wyrażenie (c) można zapisad jako:
Wzór (*) określa wszechstronny indeks wielkości stosunkowych ważonych współczynnikami struktury
składnika b, natomiast wzór (**) wszechstronny indeks wielkości stosunkowych ważonych
współczynnikami struktury składnika a.
Wartośd indeksu wszechstronnego wynika z działania dwóch czynników:
1. Dynamiki cząstkowych wielkości stosunkowych.
2. Zmian w dynamice w strukturze czynnika a lub czynnika b.
Pyt. 3. Jak można określid te wpływy?
żð Agregatowe indeksy wielkoÅ›ci stosunkowych o staÅ‚ej strukturze.
Wyrażają one wpływ dynamiki cząstkowych wielkości stosunkowych na poziom indeksu
wszechstronnego.
Øð WedÅ‚ug formuÅ‚y Laspeyresa otrzymamy:
Øð WedÅ‚ug formuÅ‚y Paaschego otrzymamy:
42
żð Agregatowe indeksy zmian strukturalnych.
Określają wpływ zmian w strukturze czynników a i b ma poziom indeksy wszechstronnego.
Wpływ czynnika b określimy następująco:
Øð WedÅ‚ug formuÅ‚y Laspeyresa:
Øð WedÅ‚ug formuÅ‚y Paaschego:
Wpływ czynnika a określimy następująco:
Øð WedÅ‚ug formuÅ‚y Laspeyresa:
Øð WedÅ‚ug formuÅ‚y Paaschego:
üð RównoÅ›ci indeksowe:
EGZAMIN informacje teoretyczne, jeśli chodzi o indeksy zespolone. Przykłady liczbowe do
pozostałych indeksów (podstawianie do wzoru z informacji, które będą dostępne wskazujemy
sposób rozwiązania). INDEKS CEN KONSUMPCYJNYCH służy do przeliczania nominalnych wielkości
na realne wielkości (przykłady).
43
Wyszukiwarka
Podobne podstrony:
Statystyka wyklad 7Statystyka wyklad 4Statystyka wyklad4nowysdz statystyka wyklad 4Statystyka wykładyStatystyka wyklad5Statystyka wyklad 8Statystyka wyklad 3Statystyka wyklad 9Statystyka1st Wyklad2Statystyka wyklad 6Statystyka1st Wyklad6 Regresja20151012 MichalTrzesiok Statystyka wyklad2 miary statystyczne handoutsdz statystyka wyklad 3Statystyka wykladyStatystyka wykładyStatystyka1st Wyklad1więcej podobnych podstron