Statystyka wykłady

Wykład 1. 21.02.2013

Statystyka to nauka o metodach ilościowych badania zjawisk masowych.

Metoda poznania w statystyce jest metodą indukcyjną umożliwiającą uogólnienie spostrzeżeń z rezultatów badania empirycznego.

Zjawiska masowe to takie które badane w dużej masie zdarzeń wykazują prawidłowości, jakich nie można dostrzec w pojedynczym przypadku.

Przyczyny główne(prawidłowości) – działają na każde zjawisko w sposób jednakowy, mają charakter wewnętrzny, działają w określonym kierunku, są wspólne dla wszystkich jednostek badanych.

Przyczyny uboczne (wyjatki) – działają na każde zjawisko w sposób odmienny, mają charakter zewnętrzny.

Składnik systematyczny i przypadkowy (losowy).

Składnik systematyczny – wynik działań przyczyn głównych:


$$\frac{m}{n} = p + u$$

m- zdarzenie z daną cechą; n-liczba wszystkich zdarzeń; p-składnik systematyczny;

u-składnik losowy

Warunki występowania prawa wielkich liczb:

Statystyka opisowa oparta jest na indukcji zupełnej, ukazuje metody gromadzenia, opracowania i prezentacji danych wraz z sumarycznym ich opisem przy wykorzystaniu właściwych narzędzi statystycznych.

Statystyka matematyczna oparta jest na indukcji niezupełnej:

Teoria estymacji – umożliwia szacunek nieznanych parametrów w populacji na podstawie próby.

Teoria weryfikacji hipotez statystycznych – pozwala na sprawdzenie hipotez

Zadania statystyki:

Etapy badania statystycznego:

  1. Przygotowanie badania

  2. Obserwacje statystyczne

  3. Opracowania statystyczne

  4. Analiza statystyczna

Ad 1. Zbiorowością statystyczną nazywamy odpowiednio liczny zbiór elementów nie identycznych, ale tworzących całość jednoznacznie określoną pod względem rzeczowym, czasowym i przestrzennym.

Z punktu widzenia liczebności:

  1. Skończenie liczne – zbiorowości składające się z określonej przeliczonej liczby elementów

  2. Nieskończenie liczne - zbiorowości tworzone przez elementy o niepoliczalnej liczbie

Z punktu widzenia czasu:

  1. Statyczne – tworzone przez jednostki, które istaniały, istnieją i będą istnieć w określonym momencie.

  2. Dynamiczne – tworzone przez jednostki obserwowane w pewnym przedziale czasu.

Wykład 2.

Z punktu widzenia treści:

  1. Jednorodne – to zbiorowości tworzone przez jednostki nie zróżnicowane pod względem cechy stałej.

  2. Niejednorodne – jednostki nie posiadają takiej samej cechy przedmiotowej.

Z punktu widzenia pełnej lub częściowej obserwacji:

  1. Generalna – to zbiorowość wszystkich elementów.

  2. Próbna – to część zbiorowości wybrana losowo lub przez wybór losowy.

Jednostka statystyczna – poszczególny element wchodzący w skład zbiorowości


$$N = \sum_{i = 1}^{k}{n1}$$

N – ogólna liczebność; n1- jednostki zbiorowości (i=1,2,3,…, k)

Cechy statystyczne – właściwości którymi odznaczają się jednostki wchodzące w skład zbiorowości.

Cechy zbiorowości

Stałe – wspólne wszystkim jednostkom zmienne – decydują o kwalifikacji

Rzeczowe, czasowe, przestrzenne jednostek podlegająca badaniu statystycznemu

Rzeczowe czasowe Przestrzenne

Niemierzalne Mierzalne

(porządkowo, nominalnie) (ciągłe, skokowe)

Wariant – odmiana cechy

Zbiorowość statystyczna i jej elementy:

Zbiorowość statystyczna Cecha zmienna Wariant Cechy Rodzaj cechy
Studenci 1 roku AE w Poznaniu w roku akademickim 2007/2008
  1. Płeć

  2. Wiek

  3. Forma studiów

  4. Miejsce zamieszk.

  1. K.M.

  2. 20,21,22, itd.

  3. Stacj/Niestacj

  4. Poznań, Kościan itd

  1. Rzeczowa, niemierz

  2. Rzeczowa, mierz, ciągła

  3. Rzeczowa niemierz

  4. Przestrzenna

II Etap.

Obserwacja statystyczna – polega na zbieraniu indywidualnych danych o wyróżnionych cechach zmiennych każdej jednostki badanej zbiorowości. Efektem obserwacji jest materiał statystyczny.

Materiał statystyczny – zbiór informacji ustalonych z regóły na piśmie o wchodzących w skład badanej zbiorowości jednostkach.

Materiał pierwotny – Jest otrzymywany w toku specjalnego badania statystycznego.

Materiał wtóry – jest zbierany dla innych celów niż statystyczne. Materiał ten w dużej mierze ma charakter instytucjonalny.

Kwestionariusz statystyczny – zbiór pytań dotyczących pewnego zagadnienia, uszeregowanych w logicznej kolejności, służący do zbierania materiału statystycznego.

Powinien składać się z 3 części:

  1. Wstępnej, która zawiera tytuł, nazwę jednostki organizującej badania, czas do którego odnoszą się dane.

  2. Zasadniczej z pytaniami na które oczekuje się odpowiedzi.

  3. Końcowej w której podaje się datę wypełnienia formularza oraz uwagi, które nasunęły się w trakcie jego wypełniania.

Metody i Techniki obserwacji

Pełne(obejmują wszystkie Częściowe

jednostki badanej zbiorowości)

Spis powszechny Rejestracja bieżąca

m. ankietową m. monograficzną m. reprezentacyjna

Spis statystyczny – jest jednorazowym lub periodycznie powtarzanym badaniem statystycznym mającym na celu ustalenie stanu i struktury danej zbiorowości w określonym momencie czasowym. Np. spis ludności, spis gospodarstw rolnych.

Cechy spisu wg Biura statystycznego ONZ

Rejestracja bieżąca – polega na systematycznym notowaniu określonych faktów będących przedmiotem badania. Jest badaniem dynamicznym. Np. rejestry administracyjne lub ewidencja naturalnego ruchu ludności.

Metoda ankietowa – Sprowadza się do uzyskanie informacji poprzez pytania ubiektywne i obiektywne zawarte w kwestionariuszu. Metoda ta odznacza się:

Techniki obserwacji : ankieta (pocztowa telefoniczna, rozdawana), wywiady bezpośrednie.

Metoda monograficzna – polega na wszechstronnym opisie i analizie wybranej jednostki statystycznej lub niewielkiego zespołu jednostek. Umożliwia poznanie charakteryzujących właściwości zbiorowości w formie ilościowej i jakościowo-opisowej. Wybrana jednostka powinna być typowa.

Metoda reprezentatywna – oparta jest na próbie pobranej ze zbiorowości generalnej w sposób losowy. Reprezentatywność próby zależy od sposobu doboru próby i liczebności próby. Dobór jednostek do próby: przypadkowy lub celowy. Metoda reprezentacyjna jest najbardziej prawidłową formą badania częściowego.

Opracowanie materiału statystycznego

Kontrola formalna – dotyczy sprawdzania kompletności, pełności i zupełności danego materiału statystycznego.

Kontrola merytoryczna – ocenia logiczną poprawność danych.

Kontrola logiczna – polega na sprawdzeniu, czy treść rubryk formularza odpowiada rzeczywistości.

Kontrola arytmetyczna – polega na porównaniu liczb otrzymanych z sumowania anych źródłowych z liczbami w sprawozdaniach zbiorowych.

Grupowanie statystyczne polega na mniej lub bardziej zróżnicowanym podziale niejednorodnej zbiorowości na możliwie jednorodne grupy wg wybranych kryteriów. Grupowanie statystyczne stanowi podstawę umożliwiającą obliczenia charakterystycznych liczbowych. Pozwala na prawidłowe odzwierciedlenie struktury badanej zbiorowości. Pozwala na ustalenie związków między badanymi cechami.

Grupowanie typologiczne – polega na podzieleniu niejednorodnej zbiorowości na jakościowo jednorodne, społeczno-ekonomiczne typy zjawiska. Jest oparty o cechę jakościową.

Grupowanie wariancyjne – polega na łączeniu poszczególnych jednostek wg jednej interesującej nas cechy. Jedna cecha mieszana.

Grupowanie analityczne – polega na jednoczesnym grupowaniu materiału źródłowego wg dwóch lub więcej cech.

Efektem grupowania są szeregi.

Wykład 3.

Grupowanie wariancyjne

Budowa szeregu

  1. Sporządzić wykaz wariantów badanej cechy zmiennej

  2. Uporządkowanie wariantów w kolejności rosnącej lub malejącej

  3. Ustalić obszar zmienności

Rx=Xmax-Xmin <- rozstęp

  1. Określenie liczny klas (zawsze liczba całkowita)

Liczba obserwacji Proponowana liczba klas

20-40 5-7

40-60 6-8

60-100 7-10

100-200 9-12

200-500 12-17

K≤5logN N – ogólna liczebność

K=1+3,322*logN

K≤$\sqrt{\frac{N}{2}}$

  1. Rozpiętość przedziału klasowego – C

C=$\frac{\text{Rx}}{k}$ Rx – obszar zmienności; k- liczba klas

  1. Określamy granice przedziałów.

Szereg jest poprawnie zbudowany gdy:

  1. Jest zamknięty górą i dołem

  2. Ma równe przedziały klasowe

  3. Posiada jedno maksimum

  4. Nie ma przedziałów pustych

Jeśli nie spełnia warunków to wybieramy inną liczbę klas.

Szereg statystyczny – nazywamy ciąg wielkości statystycznych usystematyzowanych według określonych kryteriów.

Z punktu widzenia treści:

  1. Szereg strukturalny – Opisuje wewnętrzną strukturę zbiorowości.

  2. Szereg czasowy – obrazuje rozwój danego zjawiska w jednostce czasu. Ilość momentów lub okresów, strumień zdarzeń.

  3. Szereg przestrzenny

Z punktu widzenia formy:

  1. Szeregi proste (wyliczające)

  2. Szeregi rozdzielne – gdy zbiorowość jest podzielona na podgrupy.

Cechy zmienne:

Formy prezentowania danych statystycznych:

  1. Tablice statystyczne są formą prezentacji zebranego i opracowanego materiału empirycznego. Składa się:

    • Tytułu (jasny zwięzły)

    • Tablicy właściwej – kolumny i wiersze

    • Źródeł i ew uwag

Znaki umowne:

1.Kreska - zjawisko nie wystąpiło.

  1. Zero 0 Zjawisko wystąpiło, ale nie można go wyrazić w jednostkach miar stosowanych w tablicy

  2. Kropka . Zjawisko istnieje lecz brak o nim informacji lub informacji wiarygodnych

  3. Krzyżyk X wypełnienie jest niecelowe lub niemożliwe ze względu na układ tablicy

  4. „w tym” nie podaje się wszystkich składników.

TABLICE

2.Wykres – wizualna forma prezentacji danych wyjściowych oraz wyników analizy statystycznej. Wykres spełnia rolę komplementarną, a więc nie jest formą substytutu do tabelarycznej. Składa się z:

Analiza statystyczna etap IV

  1. Analiza struktury – badająca prawidłowości charakteryzującą budowę wewnetrzną zbiorowości.

  2. Analiza współzależności – umożliwiającą wykrycie i mierzenie związków między zjawiskami i cechami.

  3. Analiza dynamiki – rozwój badanych zjawisk w czasie.

Typy rozkładów empirycznych – nazywamy przyporządkowanie kolejnym wartościom zmiennej x odpowiadającą im liczebność.

Celem analizy struktury jest ustalenie podobieństw i różnic między jednostkami badanej zbiorowości ze względu na wyróżnioną cechę zmienną. Dotyczy tylko jednej zmiennej.

Podobieństwa między jednostkami ustala się przez wyznaczenie przeciętnego poziomu wartości wszystkich jednostek.

Badanie różnic przebiega wielokierunkowo i obejmuje:

Parametry klas stosujemy wtedy gdy zbiorowość jest jednorodna, gdy szereg jest symetryczny lub umiarkowanie asymetryczny.

Gdy szeregi rozdzielcze są zamknięte i posiadają różne przedziały klasowe

Parametry pozycyjne – stosujemy we wszystkich szeregach szczególnie w szeregach skrajnie asymetrycznych, otwartych lub o nie równych przedziałach czasowych.

Funkcja pomocnicza w stosunku do miar klasycznych.

Miary przeciętne

Średnia arytmetyczna: (Xa)

W szeregu prostym:


$$\frac{\sum_{i = 1}^{k}\text{xi}}{N}$$

W szeregu rozdzielczym: (ważona)


$$\frac{\sum_{i = 1}^{k}{xi*ni}}{N}$$

W rozdzielczym przedziałowym:


$$\frac{\sum_{i = 1}^{k}{Xi^{'}*ni'}}{N}$$

Wykład 4.

Właściwości średniej arytmetycznej:


$$\overset{\overline{}}{x} = \frac{\sum_{i = 1}^{n}{x1}}{N}$$

Suma odchyleń wartości poszczególnych jednostek zbiorowości statystycznej od średniej arytmetycznej, równa się zero.


$$\sum_{i = 1}^{n}{(x_{1} - \overset{\overline{}}{x}}) = 0$$

Suma kwadratów odchyleń wartości poszczególnych jednostek zbiorowości statystycznej od średniej arytmetycznej równa się minimum.


$$\sum_{i = 1}^{n}{\left( x_{1} - \overset{\overline{}}{x} \right)^{2} = min}$$

Średnia geometryczna

W szeregu prostym:


$${\overset{\overline{}}{x}}_{g} = \sqrt[n]{x_{1}*x_{2}*x_{3}*\ldots*x_{n}}$$

W szeregu rozdzielczym:


$${\overset{\overline{}}{x}}_{g} = \sqrt[N]{x_{1}^{n_{1}}*x_{2}^{n_{2}}*x_{3}^{n_{3}}*\ldots*x_{n}^{n_{n}}}$$

Średnia harmoniczna

W szeregu prostym:


$${\overset{\overline{}}{x}}_{h} = \frac{N}{\sum_{i = 1}^{n}\frac{1}{x_{1}}}$$

W szeregu rozdzielczym:


$${\overset{\overline{}}{x}}_{h} = \frac{N}{\sum_{i = 1}^{n}\frac{n_{1}}{x_{1}}}$$

Średnia potęgowa:


$${\overset{\overline{}}{x}}_{p} = \sqrt[k]{\frac{\sum_{}^{}x^{k}}{N}}$$

k=1,2,3…n

dla k=1 relacja sprowadza się do wzoru na średnią arytmetyczną, a dla k=2 uzyskujemy średnią kwadratową.

Średnia kwadratowa:

W szeregu prostym:


$${\overset{\overline{}}{x}}_{k} = \sqrt{\frac{\sum_{i = 1}^{n}x_{i}^{2}}{N}}$$

W szeregu rozdzielczym:


$${\overset{\overline{}}{x}}_{k} = \sqrt{\frac{\sum_{i = 1}^{n}{x_{i}^{2}*n_{1}}}{N}}$$

Miary Pozycyjne

Dominanta

W szeregu prostym: wartość najczęstsza

W szeregu rozdzielczym:


$$D = x_{d} + c*\frac{n_{d} - n_{d - 1}}{\left( n_{d} - n_{d - 1} \right) + (n_{d} - n_{d + 1})}$$

Xd – dolna granica przedziału w którym znajduje się dominanta

C – rozpiętość przedziału dominanty

Nd – liczebność przedziału dominanty

Nd-1 – liczebność przedziału poprzedzającego

Nd+1 – liczebność przedziału następującego

Warunki:

  1. Gdy szeregi nie są skrajnie asymetryczne

  2. Gdy rozkład posiada jedno maksimum

  3. Gdy przedział dominanty i 2 sąsiednie mają jednakową rozpiętość

  4. Dominanty nie można wyznaczyć w szeregach n-modalnych i wielomodalnych.

Mediana

W szeregu prostym: 40, 45, 50, 55, 60 Me=50

W szeregu rozdzielczym przedziałowym wykorzystuje się wzór interpolacyjny


$$Me = x_{d} + \left( \frac{n}{2} - cum\ n_{- 1} \right)*\frac{c_{0}}{n_{0}}$$

Xd – dolna granica przedziału w którym znajduje się mediana

Cum n-1 – skumulowana liczebność poprzedzającego przedział mediany

C0 – rozpiętość przedziału mediany

N0 – liczebność przedziału mediany

Kwartyle

Wartości ćwiartkowe Q1, Q2=Me, Q3

Kwartyl pierwszy jest to taka wartość poniżej której leży 25 % jednostek zbiorowości


$$Q_{1} = x_{d} + \left( \frac{N}{4} - \text{cum}_{n - 1} \right)*\frac{c_{0}}{n_{0}}$$

Kwartyl trzeci dzieli zbiorowość na dwie części w taki sposób, że ¾ jednostek ma wartość niższe niż Q4


$$Q_{3} = x_{d} + \left( \frac{3N}{4} - \text{cum}_{n - 1} \right)*\frac{c_{0}}{n_{0}}$$

Miary dyspersji (zróżnicowania)

Umożliwiają pomiar i liczbowe określenie wielkości zróżnicowania badanej cechy

Klasyczne Pozycyjne

Odchylenie przeciętne Obszar zmienności

Odchylenie standardowe Odchylenie ćwiartkowe

Wariancja Pozycyjne współ. Zmienności

Klasyczny współ. Zmienności

Obszar zmienności (rozstęp)

  1. Należy do pozycyjnych miar dyspersji

  2. Definiuje się jako różnice między najwyższą a najniższą wartością cechy.


Rx = xmax − xmin

Odchylenie ćwiartkowe

  1. Określa połowę różnicy między kwartylem trzecim a pierwszym


$$Q = \frac{Q_{3} - Q_{1}}{2}$$

Odchylenie ćwiartkowe na zastosowanie wówczas gdy niemożliwe jest obliczenie średniej arytmetycznej, a przeciętny poziom opisano za pomocą kwartyli.

Kwartylowy obszar zmienności ustala się według wzoru:


Me − Q < xtyp < Me + Q

Za nietypowe należy uznać jednostki w danej zbiorowości, które mają wartości mniejsze od Me-Q oraz większe od Me+Q

Odchylenie standardowe – wyznaczanie

W szeregu prostym:


$$S_{(x)} = \sqrt{\frac{\sum_{}^{}{(x_{1} - \overset{\overline{}}{x})}^{2}}{N}}$$

W szeregu rozdzielczym punktowym:


$$S_{\left( x \right)} = \sqrt{\frac{\sum_{}^{}{\left( x_{1} - \overset{\overline{}}{x} \right)^{2}*n_{1}}}{N}}$$

W szeregu rozdzielczym przedziałowym:


$$S_{(x)} = \sqrt{\frac{\sum_{}^{}{{(x_{1}^{'} - \overset{\overline{}}{x})}^{2}*n_{1}}}{N}}$$

Właściwości:

  1. Należy do miar klasycznych

  2. Oblicza się na podstawie wszystkich wartości szeregu

  3. Można je wyznaczyć również wtedy gdy liczebności szeregu podane są w liczbach względnych.

  4. Dla obliczenia odchylenia standardowego konieczna jest znajomość średniej arytmetycznej.

  5. Wartość odchylenia standardowego nie ulegnie zmianie, gdy do wszystkich wartości zmiennej w szeregu dodamy pewną stałą liczbę.

  6. Jeżeli wszystkie wartości szeregu pomnożymy lub podzielimy przez jakąkolwiek tę samą liczbę większą od zera, to odchylenie standardowe będzie również trzykrotnie mniejsza lub wieksza.

Reguła tzw. 3 sigm. W przypadku rozkładu normalnego lub do niego zbliżonego blisko 1/3 wszystkich wartości zmiennej różni się od średniej arytmetycznej o ± odchylenie standardowe. Jedna na 20 obserwacji przekracza tą zmienną o ±.

Obszar zmienności typowych jednostek:


$$\overset{\overline{}}{x} - \ S_{\left( x \right)} < x_{\text{typ}} < \overset{\overline{}}{x} + S_{\left( x \right)}$$

W obszarze tym mieści się około 2/3 wszystkich jednostek.

Względne miary dysproporcji

Klasyczny współczynnik zmienności:


$$V_{\left( x \right)} = \frac{S_{\left( x \right)}}{\overset{\overline{}}{x}}*100$$

Pozycyjny układ zmienności:


$$V_{q} = \frac{Q}{\text{Me}}*100$$

Umownie przyjmuje się, że:

V≤35% dyspersja jest mała, średnia arytmetyczna dobrze charakteryzuje średni poziom badanego zjawiska. Można udać, że badana zbiorowość jest jednorodna.

35%<V≤60% dyspersja jest umiarkowana a średnia arytmetyczna dość dobrze charakteryzuje średni poziom badanego zjawiska.

60%<V< 75 % dyspersja jest duża, a średnia arytmetyczna nie jest miarą dobrze charakteryzującą tendencje centralności. Zbiorowość jest niejednorodna.

Miary asymetrii:

  1. Absolutne – pokazują kierunek asymetrii

  2. Względne – mówią o kierunku i o sile.

  3. W rozkładzie symetrycznym poszczególne wartości badanej zmiennej rozkładają się równomiernie po obu stronach średniej arytmetycznej


$$\overset{\overline{}}{x} = D = Me$$

  1. W rozkładzie asymetrycznym prawostronnie przeważają jednostki o wartościach cechy mniejszej od średniej arytmetycznej


$$D < Me < \overset{\overline{}}{x}$$

  1. W rozkładzie asymetrycznym lewostronnie przeważają jednostki o wartościach większych od średniej arytmetycznej


$$\overset{\overline{}}{x} < Me < D$$

Klasyczno-pozycyjne miary asymetrii:

$A_{s} = \frac{\overset{\overline{}}{x} - D}{S_{(x)}}$ -1<As<1

$A_{s} = \frac{3(\overset{\overline{}}{x} - \text{Me})}{S_{(x)}}$ -1<As<1

$A_{s} = \frac{\frac{3}{2}(\text{Me} - D)}{S_{(x)}}$ -3<As<3

Pozycyjne miary asymetrii

Gdy niemożliwe jest obliczenie dominanty czy średniej arytmetycznej do wyznaczenia współczynnika asymetrii wykorzystuje się kwartale


$$A_{s} = \frac{\left( Q_{3} - Me \right) - (Me - Q_{1})}{\left( Q_{3} - Me \right) + (Me - Q_{1})}$$

Wykład 5.

Klasyczny współczynnik asymetrii: (a3)


$$\frac{\sum_{i = 1}^{k}{{(x_{i} - x_{a})}^{3}*n_{i}}}{N*{S(x)}^{3}}$$

Jeżeli:

a3=0 -symetryczny

a3>0 - asymetryczny prawostronnie

a3<0 -asymetryczny lewostronnie

Koncentracja wokół średniej: (a4)

Struktury zjawisk masowych bada się pod katem koncentracji (skupienia) poszczególnych wartości zmiennej wokół średniej.


$$\frac{\sum_{i = 1}^{k}{{(Xi - Xa)}^{4}*ni}}{N*{S(x)}^{4}}$$

Względną miarą natężenia jest współczynnik koncentracji

Jeżeli:

a4=3 -układ normalny

a4>3 -wysmukły o skupieniu silniejszym niż normalny

a4<3 -spłaszczony o skupieniu słabszym niż normalny.

Zadanie 1.

Kompleksowa analiza w szeregu prostym.

Wylosowano 10 gospodarstw domowych 4-osobowych w pewnym mieście i otrzymywano od nich informacje o rocznym zużyciu wody z wodociągów w m3

  1. Określi zbiorowość, jednostkę i cechę

  2. Przeprowadź kompleksową analizę struktury stosując parametry dla danego układu informacji.

  3. Podaj wnioski z analizy.

Ad 1. Zbiorowość: Gospodarstwa domowe

Jednostka – 4-osobowe gospodarstwo domowe


x1

$$x_{1} - \overset{\overline{}}{x}$$

$${(x_{1} - \overset{\overline{}}{x})}^{2}$$
210 -76 5776
240 -46 2116
254 -32 1024
265 -21 441
285 -1 1
285 -1 1
285 -1 1
316 30 900
345 59 3481
375 86 7921
2860 21662

Cecha – ilość zużytej wody – rzeczowa, mierzalna, ciągła.

Analiza:

  1. $\overset{\overline{}}{x} = \frac{2860}{10} = 286$

  2. D = 285

  3. $S_{(x)} = \sqrt{\frac{\sum_{}^{}{(x_{1} - \overset{\overline{}}{x})}^{2}}{N}}$

  4. $\overset{\overline{}}{x} - S_{\left( x \right)} < x_{\text{typ}} < \overset{\overline{}}{x} + S_{\left( x \right)}$

239,46<xtyp<332,54

  1. $V_{\left( x \right)} = \frac{S_{\left( x \right)}}{\overset{\overline{}}{x}}*100 = 16,27\%$

  2. $A_{s} = \frac{\overset{\overline{}}{x} - D}{S_{\left( x \right)}} = 0,02$

Interpretacja:

  1. Przeciętne zużycie wody wylosowanych gospodarstw domowych 4-osobowych wynosiło 286 m3

  2. W badanej zbiorowości przeważyły gospodarstwa zużywające miesięcznie 286 m3

  3. Odchylenie standardowe – przeciętnie biorąc zuzycie wody odchyla się od średniego zużycia o ±46,54 m3

  4. Typowy przedział zmienności –ok. 2/3 gospodarstw domowych zużywało miesięcznie od 239,46 do 332,54 m3

  5. Współczynnik zmienności – odchylenie standardowe stanowi 16,27 % średniej arytmetycznej, świadczy to o niewielkim zróżnicowaniu zbiorowości. Zbiorowość jest jednorodna.

  6. Rozkład badanej cechy charakteryzuje się asymetrią prawostronną, co oznacza przewagę gospodarstw domowych zużywających rocznie mniej wody niż na to wskazuje średnia arytmetyczna.

Zadanie 2

Kompletna analiza strukturalna w szeregu punktowo rozdzielczym.

Stopień mechanizacji mierzony liczbą posiadanych maszyn rolniczych w wybranych gospodarstwach rolnych w pewnej gminie w woj. Wielkopolski w 2012.

Liczba maszyn Liczba gosp.
xi * ni

$$(x_{i} - \overset{\overline{}}{x})$$

$${(x_{i} - \overset{\overline{}}{x})}^{2}$$

$${(x_{i} - \overset{\overline{}}{x})}^{2}*n_{i}$$

$${(x_{i} - \overset{\overline{}}{x})}^{4}*n_{i}$$
0 5 0 -3,61 13,03 65,15 848,9
1 11 11 -2,61 6,81 74,91 510,14
2 20 40 -1,61 2,59 51,80 134,16
3 40 120 -0,61 0,37 14,80 5,48
4 79 316 0,39 0,15 11,85 1,78
5 35 175 1,39 1,93 67,55 130,37
6 10 60 2,39 5,71 57,10 326,04
200 722 343,16 1956,87

Cecha: liczba maszyn – rzeczowa, mierzalna, skokowa

Jednostka: gospodarstwo rolne w pewnej gminie w woj. Wielkopolskim w 2012

  1. $\overset{\overline{}}{x} = \frac{\sum_{}^{}{x_{i}*n_{i}}}{N} = \frac{722}{200} = 3,61$

  2. D=4

  3. $S_{\left( x \right)} = \sqrt{\frac{\sum_{}^{}{\left( x_{i} - \overset{\overline{}}{x} \right)^{2}*n_{i}}}{N}} = \sqrt{\frac{342,16}{200}} = 1,31$

  4. 3,61-1,31<xtyp<3,61+1,31 2,3<xtyp<4,92

  5. $V_{\left( x \right)} = \frac{1,31}{3,61}*100 = 36,29\%$

  6. $A_{s} = \frac{3,61 - 4}{1,31} = - 0,3$

  7. $\propto_{4} = \frac{1956,87}{200*{1,31}^{4}} = 3,32$

Interpretacja:

  1. Przecietna liczba maszyn rolniczych wynosiła 3,61

  2. W badanej zbiorowości przeważały gospodarstwa mająca 4 maszyny rolnicze

  3. Przeciętnie biorąc liczba maszyn rolniczych w gospodarstwach rolnych odchyla się od sredniej arytmetycznej o ±1,31

  4. Prawie 2/3 badanych gospodarstw posiadała liczbę maszyn rolniczych w przedziale 2,31-4,92

  5. Odchylenie standardowe stanowi 36,29% średniej arytmetycznej co wskazuje na umiarkowane zróżnicowanie badanej zbiorowości

  6. Rozkład badanej cechy charakteryzuje się asymetrią lewostronną co oznacza przewagę gospodarstw rolnych mających więcej maszyn rolniczych niż na to wskazuje średnia arytm.

  7. Współczynnik koncentracji wskazuje na silniejsze skupienie wokół średniej aniżeli w rozkładzie normalnym.

Zadanie 3

Kompleksowa analiza struktury w szeregu rozdzielczym przedziałowym górą i dołem zamknietych.

Strukturę stażu pracy pracowników pewnego banku obrazuje poniższa tabela.

Xi - w latach Ni – liczba pracow. Xi
xi * ni

$$x_{i}^{'} - \overset{\overline{}}{x}$$

$${(x_{i}^{'} - \overset{\overline{}}{x})}^{2}$$

$${(x_{i}^{'} - \overset{\overline{}}{x})}^{2}{*n}_{i}$$

$${(x_{i}^{'} - \overset{\overline{}}{x})}^{4}{*n}_{i}$$
0-5 5 2,5 12,5 -11,33 128,37 641,85 82394,28
5-10 30 7,5 225 -6,33 40,07 1202,1 48168,15
10-15 45 12,5 562,5 -1,33 1,87 79,65 140,98
15-20 18 17,5 315 3,67 13,47 242,46 3265,94
20-25 12 22,5 270 8,67 75,17 902,04 67806,35
25-30 10 27,5 275 13,67 186,87 1868,7 349203,97
suma 120 1660 4936,8 550979,67

Cecha rzeczowa mierzalna ciągła

  1. $\overset{\overline{}}{x} = \frac{\sum_{}^{}{x_{i}^{'}*n_{i}}}{N} = \frac{1660}{120} = 13,83$

  2. $D = 10 + 5*\frac{45 - 30}{\left( 45 - 30 \right) + \left( 45 - 18 \right)} = 11,79$

  3. $S_{\left( x \right)} = \sqrt{\frac{4936,8}{120}} = 6,41$

  4. 7,42<xtyp<20,24

  5. $V_{\left( x \right)} = \frac{6,41}{13,83}*100 = 46,35\%$

  6. $A_{s} = \frac{13,83 - 11,79}{6,41} = 0,32$

  7. $\propto_{4} = \frac{550979,67}{120*{6,41}^{4}} = 2,72$

Interpretacja:

  1. Przeciętny staż pracy pracownika danego banku wynosił 13,83

  2. W badanej zbiorowości przeważają pracownicy o stażu równym 11,79 lat

  3. Przeciętnie biorąc staż pracowników odchyla się o ± 6, 41 lat od średniego stażu.

  4. Prawie 2/3 pracowników banku posiadało staż w granicach 7,42 – 20,24 lata

  5. Odchylenie standardowe stanowi 46,35% średniej arytmetycznej. Dyspersja jest umiarkowana.

  6. Rozkład badanej cechy jest asymetryczny prawostronnie co oznacza, że w zbiorowości znajduje się więcej pracowników ze stażem poniżej średniej arytmetycznej.

  7. Współczynnik koncentracji wskazuje na mniejszą aniżeli w układzie normalnym koncentrację wokół średniej.

Zadanie 4

Kompleksowa analiza struktury w szeregu rozdzielczym przedziałowym górą i dołem otwartym o nierównych przedziałach klasowych.

Obserwacji poddano kredytobiorców którzy w grudniu 2012 r. pobrali kredyt konsumpcyjny w banku PKO BP.

Kredyt w tys Liczba osób Cumn
Poniżej 15 6 6
15-20 40 46 Q1
20-25 60 106 Me, Q3
25-40 20 126
Powyżej 40 4 130
130
  1. $\frac{N}{2} = \frac{130}{2} = 65$ $poz\ Me = 20 + \left( 65 - 46 \right)*\frac{5}{60} = 21,58$

  2. $\frac{N}{4} = \frac{130}{4} = 32,5$ $\text{poz\ }Q_{1} = 15 + \left( 32,5 - 6 \right)*\frac{5}{40} = 18,31$

  3. $\frac{3N}{4} = \frac{3*130}{4} = 97,3$ $\text{poz\ }Q_{3} = 20 + \left( 97,3 - 46 \right)*\frac{5}{60} = 24,29$

  4. $Q = \frac{Q_{3} - Q_{1}}{2} = 2,99$

  5. 21,58-2,99<xtyp<21,58+2,99 18,59<xtyp<24,57

  6. $V_{\left( q \right)} = \frac{Q}{\text{Me}}*100 = 13,85\%$

  7. $A_{s} = \frac{\left( 24,29 - 21,58 \right) - \left( 21,58 - 18,31 \right)}{\left( 24,29 - 21,58 \right) + \left( 21,58 - 18,31 \right)} = - 0,09$

Interpretacja:

  1. Połowa kredytobiorców pobrała kredyt niższy niż 21,58 tys.

  2. ¼ kredytobiorców pobrała kredyt nie wyższy niż 18,31 tys.

  3. ¾ kredytobiorców pobrało kredyt nie wyższy niż 24,29 tys.

  4. Przeciętnie biorąc wysokość pobranych kredytów odchyla się o ±2,99 tys od poziomu średniego.

  5. Ok. 2/3 kredytobiorców pobrało kredyt w wysokości 18,59-24,57 tys.

  6. Odchylenie ćwiartkowe stanowi 13,85 % wartości mediany, więc zbiorowość jest jednorodna.

  7. Rozkład badanej cechy charakteryzuje się asymetrią lewostronną, co oznacza, że kredytobiorcy biorą kredyty wyższe niż może na to wskazywać wartość średnia.

Wykład 6.

Analiza współzależności

Zależność funkcyjna polega na tym, że zmiana wartości jednej zmiennej powoduje ściśle określoną zmianę wartości drugiej zmiennej.

X – zmienna objaśniająca

Y – zmienna objaśniana

Zależnością statystyczną nazywamy zależność pomiędzy dwoma zmiennymi losowymi polegającą na tym, że wraz ze zmianą wartości jednej zmiennej zmienia się rozkład podobieństw drugiej zmiennej.

Zależność korelacyjna - polega na tym że określonym wartością jednej zmiennej odpowiadają ściśle określone średnie wartości drugiej zmiennej.

r(x,y) – współczynnik korelacji Pearsona


$$r_{(x,y)} = \frac{\frac{1}{N}\sum_{}^{}{x_{i}y_{1} - \overset{\overline{}}{x}*\overset{\overline{}}{y}}}{S_{(x)}*S_{(y)}}$$

Współczynnik ten jest wielkością unormowaną. Przyjmuje wartości z przedziału:

-1≤r(x,y)≤1

Jeżeli współczynnik korelacji zbliża się do zera oznacza to, że nie ma związku pomiędzy badanymi cechami i odwrotnie. Jeżeli zbliża się do 1 lub -1 związek jest bardzo silny

r(x,y)=1 korelacja dodatnia, doskonała zależność funkcyjna

0<r(x,y)<1 korelacja dodatnia, niedoskonała

r(x,y)=0 brak zależności pomiędzy zmiennymi

-1< r(x,y)<0 korelacja ujemna, niedoskonała

r(x,y)=-1 korelacja ujemna, doskonała zależność funkcyjna

Równania regresji

Równanie regresji jest ilościowym wyrazem zależności między określonymi wartościami zmiennej niezależnej i odpowiadającymi im średnimi wartościami zmiennej zależnej.

Funkcja regresji liniowej ma postać:


$$\hat{Y_{(x)}} = a_{(x)} + b_{\left( x \right)}X$$

Y – niezależna

X – zależna


$$\hat{X_{\left( y \right)}} = a_{\left( y \right)} + b_{\left( y \right)}X$$

X – zależna

Y – niezależna

Ax, ay – wyrazy wolne równania

Bx, by – współczynniki regresji. Wartość współczynnika wyraża o ile przeciętnie zmieni się zmienna zależna jeśli zmienna niezależna wzrośnie o jednostkę.

Parametry równania regresji

$b_{y} = r_{(x,y)}*\frac{S_{y}}{S_{x}}$ $b_{x} = r_{(x,y)}*\frac{S_{x}}{S_{y}}$

$a_{y} = \overset{\overline{}}{y} - b_{y}*\overset{\overline{}}{x}$ $a_{x} = \overset{\overline{}}{x} - b_{x}*\overset{\overline{}}{y}$


$$r_{(x,y)} = \pm \sqrt{b_{x}*b_{y}}$$

Ocena stopnia „dobroci”

Odchylenie standardowe składnika resztowego – informuje, o ile przeciętnie można się pomylić szacując wartości y i x na podstawie funkcji regresji.


$$S_{y} = \sqrt{\frac{\sum_{}^{}{(y_{i} - \hat{y_{i}})}^{2}}{n - k}}$$


$$S_{y} = S_{y}*\sqrt{1 - r_{x,y}^{2}}$$


$$S_{x} = \sqrt{\frac{\sum_{}^{}{(x_{i} - \hat{x_{i}})}^{2}}{n - k}}$$


$$S_{x} = S_{x}*\sqrt{1 - r_{x,y}^{2}}$$

n – liczba obserwacji

k – liczba szacowanych parametrów

Współczynnik determinacji jest miarą stopnia w jakim model wyjaśnia zmienność zmiennej Y lub X


d = rx, y2


d = rx, y2 * 100

Dopasowanie modelu do danych empirycznych jest tym lepsze im bliżej zbliża się do 1 lub 100%

Współczynnik indeterminacji (zbieżności) wskazuje jaka część zmienności zmiennej y lub x nie jest objaśniona za pomocą modelu.


$$\varphi^{2} = \frac{\sum_{}^{}{(y_{i} - \hat{y})}^{2}}{\sum_{}^{}{(y_{i} - \overset{\overline{}}{y})}^{2}}$$


$$\varphi^{2} = \frac{\sum_{}^{}{(x_{i} - \hat{x})}^{2}}{\sum_{}^{}{(x - \overset{\overline{}}{x})}^{2}}$$


φ2 = 1 − rx, y2

Współczynnik ten jest miarą zawartą w przedziale zamkniętym <0,1>. Im wartość jego jest bliższa zeru tym oszacowana funkcja regresji jest lepiej dopasowana do wartości empirycznych.

Jeżeli współczynnik determinacji=1 a indeterminacji=0 to jest to sytuacja, w której zaobserwowane punkty leżą dokładnie na prostej.

Jeżeli współczynnik determinacji=0 a indeterminacji=1to jest to sytuacja maksymalnego możliwego odchylania się zaobserwowanych punktów od dopasowanej prostej.

Współczynnik zmienności resztowej informuje, jaką część średniej wartości zmiennej objaśnianej stanowi jej odchylenie standardowe reszt.


$$V_{r} = \frac{S_{y}}{\overset{\overline{}}{y}}*100$$


$$V_{r} = \frac{S_{x}}{\overset{\overline{}}{x}}*100$$

W praktyce przyjmuje się za dopuszczalny model jeżeli 0%≤Vr≤20%

Wykład 7.

W pewnej fabryce badanie wydajności pracowników i czasu nieprzerwanej dostarczyły informacji:

Czas pracy w h Wydajn w szt/h X*Y
$$(x_{i} - \overset{\overline{}}{x})$$

$$(y_{i} - \overset{\overline{}}{y})$$

$${(x_{i} - \overset{\overline{}}{x})}^{2}$$

$${(y_{i} - \overset{\overline{}}{y})}^{2}$$
1 18 18 -4,5 3,1 20,25 9,61
2 20 40 -3,5 5,1 12,25 26,01
3 18 54 -2,5 3,1 6,25 9,61
4 17 68 -1,5 2,1 2,25 4,41
5 15 75 -0,5 0,1 0,25 0,01
6 15 90 0,5 0,1 0,25 0,01
7 14 98 1,5 -0,9 2,25 0,81
8 12 96 2,5 -2,9 6,25 8,41
9 10 90 3,5 -4,9 12,25 24,01
10 10 100 4,5 -4,9 20,25 24,01
55 149 729 82,5 106,9
  1. Sporządzić diagram korelacyjny

  2. Okreśłić siłę o kierunke zależności przy pomocy współczynnika korelacji pearsona.

  3. Wyznaczyć rachunkowo i graficznie oba równania regresji.

  4. Oszacować czas nieprzerwanej pracy gdy wydajność wynosi 16 szt/h


$$\overset{\overline{}}{x} = \frac{55}{10} = 5,5$$


$$\overset{\overline{}}{y} = \frac{149}{10} = 14,9$$


$$S_{\left( x \right)} = \sqrt{\frac{82,5}{10}} = 2,87$$


$$S_{\left( y \right)} = \sqrt{\frac{106,9}{10}} = 3,27$$

Współczynnik korelacji ujemny.

Wsp korelacji Pearsona: $\frac{\frac{1}{N}*\sum_{}^{}{xy - \overset{\overline{}}{x}*\overset{\overline{}}{y}}}{s_{(x)}*s_{(y)}}$


$$r_{x,y} = \frac{\frac{1}{10}*729 - 5,5*14,9}{2,87*3,27} = - 0,96$$

Pomiędzy czasem nieprzerwanej pracy a wydajnością zachodzi silna ujemna zależność korelacyjna wraz ze wzrostem czasu nieprzerwanej pracy maleje wydajność.

Równania regresji są blisko bo współczynnik jest wysoki.


$$S_{x} = 2,87*\sqrt{1 - \left( {- 0,96}^{2} \right)} = 0,8$$

Szacując czas nieprzerwanej pracy na podstawie równania regresji przeciętnie można się pomylić o 0,8 h

  1. $\hat{y_{\left( x \right)}} = a_{\left( y \right)} + b_{\left( y \right)}*x$


$$b_{\left( y \right)} = r_{\left( x,y \right)}*\frac{S_{x}}{S_{y}} = - 0,96*\frac{3,27}{2,81} = - 1,09$$


$$a_{\left( y \right)} = \overset{\overline{}}{y} - b_{\left( y \right)}\overset{\overline{}}{x} = 14,91,09*5,5 = 20,9$$


$$\hat{y_{(x)}} = 20,9 - 1,09*X$$

Z równania tego wynika, że wzrost czasu nieprzerwanej pracy o jednostkę (to jest o 1h) powoduje zmniejszenie wydajności pracy przeciętnie biorąc o 1,09 szt/h

Xmin=1

Y=20,9-1,09*1=19,81

Xmax=10

Y=20,9-1,09*10=10


$$S_{y} = s_{y}*\sqrt{1 - r_{x,y}^{2}} = 0,92$$

Szacując wydajność pracy na podstawie równania regresji przeciętnie można się pomylić o ± 0,92 szt/h

  1. $\hat{x} = a_{\left( x \right)} + b_{\left( x \right)}*y$


$$b_{\left( x \right)} = r_{\left( x,y \right)}*\frac{S_{y}}{S_{x}} = - 0,96*\frac{2,81}{3,27} = - 0,84$$


$$a_{\left( x \right)} = \overset{\overline{}}{x} - b_{\left( x \right)}\overset{\overline{}}{y} = 5,50,84*14,9 = 18,02$$


$$\hat{x} = 18,02 - 0,84*y$$

Z równania tego wynika, że zwiększeniu wydajności pracy o jednostkę towarzyszy zmniejszenie czasu nieprzerwanej pracy przeciętnie o 0,84 h

Ymin=10

X=18,02-0,84*10=9,62

Ymax=20

X=18,02-0,84*20=1,22


d = rxy2 * 100 = −0, 962 * 100 = 92, 16%

Współczynnik determinacji wskazuje, że 92,16 % zmienności zmiennej objaśnianej zostało wyjaśnione przez oszacowaną funkcję regresji.


φ2 = 100%−92, 16%=7, 48%

Oznacza to, że 7,84%zmienności zmiennej objaśnianej zależy od innych zmiennych nie uwzględnionych w modelu.

Współczynnik zmienności resztowej:


$$V_{r} = \frac{S_{y}}{\overset{\overline{}}{y}}*100 = 6,17\%$$

(Jeśli nie przekracza 20% to model jest dopuszczalny). Model regresji można uznać za dopuszczalny gdyż wahania losowe stanowią jedynie 6,17% średniego poziomu wydajności pracy.

Y=16

X=18,02-0,84*16=4,58±0,8

Współczynnik korelacji rang spearmana jest stosowany do poziomu siły i kierunku zależności między cechami w przypadku mało licznych zbiorowości.


$$r_{d} = 1*\frac{6*\sum_{}^{}d_{i}^{2}}{n^{3} - n}$$

d – różnica między rangami cechy x i y

Rangowanie może odbywać się od najmniejszej do największej wartości cech, przy czym sposób rangowania musi być jednakowy dla obu zmiennych.

W przypadku gdy występują jednakowe warianty zmiennych przyporządkowuje się im średnią arytmetyczną z ich kolejnych numerów.

Współczynnik korelacji rang przyjmuje wartości z przedziału <-1,1> a jego interpretacja przebiega podobnie jak współczynnik korelacji Pearsona.

R=0 korelacja nie występują

0<r<1 Związek korelacji jest dodatni

-1<r<0 Związek korelacji jest ujemny

W celu sprawdzenia czy istnieje zależność między liczbą reklam pewnego środka czystości w TV w ciągu miesiąca a wielkością sprzedaży tego środka w ciągu następnego miesiąca przeprowadzono w pewnej miejscowości badanie uzyskując następujące dane:

Liczba rek (x) Sprz w tys (y) Ranga Rx Ranga Ry d=Rx-Ry D2
16 10 5 3,5 1,5 2,25
10 9 3 2 1 1
7 8 1 1 0 0
25 16 9 9 0 0
8 10 2 3,5 -1,5 2,25
17 15 6 8 -2 4
12 13 4 5 -1 1
18 14 7 6,5 0,5 0,25
20 14 8 6,5 1,5 2,25
Suma 13
  1. Ustalić siłę i kierunek zależności między badanymi zmiennymi przy pomocy współczynnika korelacji rang


$$r_{s} = 1*\frac{6*13}{9^{3} - 9} = 0,89$$

Między liczbą reklam a wartością sprzedaży zachodzi silna dodatnia zależność korelacyjna. Im więcej reklam tym większa sprzedaż środków czystości.

Korelacja cech jakościowych:

+ - Razem
+ A B A+B
- C D C+D
Razem A+C B+D N

A – liczba jednostek posiadających cechę x i y

B – liczba jednostek posiadających cechę x, ale nie posiadających cechy y

C – liczba jednostek posiadających cechę y, ale nie posiadających cechy x

D – liczba jednostek nie posiadających ani cechy x ani y

Współczynnik korelacji Pearsona:


$$C_{\text{xy}} = \sqrt{\frac{\times^{2}}{\times^{2} + n}}$$

W przypadku tablicy o wymiarach 2/2 do wyznaczenia statystyka χ2 można zastosować wzór:


$$\times^{2} = \frac{{n\left( ad - bc \right)}^{2}}{\left( a + b \right)\left( a + c \right)\left( b + d \right)\left( c + d \right)}$$

W przypadku tablicy o r wierszach i k kolumnach do wyznaczania statystyka χ2 można zastosować wzór:


$$\times^{2} = \sum_{i = 1}^{k}{\sum_{i = 1}^{r}\frac{\left( n_{\text{ij}} - \hat{n_{\text{ij}}} \right)^{2}}{\hat{n_{\text{ij}}}}}$$

Nij – liczebność empiryczna itego wiersza i jotej kolumny

$\hat{n_{\text{ij}}}$ - liczebność teoretyczna itego wiersza i jotej kolumny

Liczebność teoretyczną otrzymujemy mnożąc sumę itego wiersza przez sumę jotej kolumny i dzielimy prze ogólną liczebność.

Współczynnik kontyngencji przyjmuje wartości z przedziału <0,Cmax> przy czym maksymalna jego wielkość zależy od liczby kolumn i liczby wierszy w tablicy wielodzielnej.

  1. W przypadku tablicy kwadratowej max wartość współczynnika wynosi:


$$C_{\max} = \sqrt{\frac{k - 1}{k}}$$

  1. W przypadku tablicy prostokątnych


$$C_{\max} = \frac{\sqrt{\frac{k - 1}{k}} + \sqrt{\frac{r - 1}{r}}}{2}$$

Skorygowana wartość współczynnika C:


$$C_{\text{kor}} = \frac{C}{C_{\max}}$$

Wykład 8

W celu oceny stopnia zależności między absencją w pracy a płcią zbadano zbiorowość liczącą 1000 pracowników. Okazało się, że absencja mniejsza niż 5 dni w miesiącu miało 700 osób a równą lub przekraczającą 5 dni 100 kobiet. Wiadomo też, że w próbie było 600 mężczyzn

Czy pomiędzy tymi zmiennymi występuje zależność?

Kobieta Mężczyzna Razem
<5 dni 300 400 700
≥5dni 100 200 300
Razem 400 600 1000


$$\times^{2} = \frac{{1000\left( 300*200 - 100*400 \right)}^{2}}{700*400*600*300} = 7,937$$


$$C = \sqrt{\frac{7,937}{7,937 + 1000}} = 0,089$$


$$C_{\max} = \sqrt{\frac{2 - 1}{2}} = 0,71$$

W celu określenia związku między poziomem wykształcenia a ich aktywnością zawodową zbadano zbiorowość liczącą 1000 kobiet. Otrzymano następujące wyniki:

Podst śred Wyższe Razem
Pracująca 100/175 350/315 250/210 700
Nie pracująca 150/75 100/135 50/90 300
Razem 250 450 300 1000

Po / wartość teoretyczna

Określ stopień ścisłości związku badanych cech


$$\hat{n_{11}} = \frac{700*250}{1000} = 175$$


$$\hat{n_{21}} = \frac{300*250}{1000} = 75$$


$$\hat{n_{12}} = \frac{700*450}{1000} = 315$$


$$\hat{n_{22}} = \frac{450*300}{1000} = 135$$


$$\hat{n_{13}} = \frac{700*300}{1000} = 210$$


$$\hat{n_{23}} = \frac{300*300}{1000} = 90$$

nij
$$\hat{n_{\text{ij}}}$$

$$n_{\text{ij}} - \hat{n_{\text{ij}}}$$

$${(n_{\text{ij}} - \hat{n_{\text{ij}}})}^{2}$$

$$\frac{{(n_{\text{ij}} - \hat{n_{\text{ij}}})}^{2}}{\hat{n_{\text{ij}}}}$$
100 175 -75 5625 32,14
150 75 75 5625 75
350 315 35 1225 3,89
100 135 -35 1225 9,07
250 210 40 1600 7,62
50 90 -40 1600 17,78
145,5

χ2=145,5


$$C = \sqrt{\frac{145,5}{145,5 + 1000}} = 0,356$$


$$C_{\max} = \frac{\sqrt{\frac{3 - 1}{3}} + \sqrt{\frac{2 - 1}{2}}}{2} = 0,765$$


$$C_{\text{kor}} = \frac{0,356}{0,765} = 0,465$$

Korelacja cząstkowa występuje wówczas gdy porównujemy ze sobą 2 cechy przy założeniu, że istnieją i mają wpływ na dane zjawisko inne zmienne od których świadomie się abstrahuje.

Współczynnik korelacji cząstkowej:

  1. Przyjmuje wartości z przedziału <-1,1>

  2. Siłę zależności interpretuje się tak samo jak współczynnik Pearsona


$$r_{yx_{1}x_{2}} = \frac{r_{yx_{1}} - r_{yx_{2}}*r_{x_{1}x_{2}}}{\sqrt{\left( 1 - r_{yx_{2}}^{2} \right)(1 - r_{x_{1}x_{2}}^{2})}}$$


$$r_{yx_{2}x_{1}} = \frac{r_{yx_{2}} - r_{yx_{1}}*r_{x_{1}x_{2}}}{\sqrt{\left( 1 - r_{yx_{1}}^{2} \right)(1 - r_{x_{1}x_{2}}^{2})}}$$


$$r_{x_{1}x_{2}y} = \frac{r_{x_{1}x_{2}} - r_{yx_{1}}*r_{yx_{2}}}{\sqrt{\left( 1 - r_{yx_{1}}^{2} \right)(1 - r_{yx_{2}}^{2})}}$$

Korelacja wieloraka występuje wówczas gdy badamy zależność między więcej niż 2 zmiennymi.

Współczynnik korelacji wielorakiej w przypadku 3 zmiennych


$$R_{yx_{1}x_{2}} = \sqrt{1 - \left( 1 - r_{yx_{1}}^{2} \right)(1 - r_{\text{yx}_{2}x_{1}}^{2})}$$

0≤Ryx1x2≤1

Model regresji wielorakiej


$$\hat{Y} = a_{0} + a_{1}*x_{1} + a_{2}*x_{2} + \ldots + a_{k}*x_{k} + E$$

Y – zmienna objaśniana

X – zmienne objaśniające

A0 – wyraz wolny funkcji regresji

A1 – współczynnik regresji

E – składnik losowy


$$a_{1} = \frac{S_{y}}{S_{x_{1}}}*\frac{r_{yx_{1}} - r_{yx_{2}}*r_{x_{1}x_{2}}}{1 - r_{x_{1}x_{2}}^{2}}$$


$$a_{2} = \frac{S_{y}}{S_{x_{2}}}*\frac{r_{yx_{2}} - r_{yx_{1}}*r_{x_{1}x_{2}}}{1 - r_{x_{1}x_{2}}^{2}}$$


$$a_{0} = \overset{\overline{}}{y} - a_{1}*\overset{\overline{}}{x_{1}} - a_{2}*\overset{\overline{}}{x_{2}}$$

Odchylenie standardowe składnika resztowego:


$$S_{x} = \sqrt{\frac{\sum_{}^{}{(y - \hat{y})}^{2}}{n - 3}}$$


$$S_{x} = S_{y}*\sqrt{1 - R_{yx_{1}x_{2}}^{2}}$$

Współczynnik β jest miarą relatywnego wpływu zmiennych objaśniających na zmienną objaśnianą


$$\beta_{1} = a_{1}*\frac{S_{x_{1}}}{S_{y}}$$


$$\beta_{2} = a_{2}*\frac{S_{x_{2}}}{S_{y}}$$

  1. Funkcja regresji wielorakiej produkcji ziemi rolnej 100 gospodarstw rolnych o wielkości powierzchni 100h względem powierzchni zasiewu (x1) i zużycia nawozu (x2) była następująca:


$$\hat{y} = 22 + 0,16x_{1} + 0,03x_{2}$$


Sy = 1, 2

Odchylenia standardowe obliczono dla poszczególnych zmiennych wynoszą:


Sx1 = 5h


Sy = 1, 5 tys zl


$$S_{x_{2}} = 14\frac{\text{kg}}{h}$$

  1. Zinterpretuj parametry funkcji regresji wielorakiej

  2. Czy bardziej opłaca się zwiększyć produkcję poprzez wzrost powierzchni czy wzrost nawożenia.

  3. Oszacuj wartość produkcji rolnej przy powierzchni zasiewu 50 h oraz zużyciu nawozu 100 kg/h

Ad 1. Jeżeli powierzchnia zasiewów (x1) zwiększy się o jednostkę to wartość produkcji rolnej wzrośnie przeciętnie o 0,16 tys zł przy założeniu że zużycie nawozów nie ulegnie zmianie

Jeżeli zużycie nawozów wzrośnie o jednostkę to wartość produkcji rolnej wzrasta przeciętnie o 0,03 tys zł przy założeniu że powierzchnia zasiewów się nie zmieni.

Ad 2.


$$\beta_{1} = a_{1}*\frac{S_{x_{1}}}{S_{y}} = 0,16*\frac{5}{1,5} = 0,533$$


$$\beta_{2} = a_{2}*\frac{S_{x_{2}}}{S_{y}} = 0,03*\frac{14}{1,5} = 0,280$$


β1 > β2

Bardziej opłaca się zwiększyć produkcje poprze zwiększenie powierzchni zasiewów.

Ad 3.

X1=50 x2=100

Y=22+0,16*50+0,03*100=33tys zł±1,2

Zadanie 2

W przedsiębiorstwie Z zbadano zależność między wydajnością pracy a stażem pracy (x1)i poziomem wykształcenia (x2) 100 pracowników bezp produkcyjnych.

  1. Średnia wydajność 50 szt/h przy odchyleniu stanowiącym 20 szt/h

  2. Średni staż pracy wynosił 8 lat a jego względna dyspersja 50%

  3. Łączna liczba lat nauki wszystkich pracowników wynosiła 1000 lat a suma ich kwadratów 11600

  4. Wiadomo też że macierz współczynników korelacji jest następująca:


$$\begin{matrix} 1 & 0,6 & 0,8 \\ & 1 & 0,5 \\ & & 1 \\ \end{matrix}$$

  1. Jaka jest współzależność między badanymi cechami?

  2. Czy w świetle tego badania lepiej jest korzystać z pracowników z większym stażem pracy czy o większym wykształceniu

  3. Jaka będzie spodziewana wydajność pracowników o 5 letnim stażu i wykształceniu określonym na 12 lat.

ZROBIĆ!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

Analiza Dynamiki

Celem analizy dynamiki jest potwierdzenie lub wykrycie prawidłowości odnoszących się do rozwoju badanego zjawiska oraz poznania jego struktury

W analizie statystycznej posługujemy się wielkościami absolutnymi i względnymi

Wielkość absolutna- powstają przez zliczenie, mierzenie, ważenie wycena jednostki. Wyrażają one rozmiar badanego zjawiska (liczny mianowicie)

Liczby względne – powstają prze porównanie 2 liczb ze sobą. Wyrażają rozmiary jednego zjawiska w porównaniu z rozmiarami drugiego zjawiska

Rozrózniamy 3 podstawowe rodzaje liczb względnych.

Wskaźniki struktury powstają przez porównanie części liczebności badanej zbiorowości do ogólnej liczebności określają jaką część całości stanowią wyróżnione elementy.


$$W_{2} = \frac{n_{i}}{N}*100$$

Wskaźniki natężenia – powstają przez porównanie dwóch różnych wielkości pozostających względem siebie w pewnym związku logicznym. Wyraża się w wielkości badanego zjawiska przypadającego na 100, 1000

Przyrosty różnice

Absolutne Względne

Jednopodstawowe Łańcuchowe 1-podstawowe Łańcuchowe

Przyrost absolutny jest to raczej różnica między poziomem zjawiska w okresie badanym a poziomem zjawiska przyjętym w okresie za podstawę.


Pab = Yn − Y0

Yn – poziom zjawiska w okresie badanym

Y0 – poziom zjawiska w okresie bazowym, podstawowym


Pab = Yn − Yn − 1

Yn-1 – poziom zjawiska w okresie poprzedzającym

Przyrost względny – stosunek różnicy absolutnej zjawiska do jego poziomu w okresie pryjętym za podstawę porównania


$$P_{w} = \frac{Y_{n} - Y_{0}}{Y_{0}}$$


$$P_{w} = \frac{Y_{n} - Y_{n - 1}}{Y_{n - 1}}$$

Tempo przyrostu: Pw*100%

Tp>0 Wzrost poziomu

Tp<0 Spadek poziomu

Tp=0 Nie nastąpiły zmiany w poziomie

Indeksy

Indywidualne Agregatowe

1-podstawowe Wlk absolutne Wlk stosunkowe

Łańcuchowe (indeks wartości (ind cen) lub ilości Indeks wydajności Indeks wyko

(Lasperpes’a, Paasche’go, Fishera) grupy nania normy

Każdy jest 1-podst lub łańcuchowy)

Indeksy indywidualne – nazywamy stosunek wielkości tego samego zjawiska w okresie badanym do wielkości tego zjawiska w okresie przyjętym za podstawę porównania


$$i_{n/0} = \frac{y_{n}}{y_{0}}$$


$$i_{n/0} = \frac{y_{n}}{y_{0}}*100\%$$

W ułamku lub procentach, wielkość niemierzalna, indeks jednopodstawowy.

Indeks dynamiki łańcuchowy to stosunek wielkości zjawiska w okresie badanym do wielkości tego zjawiska w okresie bezpośrednio poprzedzającym okres badany.


$$i_{n/n - 1} = \frac{y_{n}}{y_{n - 1}}$$


$$i_{n/n - 1} = \frac{y_{n}}{y_{n - 1}}*100$$

i>1 Wzrost poziomu zjawiska w okresie badanym w stosunku do okresu poprzedniego.

I=1 Poziom zjawiska w okresie badanym i poprzedzającym nie zmieniły się

0<i<1 spadek poziomu zjawiska w o kresie badanym w stosunku do poprzedniego


$$P_{w} = \frac{y_{n} - y_{0}}{y_{0}} = \frac{y_{n}}{y_{0}} - 1 = i_{n/0} - 1$$


$$P_{w} = \frac{y_{n} - y_{n - 1}}{y_{n - 1}} = \frac{y_{n}}{y_{n - 1}} - 1 = i_{n/n - 1} - 1$$

Oceny średniego poziomu badanego zjawiska w przeliczeniu na jednostkę czasu w danym szeregu czasowym dokonujemy za pomocą średniego indeksu łańcuchowego.

Średnio okresowe tempo zmian określa ile procent przeciętnie biorąc zmienia się (wzrasta lub spada) poziom zjawiska z okresu na okres w całym przedziale czasowym objętym obserwacją.

Średni indeks łańcuchowy można obliczyć

  1. Opierając się na ekstremalnych wielkościach absolutnych (1 i ostatni badany okres)


$$i_{n/n - 1} = \sqrt[{n - 1}]{\frac{y_{n}}{y_{1}}}*100$$

Yn – poziom zjawiska w ostatnim okresie

Y1 – w 1 okresie n – liczba okresów.

  1. Na podstawie indeksów łańcuchowych


$$i_{n/n - 1} = \sqrt[n]{i_{1}*i_{2}*i_{3}*\ldots*i_{n}}$$

  1. Na podstawie ekstremalnych indeksów o podstawie stałej przy założeniu, że badany okres=1 lub 100


$$i_{n/n - 1} = \sqrt[{n - 1}]{\frac{i_{n/0}}{i_{0}}}*100$$

  1. Na podstawie tablic średniego tempa wzrostu

Miernik ten otrzymujemy odejmując od średniookresowego indeksu łańcuchowego 1 lub 100 jeśli indeks wyrażony jest w procentach.


$$\overset{\overline{}}{T} = \overset{\overline{}}{i_{n/n - 1}} - 1$$


$$\overset{\overline{}}{T} = \overset{\overline{}}{i_{n/n - 1}} - 100$$

Zadanie 1.

Liczba absolwentów szkół wyższych w latach 2003-2011 kształtowała się następująco.

lata Liczb absolw w tys
yn − y0

yn − yn − 1
Ind 2003=100 Ind rok pop=100
2003 366(y0) 0 · 100 ·
2004 384 18 18 104,9 104,9
2005 391 25 7 106,8 101,8
2006 394 28 3 107,7 100,8
2007 410 44 16 112 104,1
2008 421 55 11 115 102,7
2009 440 74 19 120,2 104,5
2010 479 113 39 130,9 108,9
2011 498 132 19 136,1 104
  1. Wyznaczyć przyrost absolutny , podstawowe oraz indeksy indywidualne.

  2. Oblicz średniookresowe tempo zmian

  3. Oszacuj liczbę absolwentów w 2012


$$\overset{\overline{}}{i_{n/n - 1}} = \sqrt[{n - 1}]{\frac{y_{n}}{y_{1}}}*100 = \sqrt[8]{\frac{498}{366}}*100 = 103,92\%$$

Średni indeks łańcuchowy

W latach 2003-2011 liczba absolwentów szkół wyższych z roku na roku wzrastała przeciętnie o 3,92%

2011-498tys

2012: 498*1,0392=517,5 tys Przypuszczalna liczba absolwentów w 2012

Zamiana podstaw indeksów:

  1. Zamiana indeksów 1 podstawowych na indeksy 1 podstawowe o innej podstawie porównania

Zamiany tej dokonujemy dzieląc każdy indeks 1 podstawowy przez indeks 1-podstawowy z tego okresu który ma stanowić nową podstawę porównania i mnożymy przez 100

Lata Ind 2000=100 Działania Ind 2005=100
2000 100 100/117,9*100 84,8
2001 103,4 103,4/117,9*100 87,7
2002 107,4 107,4/117,9*100 91,1
2003 111,2 111,2/117,9*100 94,3
2004 112,9 112,9/117,9*100 95,8
2005 117,9 117,9/117,9*100 100
2006 122,1 122,1/117,9*100 103,6
2007 127,1 127,1/117,9*100 107,8
2008 131,5 131,5/117,9*100 111,5
2009 135,7 135,7/117,9*100 115,1
  1. Zamiana indeksu 1-podstawowego na łańcuchowe

Zamiany tej dokonujemy dzieląc każdy indeks 1-podstawowy przez bezpośrednio poprzedzający go i mnożymy przez 100

Lata Ind 2000=100 Działania Ind rok poprz=100
2000 100 · ·
2001 103,4 103,4/100*100 103,4
2002 107,4 107,4/103,4*100 103,9
2003 111,2 111,2/107,4*100 103,5
2004 112,9 112,9/111,2*100 101,5
  1. Zamiana indeksów łańcuchowych na 1-podst

Zamiany tej dokonujemy:

  1. Dla okresów późniejszych od przyjętego za podstawę. Dany indeks 1-podstawowy mnożymy przez indeks łańcuchowy

  2. Okresu następnego i dzielimy przez 100

  3. Dla okresów wcześniejszych od przyjętego za podstawę dany indeks 1-podstawowy dzielimy przez odpowiadający mu indeks łańcuchowy i mnożymy przez 100

Lata Ind rok poprz=100 Działanie Ind 2005=100
2000 · 71,5/130*100 55,0
2001 130,0 70,8/99*100 71,5
2002 99 80,4/113,5*100 70,8
2003 113,5 91,2/113,4*100 80,4
2004 113,4 100/109,7*100 91,2
2005 109,7 100 100
2006 104,6 100*104,6/100 104,6
2007 103,9 104,6*103,9/100 108,7
2008 114,3 108,7*114,3/100 124,2
2009 112,5 124,2*112,5/100 139,7

Zadanie

Dynamikę zuzycia w gospodarstwie domowym miasta na 1 miesiąc wody z wodociągów w m3 przedstawia następujący ciąg indeksów łańcuchowych:

Lata Ind rok poprz=100 Zuzycie w m3
2001 · 56,2
2002 93,59 52,6
2003 94,49 49,7
2004 94,47 47,2
2005 96,40 45,5
2006 96,48 43,9
2007 95,67 42
2008 96,67 40,6
2009 97,54 39,6
2010 96,47 38,2
2011 97,38 37,2
  1. Obliczyć wielkość zużycia wody z wodociągów w m3 na 1 mieszkańca dla wszystkich lat wiedząc że w 2001 wynosiło 56,2 m3

  2. Obliczyć średniookresowe tempo zmian w czasie

  3. Oszacuje wielkość zużycia wody w 2013


$$\overset{\overline{}}{i} = \sqrt[10]{\frac{37,2}{56,2}}*100 = 95,96\%$$


$$\overset{\overline{}}{T} = 95,96\% - 100\% = - 4,04\%$$

2011-37,2

2012: 37,2*0,9596=35,7

2012: 35,7*0,9596=34,26

Ilość*cena=wartość


$$I_{w} = \frac{\sum_{}^{}{q_{n}p_{n}}}{\sum_{}^{}{q_{0}p_{0}}}*100$$

Qn – ilość w okresie badanym

Pn – cena w okresie badanym

Q0 – ilość w okresie bazowym

P0 – cena w okresie bazowym

Łańcuchowy:


$$I_{w} = \frac{\sum_{}^{}{q_{n}p_{n}}}{\sum_{}^{}{q_{n - 1}p_{n - 1}}}*100$$

Qn-1 – ilość poprzedzająca okres badany

Lasperesa:


$$I_{q}^{L} = \frac{\sum_{}^{}{q_{n}p_{0}}}{\sum_{}^{}{q_{0}p_{0}}}*100$$

Bada zmiany w ilości przyjmując ceny z okresu bazowego jako stałe.

Paaschego:


$$I_{q}^{P} = \frac{\sum_{}^{}{q_{n}p_{n}}}{\sum_{}^{}{q_{0}p_{n}}}*100$$

Bada zmiany w ilości przyjmują ceny z okresu badanego jako stałe.

Jeżeli znany jest indywidualny okres ilości to:


$$i_{q} = \frac{q_{n}}{q_{0}}$$

Formuła zastępcza w postaci średniej arytmetycznej:


$$I_{q}^{L} = \frac{\sum_{}^{}{i_{q}p_{0}q_{n}}}{\sum_{}^{}{q_{0}p_{0}}}$$

Formuła zastępcza w postaci średniej harmonicznej:


$$I_{q}^{P} = \frac{\sum_{}^{}{q_{n}p_{n}}}{\sum_{}^{}\frac{q_{n}p_{n}}{i_{q}}}*100$$

Indeks Fishera, który służy do formułowania uogólnionych wniosków o dynamice ilości obliczamy na podstawie średniej geometrycznej z obu formuł agregatowych tego indeksu ilości:


$$I^{F} = \sqrt{I_{q}^{L}*I_{q}^{P}}$$

Agregatowe indeksy cen

Stała ilość z okresu bazowego:


$$I_{p}^{L} = \frac{\sum_{}^{}{q_{0}p_{n}}}{\sum_{}^{}{q_{0}p_{0}}}*100$$

Stała ilość z okresu badanego:


$$I_{p}^{P} = \frac{\sum_{}^{}{q_{n}p_{n}}}{\sum_{}^{}{q_{n}p_{0}}}*100$$

Jeśli znany jest indywidualny indeks cen to:


$$i_{p} = \frac{p_{n}}{p_{0}}$$

Formuła zastępcza o postaci średniej arytmetycznej:


$$I_{p}^{L} = \frac{\sum_{}^{}{{i_{p}q}_{0}p_{n}}}{\sum_{}^{}{q_{0}p_{0}}}*100$$

Formuła zastępcza o postaci średniej harmonicznej:


$$I_{p}^{P} = \frac{\sum_{}^{}{q_{n}p_{n}}}{\sum_{}^{}\frac{q_{n}p_{n}}{i_{p}}}*100$$

Indeks Fishera jak wyżej


$$I^{F} = \sqrt{I_{p}^{L}*I_{p}^{P}}$$


Iw = iqL * ipP


Iw = ipL * iqP

Pewien rolnik sprzedaje na targu ziemniaki, kapustę, pomidory. Wartość sprzedaży tych artykułów w maju wynosiła 4 tys zł, a w lipcu przedstawiła się następująco:

Wart sprz qnpn Spadek cen Ip
$$\frac{q_{n}p_{n}}{i_{p}}$$
Ziemniaki 2000 30% 0,7 2854,14
Kapusta 500 20% 0,8 625
Pomidory 1000 10% 0,9 111,11
4593,25
  1. Oceń dynamikę wartości sprzedaży w lipcu w stosunku do maja

  2. Jaki wpływ na dynamikę wartości miały ceny a jaki ilość


$$\sum_{}^{}{q_{0}p_{0} = 4000}$$


$$I_{w} = \frac{\sum_{}^{}{q_{n}p_{n}}}{\sum_{}^{}{q_{0}p_{0}}}*100 = \frac{3500}{4000}*100 = 87,5\%$$

Łączna wartość sprzedaży tych artykułów w lipcu w stosunku do maja spadła o 12,5%


$$I_{p}^{P} = \frac{\sum_{}^{}{q_{n}p_{n}}}{\sum_{}^{}\frac{q_{n}p_{n}}{i_{p}}}*100 = \frac{3500}{4593,25}*100 = 76,2\%$$

Agregatowy indeks cen Paaschego wskazuje na spadek cen sprzedawanych dóbr w stosunku do maja o 23,8% przy założeniu stałej ilości na poziomie lipca.


$$I_{q}^{L} = \frac{I_{w}}{I_{p}^{P}} = \frac{87,5}{76,2} = 114,8$$

Agregatowy indeks ilości lesperesa wskazuje na wzrost ilości sprzedawanych dóbr w stosunku do maja o 14,8% przy założeniu stałych cen na poziomie maja.

Zadanie 2

Przedsiębiorstwo prowadzi sprzedaż środków piorących. Obroty tymi artykułami w grudniu w styczniu były następujące:

Obr w stycz Obr w grud Powyżka cen gru-sty Ip
ipq0p0

$$\frac{q_{n}p_{n}}{i_{p}}$$
Proszek 50 60 3% 1,03 51,5 58,25
Płyn do Pł 10 15 5% 1,05 10,5 14,29
Płyn do Pr 20 20 5% 1,05 21 19,05
80 95 83 91,59


$$I_{w} = \frac{95}{80}*100 = 118,75$$

Interpretacja: łączna wartość sprzedaży wszystkich 3 środków piorących w grudniu jest o 18,75% wyższa od wartości w styczniu


$$I_{p}^{L} = \frac{83}{80}*100 = 103,75\%$$

Agregatowy indeks cen Lesperesa informuje nas, że ceny wzrosły w grudniu w stosunku do stycznia o 3,75% przy założeniu, że ilość artykułów jest stałą wartością z stycznia.


$$I_{p}^{P} = \frac{95}{91,59}*100 = 103,72\%$$

Interpretacja: Agregatowy indeks cen Paaschego informuje nas, że ceny wzrosły w grudniu w stosunku do stycznia o 3,72% przy założeniu, że ilość artykułów jest stałą z grudnia.


$$I_{p}^{F} = \sqrt{103,75*103,72} = 103,73$$

Średnio ceny tych 3 artykułów wzrosły o 3,73%


Iw = IpL * IqP


$$I_{q}^{P} = \frac{I_{w}}{I_{p}^{L}}*100 = 114,46\%$$

Wskazuje na wzrost ilości sprzedanych środków w grudniu w stosunku do stycznia o 14,46% przy założeniu, że ceny tych artykułów w obu badanych okresach były na poziomie grudnia


$$I_{q}^{L} = \frac{I_{w}}{I_{p}^{P}}*100 = 114,49\%$$

Wskazuje na wzrost ilości sprzedanych artykułów o 14,49% przy założeniu, że ceny w grudniu były takie same jak w styczniu


$$I_{q}^{F} = \sqrt{114,46*114,49} = 114,47\%$$

Średnio łączny wzrost sprzedaży w grudniu w stosunku do stycznia wyniósł 14,47%

Wahania przypadkowe – nieregularne, nieperiodyczne, zmiany w działalności gospodarstw wynikające z nieustannego występowania różnego rodzaju zjawisk przypadkowych.

Zbliżone do wahań przypadkowych są wahania katastrofalne, spowodowane różnego rodzaju kataklizmami. Wywołują trwałe i silne zmiany w tworzeniu gospodarki narodowej.

Wahania cykliczne zwane koniunkturalnymi – cecha charakterystyczna tych wahań jest pena periodyczność i fazy rozwojowe

Wahania sezonowe – dla tego rodzaju wahań charakterystyczna jest również periodyczność są one związane z określonymi sezonami. Zmiany zachodzą w cyklu rocznym.

Trendy – powolne, regularne i systematyczne zmiany określonego zjawiska obserwowane w dostatecznie długim przedziale czasu. Przyjmuje się, że do wyodrębnienia trendu powinien być wykorzystany okres przynajmniej 10 letni

Wyodrębnienie tendencji rozwojowej poprzez eliminację wahań przypadkowych i okresowych nazywamy wyrównaniem szeregu. Wyróżniamy metodę mechaniczną i analityczną.

Metoda mechaniczna – opiera się na średnich ruchomych. Średnie ruchome można obliczyć z parzystej bądź nieparzystej liczby wyrazów.


Wyszukiwarka

Podobne podstrony:
statystyka wykład
statystyka wyklady, Szkoła WSTiH
Statystyka wykład 1
statystyka wyklad III
Statystyka - egzamin - ściąga - Kuszewski, Statystyka - wykłady - T.Kuszewski
statystyka- wyklady, Ekonomia, 1ROK, statystyka
statystyka -wykłady II sem, statystyka
AnaLIZA STATYSTYCZNA 8 wykład6, 1
statystyka wyklad V
Metodologia badań psychologicznych i statystyka dr I. Sowińska Gługiewicz, Metodologia badań psychol
STATYSTYKA WYKŁAD wybrane rozkłady zmiennych lsoowych
statystyka wyklad IV
STATYSTYKA WYKŁAD 5
AnaLIZA STATYSTYCZNA 8 wykład2, ANALIZA STATYSTYCZNA
AnaLIZA STATYSTYCZNA 8 wykład3, ANALIZA STATYSTYCZNA
statystyka wykłady, Wyklad5-6, Rozkład normalny
Rajfura A, Statystyka Wyklad 01 OPIS STATYSTYCZNY krotki

więcej podobnych podstron