Analiza zbiorowości badanej ze względu na 1 cechę
Zad.1. Analityk przygotowuje raport dotyczący kształtowania się jednostkowych kosztów stosowania pewnej procedury medycznej w województwie małopolskim. Jednakże zebranie danych od wszystkich pacjentów, u których wykonano procedurę medyczną wymagałoby dużych nakładów pracy. Dlatego analityk zgromadził dane dla 15 losowo wybranych pacjentów. Otrzymano następujące wyniki (w złotych): 101 90 93 95 99 100 101 104 101 105 106 109 111 115 92.
Określić zbiorowość generalną oraz cechę statystyczną (X).
Przedstawić dane w postaci szeregu prostego szczegółowego.
Określić średni koszt.
Nazwać, wyznaczyć oraz zinterpretować podstawową miarę rozproszenia cechy X.
Wyznaczyć i zinterpretować współczynnik zmienności cechy X.
Wyznaczyć i zinterpretować wartość modalną (typową, najczęstszą) cechy X.
Wyznaczyć i zinterpretować medianę, pierwszy oraz trzeci kwartyl cechy X.
Wyznaczyć i zinterpretować współczynnik asymetrii cechy X.
Analityk dysponuje charakterystykami pozycyjnymi cechy X dla województwa mazowieckiego. Są to: min=35, Q1=45, Me=51, Q3=63, max=67. Narysować wykres pudełkowy (wykres ramka-wąsy) cechy X dla obu województw. Jakie wnioski płyną z analizy wykresu?
W trakcie analizy okazało się, że dostępna jest wartość cechy X dla jeszcze jednego pacjenta. Wynosi ona 350.
Wyznaczyć średnią arytmetyczną oraz medianę cechy X (dla wszystkich 16 obserwacji).
Wyznaczyć odchylenie standardowe cechy X (dla 16 obserwacji).
Określić, jaki wpływ na wyniki analizy ma nietypowa obserwacja. Własnymi słowami zdefiniować pojęcie odporności miary statystycznej na obserwacje odstające (nietypowe).
Wyznaczyć współczynnik asymetrii cechy X (dla wszystkich 16 obserwacji).
Nakłady na badania i rozwój [tys. zł] |
Liczba przedsiębiorców |
7-15 |
3 |
15-23 |
5 |
23-31 |
6 |
31-39 |
10 |
39-47 |
5 |
47-55 |
3 |
55-63 |
3 |
Zad.2. Pewna firma zleciła sporządzenie raportu na temat kształtowania się nakładów na badania i rozwój wśród małopolskich przedsiębiorstw. Tabela obok przedstawia zestawienie nakładów dla 35 losowo wybranych małopolskich przedsiębiorstw.
Określić zbiorowość generalną oraz cechę statystyczną (X).
Narysować histogram cechy X.
Wyznaczyć i zinterpretować liczebności skumulowane, częstości względne, częstości względne skumulowane.
Wyznaczyć i zinterpretować średnią arytmetyczną cechy X.
Wyznaczyć i zinterpretować odchylenie standardowe oraz współczynnik zmienności cechy X.
Wyznaczyć i zinterpretować wartość modalną cechy X.
Wyznaczyć i zinterpretować medianę, pierwszy oraz trzeci kwartyl cechy X.
Wyznaczyć i zinterpretować współczynnik asymetrii cechy X.
Zadanie domowe
Zad.1. W pewnym przedsiębiorstwie wylosowano 10 pracowników i zebrano dane dotyczące ich wieku: 58, 54, 23, 21, 38, 38, 20, 24, 41, 50.
Określić zbiorowość generalną i cechę badania.
Przedstawić zebrane dane w postaci szeregu szczegółowego prostego.
Obliczyć średni wiek wylosowanych pracowników.
Obliczyć i zinterpretować medianę oraz modalną.
Wyznaczyć i zinterpretować odchylenie standardowe, współczynnik zmienności oraz współczynnik asymetrii.
Zad.2. Producent materiałów budowlanych zgromadził dane na temat czasu oczekiwania na zapłatę (w dniach) dla 60 losowo wybranych faktur:
Czas oczekiwania |
Liczba transakcji |
0 - 10 |
5 |
10 - 20 |
8 |
20 - 30 |
20 |
30 - 40 |
18 |
40 - 50 |
6 |
50 - 60 |
3 |
Określić cechę badania.
Wyznaczyć liczebności skumulowane, częstości względne, częstości względna skumulowane.
Wyznaczyć średni czas oczekiwania.
Obliczyć i zinterpretować medianę oraz modalną.
Obliczyć i zinterpretować kwartyl pierwszy i kwartyl trzeci.
Wyznaczyć i zinterpretować odchylenie standardowe, współczynnik zmienności oraz współczynnik asymetrii.
Narysować histogram.
Wzory
- średnia arytmetyczna:
;
- odchylenie standardowe:
- współczynnik zmienności:
- wartość modalna w szeregu z przedziałami klasowymi:
- mediana w szeregu z przedziałami klasowymi:
- pierwszy kwartyl w szeregu z przedziałami klasowymi:
- trzeci kwartyl w szeregu z przedziałami klasowymi:
- współczynnik asymetrii:
lub
lub
Czas przebywania na zwolnieniu |
Liczba pracowników |
0 |
10 |
1 |
12 |
2 |
15 |
3 |
8 |
4 |
5 |
5 |
5 |
Zad.3. W pewnym przedsiębiorstwie określono czas przebywania (w dniach) poszczególnych pracowników na zwolnieniu lekarskim. Rozkład badanej zmiennej przedstawia tabela.
Wyznaczyć liczebności skumulowane, częstości względne, częstości względne skumulowane.
Obliczyć średni czas przebywania na zwolnieniu.
Obliczyć i zinterpretować medianę oraz modalną.
Obliczyć i zinterpretować kwartyl pierwszy i kwartyl trzeci.
Przedstawić graficznie otrzymany szereg statystyczny.
Wyznaczyć i zinterpretować odchylenie standardowe oraz współczynnik zmienności.
Wzory
- średnia arytmetyczna:
- odchylenie standardowe:
2