Korelacja i regresja - ćwiczenia

Zad.1. W losowo wybranych przedsiębiorstwach turystycznych świadczących usługi zagraniczne zbadano zależność między liczbą klientów(w tys.) a wysokością przychodów ( w mln zł) z tytułu świadczenia usług zagranicznych.

Firma

liczba klientów (w tys.)

Przychody (mln zł)

 

A

79

142

B

70

118

C

65

110

D

61

80

E

48

101

F

44

52

G

35

75

H

28

36

I

27

48

J

26

44

  1. Sporządzić wykres korelacyjny i na jego podstawie wypowiedzieć się o sile, kierunku korelacji i charakterze korelacji

  2. Obliczyć i podać interpretację współczynnika korelacji liniowej Pearsona.

  3. Wyznaczyć parametry liniowej funkcji regresji, podać ich interpretację.

  4. Sporządzić wykres liniowej funkcji regresji ( na wykresie korelacyjnym z punktu 1) i na jego podstawie ocenić dopasowanie liniowej funkcji regresji do danych empirycznych

  5. Obliczyć miary dopasowania otrzymanej funkcji regresji do danych empirycznych . Podać ich interpretację.

  6. Oszacować poziom przychodów w przedsiębiorstwie, które obsłużyło 80 tys. klientów.

  1. Oszacowano parametry następujących krzywoliniowych funkcji regresji: potęgowej, wykładniczej i hiperbolicznej.

Podać interpretację parametrów .

Która z wszystkich funkcji (łącznie z liniową) najlepiej opisuje badaną zależność?

Zad.2. Zbadano zależność między liczbą osób w gospodarstwie domowym pracujących na własny rachunek a poziomem średnich miesięcznych wydatków na żywność (w zł na 1 osobę) . Otrzymano:

Liczba osób

xi

Wydatki na 1 osobę (w zł)

yi

1

930

2

850

2

800

3

760

4

770

4

620

5

680

5

650

6

520

7

490

  1. Sporządzić wykres korelacyjny i na jego podstawie wypowiedzieć się o sile i kierunku korelacji.

  2. Obliczyć i podać interpretację współczynnika korelacji liniowej Pearsona.

  3. Wyznaczyć parametry liniowej funkcji regresji, podać ich interpretację.

  4. Sporządzić wykres liniowej funkcji regresji ( na wykresie korelacyjnym z punktu 1) i na jego podstawie ocenić dopasowanie liniowej funkcji regresji do danych empirycznych

  5. Obliczyć miary dopasowania otrzymanej funkcji regresji do danych empirycznych . Podać ich interpretację.

  6. Oszacować poziom wydatków w 8 osobowych gospodarstwach domowych

  7. Oszacowano parametry następujących krzywoliniowych funkcji regresji: potęgowej, wykładniczej i hiperbolicznej.

Podać interpretację parametrów .

Która z wszystkich funkcji (łącznie z liniową) najlepiej opisuje badaną zależność?

Zad. 3. Liczba używanych samochodów nabytych w UE (w tys. szt.) i podatek akcyzowy (w tys. zł) w grudniu 2007 roku:

Izba Celna

liczba samochodów

akcyza

Białystok

2,0

738

Opole

2,5

821

Olsztyn

3,0

999

Kielce

3,7

1198

Rzepin

3,8

1000

Szczecin

3,9

1493

Przemyśl

4,0

1200

Biała Podl.

4,4

1227

Toruń

4,4

1469

Łódź

4,4

1812

Gdynia

4,7

2535

Kraków

6,2

2982

Wrocław

6,9

2916

Katowice

7,8

5501

Warszawa

9,2

30788

Poznań

14,7

16169

Źródło: Służby Celne

  1. Sporządzić wykres korelacyjny i na jego podstawie wypowiedzieć się o sile i kierunku korelacji.

  2. Obliczyć i podać interpretację współczynnika korelacji liniowej Pearsona.

  3. Wyznaczyć parametry liniowej funkcji regresji, podać ich interpretację.

  4. Sporządzić wykres liniowej funkcji regresji ( na wykresie korelacyjnym z punktu 1) i na jego podstawie ocenić dopasowanie liniowej funkcji regresji do danych empirycznych

  5. Obliczyć miary dopasowania otrzymanej funkcji regresji do danych empirycznych . Podać ich interpretację.

  6. Jak zmieni się wartość współczynnika korelacji (i dlaczego) jeżeli w badaniu nie uwzględnimy Warszawy?

Zad. 4. Krytykowane przez turystów Niemiec oraz Rosji, Ukrainy i Białorusi aspekty wizyty w Polsce przedstawia tablica:

Wyszczególnienie

Ranga

Niemcy

Rosja, Ukraina i Białoruś

Koszty pobytu

5

1

Stan bezpieczeństwa

3

3

Warunki dojazdu

2

4

Stan sanitarny

1

5

Brak informacji

6

6

Organizacja podróży i pobytu

7

2

Standard usług

4

7

Suma

X

X

Czy istnieje zgodność uporządkowania aspektów (zbieżność lokat) w badanych krajach?

Zad.5. Zbadać czy istnieje związek między świadomością marki a pozycją w rankingu według wartości firmy/marki (1 - wartość najwyższa) wybranych artykułów żywnościowych

Pozycja w rankingu

Marka (użytkownik marki)

Świadomość marki (0-100)

12

Wedel (Cadbury Wedel)

89

14

Mlekovita (SM Mlekovita)

42

16

Sokołów (Sokołów)

65

22

Winiary (Nestle)

77

38

Indykpol (Indykpol)

36

40

Łaciate (SM Mlekpol)

65

49

Bakoma (Bakoma)

75

51

Pudliszki (Pudliszki)

77

53

Morliny (Animex)

59

57

Hortex - mrożonki (Hortex)

74

61

Wawel (Wawel)

54

64

Mleko Łowickie (OSM Łowicz)

28

66

Piątnica (OSM Piątnica)

28

69

Olej Kujawski (ZT Kruszwica)

65

72

Koral (PPL Koral)

74

(Świadomość marki oznacza jej znajomość. W konstrukcji wskaźnika punktowego (w skali 0-100 pkt) uwzględniono znajomość spontaniczną i wspomaganą marki. Wyniki uzyskano na podstawie badań przeprowadzonych przez ACNielsen.)

Zad. 6. Trzy ośrodki badające opinię publiczną przeprowadziły badanie mające na celu sprawdzenie, czy preferencje polityczne zależą od płci . Otrzymano następujące wyniki:

A.

Płeć

Lubię polityka X

Razem

Tak

Nie

Kobieta

Mężczyzna

50

20

10

90

60

110

Razem

70

100

170

B.

Płeć

Zaufanie do polityka X

Razem

Tak

Nie

Kobieta

Mężczyzna

4

26

21

39

25

65

Razem

30

60

90

C.

Płeć

Wiarygodność polityka X

Razem

Tak

Nie

Nie mam zdania

Kobieta

Mężczyzna

30

50

20

30

60

10

110

90

Razem

80

50

70

200

Stosując odpowiednią miarę ocenić czy istnieje związek między badanymi zmiennymi.

1

Teresa Plenikowska

PWSPSiG Starogard - 2003/2004

Teresa Plenikowska