współzależność, Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych


Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

  1. Poniższe dane ukazują liczbę studentów oraz liczbę pracowników naukowo - dydaktycznych w Akademii Ekonomicznej w latach od 1990 - 1999

  2. lata

    i

    liczba studentów

    xi

    liczba pracowników

    yi

    1990

    1

    4780

    417

    1991

    2

    4975

    463

    1992

    3

    7732

    433

    1993

    4

    9701

    487

    1994

    5

    12154

    506

    1995

    6

    14300

    518

    1996

    7

    15766

    554

    1997

    8

    17516

    563

    1998

    9

    18355

    575

    1999

    10

    18633

    594

    xxx

    suma

    123912

    5110

    Na podstawie powyższych informacji ustalić siłę i kierunek współzależności obu zmiennych.

    0x01 graphic

    i

    liczba studentów

    xi

    liczba pracowników

    yi

    0x01 graphic

    0x01 graphic

    (0x01 graphic
    )*

    (0x01 graphic
    )

    0x01 graphic

    0x01 graphic

    1

    4780,00

    417,00

    -7611,20

    -94,00

    715452,80

    57930365,44

    8836,00

    2

    4975,00

    463,00

    -7416,20

    -48,00

    355977,60

    55000022,44

    2304,00

    3

    7732,00

    433,00

    -4659,20

    -78,00

    363417,60

    21708144,64

    6084,00

    4

    9701,00

    487,00

    -2690,20

    -24,00

    64564,80

    7237176,04

    576,00

    5

    12154,00

    506,00

    -237,20

    -5,00

    1186,00

    56263,84

    25,00

    6

    14300,00

    518,00

    1908,80

    7,00

    13361,60

    3643517,44

    49,00

    7

    15766,00

    554,00

    3374,80

    43,00

    145116,40

    11389275,04

    1849,00

    8

    17516,00

    563,00

    5124,80

    52,00

    266489,60

    26263575,04

    2704,00

    9

    18355,00

    575,00

    5963,80

    64,00

    381683,20

    35566910,44

    4096,00

    10

    18633,00

    594,00

    6241,80

    83,00

    518069,40

    38960067,24

    6889,00

    sumy

    123912,00

    5110,00

    0,00

    0,00

    2825319,00

    257755317,60

    33412,00

    0x01 graphic

    0x01 graphic
    0x01 graphic

    Współczynnik determinacji:

    0x01 graphic

    Współczynnik indeterminacji:

    0x01 graphic

    Zarówno współczynnik determinacji jak i indeterminacji po przemnożeniu przez 100 można wyrazić w procentach.

    Wówczas współczynnik determinacji informuje nas, w jakim procencie zmienność jednej zmiennej (X lub Y) można wyjaśnić zmiennością drugiej zmiennej (Y lub X).

    Obliczając współczynnik indeterminacji dowiemy się, w jakim procencie zmienność jednej ze zmiennych (X lub Y) nie zależy od zmienności drugiej (Y lub X), lecz od innych czynników losowych.

    Aproksymacja funkcji liniowej postaci y = ax + b

    0x01 graphic

    Parametry a i b:

    0x01 graphic

    0x01 graphic

    0x01 graphic

    0x01 graphic

    funkcja regresji:

    0x01 graphic

    i

    liczba studentów

    xi

    liczba pracowników

    yi

    0x01 graphic

    0x01 graphic

    0x01 graphic

    1

    4780

    417

    427,5718

    -10,5718

    111,7625

    2

    4975

    463

    429,7092

    33,29078

    1108,276

    3

    7732

    433

    459,9294

    -26,9294

    725,191

    4

    9701

    487

    481,5121

    5,487939

    30,11748

    5

    12154

    506

    508,4

    -2,39999

    5,759966

    6

    14300

    518

    531,9228

    -13,9228

    193,845

    7

    15766

    554

    547,992

    6,007993

    36,09598

    8

    17516

    563

    567,1742

    -4,17418

    17,42382

    9

    18355

    575

    576,3707

    -1,37067

    1,878732

    10

    18633

    594

    579,4179

    14,58211

    212,6378

    suma

    123912

    5110

    2442,988

    Współczynnik determinacji

    0x01 graphic

    Współczynnik indeterminacji

    0x01 graphic

    Wariancja resztowa

    0x01 graphic

    odchylenie standardowe składnika resztowego

    0x01 graphic

    0x08 graphic

    Współczynnik korelacji dwuseryjnej

    Jeżeli jedna ze zmiennych jest zmienną ciągłą (np. zmienna Y) a druga zmienna jestzmienną zero - jedynkową (np. zmienna X), to do określenia siły współzależności pomiędzy zmiennymi można wykorzystać tzw. współczynnik korelacji dwuseryjnej

    (rd.xy) postaci:

    0x01 graphic
    , (7)

    gdzie:

    0x01 graphic
    - średnia arytmetyczna realizacji zmiennej Y, skojarzonych z realizacjami zmiennej X o wartości 0,

    0x01 graphic
    - średnia arytmetyczna realizacji zmiennej Y, skojarzonych z realizacjami zmiennej X o wartości 1,

    0x01 graphic
    - odchylenie standardowe zmiennej Y,

    N0 - liczebność podzbioru zer,

    N1 - liczebność podzbioru jedynek,

    N = N0 + N1.

    Przykład 2

    W celu zbadania wpływu uczestnictwa na wykładzie na wyniki otrzymane ze sprawdzianu ze statystyki, poddano badaniu grupę 10 studentów. Pierwszą z cech oceniano na skali dwupunktowej w następujący sposób:

    0x01 graphic

    natomiast druga z cech była oceniana na skali punktowej od 0 do 25 punktów

    Otrzymano następujące wyniki:

    student

    i

    obecność

    xi

    liczba punktów

    yi

    1

    1

    15,5

    2

    0

    12

    3

    0

    13

    4

    1

    20

    5

    0

    8

    6

    0

    10

    7

    1

    20,5

    8

    0

    14

    9

    1

    19

    10

    1

    18

    Źródło: badania własne

    Czy istnieje współzależność pomiędzy wynikami ze sprawdzianu a obecnością podczas wykładu?

    Średnia ilość punktów wyniosła: 0x01 graphic

    Obliczania pomocnicze

    student

    i

    obecność

    xi

    liczba punktów

    yi

    0x01 graphic

    0x01 graphic

    1

    1

    15,5

    0,5

    0,25

    2

    0

    12

    -3

    9

    3

    0

    13

    -2

    4

    4

    1

    20

    5

    25

    5

    0

    8

    -7

    49

    6

    0

    10

    -5

    25

    7

    1

    20,5

    5,5

    30,25

    8

    0

    14

    -1

    1

    9

    1

    19

    4

    16

    10

    1

    18

    3

    9

    suma

    5

    150

    168,5

    Źródło: Obliczenia własne

    Wariancja i odchylenie standardowe zmiennej Y wyniosły:

    0x01 graphic
    ;

    0x01 graphic
    .

    Wartości 0x01 graphic
    i 0x01 graphic
    , N, N0 i N1, obliczamy następująco:

    0x01 graphic
    ,

    0x01 graphic
    .

    N0 = N1 = 5 => N = 10.

    Zatem współczynnik korelacji dwuseryjnej wyniesie:

    0x01 graphic
    .

    Uzyskany wynik świadczy o bardzo dużym związku pomiędzy obecnością podczas wykładu a ilością uzyskanych punktów podczas sprawdzianów kontrolnych.

    Współczynnik skojarzenia

    Zmienne X i Y, to zmienne zero - jedynkowe.

    Rozkład wartości zmiennych oraz ich liczebności przedstawia poniższa tablica.

    Y

    Σ

    0

    1

    X

    0

    f(0;0)

    f(0;1)

    f(0;0) + f(0;1)

    1

    f(1;0)

    f(1;1)

    f(1;0) + f(1;1)

    Σ

    f(0;0) + f(1;0)

    f(0;1) + f(1;1)

    N

    W ostatniej kolumnie i w ostatnim wierszu tablicy zapisuje się liczebności brzegowe zmiennej X i zmiennej Y.

    Współczynnik skojarzenia (Qxy) oblicza się stosując wzór:

    0x01 graphic
    (8)

    Przykład 3

    60 studentów regularnie przygotowywało się do zajęć ze Statystyki, a 40 sporadycznie. w grupie pierwszej egzaminy poprawkowe zdarzyły się 10 razy w ciągu studiów, a w drugiej aż 30. Czy istnieje związek pomiędzy solidnością pracy i koniecznością poprawkowych egzaminów? Uzasadnić odpowiedź posługując się odpowiednim miernikiem

    Przyjmijmy następujące oznaczenia:

    X = 0, jeżeli student zdał egzamin w pierwszym terminie

    X = 1, jeżeli student miał egzamin poprawkowy

    Y = 0, jeżeli student uczył się regularnie

    Y = 1, jeżeli student uczył się sporadycznie

    Tablica korelacji ma postać:

    Y

    Σ

    0

    1

    X

    0

    50

    10

    60

    1

    10

    30

    40

    Σ

    60

    40

    100

    0x01 graphic

    Otrzymany wynik świadczy o wysokiej dodatniej współzależności pomiędzy solidnością pracy a terminem zdania egzaminu.

    Współczynnik korelacji rang Spearmana

    Współczynnik korelacji rang stosuje się wówczas, gdy wartości cech mierzalnych opisanych przez odpowiednie zmienne (ciągłe lub skokowe) lub warianty cechy niemierzalnej, zostały zastąpione rangami, czyli kolejnymi liczbami.

    0x01 graphic
    (8)

    gdzie

    0x01 graphic
    oznacza różnicę pomiędzy rangami zmiennej X i Y,

    N - ilość par obserwacji zmiennej X i Y.

    Podobnie jak klasyczny współczynnik korelacji liniowej, współczynnik korelacji rang przyjmuje wartości z przedziału [-1; 1]. Jeżeli rs.xy= -1, to oznacza to pełną przeciwstawność uporządkowań, gdy rs.xy= 1, uporządkowania są w pełni zgodne, natomiast, gdy rs.xy= o, to mówimy o całkowitym braku uporządkowań.

    Współzależność wielu zmiennych, korelacja cząstkowa i wieloraka.

    Funkcja regresji wielu zmiennych

    Mając następujące dane dotyczące produkcji dwu różnych wyrobów w sztukach oraz zużycie energii na tę produkcję w sześciu kolejnych okresach:

    okres

    produkcja

    L

    x1i

    produkcja

    K

    x2i

    zużycie energii

    w kWh

    yi

    1

    2

    3

    12

    2

    4

    2

    14

    3

    3

    1

    11

    4

    5

    3

    15

    5

    2

    2

    14

    6

    2

    1

    6

    1. oszacować za pomocą metody najmniejszych kwadratów parametry funkcji regresji typu y = ao + a1x1 + a2x2, gdzie Y oznacza zużycie energii elektrycznej, X1 - produkcję wyrobu L, X2 produkcje wyrobu K,

    2. zbadać dobroć dopasowania funkcji regresji,

    3. obliczyć współczynniki korelacji cząstkowej.

    Rozwiązanie

    0x01 graphic

    0x01 graphic

    a0 = 5; a1 = 1; a2 = 2

    Równanie regresji liniowej będzie miało postać:

    0x01 graphic

    Wariancja resztowa 0x01 graphic

    Odchylenie standardowe składnika resztowego 0x01 graphic

    Współczynnik indeterminacji 0x01 graphic

    Współczynnik determinacji 0x01 graphic

    Współczynnik korelacji wielorakiej 0x01 graphic


    okres

    produkcja

    L

    x1i

    produkcja

    K

    x2i

    zużycie energii

    w kWh

    yi

    0x01 graphic

    0x01 graphic

    0x01 graphic

    0x01 graphic

    0x01 graphic

    0x01 graphic

    0x01 graphic

    0x01 graphic

    1

    2

    3

    12

    4

    6

    9

    24

    36

    0

    13

    1

    2

    4

    2

    14

    16

    8

    4

    56

    28

    4

    13

    1

    3

    3

    1

    11

    9

    3

    1

    33

    11

    1

    10

    1

    4

    5

    3

    15

    25

    15

    9

    75

    45

    9

    16

    1

    5

    2

    2

    14

    4

    4

    4

    28

    28

    4

    11

    9

    6

    2

    1

    6

    4

    2

    1

    12

    6

    36

    9

    9

    suma

    18

    12

    72

    62

    38

    28

    228

    154

    54

    22

    średnie

    3

    2

    12

    okres

    0x01 graphic

    0x01 graphic

    0x01 graphic

    0x01 graphic

    0x01 graphic

    0x01 graphic

    1

    0

    0

    -1

    1

    1

    0

    2

    2

    0

    0

    1

    0

    4

    3

    0

    1

    0

    0

    1

    1

    4

    6

    3

    2

    4

    1

    9

    5

    -2

    0

    0

    1

    0

    4

    6

    6

    6

    1

    1

    1

    36

    suma

    12

    10

    2

    8

    4

    54

    Przyjmiemy następujące założenia: Y - 0; X1 - 1; X2 - 2. Wówczas współczynniki korelacji r01­ = 0,57735; r02 = 0,68041 i r12 = 0,35355


    Macierz współczynników korelacji:

    0x01 graphic
    Wyznacznik macierzy |R| = 0,35648

    Współczynniki korelacji cząstkowej.

    0x01 graphic
    , gdzie Rij, Rii, Rjj są dopełnieniami algebraicznymi macierzy R.

    R00 = 0,875; R11 = 0,53704;R22 = 0,66667;

    R01 = -0,33679; R02 = -0,47629; R12 = 0,03928

    0x01 graphic

    0x01 graphic
    0x01 graphic

    Korelacja wieloraka

    0x01 graphic

    0x01 graphic



    Wyszukiwarka

    Podobne podstrony:
    statystyka, wzory, Współczynnik korelacji liniowej Pearsona
    Regresja liniowa dwoch zmiennych, materiały z roku 2011-2012, Semestr II, Statystyka opisowa - ćwicz
    06 Wspolczynniki korelacji rangowej i liniowej
    wzory, miary dopasowania, Ocena dobroci dopasowania liniowej funkcji regresji do danych empirycznych
    wyznaczanie współczynnika strat liniowych, studia, V semestr, Mechanika płynów
    ,Laboratorium podstaw fizyki, WYZNACZANIE WSPÓŁCZYNNIKA ROZSZERZALNOŚCI LINIOWEJ METODĄ
    Wyznaczanie współczynnika rozszerzalności liniowej i objętościowej, Fizyka
    Korelacja liniowa, fizyczna, chemia fizyczna, Fizyczna, CH. FIZYCZNA, laborki sprawozdania fizyczna
    Wyznaczanie współczynnika rozszerzalności liniowej ciał stałych przy pomocy dylatometru 1 (2)
    współczynnik oporu liniowego GSZSP52JK34EXQEU3FHPVRDPVGAXZYXFPGMNUHQ
    Wyznaczanie współczynnika rozszerzalności liniowej ciał stałych
    Wyznaczanie współczynnika rozszerzalności liniowej metodą elektryczną 1 (2)
    Wyznaczanie bezwymiarowego współczynnika oporu liniowego λx
    105 Wyznaczanie współczynnika rozszerzalności liniowej ciał stałych
    Ćw 8; Wyznaczenie współczynnika rozszerzalności liniowej ciał stałych
    (Wspólczynnik oporu liniowego)id 1460
    Pomiar współczynnika oporu liniowego, sprawozdania
    Wyznaczanie współczynnika rozszerzalności liniowej metalu

    więcej podobnych podstron