- Gamma
W przypadku kiedy dane zawierają wiele przypadków jednakowych rang to zamiast stosować R Spearmana czy Tau Keńdalla należy raczej wybrać , statystykę gamma. J?od względem wymaganych założeń wszystkie ^ trzy statystyki są równoważne, pod względem interpretacji ^ri_pmęgdiiix.,.QbUc2^oTO gamma Jest bardziej podobne do Tau Keńdalla niż do R Spearmana. Gamma jest również prawdópódobfeństwem: Jest óńó obhczańe^j^o różnica2 prawdopodobieństw tego, że rangi dwóch zmiennych są ze sobą zgodne i tego, że rangi te są niezgodne minus prawdopodobieństwo jednakowych rang. W tym sensie gamma jest w zasadzie równoważne Tau Keńdalla z tą różnicą ż brane są pod uwagę przypadki jednakowych rang. Szczegółową dyskusję statystyki Gamma można znaleźć w: Goodman i Kruskal (1954, 1959, 1963,1972), Siegel (1956) i Siegel i Castellan (1988).
Korelacje dla skal porządkowych i nominalnych
Korelacje w tabelach dwuazielczych.
Tabele wielodzielcze, ogólnie rzecz ujmując pozwalają na zidentyfikowanie relacji pomiędzy tabelaryzowanymi wielkościami. Poniższa tabela ilustruje przykład bardzo silnej zależności pomiędzy dwiema- :^eiłnąułubioji& Ciastko,
(A idb B);
I CIASTKO & i - CIASTKO :3 1/"
DOROSŁY |
— + -— / i ' |
50 |
~._-f—.. i |
0 |
—h---. , 1*50 |
DZIECKO |
—+-- |
C |
- — |
50 |
mm--- 1 50 |
50 |
—+--- I |
50 |
--+--- I 100 |
Wszystkie dzieci preferują ciastko B a dorośli ciastko A. W takim przypadku nie ma wątpliwości co do wiarygodności tego odkrycia ponieważ trudno dopuścić myśl, że taki układ tabeli mógł powstać przez przypadek to znaczy bez istnienia prawdziwej różnicy w upodobaniach co do ciastek u dzieci i dorosłych. Jednak w życiu relacje między zmiennymi są zazwyczaj znacznie słabsze i powstaje wtedy pytanie jak mierzyć te zależności i jak oceniać ich statystyczną istotność. Zamieszczony niżej przegląd zawiera najbardziej typowe miary zależności między dwiema zmiennymi nominalnymi to znaczy miary dla tablic dwudzielczych. Techniki analizowania relacji między więcej niż dwiema zmiennymi jednocześnie w tabelach wielodzielczych dyskutowane są przy Analizie log-liniowej i Analizie korespondencji.
Statystyki w tabelach wielodzielczych - Chi-kwadrat Pearsona
Statystyka Chi-kwadrat Pearsona jest podstawą najbardziej rozpowszechnionego testu istotności dla zmiennych jakościowych (kategoryzowanych). Miara ta oparta jest na fakcie, że istnieje możliwość obliczenia liczebności oczekiwanych w tabeli dwudzielczej (to znaczy