Wstęp
Oddaje Wam do łapek poprawioną wersję opracowania statystyki dla opornych autorstwa Ani Werner z trzeciego roku.
Oczywiście tytuł opracowania ma nawiązywać do serii „Komputer dla opornych” i w podobnie prosty, łatwy i przyjemny sposób ma przybliżyć niezmiernie trudne zadania rozwiązywane przez poprzedni rok w ramach ćwiczeń ze statystyki.
Instrukcje obrazkowe są autorstwa Ani, ja jedynie dodałam wskaźniki, co i gdzie należy pozmieniać. Mam nadzieję że taka instrukcja będzie najlepszym sposobem, aby pojąć, co i jak należy zrobić aby zadanie wyszło dobrze.
Kolorem niebieskim zaznaczone są sposoby rozwiązania zaproponowane przez Anie, kolorem czerwonym dodałam moje komentarze oraz oznaczenia na rysunkach.
Zatem miłej nauki
LuSy Słomska
1. W badanym akwenie rozkład temperatur można przybliżyć rozkładem N(μ=15,2°C;σ=2,1°C).
a) W jakim przedziale leży 30% temperatur najbliższych średniej (wyniki z dokładnością do 0,01°C)?
Z menu wybrać Statystyka -> Kalkulator prawdopodobieństwa -> Rozkłady Zmień rozkład na Z normalny, średnia=15,2; odchylenie=2,1; pamiętaj o wyłączeniu stałego skalowania
Jest to rozkład symetryczny, więc jeśli koło średniej ma być 30%, to po bokach zostaje po 35%( w sumie 70%), w kalkulatorze wpisujesz 35%=0,35 i wylicza Ci pierwszą wartość, od której 35% wartości jest mniejszych, potem zaznaczasz (1-p) i wylicza Ci wartość, od której 35% wartości jest większych. Więc w przedziale między tymi wartościami znajduje się 30% wartości najbliższych średniej.
Odpowiedź to przedział [14,39;16,01].
b) Jakie jest prawdopodobieństwo wystąpienia w tym akwenie temperatur z zakresu 14-16°C (wyniki z dokładnością do 0,01%)?
P(XЄ(14;16))=P(X<16)-P(X<14)=64,8381%-28,3855%=36,4526%≈36,45%
Najpierw liczysz X<16,potem X<14 i odejmujesz od siebie.
Odpowiedź 36,45%.
2. W badanym akwenie rozkład przezroczystości wód można przybliżyć rozkładem LN(μ=1,0m;σ=0,5°C).
a) Jakie jest prawdopodobieństwo wystąpienia w tym akwenie wód o przezroczystości powyżej 1m (wyniki z dokładnością do 0,01%)?
Kalkulator prawdopodobieństwa, rozkład lognormalny, średnia=1;odchylenie=0,5.
Wpisujesz x=1, aby były większe zaznaczasz (1-p).
Odpowiedź P(X>1)≈97,73%
b) Ile wynosi dolny kwartyl przezroczystości wód w tym akwenie (wyniki z dokładnością do 0,01m)?
Dolny kwartyl Q1=25%. Wpisujesz prawdopodobieństwo 25%.
Odpowiedź X=1,94m, można zapisać P(X<1,94)=25%.
3. W akwenie badano zasolenie. Można przyjąć że ma ono rozkład normalny. Średnie zasolenia w próbie (n=100) wyniosło 7psu z odchyleniem standardowym 1psu. W jakim przedziale na poziomie ufności 95% należy się spodziewać wariancji zasolenia dla całego akwenu (granice przedziału z dokładnością do 0,01)?
Kalkulator prawdopodobieństwa, rozkład Chi^2, df=n-1=99, przedział ufności=95%, więc po bokach odcina po 2,5%. Wpisujesz p=2,5%=0,025. Wyliczasz Chi^2 1=73,36 i Chi^2 2=128,42. Podstawiasz do wzoru na Chi:
Po wyliczeniu wychodzi przedział 0,77<σ2<1,35.
4. W pewnym akwenie prowadzono badania, których dane zestawiono w arkuszu Dane1.sta O ile maksymalnie średnia temp. wód powierzchniowych całego akwenu może być niższa od średniej z badanej próby na poziomie ufności 99% (wynik podać z dokładnością do 0,001°C)?
Otwierasz dane i w statystykach podstawowych-statystykach opisowych liczysz dla zmiennej Temperatura średnią i przedział ufności=99%.
Otrzymujesz wyniki:
O ile może być niższa od średniej: 15,17513-14,61982=0,55531≈0,555. Odpowiedź o 0,555ºC.
5. W pewnym akwenie prowadzono badania, których dane zestawiono w arkuszu Dane1.sta Jaka jest siła (nazwij ją zgodnie z klasyfikacją podaną na wykładzie) i kierunek zależności w badanej próbie pomiędzy temp. a koncentracją zawiesiny mineralnej?
Najpierw badasz normalność rozkładów T i C, by zdecydować jaki użyć współczynnik korelacji.
W tabelach liczności (statystyki podstawowe i tabele) rysujesz histogramy. N dla T i C wynosi 100, więc dokładna liczba przedziałów=10.
Temperatura ma rozkład normalny.
Koncentracja nie ma rozkładu normalnego, ma prawoskośny.
Do określenia korelacji używamy współczynnika Spearmana (Pearson jest dla symetrycznych, a C nie jest symetryczne).
Statystyka-statystyki nieparametryczne-Korelacje Spearmana- zmienne Ti C- liczymy R Spearmana
r=-0,005047, korelacja nikła (wg klasyfikacji z wykładów), ujemna.
6. W akwenie prowadzono badania, których dane zestawiono w arkuszu Dane2.sta w celu ustalenia czy zasolenie może być czynnikiem różnicującym skład gatunkowy ryb w podanym akwenie.
a) Jakiego odsetka osobników należących do gatunku A wśród tych odłowionych w wodach słonych należy oczekiwać gdyby nie istniała zależność pomiędzy tymi cechami (zasoleniem i gatunkiem)?
Liczymy współczynnik V-Cramera. Otwierasz dane, w statystykach podstawowych-tabele wielodzielcze określasz tabele 1-akwen, 2-gatunek, ok -opcje- zaznaczasz liczności oczekiwane, fi i chi- więcej-dokładne tabele dwudzielcze.
Otrzymujesz 3 tabele, druga to liczności oczekiwane(bez zależności).
Dla A wyszło 6,6. Odsetek to 6,6/22=0,3=30%.
b) Czy na poziomie istotności 5% można przyjąć hipotezę o istnieniu zależności pomiędzy zasoleniem a gatunkiem ryb bytujących w akwenie(dla całej populacji)?
Patrzysz na trzecią otrzymaną tabelę
p=0,00000<0,05(5%), przyjmujemy hipotezę alternatywną o istnieniu korelacji.
7. W pewnym akwenie prowadzono badania, których dane zestawiono w arkuszu Dane3.xls Na podstawie wyników odpowiedz na pytania.
a) Na której stacji zakres nie odstających wartości temp. był największy (wartości odstające i ekstremalne definiowane ze współczynnikiem 1,5)?
Importujesz dane. Wykresy-wykresy 2W-ramka-wąsy. Wielokrotny, tryb całkowity, punkt środkowy-mediana, ramka-percentyle 25, wąs-zakres niedostających 1, odstające i ekstremalne 1,5, zmienne zależna-T, grupująca-stacja.
Wychodzą takie ramki. Odpowiedź: na stacji 708.
b) W której warstwie średnie zasolenie było najwyższe?
Statystyki opisowe dla zmiennej S policzyć średnią, grupami-zmienna grupująca-warstwa(trzeba dodać zmienną warstwa i wpisać formułę).
Wyniki:
Odpowiedź: w warstwie głębokowodnej.
c) Jakie temp. dominowały na stacji 706, jaka część obserwacji miała wartości mniejsze niż dominujące?
Włączona selekcja wyrażona przez v1=706, w statystykach wyliczona liczba pomiarów dla stacji 706 = 116. W tabelach liczności wyliczone przedziały.
Odpowiedź: dominujące od 4,5 do 5,0, mniejsze stanowiły 46,55 %.