Jaka jest różnica między cechą skokową i ciągła?
Różnica między tymi cechami polega na tym, że cecha skokowa jest cechą, która przyjmuje wartości skończone, przeliczalne i nie przyjmująca wartości pośrednich, natomiast cecha ciągła to cecha, która przyjmuje wszystkie wartości z pewnego przedziału.
Wymienić typy cech i podać po jednym przykładzie.
Cecha (ilościowa) skokowa- jest to cecha, która przyjmuje wartości skończone lub przeliczalne i nie przyjmująca wartości pośrednich (np. ilość bakterii, ilość pracowników, ilość pasażerów). Cechy te nazywane są również dyskretnymi. Cecha (ilościowa) ciągła - cecha przyjmująca wartości z pewnego przedziału liczbowego (np. wzrost, waga, plon)
Podać przynajmniej trzy nazwy rozkładów cech i jakiego typu są to cechy.
-Rozkład normalny- błędy pomiarowe, ciężar ciała; ciągłe
-Rozkład Poissona- ilość wad w metrze kwadratowym produkowanego materiału, il klientów przybywających do sklepu w jednostce czasu
-Rozkład dwupunktowy- płeć osoby, wadliwość produktu: skokowe
-Rozkład dwumianowy- ilość nasion, z których wzeszły rośliny, ilość wadliwych produktów, popularność danej osobistości publicznej; skokowe
Cecha X ma rozkład N(12,16). Bez użycia tablic obliczyć P{X€(8,16)}?
Jeżeli X znajduje się w tym przedziale to prawdopodobieństwo wynosi 0,68
Szacuje się, że średnia cena detaliczna pewnego artykułu wynosi 15 zł. Zakładając, ze cena ma rozkład normalny uzasadnij, czy można prrzyjąc, że cena 98% tych artykułów przekracza 15 zł?
Nie można przyjąć, bo jest 50% szans, że wartość ceny przekroczy 15 zł, to przy rozkładzie normalnym.
W jaki sposób można sprawdzić założenie o normalności?
Można sprawdzić to za pomocą testu chi kwadrat na zgodność z rozkładem normalnym.
W jakim celu stosuje się w praktyce uśrednianie wartości pewnej cechy?
Aby zmniejszyć zróżnicowanie uzyskiwanych wartości.
Wymienić rozkłady pojawiające się we wnioskowaniu statystycznym, a związane z rozkładem normalnym.
Test studenta, rozkład F, współczynnik korelacji Pearsona
Kiedy można stosować we wnioskowaniu statystycznym rozkład t.
Przy weryfikacji hipotezy H0:n=n0 X~N(n,sigma2) oraz H0:n1=n2 Xi~N(ni,sigma2)
Kiedy we wnioskowaniu można stosować rozkład chi kwadrat?
Przy testowaniu niezależności cech X, Y oraz gdy cechy mają rozkład normalny
Jeden z badaczy traktuje wiek jako cechę ciągła, zaś drugi skokową. Który z nich ma rację i dlaczego?
Obaj mają rację, ponieważ pierwszy traktuje wiek jako kategorię skokową, czyli młody, średni wiek, stary. Natomiast drugi jako cechę ilościową ciągłą, bo np. 2 lata, 5 lat
Co to jest wnioskowanie statystyczne?
Rodzaj wnioskowania o parametrach zbiorowości na podstawie próby (reprezentatywnej części tej zbiorowości).
Jakie są podstawowe różnice między populacja i próbą?
Populacja- z góry ustalona
Próba- część populacji, nie ustalona (losujemy)
Podać przykład próbki nie reprezentatywnej dla oszacowania zróżnicowania zarobków ludzi w Polsce.
Np. zarobki hutników, zarobki nauczycieli, ludzi w wieku 25 - 30 lat, zarobki ludzi z woj. łódzkiego, zarobki kobiet
Co to jest estymator?
Oszacowanie interesującego nas parametru.
Co to jest przedział ufności?
Przedział ufności (estymator przedziałowy) jest przedziałem o końcach zależnych od próby, który z pewnym z góry zadanym prawdopodobieństwem pokrywa nieznaną wartość parametru 0
P{ θ ∈( θ ( 2 (θ (X1, . . . ,Xn), 0(X1, . . . ,Xn))} = 1 - α. Zakres, w jakim zawiera się szacowana wartość parametru z prawdopodobieństwem równym żądanemu poziomowi ufności.
Co to jest poziom ufności?
Poziom ufności - prawdopodobieństwo 1- α; Jest to prawdopodobieństwo, że przedział ufności zawiera szacowaną wartość naszego parametru, np. 1 -α= 95% tzn., że na 95% jesteśmy przekonani, że wartość parametru zawiera się w przedziale ufności. Z góry zadane prawdopodobieństwo.
Jaka jest interpretacja poziomu ufności?
1- α = 95%, przedział ufności (160 - 180) - dla wzrostu studentek, WnoŻCzłiK
Na 95% jesteśmy pewni, że średnia wzrostu studentek tego wydziału jest w przedziale ufności (160 - 180)
Od jakich czynników i jak zależy długość przedziału ufności? Czy prowadzący doświadczenie może mieć wpływ na długość przedziału ufności? Może
Liczność próby (n ↑ => d↓)
Poziom ufności (1- α↑ => d↑)
Wariancja cechy (σ2↓ => d↓)
Co rozumiemy pod pojęciem hipotezy statystycznej?
Hipoteza statystyczna nazywamy dowolne przypuszczenie dotyczące rozkładu prawdopodobieństwa cechy w populacji. Oznaczenie Ho.
Podać przykłady hipotezy statystycznej oraz przykłady hipotezy, która nie jest statystyczna.
-Hipoteza statystyczna- dotyczy zbiorowości, mężczyźni nie znają się na kobietach
-Hipoteza nie statystyczna- Konrad nie zna się na kobietach
Co rozumiemy pod pojęciem testu statystycznego?
Postępowanie do weryfikacji hipotezy statystycznej oparte na próbie.
Jaki błąd wnioskowania nazywamy błędem I rodzaju?
Polega on na odrzuceniu hipotezy, gdy w rzeczywistości jest prawdziwa. Ustalamy z góry prawdopodobieństwo jego popełnienia
Jaka jest interpretacja poziomu istotności?
Skoro jest to prawdopodobieństwo popełnienia błędu I rodzaju. Jeżeli poziom istotności (0,05) ustalony jest blisko 0, prawdopodobieństwo jest małe, zazwyczaj 0,1.
Co to jest błąd II rodzaju?
Błąd polegający na nie odrzuceniu fałszywej hipotezy.
Zinterpretować wniosek: odrzucono weryfikowaną hipotezę na poziomie istotności 0,05.
Hipoteza nie jest prawdziwa, zaufanie do wniosku 95% (poziom mojego zaufania)
Sformułować hipotezy weryfikowane testem analizy wariancji.
H0: n1=n2=...=ni Xi~N(ni,sigma2) i=1,2,3,..... Test analizy wariancji- wartość przeciętna badanej cechy nie zależy od populacji
Wymienić założenia formułowane w analizie wariancji.
Cechy mają rozkład normalny
Cechy mają te są wariancję
Cechy te są niezależne
Co to są porównania szczegółowe (wielokrotne)?
Podział zbioru średnich na gr jednorodne (nie różnią się między sobą).
Co mierzy współczynnik korelacji?
Mierzy zależność liniową cech X i Y, blisko 1 większa zależność liniowa, blisko 0 nie ma tej zależności.
Jakich założeń wymaga test współczynnika korelacji Pearsona?
łączny rozkład cech jest normalny
Pary naszych obserwacji są niezależne
Na podstawie obliczeń uzyskano współczynnik korelacji równy 1,09. Jak można zinterpretować tę wartość?
Popełniono błąd rachunkowy, więc nie można interpretować tej wartości. Współczynnik korelacji musi być w przedziale (-1,1).
Co to jest funkcja regresji?
Funkcja, która opisuje zależność pomiędzy średnią wartość cechy zależnej od wartości cechy niezależnej Y względnej X.
41. Porównywano ceny jednego kilograma cukru w dziesięciu różnych miastach. W każdym z miast zebrano informacje z dziewięciu sklepów. Po wykonaniu obliczeń uzyskano wartość odpowiedniej statystyki testowej równą 17,231.
opisać badaną cechę- cena kg cukru;
sformułować odpowiednie założenia- cecha X~N(ni,sigma2) w każdym mieście niech Xi- badana cecha cena cukru w i-tym mieście, i=1, ...,10 X1, X2,...,X10- niezależne;
sformułować odpowiednią hipotezę- H0:n1=...=n10, cena cukru nie zależy od miasta;
zweryfikować sformułowaną hipotezę- poziom istotności L=0,05 Femp=17,231 F(0,05;9;80);
sformułować odpowiedni wniosek
42. Porównywano ceny jednego kwiatu róży ogrodowej w pięciu różnych miastach. W każdym z miast zebrano informacje z ośmiu kwiaciarni. Po wykonaniu obliczeń uzyskano wartość odpowiedniej statystyki testowej równą 17,231.
opisać badaną cechę- cena róży
sformułować odpowiednie założenia- cech X~N(ni,sigma2) w każdym mieście niech Xi- badana cecha cena róży w i-tym mieście, i=1,2,...,10; X1,X2,...,X10- niezależne
sformułować odpowiednią hipotezę- H0:n1=...=n10, cena rózy nie zależy od miasta
zweryfikować sformułowaną hipotezę- poziom istotności L=0,05 Femp=17,231 F(0,05;4;35)
sformułować odpowiedni wniosek
43. Badano istnienie zależności między długością czasu pracy a wydajnością. Na podstawie badania pięćdziesięciu pracowników uzyskano wartość odpowiedniej statystyki testowej równą -0,895.
opisać badaną cechę- cecha X- czas pracy Y- wydajność
sformułować odpowiednie założenia- X,Y~N(ni,sigma2)
sformułować odpowiednią hipotezę- wydajność nie zależy od długości czasu pracy
zweryfikować sformułowaną hipotezę- poziom istotności L=0,05 (-0,85)>a(0,05;50)
sformułować odpowiedni wniosek
44. W badaniach ankietowych dotyczących oglądalności serialu „Salamandra” podano, iż serial ogląda 25% dorosłej części mieszkańców Polski oraz, że błąd statystyczny oceny wynosi 2,7%. Wyjaśnić co oznacza błąd statystyczny. Jak należy rozumieć podany wynik w kontekście całej badanej zbiorowości liczącej 20 mln ludzi?
Rzeczywista oglądalność to przedział +-2,7%, ogląda 5 mln ludzi +-0,54 mln, czyli ogląda co najmniej 4,46 mln a nie więcej niż 5,54 mln
45. W badaniach ankietowych dotyczących poparcia partii „Kameleony” podano, iż 15% dorosłej części mieszkańców Polski popiera tą partię oraz, że błąd statystyczny oceny wynosi 2,1%. Wyjaśnić co oznacza błąd statystyczny. Jak należy rozumieć podany wynik w kontekście całej badanej zbiorowości liczącej 30 mln ludzi?
Rzeczywiste poparcie dla partii to przedział +-2,1%, popiera 4,5 mln ludzi +-0,945, czyli popiera co najmniej 3,555 mln a nie więcej niż 5,445 mln ludzi.
46. W badaniach wydajności pracy podano, iż średnia dzienna wydajność robotnika wynosi 5000 sztuk oraz odchylenie standardowe 200. Błąd statystyczny oceny średniej wydajności wynosi 100. Wyjaśnić co oznacza błąd statystyczny. Jakiej minimalnej dziennej produkcji można oczekiwać, jeżeli wszystkich zatrudnionych jest 100000?
4900*100000= 490000000 szt to jest minimalna produkcja przy zatrudnionych 100000
47. Przed tłustym czwartkiem została opublikowana nowa technologia „Lukierek” smażenia pączków. Jej twórca twierdzi, że „zakalcowatość” tej technologii nie przekracza 3,2%. Sprawdzono to odpowiednimi testami statystycznymi stosowanymi na poziomie istotności 0,01. „Lukierek” został wykorzystany przez 100000 ciastkarni w Polsce. W ilu z nich (w przybliżeniu) „zaklacowatość” będzie większa od 3,2%. Odpowiedź uzasadnić.
100000*0,01 (poziom istotności)= 1000 to jest przybliżona zakalcowatość gdzie będzie większa od 3,2%
48. Producent mundurków szkolnych granacik jest gotów 30% swojej produkcji przygotować na wzrost (145; 150). Chcąc sprawdzić, czy słusznie będzie postępować na podstawie pomiarów wzrostu w losowo wybranych szkołach zweryfikować odpowiednią hipotezę statystyczną i nie odrzucił jej na poziomie istotności 0,05. W jakiej (w przybliżeniu) ilości szkół spośród 10000 zapotrzebowanie na powyższe mundurki będzie większe lub mniejsze niż 30%? Odpowiedź uzasadnić.
10000*0,05= 500 szt
49. W badaniach poczytności gazety „Plotki z magla” stwierdzono, że procent osób czytających tą gazetę może być reprezentowany liczbą z przedziału (13%; 27%). Oszacowanie to nie zadowala wydawcy, który chciałaby mieć dokładniejszą ocenę poczytności. Zaproponować dwa sposoby zwiększenia precyzji oszacowania poczytności gazety.
zwiększyć ilość obserwacji (próbę)
zmniejszyć poziom ufności
50. W badaniach średniego czasu użytkowania baterii w telefonie komórkowym (w godzinach) stwierdzono iż jest on liczbą z przedziału (53; 126). Oszacowanie to nie zadowala producenta, który chciałaby mieć dokładniejszą ocenę. Zaproponować dwa sposoby zwiększenia precyzji oszacowania średniego czasu użytkowania baterii.
zwiększyć ilość obserwacji (próbę)
zmniejszyć poziom ufności
51. W badaniach średniej wydajności pracy (w sztukach na godzinę) w fabryce uniwersalnych spinaczy biurowych stwierdzono iż jest ona liczbą z przedziału (156; 432). Oszacowanie to nie zadowala właściciela fabryki, który chciałaby mieć dokładniejszą ocenę. Zaproponować dwa sposoby zwiększenia precyzji oszacowania średniej wydajności pracy.
zwiększyć ilość obserwacji (próbę)
zmniejszyć poziom ufności
52. W badaniach udziału w rynku napojów chłodzących napoju „Zmarzlaczek” stwierdzono, że udział ten może być reprezentowany liczbą z przedziału (5%; 17%). Oszacowanie to nie zadowala producenta „Zmarzlaczka”, który chciałaby mieć dokładniejszą ocenę udziału w rynku. Zaproponować dwa sposoby zwiększenia precyzji oszacowania tego udziału.
zwiększyć ilość obserwacji (próbę)
zmniejszyć poziom ufności
60. Badano istnienie zależności pomiędzy poziomem wykształcenia i zarobkami. Stosując odpowiedni test hipotezę o braku zależności odrzucono. Czy oznacza to, że im wyższy poziom wykształcenia tym wyższe zarobki?
Hipoteza - brak zależności między poziomem wykształcenia i zarobkami - odrzucona
Odrzucenie powyższej hipotezy świadczy o istnieniu zależności między poziomem wykształcenia i zarobkami, a więc można przyjąć, że im wyższy poziom wykształcenia tym wyższe zarobki
61. Jakie wnioski wynikają z odrzucenia hipotezy ogólnej H0 :n1 = n2 =... = nk w teście analizy?
wariancji?
Co najmniej jedna cecha ma inną średnią
62. W jaki celu stosuje się standaryzację zmiennych losowych?
-standaryzacja - porównanie
-standaryzacje stosuje się w celu porównania dwóch różnych zmiennych
Standaryzacja współczynników
-porównanie stanu zdrowia dwóch różnych populacji, uwzględniające wpływ wieku lub innych czynników mających istotne znaczenie na wskaźniki zdrowia (umieralność, chorobowość, zapadalność itd.)
-polega na obliczeniu nowych, teoretycznych współczynników przy założeniu, że struktury wewnętrzne porównywanych populacji odpowiadają strukturze wewnętrznej zbiorowości przyjętej umownie za wzór (standard)
współczynniki standaryzowane nie przedstawiają umieralności (zapadalności) rzeczywistej, ich wartości służą jedynie do porównań
CO TO JEST POPULACJA?
Populacja - zbiór obiektów z wyróżnioną cechą (cechami)
JAKIMI PROBLEMAMI ZAJMUJE SIĘ STATYSTYKA?
Statystyka zajmuje się badaniem (analizowaniem) zjawisk masowych: polega na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w postaci zestawień tabelarycznych, wykresów itp.; posługuje się rachunkiem prawdopodobieństwa
SFORMUŁUJ JEDNO Z ZADAŃ STATYSTYKI MATEMATYCZNEJ?
Statystyka matematyczna - dział matematyki stosowanej oparty na rachunku prawdopodobieństwa; zajmuje się badaniem zbiorów na podstawie znajomości własności ich części
CO TO JEST WNIOSKOWANIE STATYSTYCZNE?
Jest to uogólnienie wniosków wyciągniętych na podstawie badań próby na całą populację reprezentatywną właśnie przez badana próbą
CO WPŁYWA NA JAKOŚC WNIOSKOWANIA STATYSTYCZNEGO?
- prawidłowe określenie badanej populacji i jej cechy
- prawidłowy dobór próby reprezentującej daną populację
- prawidłowa „obróbka danych” (zastosowanie odpowiednich technik statystycznych)
- ustalenie odpowiedniego poziomu istotności (ufności) dla wyciągniętych wniosków
ŹRÓDŁA BŁĘDÓW WE WNIOSKOWANIU STATYSTYCZNYM?
- nieprawidłowe określenie badanej populacji i jej cechy (cech)
- nieprawidłowy dobór założeń dotyczących populacji i badanej cechy
- źle dobrana próba (za mała, nie reprezentatywna)
- nieprawidłowa „obróbka próby” (zastosowanie nieodpowiednich technik statystycznych)
- ustalenie odpowiedniego poziomu istotności (ufności) dla wyciąganych wniosków
CO TO JEST PRÓBA?
Próba - wybrana część populacji podlegająca badaniu
CO TO JEST PRÓBA REPREZENTATYWNA?
Jest to próba wybrana losowo z populacji; każdy element populacji musi mieć taką samą szansę trafienia do próby; musi być odpowiednia ilość tych elementów
CO TO JEST CECHA?
Cecha - wielkość losowa charakteryzująca obiekty danej populacji
CO TO ZNACZY, ZE ESTYMATOR JEST PRECYZYJNY?
Jest bliski jedności, wysokie prawdopodobieństwo trafienia w okolicę bliską rzeczywistości
W WYNIKU WERYFIKACJI Ho: n1 ≤ n2 UZYSKANO p- value = 0,52480. CZY WERYFIKOWANA HIPOTEZĘ NALEŻY ODRZUCIĆ I DLACZEGO ?
α = 0,05; p - value > α - nie odrzucamy hipotezy
MOC TESTU
Mocą testu nazywamy prawdopodobieństwo odrzucenia testowanej hipotezy, gdy jest ona nieprawdziwa, czyli prawdopodobieństwo nie popełnienia błędu II rodzaju. Oznaczenie: 1 - β
Mocne postępowanie wychwytuje nawet małe różnice, słabe nie wychwytuje ich, nam zależy na tym żeby moc testu była duża
- rozmiar próby↑ - moc testu ↑
- zróżnicowanie ↑- moc testu ś
PRZYKŁAD PRÓBKI NIEREPREZENTATYWNEJ DLA WZROSTU WSZYSTKICH KOBIET W POLSCE
Studentki AWF
SFORMUŁOWAC 2 HIPOTEZY WERYFIKOWANE TESTEM t
2 odmiany jabłek nie różnią się pod względem średniego ciężaru H0: n1=n2
2 populacje serów żółtych nie różnią się pod względem średniej zawartości tłuszczu Ho0: n1=n2
CO TO SĄ PRÓWNANIE SZCZEGÓŁOWE (WIELOKROTNE)
Są to postępowania statystyczne zmierzające do podzielenia zbioru średnich na grupy jednorodne
Grupy jednorodne - największe podzbiory o równych sobie średnich
WSPÓŁCZYNNIK DETERMINACJI
Określa na ile względna cecha X determinuje cechę Y
ZMIENNA LOSOWA
Jest to wynik zdarzenia losowego. Zmienna losowa (cecha) -funkcja o wartościach rzeczywistych określona na zbiorze zdarzeń elementarnych. Rozkład zmiennej losowej - zbiór wartości zmiennej losowej oraz prawdopodobieństwa z jakimi są te wartości przyjmowane np. jednokrotny rzut kostka.
Zmienna losowa: ilość wyrzuconych oczek. Zbiór wartości: {1, 2, 3, 4, 5, 6}. Zmienna losowa skokowa (dyskretna) jest to zmienna, której zbiór wartości jest skończony lub przeliczalny
Jeżeli x1 oraz x2 są kolejnymi wartościami zmiennej losowej skokowej, to nie przyjmuje ona żadnych wartości miedzy x1 a x2 np Rzut kostka, liczba bakterii, ilość pracowników. Zmienna losowa ciągła jest to zmienna przyjmująca wszystkie wartości z pewnego przedziału (najczęściej zbioru liczb rzeczywistych). Jeżeli x1 oraz x2 są dwiema wartościami zmiennej losowej ciag³ej, to może ona przyjąć dowolna wartość miedzy x1 a x2 np. Wzrost, ciężar paczki towaru, wydajność
pracowników
2 PRZYKŁADY CECH O ROZKŁADZIE DWUMIANOWYM
Rzut kostką, nasiona które wykiełkowały
DO CZEGO SŁUZY ANALIZA REGRESJI
Służy do zbadania współzależności między 2 cechami o rozkładzie normalnym
JAKIE WARTOŚCI MOŻE PRZYJMOWAC WSPÓŁCZYNNIK KORELACJI WIELOKROTNEJ
Współczynnik korelacji jest miernikiem zależności miedzy dwiema cechami. Oznaczenie: ρθ
Własności współczynnika korelacji
1. Współczynnik korelacji jest liczba niemianowana
2. ρ ∈<-1, 1〉
3. Jeżeli ρ > 0, to większym wartościom jednej cechy odpowiadają (średnio) większe wartości drugiej cechy. Zależność dodatnia (rosnąca, stymulująca).
4. Jeżeli ρ < 0, to większym wartościom jednej cechy odpowiadają (średnio) mniejsze wartości drugiej cechy. Zależność ujemna (malejąca, limitująca).
5. Jeżeli ρ = 0, to bez względu na wartości przyjmowane przez jedna z cech, średnie wartości drugiej cechy są takie same. Cechy nie skorelowane.
6. Jeżeli ρ = ±1, to istnieją takie liczby rzeczywiste a oraz b, ze Y = aX + b. Jeżeli % = 1, to a>0.Jeżeli ρ = -1, to a < 0.
Współczynnik korelacji jest miernikiem liniowej zależności miedzy cechami X oraz Y .
Im |ρ| jest bliższe 1, tym bardziej „liniowa” jest zależność miedzy cechami.
7. Jeżeli (X, Y ) ma dwuwymiarowy rozk³ad normalny,
to ρ = 0 jest równoważne niezależności cech X, Y .
W GOSP WIEJSKICH BADANO ZALEŻNOŚĆ MIĘDZY SPOŻYCIEM ZIEMNIKÓW (CECHA X) I ARTYKUŁÓW ZBOZOWYCH (CEHCA Y). UZYSKANO FUNKCJE REGRESJI : - 0.987X + 1,23. ZINTERPRETWAĆ WSPÓLCZYNNIK REGRESJI W TYM RÓWNANIU
X - spożycie ziemniaków
Y - spożycie zbożowych
Wraz ze wzrostem spożycia ziemniaków o jedną jednostkę zmniejsza się spożycie zbożowych o 0,987
INTERPRETACJA WSPÓŁCZYNNIKA KIERUNKOWEGO (a)
Wzrost spożycia ziemniaków (x) o jednostkę powoduje średni spadek spożycia art. Zbożowych (y) o około 1,080 g/dobę y = 1 .... - 4,086x
WSPÓLCZYNNIK KIERUNKOWY
Mówi o ile i jak zmieni się wartość cechy zależnej, jeśli wartość cechy niezależnej zmieni się o jednostkę
WYZNACZENIE GRUP JEDNORODNYCH (PROCEDURĄ TUKEYA)
NIR - najmniejsza istotna różnica; jeżeli różnice wartości średniej < NIR - populacje się nie różnią; jeżeli różnice wartości średniej > NIR - populacje się różnią
TO DO TESTU TAKIEGO JAK MA BYĆ PISZE TYLKO PRAWIDŁOWĄ ODPOWIEDŹ ZNACZY SIĘ TA CO TRZEBA ZAZNACZYĆ!!!!!!!!!!!!!!!!!!!!!
1) Próbkowy współczynnik korelacji wynosi -0,3, wartość krytyczna 0,6.
cechy X,Y są zależne TAK
większym wartością cech X odpowiadają większe od Y TAK
większym wartością cech X odpowiadają mniejsze od Y TAK
takie zaznaczenie bo R w module <rkryt [-0,3]<0,6
odpowiedzi dla -0,8 będą
NIE
TAK
NIE
2) Przedział ufności dla różnicy n1-n2 wynosi (-2,-1)
średnia n1>n2 TAK
średnia n1<n2 NIE
średnia n1 oraz n2 są równe NIE
3) Oszacowano, że procent palących kobiet jest liczbą z przdziału (50%; 58%), możemy uznać, że w zbiorowości kobiet liczącej 20 mln
co najmniej 10 mln pali NIE
co najwyżej 5,8 mln pali TAK
nie więcej niż 15 mln pali NIE
4) Dwie firmy statystyczne oszacowały poparcie dla Leppera w najbliższych wyborach. Pierwsza firma oszacowała, że Lepper ma poparcie 8-12%, druga zaś że 7-11%, możemy uznać, że Leppera popiera
od 8-12% TAK
od 7-12% TAK
od 8-11% NIE
5) Oszacowano zależność cechy Y względem X. Jeżeli cecha X wzrośnie o jeden to średnia wartość cechy Y (Y=5+6X)
wzrośnie o 5 TAK
wzrośnie 5+6=11 TAK
wzrośnie o 6 NIE
6) Oszacowano zależność S=5-0,1*N, gdzie S- spoż słodyczy w kg, N- spoż nabiału w kg. Spożycie nabiału wzrosło o 100g, zatem spożycie S zmalało o:
o ok. 1kg TAK
o ok. 100g TAK
o ok. 10g NIE, dobra odpowiedź bo 0,1*0,1=0,01 kg czyli 10 g
7) Zastosowano procedurę porównań szczegółowych w gr 3 kucharek badając przeciętny czas zmywania:
Xsr H= 5 min; Xsr J= 8 min, Xsr Z= 3 min, błąd statystyczny jednoczesnej oceny tych średnich czasów zmywania wynosi 3 min
można uznać, że Hela zmywa szybciej od Jadzi TAK
można uznać, że Jadzia szybciej od Zosi TAK
można uznać, że najszybciej zmywa Hela TAK
8) Mamy dwie cechy jakościowe X,Y. Do badania zależności tych cech można użyć:
testu t-studenta TAK
testu korelacji Pearsona TAK
testu chi- kwadrat NIE