teoria stata

ZAD.1. Wyjaśnij pojęcia: cecha statystyczna, zbiorowość dynamiczna.

Cecha statystyczna-treść wrażenia wywołanego przez daną rzecz, inaczej właściwość jednostki pozwalająca ją odróżnić od innych jednostek. Odpowiada na pytanie: Jakie to jest?

Zbiorowość dynamiczna-populacja składająca się z jednostek obserwowanych w pewnym przedziale czasu

ZAD.2. Twierdzenie Czybyszewa, zalety i wady.

Zalety:

-dzięki niemu możemy w przybliżeniu ocenić jaki procent badanej populacji znajduje się w przedziale (średnia+-k odchyleń)

- nie musimy znać kształtu rozkładu by je wyznaczyć(stosuje się je dla wszystkich typów rozkładów)

Wady:

- twierdzenie jest bardzo ogólnikowe

-bywa dosyć rozbieżne z regułą 3sigm(np. dla k=3)

-nie stosuje się go dla k=1 lub mówi się że w tym przedziale znajduje się co najmniej 1 element, gdyż nie ma to zadnej wartosci poznawczej

-wiedząc z jakim konkretnym typem rozkładu mamy do czynienia, stosowanie twierdzenia mija się z celem

ZAD.3. Jak rozumiesz znaczenie pojęcia statystyka ?

Pojęcie to jest wieloznaczne. Oznacza:

-nazwę zbioru danych liczbowych

-nazwę czynności zbierania i opracowywania danych liczbowych

-nazwę charakterystyk liczbowych policzonych dla próby

-naukę o ilościowych metodach badania prawidłowości zjawisk masowych

ZAD.4. Wady i zalety średniej arytmetycznej jako miary tendencji centralnej.

Zalety:

-jest znana większości ludzi,

-zawsze istnieje, jest tylko jedna,

-musi się zawierać w rozstępie statystycznym,

-nadaje się do dalszych czynności statystycznych,

-jest dobrym punktem odniesienia

-miara klasyczna, opiera się na wartościach cechy wszystkich jednostek populacji

Wady:

-podatna na wpływ wielkości skrajnych (nie należy jej obliczać dla rozkładów skrajnie asymetrycznych bi i wielomodalnych),

-nie należy jej obliczać dla szeregu o otwartych przedziałach klasowych(wyjątek bardzo małe liczebności w przedziałach)

-jej wartość poznawcza maleje wraz ze wzrostem asymetrii,

-nic nie mówi o rozkładzie cechy,

-ostrożnie porównujemy na podstawie średnich, bo nie wiemy nic o strukturze zjawiska

-wyznaczana tylko dla zmiennych addytywnych

ZAD.5. 190-elementową populację analizowano pod kątem cechy Q, otrzymano średnią 29j.m.i klasyczny współczynnik zmienności 16%. Ile wyniesie wariancja w populacji, jeżeli każdy element został powiększony o 7 j.m. ?

Vzk=odchyl/średnia 0,16=odchyl/29 odchyl=4.64 Var=21,53

ZAD.6. Jakie praktyczne zastosowania znajdują momenty centralne rzędu trzeciego i czwartego ?

Moment centralny rzędu trzeciego ma zastosowanie jako klasyczna absolutna miara skośności, a podzielony przez sigma ^ 3 tworzy miarę stosunkową-trzeci moment centralny standaryzowany, pozwalający na ocenę siły i kierunku asymetrii. Moment centralny rzędu czwartego ma zastosowanie jako ocena koncentracji i spłaszczenia rozkładu e4, a dzielony przed sigma^4-3 tworzy klasyczną miarę skupienia, określającą wysmukłość lub spłaszczenie rozkładu względem rozkładu normalnego oraz siłę tych rozbieżności.

ZAD.7. Wyjaśnij pojęcia: zbiorowość statyczna, indeks łańcuchowy.

Zbiorowość statystyczna-ogół rzeczy jednoznacznie określonych i wyodrębnionych, posiadających przynajmniej jedna wspólną cechę różniącą się wartościami; zbiór elementów nieidentycznych z punktu widzenia badanej cechy.

Indeks łańcuchowy- jest indywidualnym indeksem dynamiki, czyli dotyczy konkretnego jednego zjawiska i analizuje jego zmienność w czasie okres do okresu

ZAD.8. Na czym polega działanie przyczyn ubocznych ?

Przyczyny uboczne działają w indywidualnych, poszczególnych przypadkach. Ich działanie powoduje, ze poszczególne zdarzenia mogą poważnie odbiegać od ogólnej prawidłowości. Przyczyny uboczne sprawiają że prawidłowość jest tylko przybliżona, ze wyraża się tylko w masie. Łączenie zdarzeń w duże masy kompensuje działanie przyczyn ubocznych. Poznanie przyczyn ubocznych, nie oznacza że skutek ich działania przestaje być zdarzeniem przypadkowym.

ZAD.9. 250 - elementową populację analizowano pod kątem cechy A, otrzymano średnią 90j.m.i klasyczny współczynnik zmienności 26%. Ile wyniesie wariancja w populacji, jeżeli każdy element został zmniejszony o 12 j.m. ?

Vzk=sigma/90 sigma=23,4 Var=547,56

ZAD.10. Czym zajmuje się statystyka jako nauka ?

-ilościowymi metodami badania prawidłowości zjawisk masowych

-zbieraniem, przetwarzaniem, analizą i interpretacja danych liczbowych ze specjalnego typu zbiorowości

-ustala wielkości, za pomocą których możemy opisywać właściwości zjawisk masowych oraz podaje metody służące do ustalania związków między tymi wielkościami

ZAD.11. Wady i zalety mediany jako miary tendencji centralnej.

Zalety:

-zawsze istnieje i jest tylko jedna

-można ja wyznaczyć dla cechy niewyrażonej liczbowo

-nie jest wrażliwa na elementy skrajne

-można ją wyznaczać dla populacji skrajnie asymetrycznych

Wady:

-bardziej podatna na przypadkowe odchylenia od średniej(mniej wiarygodna dla próby od średniej arytm.)

-jeśli liczba obserwacji jest niewielka jej użycie nie jest wskazane

-jako miara pozycyjnach nie opiera się na wartościach cechy wszystkich jednostek populacji

ZAD.12. Czym możemy wytłumaczyć sprzeczne, co do kierunku i siły, wskazania miar asymetrii ?

-triada miar tendencji centralnej występuje blisko siebie

-gdy mamy szczególny kształt rozkładu „rekinia płetwa”

-położenie zbiorowości na małej liczbie odchyleń standardowych

ZAD.13. Wyjaśnij pojęcia: zbiorowość względnie jednorodna, tablica statystyczna.

Zbiorowość względnie jednorodna-zbiorowość składająca się z jednostek, dla których podstawowym kryterium różnicującym jest ilość. Są to jednostki tego samego typu, rodzaju, gatunku.

Tablica statystyczna-jeden lub więcej szeregów statystycznych, czyli zbiorów wyników obserwacji jednostek populacji według jednej cechy

ZAD.14. Na czym polega działanie przyczyn głównych ?

W wyniku działania przyczyn głównych powstają prawidłowości statystyczne. Przyczyny główne działają we wszystkich przypadkach oraz w obecności przyczyn ubocznych. Gdyby na każdą jednostkę w masie działały wyłącznie przyczyny główne, zawsze te same to prawidłowość byłaby absolutna.

ZAD.15. Przedstaw podział statystyki opisowej.

1)Analiza struktury zjawisk

a)miary tendencji centralnej

b)miary zróżnicowania

c)miary asymetrii

d)miary wysmukłości rozkładu(spłaszczenia)

e)miary koncentracji

2)Analiza współzależności zjawisk

a)miary regresji i korelacji 2 cech

b)miary regresji i korelacji wielorakiej

3)Analiza dynamiki zjawisk

a)miary tendencji rozwojowej

b)miary okresowości

c)miary wahań resztowych

d)indeksy statystyczne

ZAD.16. Wady i zalety współczynnika skośności Pearson’a.

Zalety:

-określa siłę i kierunek asymetrii

-łatwość co do oceny kierunku asymetrii(prawostronnie-dodatki wynik, lewostronnie-ujemny, brak asymetrii wynik zerowy)

-do oceny zakładamy przedział (-1,1), co ułatwia przede wszystkim określenie siły asymetrii(im dalej od zera tym silniejsza asymetria)

Wady:

-jest miara pozycyjną, a więc nie opiera się na wartościach cechy wszystkich jednostek populacji

-może wykazywać sprzeczne wskazania, co do siły i kierunku asymetrii, z miarami klasycznymi

ZAD.17. Omów skalę nominalną.

-najniższy typ skali pomiarowej

-odnosi się do zmiennych jakościowych

-służy jedynie klasyfikowaniu elementów

-dla dowolnej pary możemy jedynie powiedzieć czy jest pod pewnym względem jednakowa czy nie

-kategorie zmiennej nominalnej musza być rozłączne i wyczerpujące

-liczby użyte wyłącznie jako nazwy kategorii

-elementy w klasach musza być zliczane

-miarą tendencji centralnej dla tej skali jest dominanta

Przykłady: płeć, wyznanie, kolor oczu, stan cywilny, miejsce zamieszkania

ZAD.18. Kiedy i dlaczego rośnie wartość poznawcza średniej arytmetycznej ?

Wartość poznawcza średniej rośnie wraz ze zmniejszaniem się siły asymetrii i stopnia niejednorodności populacji, wynika to z tego, że średnia jest wrażliwa na elementy skrajne.

ZAD.19. Wyjaśnij pojęcia: populacja generalna, wielobok liczebności.

Populacja generalna-obejmuje wszystkie elementy będące przedmiotem badania, w odniesieniu do których formułować będziemy wnioski ogólne

Wielobok liczebności-powstaje z histogramu przez łączenie liniami prostymi punktów o współrzędnych: odcięta-środek przedziału klasowego, rzędna-liczebność klasy. Skrajne punkty łączy się ze środkami dwóch sąsiadujących przedziałów (na osi odciętych)o zerowych liczebnościach

ZAD.20. Przedstaw atrybuty prawidłowości.

-obiektywność

-powtarzalność

-porządek w zjawiskach

-obecność następstw

ZAD.21. Czym zajmuje się statystyka matematyczna ?

Statystyka matematyczna-podejście probabilistyczne-dział statystyki zajmujący się metodami wnioskowania o właściwościach zbiorowości generalnej, jej parametrach oraz postaci rozkładu badanych cech, na podstawie danych z prób losowych pobranych z tej populacji

ZAD.22. Omów skalę rangową

-dotyczy cech jakościowych

-poza klasyfikowaniem również ranguje(porządkuje) elementy zgodnie z porządkiem wielkości

-nie określa odległości miedzy elementami skali

-miary tendencji centralnej-dominanta i mediana

Przykłady:

Stopnie wojskowe, naukowe, jakość dobra, stopień ryzyka, twardość minerałów

ZAD.23. Czy istnienie dwóch dominant jest jednoznaczne z bimodalnością rozkładu ? Odpowiedź uzasadnij

Nie jest, ponieważ gdy dominanty znajdują się w bliskiej odległości(np. w sąsiadujących przedziałach rozdzielczych lub są kolejnymi wartościami cechy) od siebie wówczas rozkład nie będzie bimodalny

ZAD.24. Kiedy i dlaczego rośnie wartość poznawcza miar pozycyjnych ?

Rośnie w miarę zwiększania się asymetrii rozkładu i stopnia niejednorodności populacji.

ZAD.25. Wyjaśnij pojęcia: szereg rzekomy, element typowy

Szereg rzekomy-to szereg w którym liczebności nie są adekwatne względem rozpatrywanej cechy

Element typowy-stanowią ok. 2/3 zbiorowości i zawierają się w przedziale średnia +-sigma

ZAD.26. Omów skalę ilorazową

-skala najsilniejsza

-polega na uporządkowaniu elementów z oznaczeniem ich odległości od naturalnego początku(zera)

-zasadne jest orzekanie o stosunkach miedzy pomiarami

-można wykonywać wszystkie operacje arytmetyczne

-odnosi się do wszystkich cech mierzonych za pomocą CGS i SI

-miara statystyczna-średnia geometryczna

Przykłady-długość, masa, objętość, upływający czas, temperatura Kelvina

ZAD.27. Typy populacji statystycznych w przykładach.

1.Przeliczalne(skończone-liczba pracowników w firmie, nieskończone-zbiór liczb naturalnych) i nieprzeliczalne(liczby rzeczywiste z przedziału 1-2)

2.Jednowymiarowe(studenci ze względu na średnią ocen) i wielowymiarowe(studenci ze względu na płeć i wagę)

3.Statyczne(liczba studentów na stan z 12 grudnia 2011) i dynamiczne(zmiany liczby studentów w latach2000-2010)

4.Względnie jednorodne(śledzie, sarny, studenci ze względu na zainteresowania) i niejednorodne(akcje i obligacje)

ZAD.28. Wady i zalety odchylenia przeciętnego.

Zalety:

-jest miarą klasyczną-jest wypadkową wartości cechy wszystkich jednostek zbiorowości

-zrozumiała geneza i interpretacja

-określa o ile wszystkie jednostki danej zbiorowości różnią się średnio, ze względu na wartość zmiennej, od średniej arytmetycznej badanej zmiennej

Wady:

-jest miarą klasyczną, a wiec nie może być liczona dla rozkładów skrajnie asymetrycznych

-miara bazująca na modułach, jej uzycie wiąże się z wieloma błędami, łatwość pomylenia modułu z nawiasem, wyrażenia tej postaci nie są podatne na przekształcenia algebraiczne

ZAD.29. Jakie problemy mogą powstać przy graficznym porównywaniu populacji ?

Chodzi o zachowanie równości pól pod wykresami. I tak dla histogramu przy różnych długościach klas liczymy gi z ni. Natomiast dla wieloboku liczebności dla więcej niż jednej populacji i równych ich liczebnościach i różnych długości klas liczymy gi z wi, a dla różnych liczebności i długości klas liczymy gi z wi. Chcąć porównywać populacje z przypadku kumulaty przechodzimy na wi.

ZAD.30. Kiedy i dlaczego warto stosować miary stosunkowe ?

-warto je stosować przy kompleksowej analizie zbiorowości oraz przy porównaniach zbiorowości, ponieważ jako ilorazy stosowanych wielkości służą określeniu siły (asymetrii i zróżnicowania), co pomaga w sformułowaniu syntetycznych i końcowych wniosków oraz znacząco ułatwia porównania populacji.

ZAD.31. Wyjaśnij pojęcia: szereg czasowy, zmienna standaryzowana.

Szereg czasowy- zbiór wartości cechy w uporządkowanych chronologicznie różnych momentach (przedziałach) czasu

Zmienna standaryzowana-zmienna liczona dla konkretnej jednostki populacji pozwalająca łatwo określić jakiego typu jest to element(typowy, mały, duży itd.)

ZAD.32. Omów graficzną metodę wyznaczania kwantyli.

Kwantyle z wykresu kumulaty znajdujemy prowadząc przez punkt na osi rzędnych, odpowiadający numerowi danego kwantyla, prostą równoległej do podstawy do miejsca spotkania z kumulatą, a następnie opuszczając stąd prostą prostopadłą do podstawy i uznając odczytana na osi odciętych liczbę za wartość kwantyla.

ZAD.33. Wymień formy prezentacji materiału statystycznego.

-Tablice

-Wykresy(wymiarowe, ilościowe, mapowe, sporządzone w prostokątnym ukł. współrzędnych)

-Charakterystyki opisowe

-Wzory analityczne

ZAD.34. Wady i zalety odchylenia standardowego.

Zalety:

-najważniejsza miara w statystyce

-określa (umownie) o ile wszystkie jednostki danej zbiorowości różnią się średnio, ze względu na wartość badanej zmiennej, od średniej arytmetycznej tej zmiennej

-jako miara klasyczna stanowi wypadkową wartości cechy wszystkich jednostek populacji

Wady:

-umowna interpretacja

-miar klasycznych nie liczymy dla rozkładów skrajnie asymetrycznych

ZAD.35. Przedstaw podstawowe kształty rozkładów empirycznych.

Rozkłady jedno i wielomodalne

Jednomodalne- symetryczne, słabo, umiarkowanie, silnie, skrajnie asymetryczne-lewo lub prawostronnie)

Je narysować + bimodalny, siodłowy(antypodalny), rozkład bez wyraźnie zaznaczonego ośrodka dominującego, lepto, mezo i plato kurtyczne

ZAD.36. Jakie zastosowania znajdują momenty zwykłe i centralne rzędu drugiego ?

Moment zwykły rzędu drugiego to inaczej średnia kwadratów, używana w alternatywnym wzorze na obliczenie wariancji, natomiast drugi moment centralny to wariancja.

ZAD.37. Kiedy i dlaczego należy przechodzić na gęstości(natężenia liczebności) przy tworzeniu wykresów w prostokątnym układzie współrzędnych ?

Dokonujemy tego zabiegu w celu utrzymania równości pól pod wykresami

Histogram: gdy długości klas nie są stałe

Wielobok liczebności: gdy jedna populacja i długości klas nie są stałe oraz gdy więcej populacji, nierówne liczebności i niestałe długości klas to z wi liczymy gi

Kumulata: nie używamy

ZAD.38. Wyjaśnij pojęcia: jednostka statystyczna.

Jednostka statystyczna-element zbiorowości statystycznej

ZAD.39. Co to jest rozkład teoretyczny, podaj przykład.

Rozkładem teoretycznym nazywa się przyporządkowanie kolejnym wartościom zmiennej x odpowiadających im liczebności w oparciu o wyidealizowany model

Przykłady-rozkład dwumianowy, trójkątny, normalny

ZAD.40. Jakie znasz własności mediany ?

-zawsze istnieje i jest tylko jedna

-jest miarą pozycyjną

-dzieli pole pod krzywa na 2 równe części

-nie ulega wpływom wartości skrajnych

-możemy ja wyznaczyć dla cechy niewyrażonej liczbowo

-bardziej podatna na przypadkowe odchylenia od sredniej

-jej walory poznawcze rośna w miarę zwiększania liczebności populacji(gdy mało to nie używamy)

-można ja wyznaczać dla rozkładów skrajnie asymetrycznych

ZAD.41. Omów skalę przedziałową

-dotyczy cech mierzalnych

-polega na przyjęciu stałej różnicy jako jednostki porównań miedzy elementami, w sytuacji gdy nie istnieje naturalny początek

-zostają ustalone wzorcowe obiekty oraz różnica

-możliwe operacje dodawania i odejmowania

-miary statystyczne: średnia arytmetyczna i odchylenie standardowe

Przykłady-temperatura, iloraz inteligencji, czas kalendarzowy

ZAD.42. Co to jest rozkład empiryczny, odpowiedź uzupełnij przykładem.

Rozkład empiryczny jest to przyporządkowanie kolejnym wartościom zmiennej x odpowiadających im liczebności na podstawie konkretnych obserwacji. Rozkłady dzielą się na jedno i wielo modlane, natomiast jednomodalne na symetryczne i słabo, umiarkowanie, silnie i skrajnie asymetryczne oraz na lewo i prawostronnie asymetryczne.

Przykład-rozkład poziomu zarobków w Polsce, rozkład liczby zmarłych w zależności od wieku

ZAD.43. Kiedy i dlaczego warto stosować współczynniki zmienności?

Warto stosować je przy porównywaniu populacji pod względem ich zróżnicowania oraz przy analizie kompleksowej zbiorowości. Są przydatne przy budowaniu syntetycznych wniosków. Za ich pomocą z łatwością oceniamy siłę zróżnicowania.

ZAD.44. Wyjaśnij pojęcia: indeks jednopodstawowy

Indeks jednopodstawowy-analizuje zmienność w czasie w odniesieniu do okresu podstawowego

ZAD.45. Czy zgodzisz się ze stwierdzeniem, że średnia arytmetyczna i odchylenie standardowe to dwie najważniejsze miary w statystyce ? Odpowiedź uzasadnij.

Tak. Ponieważ średnia arytmetyczna stanowi dobry punkt odniesień, natomiast odchylenie standardowe to podstawowa miara zróżnicowania. Dzięki nim można przeprowadzić zabieg standaryzacji, który prowadzi do ujednolicenia zbiorowości.

ZAD.46. Jakie zastosowania znajdują kwartyle ?

Znajdują zastosowanie w miarach pozycyjnych. Poza rozstępem, Was i Vas prawie we wszystkich miarach pozycyjnych mamy do czynienia z kwartynami.

ZAD.47. Zalety i wady wykresu pudełkowego.

Zalety:

-łatwość budowy na podstawie wykresu kumulaty

-łatwość odczytu wniosków

-przejrzystość

Wady:

-prawidłowa ocena zróżnicowania i asymetrii(wnioski do wykresu) zależy od dokładności wykresu kumulaty(podatność na niedokładności w rysowaniu wykresu)

ZAD.48. Scharakteryzuj błędy nielosowe.

Wyróżniamy błędy systematyczne i przypadkowe. Systematyczne wynikają z jednokierunkowej tendencji do zniekształcania badanej rzeczywistości. Błędy przypadkowe są wywołane nieuwagą, niedbalstwem czy nieumiejętnością podania prawidłowej odpowiedzi powodują rozrzut wokół rzeczywistej wartości danej wielkości.

ZAD.49. Omów zależność pomiędzy zróżnicowaniem, a skośnością.

-jeśli rośnie siła asymetrii, to rośnie również siła zróżnicowania, ale zasada nie działa w przeciwnym kierunku

ZAD.50. Dlaczego każdą analizę statystyczną powinno poprzedzić się narysowaniem wykresu ?

Ponieważ kształt rozkładu i wstępne wnioski warunkują wybór miar jakich będziemy używać do badania danej populacji. W przypadku rozkładów wielomodalnych w ogóle nie liczymy żadnych miar, a w przypadku rozkładów skrajnie asymetrycznych liczymy jedynie miary pozycyjne.

ZAD.51. Zalety i wady wieloboku liczebności.

Zalety:

-łatwość jego wyznaczenia z histogramu

-jeden rysunek może pomieścić kilka wieloboków, co jest cenne przy porównaniach

-czytelność kształtu rozkładu większa niż dla histogramu

Wady:

-zniekształcenie proporcji liczebności w klasach

-obszar zmienności wieloboku jest powiększony o długość całego przedziału klasowego w porównaniu z histogramem

-problemy z dociąganiem wykresu do osi odciętych

ZAD.52. Kiedy w badaniu statystycznym mogą pojawić się błędy losowe ?

Mogą się pojawić gdy próba została wybrana metodą wyboru losowego. Stanowią tą część różnicy między wartościami populacji, a ich oszacowaniami na podstawie próby losowej, która spowodowana jest korzystaniem z danych próby losowej.

ZAD.53. Zalety i wady miar asymetrii opartych na dominancie.

Zalety:

-stanowią cenną charakterystykę zmiennej

-miary pozycyjne-można je wyznaczać dla rozkładów skrajnie asymetrycznych

Wady:

-trudność obliczania dominanty

-miary pozycyjne-nie oparte na wszystkich elementach populacji

ZAD.54. Wyjaśnij pojęcia: indywidualny indeks dynamiki

Indywidualny indeks dynamiki-dotyczy jednego konkretnego zjawiska(łańcuchowe i jednopodstawowe)

Przykłady: liczba ludności

ZAD.55. Omów zależność pomiędzy zróżnicowaniem, a koncentracją.

W miarę wzrostu koncentracji maleje siła zróżnicowania i odwrotnie. Może się zdarzyć że ta prawidłowość nie zajdzie dla populacji lezących na mniej niż sześciu odchyleniach standardowych.

ZAD.56. Zalety i wady histogramu.

Zalety:

-pola prostokątów są proporcjonalne do liczebności w poszczególnych klasach

-pole histogramu jest proporcjonalne do liczebności populacji

-na bazie histogramu można zbudować wielobok liczebności

-nie ma problemu z dociąganiem wykresu do osi odciętych

Wady:

-jeden rysunek może pomieścić tylko jeden wykres

ZAD.57. Dlaczego warto posługiwać się miarami stosunkowymi ?

Ponieważ są to miary bezmianowe, często wyrażone w procentach na podstawie których łatwo jest określić siłę zjawiska. Są wygodne do porównań i oceny siły zróżnicowania i asymetrii.

ZAD.58. Omów twierdzenie Czybyszewa.

Twierdzenie to mówi, że w przypadku każdej populacji statystycznej można być pewnym, ze cześć elementów, które różnią się od średniej arytmetycznej o mniej niż k odchyleń standardowych, stanowi ułamek nie mniejszy niż 1-1/k^2. Twierdzenie to znajduje zastosowanie dla dowolnego kształtu zbiorowości.

ZAD.59. Jakie zastosowania znajduje rozstęp statystyczny ?

Rozstęp statystyczny jest stosowany gdy chcemy obliczyć na ilu odchyleniach standardowych leży populacja, może być również przydatny przy budowaniu przedziałów rozdzielczych

ZAD.60. Zalety i wady wykresu kumulaty.

Zalety:

-nie trzeba przechodzić na gi i li

-na jednym rysunku można umieścić parę wykresów

-łatwość odczytu wniosków

-na jego podstawie rysujemy wykres pudełkowy

Wady:

-wymaga dużej staranności w rysowaniu, aby nie zaburzać wniosków z wykresu

-jego narysowanie jest bardziej czasochłonne niż wieloboku czy histogramu

ZAD.61. Na przykładzie zbiorowości jaką tworzą dworce kolejowe w Warszawie przedstaw podział cech statystycznych.

Cecha rzeczowa-pociąg

Cecha czasowa-grudzień 2011

Cecha przestrzenna-hala odjazdów

Cecha niemierzalna-numer peronu

Cecha ciągła-masa pociągu

Cecha skokowa-liczba pociągów na peronach

Cecha pozornie ciągła-cena biletu

Cecha quasi ilościowa-temperatura na peronie(gorąco, ciepło, akurat, chłodno, zimno)

ZAD.62. Wyjaśnij pojęcia: natężenie liczebności.

Natężenie liczebności-są szczególnym przypadkiem gęstości, gdy liczbę elementów w klasie odnosimy do długości klasy bazowej, przyjętej jako podstawa porównania.

ZAD.63. Czy zgodzisz się ze stwierdzeniem, że prawie cała populacja leży na sześciu odchyleniach standardowych ? Odpowiedź uzasadnij.

Zgodzę się, gdyż mówi o tym zasada 3 sigm. Fakt ten można udowodnić empirycznie-w większości przypadków populacji, jej większość leży w przedziale średnia arytmetyczna +-3xsigma.Potwierdza to również oszacowanie Snedecora i Twierdzenie Czybyszewa(co najmniej 89%populacji).

ZAD.64. Dlaczego warto posługiwać się standaryzowanymi momentami centralnymi ?

Ponieważ dzięki nim możemy zbadać siłę i kierunek asymetrii oraz ocenić siłę spłaszczenia lub wypukłości rozkładu względem rozkładu normalnego. Są łatwe w interpretacji.

ZAD.65. Omów graficzną metodę wyznaczania dominanty.

Wykreślamy cześć histogramu ograniczona do klasy najliczniejszej i jej dwóch najbliższych sąsiadów. Następnie łączymy odcinkami punkty:

-górna granica klasy poprzedzającej najliczniejszą i częstość w tej klasie z górną granicą przedziału dominanty i częstością w tej klasie

-dolna granica klasy dominanty i częstość w tej klasie z dolną granicą przedziału następującego po dominancie i częstością w tej klasie

ZAD.66. Na czym polega oszacowanie Snedecora ?

Snedecor zbudował tabelę wiążącą liczebności populacji, rozstęp i odchylenie standardowe. Tabela umożliwia znalezienie przybliżonej wartości odchylenia jeśli znamy liczebność populacji i rozstęp. Dla małych liczebności do wyników należy podchodzić ostrożnie, natomiast dla licznych populacji- rozstęp jest w przybliżeniu równy 6 odchyleniom, co nawiązuje do prawa 3sigm.

ZAD.67. Na przykładzie zbiorowości jaką tworzą osoby piszące aktualnie kolokwium przedstaw podział cech statystycznych.

Cecha rzeczowa-studenci

Cecha przestrzenna-aula

Cecha czasowa-24 stycznia 2012

Cecha niemierzalna-płeć studentów

Cecha ciągła-wzrost w cm

Cecha skokowa-liczba studentów w auli

Cecha pozornie ciągła-zarobki studentów

Cecha quasi ilościowa-ocena z kolokwium(niedostateczna, dopuszczająca, dobra, bardzo dobra)

ZAD.68. Wyjaśnij pojęcia: częstość względna, krzywa liczebności.

Częstość względna-wskaźnik struktury-to stosunek liczby zdarzeń sprzyjających temu zdarzeniu do liczby wszystkich zdarzeń.

Krzywa liczebności- uciąglony wielobok liczebności, powstaje przez zmniejszenie rozpiętości przedziałów klasowych. Dobrze odzwierciedla kształt rozkładu.

ZAD.69. Przedstaw tzw. zależność Pearson’a.

Zależność Pearsona mówi o położeniu triady miar tendencji centralnej .Mediana leży zawsze miedzy średnią i dominantą. Dla układów o umiarkowanej asymetrii mediana występuje miedzy średnią arytmetyczną a dominantą i dziali tę odległość w proporcjach 1/3 od średniej i 2/3 od dominanty. 1/3 i 2/3

ZAD.70. Jakie zastosowania znajdują momenty zwykłe ?

Moment zwykły pierwszego rzędu to średnia arytmetyczna, kolejne momenty to kolejno średnia kwadratów, sześcianów itd. Momenty zwykłe są podstawą do wyznaczenia momentów centralnych.

ZAD.71. Jak należy postępować z rozkładami skrajnie asymetrycznymi?

Wówczas opieramy analizę populacji tylko na miarach pozycyjnych rezygnując z oblicznia miar klasycznych.

ZAD.72. Wady i zalety średniej geometrycznej

Zalety:

-może być stosowana dla wielkości stosowanych w procentach

-multiplikatywność(umożliwia wyznaczanie średniej bez znajomości wszystkich elementów szeregu)

Wady:

-trudności obliczeniowe

-nie może być stosowana dla zmiennych addytywnych

ZAD.73. Na czym polega addytywność i multiplikatywność zmiennych?

Zmienne multiplikatywne mnoży się przez siebie, aby osiągnąć wartość wynikową, używa się w ich przypadku średnią geometryczną. Na przykład indeksy indywidualne. Zmienne addytywne sumuje się, aby osiągnąć wartość wynikową. W ich przypadku używa się średniej arytmetycznej i harmonicznej.

ZAD.74. Omów formy prezentacji materiału statystycznego

Są nimi: Tablice, wykresy, charakterystyki opisowe i wzory analityczne.

Tablica to jeden lub więcej szeregów statystycznych(zbiór wyników obserwacji jednostek populacji wg jednej cechy) Dla cech ilościowych w skład tabeli wchodzą wartość cechy, liczebność każdego wariantu i ewentualnie wskaźnik częstości dla każdego wariantu.

Wykresy dzielimy na: wymiarowe(liniowe, powierzchniowe, objętościowe), ilościowe(piktogramy, punktowe), mapowe(kartogramy, kardiogramy) oraz wykresy w prostokątnym układzie współrzędnych(histogram, wielobok liczebności, krzywa liczebności, kumulata, pudełkowy)

ZAD.75. Wady i zalety miar absolutnych

Zalety:

-są mianowane, wynik podany np. w cm

Wady:

-nie zawsze maja sens interpretacji

-nie mówią nic o sile zjawiska

ZAD.76. O czym mówi reguła trzech sigm i na jakiej podstawie została wyprowadzona?

Reguła trzech sigm mówi, że prawie wszystkie elementy populacji leżą w przedziale +/- 3*sigma (na sześciu odchyleniach standardowych). Regułę tę wyprowadza się z rozkładu normalnego. W praktyce zakłada się, że dane podlegają rozkładowi normalnemu. Jeśli to założenie jest uzasadnione, wówczas 99,7% populacji leży w odległości <= 3sigma od średniej.

ZAD.77. Jaki jest sens wyróżniania kształtów rozkładów?

kształt rozkładów nie tylko warunkuje dobór właściwych w danej sytuacji metod statystycznych, lecz także określa zakres dopuszczalnego wnioskowania.

ZAD.78. Dla jakich rodzajów szeregów i dlaczego nie możemy wyznaczać średniej arytmetycznej?

Średniej arytmetycznej nie możemy wyznaczać dla szeregów rozdzielczych z otwartymi klasami, ponieważ nie znamy środka takiego przedziału, nie możemy nic powiedzieć o jego rozpiętości. możemy zastosować regułę 5%, która mówi, że jeżeli w otwartych klasach występuje poniżej 5% elementów populacji, to te klasy pomijamy.

ZAD.79. Wady i zalety miar stosunkowych

Zalety:

-bezmianowe

Określają siłę zjawiska

-wygodne do porównań

Wady:

-niekiedy zbyt wyolbrzymiają natężenie bądź siłę zjawiska np. gdy M w okolicach zera

ZAD.80. Przedstaw typologię szeregów statystycznych

ZAD.81. Wyznacz typowy obszar zmienności i oceń siłę zróżnicowania rozkładu, jeśli wiemy, że charakteryzuje się umiarkowaną asymetrią oraz D=16; M=12; σ=3,1.

Wiedząc, że rozkład charakteryzuje się umiarkowaną asymetrią możemy użyć wzoru Pearsona do obliczenia średniej:

D=3M – 2x’   x’=(3M-D)/2   x’=(36-16)/2    x’=10

Obszar typowy   <x’- σ ; x’+ σ>   <6,9 ; 13,1>

Siła zróżnicowania    Vzk= σ/x’    Vzk=31% zróżnicowanie jest umiarkowane

ZAD.82. Podaj przykład badania statystycznego ciągłego i częściowego

Ciągłe-ewidencja zgonów i urodzeń obywateli Polski

Częściowe-poparcie dla danej partii politycznej

ZAD.83. Co wnoszą do analizy statystycznej miary asymetrii?

Miary asymetrii  mówią nam w którym kierunku dany rozkład odchyla się od rozkładu symetrycznego i jak silne jest to odchylenie. Dzięki tym miarom możemy wiedzieć czy jest sens liczyć inne miary statystyczne. Miary asymetrii mówią nam o strukturze wartości cechy w danej populacji.

ZAD.84. Wady i zalety współczynników zmienności

Zalety:

-są bezmianowe

-określają siłę zjawiska

-wyrażone w procentach

-wygodne do porównań

Wady:

-niekiedy zbyt wyolbrzymiają siłę zjawiska np. gdy M bliska zeru

ZAD.85. Czym należy się kierować wybierając miary charakteryzujące rozkład?

Należy sporządzić wykres i wyciągnąć z niego wnioski oraz określić kształt rozkładu

ZAD.86. Co wnoszą do analizy statystycznej miary spłaszczenia

Pomagają w stwierdzeniu czy badany układ jest wypukły czy spłaszczony względem układu normalnego, a miara zestandaryzowana pozwala też określić siłę tych rozbieżności.

ZAD.87. Co wnoszą do analizy statystycznej miary stosunkowe?

Określają siłę i natężenie zjawiska, są wygodne do porównań.

ZAD.88. Kiedy klasyczne współczynniki zmienności mają szczególną wartość poznawcza?

Maja szczególną wartość poznawczą gdy w populacji nie ma elementów skrajnych oraz im rozkład jest mniej asymetryczny. Są to czynniki wpływające na zaburzenia wartości poznawczej średniej arytmetycznej, które następnie wpłyną na wskazania klasycznych współczynników zmienności

ZAD.89. Z jakimi trudnościami spotykamy się przy tworzeniu wykresów w prostokątnym układzie współrzędnych?

1.Problem z porównaniem pól pod wykresami(przechodzenie na wi lub wi z gi lub gi z ni lub Cum z wi)

2.Wykreślenie wykresu dla 1 populacji o nierównych długościach klas(gi z ni lub Cum z ni)

3.Problem z opieraniem wykresu na osi w przypadku nierówności klas(nie wolno wychodzić poza obszar wartości, który przyjmuje cecha, nie wolno łączyć z osią odciętych gdy nie ma tendencji malejącej)

ZAD.90. Konsekwencje bledów statystycznych

Konsekwencją błędów statystycznych jest kompletnie nieprawdziwe odwzorowanie rzeczywistości i błędne o niej pojecie. Gdy odkryjemy błąd , to konsekwencja jest potrzeba przeprowadzenia ponownego badania z wykluczeniem czynnika zniekształcającego.

ZAD.91. Na czym polega kompleksowa analiza zbiorowości?

Dlaczego należy ostrożnie interpretować wartości średnie?

Ponieważ wadą średniej jest jej podatność na elementy skrajne, które mogą zniekształcać wnioski o populacji. Średnia również nic nie mówi o rozkładzie cechy, dlatego na jej podstawie nie można porównywać. Wartość poznawcza średniej maleje wraz ze wzrostem siły asymetrii.

ZAD.92. Co łączy statystykę opisową i matematyczną?

Obie są oparte na tych samych danych statystycznych. Statystyka opisowa zajmuje się metodami zbierania danych o zbiorowości, natomiast matematyczna zajmuje się metodami wnioskowania na podstawie tych danych. Statystyka matematyczna prezentuje i analizuje dane za pomoca narzedzi statystyki opisowej.

ZAD.93. Omów wady i zalety drugiego momentu centralnego

Zalety:

-mniejsza ilość błędów w użyciu niż w przypadku odchylenia przeciętnego

-wariancja jest zawsze dodatnia

-pierwiastek z wariancji stanowi drugą obok średniej arytmetycznej najważniejszą miarę w statystyce-odchylenia standardowe

Wady:

-miana w kwadratach

-brak interpretacji

ZAD.94. Wyjaśnij pojęcie: parametr

Parametrami nazywamy średnia arytmetyczną i odchylenie standardowe policzone dla zbiorowości generalnej(policzone dla próby nazywamy statystykami)

ZAD.95. Jakie znasz zależności pomiędzy poznanymi miarami, a momentami

statystycznymi?

m2=x2’, m3=x3’, m4=x4’

σ2=e2

A=e3/ σ3 – trzeci moment centralny standaryzowany

K=e4/ σ4 – kurtoza

ZAD.96. VZK i VZP – podobieństwa i różnice.

Podobieństwa:

- obie są miarami zróżnicowania populacji (dyspersji)

- obie są miarami stosunkowymi

Różnice:

- VZK jest miarą klasyczną, a VZP miarą pozycyjną

ZAD.97. Własności zjawisk masowych w przykładach.

Zjawiska masowe – zjawiska, które rozpatrywane w dużej masie odznaczają się

prawidłowością nie dającą się ustalić na podstawie pojedynczej obserwacji. Mogą

występować nieskończoną liczbę razy.

Przykład: komunikacja miejska – pasażerowie jeżdżą na gapę, korzystają z

biletów jednorazowych lub z karty miejskiej. Tylko w dużej masie wszystkich

pasażerów można powiedzieć, że skoro ktoś korzysta z komunikacji miejskiej, to

prawdopodobnie korzysta z karty miejskiej. Ten stale powtarzający się związek

pomiędzy stanami rzeczy (prawidłowość) nie jest możliwy do zaobserwowania w

małej populacji.

ZAD.98. Czy miary asymetrii mogą wskazywać na stopień jednorodności badanej

zbiorowości?

Tak, ponieważ im silniejsza jest asymetria, tym rozkład staje się bardziej

niejednorodny. Gdy rozkład jest symetryczny to możemy powiedzieć, że populacja

jest jednorodna. Wraz ze wzrostem niejednorodności populacji odkształcenia

rozkładu od postaci symetrycznej stają się coraz wyraźniejsze. W przypadku

populacji niejednorodnych rozkłady stają się nieregularne, przybierając postać

wielomodalną, siodłową czy skrajnie asymetryczną.

ZAD.99. Jak należy postępować, aby prawidłowo porównać graficznie populacje

przy pomocy skumulowanych wieloboków liczebności?

Jeśli mamy do czynienia z jedną populacją kumulatę wykreśla się dla liczebności

skumulowanych. Jeśli zaś mamy do czynienia z więcej niż jedną populacją, to

kumulatę wykreśla się również dla liczebności skumulowanych w przypadku, gdy

liczebności są równe lub dla częstości skumulowanych, gdy liczebności nie są równe.

ZAD.100. Omów przyczyny określające potrzebę prowadzenia częściowych badań

statystycznych.

Główne przyczyny określające potrzebę prowadzenia badań częściowych: brak

czasu, koszty, niszczenie lub zmniejszanie wartości użytkowej, nieskończona liczba

jednostek populacji, niedostępne dane, możliwość lepszego przygotowania badania,

potrzebne są jedynie wyniki orientacyjne.

ZAD.101. Jak na zróżnicowanie rozkładu wpłynie powiększenie (lub zmniejszenie)

każdej jednostki o taką samą wartość? Odpowiedź uzasadnij.

Gdy zwiększymy każdą jednostkę populacji o tę samą wielkość to średnia

arytmetyczna dla populacji również zwiększy się o tę samą wielkość. Odchylenie

standardowe pozostanie bez zmian. Vzk = sigma/x’. A więc w przypadku zwiększenia

każdej jednostki o tę samą wartość zróżnicowanie rozkładu zmniejszy się (lub

zwiększy w przypadku zmniejszenia każdej jednostki o tę samą wartość).

ZAD.102. Scharakteryzuj prawo wielkich liczb.

Łączenie zdarzeń w duże masy kompensuje działanie przyczyn ubocznych,

wzajemne znoszenie się dodatniej i ujemnej przypadkowości.

W miarę zwiększania ilości zdarzeń konieczne związki bardziej uwypuklają się drogą

wyrównywania się skutków przypadkowych.

ZAD.103. Co naprawdę mierzą miary zróżnicowania i miary asymetrii?

Miary zróżnicowania mierzą rozrzut jednostek populacji w obszarze zmienności

badanej cechy. (?)

Miary asymetrii w istocie mierzą jaka część jednostek badanej populacji znajduje się

powyżej średniej, a jaka poniżej.

ZAD.104. Na czym polega zabieg standaryzacji, ile wynosi średnia arytmetyczna i

wariancja dla zmiennej standaryzowanej?

Zmienna standaryzowana liczona dla konkretnej jednostki populacji pozwala łatwo

określić jakiego typu jest to element (typowy, mały, duży, itp.).

Zi=(xi-x’)/sigma

Średnia dla Zi = 0.

Wariancja (również odchylenie) dla Zi = 1.


Wyszukiwarka