RODZIAŁ 1, 2, 3
1. Podać określenie i przykłady zbiorowości statystycznej, generalnej i próbnej.
Zbiorowość (populacja) generalna - są to wszystkie elementy, będące przedmiotem badania, co do których chcemy formułować ogólne wnioski. Np. zbiorowością w badaniu statystycznym wzrostu ludzi w Polsce będą wszyscy ludzie w Polsce.
Zbiorowość próbna (próba) - jest to podzbiór populacji generalnej, obejmujący część jej elementów, wybranych w określony sposób. Np. podzbiór studentów UE, których nazwiska zaczynają się na A.
2. Wymienić rodzaje badań całkowitych i opisać jeden z nich.
spis statystyczny - jednorazowe lub powtarzalne co jakiś okres badanie, które obejmuje wszystkie jednostki zbiorowości statystycznej
inwentaryzacja - spis ujmujący faktyczny stan ilościowy i wartościowy majątku określonej jednostki administracyjnej lub podmiotu gospodarczego
rejestracja bieżąca - systematyczne notowanie ściśle określonych faktów, będących przedmiotem badań. Np. ewidencja małżeństw, urodzeń, zgonów, ewidencja operacji bankowych
sprawozdawczość statystyczna - obejmuje informacje przekazywane przez osoby fizyczne, podmioty gospodarcze i instytucje jednostkom nadrzędnym lub organom statystycznym. Np. zeznania podatkowe
3. Wymienić rodzaje badań częściowych i opisać jeden z nich.
badania reprezentacyjne - jest częściowym badaniem statystycznym opartym na pobranej ze zbiorowości generalnej w sposób losowy. Metoda ta jest najbardziej prawidłową formą badania częściowego. Przy pomocy rachunku prawdopodobieństwa przy przenoszeniu wyników z losowej próby na całą zbiorowość można określić wielkość popełnianego błędu. Należy zapewnić takie same szanse dostania się do próby wszystkim jednostkom zbiorowości generalnej
badanie monograficzne -polega na badaniu indywidualnego przypadku, np. jednego regionu, przedsiębiorstwa czy gospodarstwa domowego. Przy badaniu monograficznym nie ograniczamy się do liczbowego opisu jednostki lecz stosujemy również opis tekstowy
badanie ankietowe - jest jednym z najszybszych sposobów badania zjawisk masowych, który stosuje się zawsze w celu wyświetlenia jakiegoś specyficznego problemu (np. ocena poziomu życia w gospodarstwach domowych). Przeważnie stosuje się wywiad pisemny, bo jest on bardziej oszczędny ze względu na czas niż wywiad ustny.
4. Kiedy próba jest reprezentatywna?
Aby próba była reprezentatywna muszą być spełnione dwa warunki:
musi być wybrana losowo, tzn. każda jednostka danej zbiorowości ma znane, różne od zera prawdopodobieństwo znalezienia się w próbie,
powinna być dostatecznie liczna (pojęcie próby dostatecznie licznej jest pojęciem umownym. Często oznacza to próbę o bardzo umiarkowanej liczności).
5. Podać różnice między stymulantą a destymulantą.
Stymulanta - jest to taka cecha, której wyższe wartości pozwalają zakwalifikować daną jednostkę statystyczną jako lepszą z punktu widzenia realizowanego badania.
Destymulanta - to taka cecha, której wysokie wartości świadczą o niskiej pozycji jednostki w zbiorze.
6. Podać po jednym przykładzie stymulanty i destymulnaty.
Stymulanta - wysokość zarobków
Destymulanta - karność strzałów np. na strzelnicy
7. Podać określenie i dwa przykłady cechy skokowej.
Cecha skokowa (dyskretna) - jedna z cech mierzalnych. Przyjmuje ona skończony lub przeliczalny zbiór wartości na danej skali liczbowej, przy czym najczęściej jest to zbiór liczb całkowitych dodatnich, np. liczba osób w rodzinie, liczba usterek w jakimś produkcie.
8. Podać określenie i dwa przykłady cechy ciągłej.
Cecha ciągła - jest to cecha, która może przyjąć każdą wartość z określonego przedziału liczbowego, przy czym liczba miejsc po przecinku jest uzależniona od dokładności dokonywanych pomiarów, np. waga, wzrost.
9. Dokonać podziału cech statystycznych.
10. Jakie to są cechy mierzalne - podać dwa przykłady.
Cechy mierzalne - są to właściwości, które można zmierzyć i wyrazić za pomocą odpowiednich jednostek fizycznych, np. w kilogramach, metrach. Do cech mierzalnych zalicza się także cechy quasi-ilościowe zwane porządkowymi. Np. ocena wiadomości studenta, wzrost uczniów.
11. Jakie to są cechy jakościowe - podać dwa przykłady.
Cechy niemierzalne - to cechy określane słownie, np. płeć, przynależność sektorowa. Wśród cech niemierzalnych wyróżnia się także cechy obrazujące przestrzenny rozkład badanych zjawisk (rozmieszczenie terytorialne) tzw. cechy terytorialne.
12. Definicja szeregu statystycznego.
Szereg statystyczny - ciąg wielkości uzyskanych w wyniku obserwacji lub pomiaru i uporządkowanych według określonego kryterium takiego jak np. rodzaj badania (szeregi przekrojowe i czasowe), liczba obserwacji (szeregi szczegółowe i rozdzielcze), rodzaj cechy statystycznej (szeregi z cechą mierzalną i niemierzalną).
13. Podać określenie szeregu rozdzielczego.
Szereg rozdzielczy -zbiorowość statystyczna podzielona na części (klasy) według określonej cechy jakościowej lub ilościowej z podaniem liczebności lub częstości każdej z wyodrębnionych klas.
14. Jak odróżnić szereg szczegółowy od rozdzielczego?
W szeregu szczegółowym mamy wartości cechy po kolei, a w rozdzielczym pojawia się liczebność przedziału.
15. Jaka jest różnica między wskaźnikiem struktury, a wskaźnikiem natężenia.
Wskaźnik struktury ωi (częstość występowania danego wariantu cechy) - stosunek liczby jednostek o danej wartości cechy do liczebności próby ωi=
przy czym
Może być wyrażany również w procentach lub promilach.
Wskaźnik natężenia - wielkość stosunkowa wyrażająca kształtowanie się wielkości jednego zjawiska na tle innego, logicznie z nim związanego. Często prawidłowa ocena rozmiarów badanego zjawiska jest uwarunkowana uprzednim obliczeniem odpowiedniego wskaźnika natężenia.
Jeżeli wskaźnik struktury określa zawsze stosunek części do całości w obrębie badanej zbiorowości, to wskaźnik natężenia określa wzajemny stosunek do siebie dwóch jakościowo odrębnych, choć powiązanych ze sobą zbiorowości. Np. gdy za cel badania wzięto porównanie śmiertelności w dwóch szpitalach. Śmiertelność określa się za pomocą wskaźnika natężenia, a mianowicie stosunku liczby zgonów do liczby chorujących. Wiadomo jednak, że śmiertelność w szpitalu na jednych oddziałach jest większa, na innych mniejsza. Ogólna więc śmiertelność danego szpitala zależy od jego struktury wewnętrznej. Ponieważ różne szpitale mają na ogół różną strukturę, dlatego też porównywanie ze sobą ogólnych wskaźników jest niemożliwe. Można jedynie porównać śmiertelność w analogicznych oddziałach dwóch różnych szpitali. Istnieje jednak metoda pozwalająca porównać nasilenie występowania danego zjawiska w dwóch zbiorowościach o różnej strukturze. Metodą tą jest tzw. standaryzacja, polegająca na obliczaniu wartości wskaźników przy założeniu, że struktura badanej zbiorowości odpowiada pewnej stałej strukturze przyjętej za wzorzec - standard. Standard taki dobiera się umownie, przyjmując zwykle za podstawę bądź jedną z badanych zbiorowości, bądź jakąś zbiorowość pośrednią. Po przyjęciu takiego wzorca, czyli określonej struktury, przelicza się dla każdej z porównywanych zbiorowości ponownie wskaźniki natężenia, przy założeniu, że struktura każdej z tych zbiorowości jest taka sama jak struktura wzorcowa.
16. Podać definicję rozkładu empirycznego cechy statystycznej.
Rozkład empiryczny cechy statystycznej - zestawienie wyników w postaci szeregu rozdzielczego z cechą mierzalną. Rozkład empiryczny odzwierciedla strukturę badanej zbiorowości z punktu widzenia określonej cechy statystycznej.
17. Jakie wykresy służą do graficznej prezentacji rozkładu empirycznego, gdy dane są w postaci szeregu punktowego?
Histogram
18. Które z wykresów:
a) histogram liczebności
b)diagram liczebności skumulowanej
c) histogram częstości skumulowanej
d) histogram częstości
e)diagram częstości
można wykorzystać do ilustracji rozkładu empirycznego cechy, gdy dane są w postaci szeregu rozdzielczego przedziałowego.
19. Które z wykresów:
a) histogram liczebności
b)diagram liczebności skumulowanej
c) histogram częstości skumulowanej
d) histogram częstości
przedstawiają dystrybuantę empiryczną, gdy dane są w postaci szeregu rozdzielczego przedziałowego.
20. Które z wykresów:
a) histogram liczebności
b)diagram liczebności skumulowanej
c) histogram częstości skumulowanej
d) histogram częstości
e)diagram częstości
można wykorzystać do ilustracji rozkładu empirycznego cechy gdy dane są w postaci szeregu rozdzielczego punktowego.
21. Wykresem dystrybuanty empirycznej w przypadku danych w postaci szeregu punktowego jest diagram częstości skumulowanej.
22. Co to jest i jakie wartości przyjmuje wskaźnik podobieństwa struktur.
Wskaźnik podobieństwa struktur służy do pomiaru podobieństwa struktur. Jest zawarty pomiędzy 0 a 1. Im wskaźnik podobieństwa struktur jest bliższy 1, tym struktury badanych zbiorowości są bardziej podobne.
23. Naszkicować rozkłady: jednomodalny symetryczny, jednomodalny o umiarkowanej asymetrii prawostronnej, rozkład o skrajnej asymetrii lewostronnej.
rozkład jednomodalny symetryczny
rozkład o umiarkowanej asymetrii lewostronnej
rozkład o skrajnej asymetrii prawostronnej
24. Wymienić 4 własności średniej arytmetycznej.
Własności średniej arytmetycznej:
- średnia arytmetyczna spełnia warunek x min < x śr < x max
- suma odchyleń poszczególnych wartości cechy od średniej wynosi 0
- suma wartości cechy dla wszystkich jednostek jest równa iloczynowi średniej arytmetycznej i liczebności zbiorowej, czyli
- suma kwadratów odchyleń poszczególnych wartości od średniej jest minimalna
- jeśli w szeregach o otwartych przedziałach liczebność tych przedziałów nie przekracza 5% z ogólnej liczby obserwacji, to możliwe jest domknięcie tych przedziałów i obliczenie średniej arytmetycznej. W przeciwnym wypadku nie można obliczyć średniej arytmetycznej i stosuje się parametry pozycyjne
- średnia arytmetyczna jest wrażliwa na skrajne obserwacje, tzw. wartości odstające lub przypadkowe.
25. W jakich przypadkach nie powinno korzystać się z klasycznych parametrów statystycznych.
Z parametrów klasycznych nie powinno się korzystać w przypadku szeregów o otwartych przedziałach klasowych oraz gdy występują różne rozpiętości przedziałów klasowych.
26. Czym różni się prosta średnia arytmetyczna od średniej arytmetycznej ważonej?
Prostą średnią arytmetyczną(nieważoną) oblicza się dla danych przedstawionych w postaci szeregów szczegółowych, natomiast średnią arytmetyczną ważoną wyznacza się w szeregach rozdzielczych punktowych oraz szeregach rozdzielczych przedziałowych.
27. Do czego służy współczynnik zmiennośći?
Współczynnik zmienności jest ilorazem bezwzględnej miary zmienności cechy i średniej wartości tej struktury. Przyjmuje się, że jeżeli współczynnik zmienności jest poniżej 10%, to cechy wykazują zróżnicowanie statystycznie nieistotne. Duże wartości tego współczynnika świadczą o zróżnicowaniu, a więc niejednorodności zbiorowości.
Współczynnik zmienności służy do ocenienia czy zmienność cechy jest statystycznie istotna.
28. Współczynniki zmienności płac w zakładach A i B wynoszą odpowiednio 8% i 15%. Co z tego wynika?
Współczynnik zmienności cechy A wynosi 8%, a więc mniej niż 10% co oznacza, że zakład A pod względem płac wykazuje zróżnicowanie statystyczne nieistotne. W przypadku współczynnika zmienności cechy B=15% występuje niejednorodność zbiorowości-zakład B pod względem płac wykazuje zróżnicowanie statystyczne istotne.
29. Rozkład dochodów ludności jest prawostronnie asymetryczny. Co to oznacza?
Rozkład dochodów ludności prawostronnie asymetryczny oznacza, że większość badanej ludności(ponad 50%) osiąga dochody mniejsze od średniej arytmetycznej. W przypadku asymetrii prawostronnej zachodzi nierówność:
30. Rozkład stażu pracy w pewnym zakładzie ma asymetrię lewostronną. Co to oznacza?
Rozkład stażu pracy w pewnym zakładzie ma asymetrię lewostronną, co oznacza, że większość jednostek statystycznych ( ponad 50%) osiąga staż pracy większy od średniej arytmetycznej. W przypadku asymetrii lewostronnej zachodzi nierówność:
.
31. Podać warunki kiedy można wyznaczać modalną.
Modalną można wyznaczać, gdy rozkład jest jednomodalny(istnienie wielu modalnych może wskazywać na niejednorodność zbiorowości) oraz gdy obserwacji jest dostatecznie dużo i gdy są one pogrupowane w postaci szeregu rozdzielczego.
32. Co to znaczy, że modalna wieku pracowników wynosi 32 lata?
Modalna wieku pracowników wynosi 32, co oznacza, że najliczniejszą grupę tworzą pracownicy w wieku 32 lat.
33. Wymienić własności mediany.
własności mediany:
Obok średniej arytmetycznej najczęściej stosowany parametr statystyczny- może by obliczana w przypadkach, gdy obliczenie średniej i modalnej jest niemożliwe;
Nie reaguje na zmiany wartości cech skrajnych jednostek(przypadkowych);
Jeżeli rozkład cechy jest symetryczny, wówczas
;
Ma własność: suma|xi-Me|=min ;
Gdy badaną zbiorowośc traktujemy jako próbę pobraną z populacji generalnej, wówczas przy zmianie próby mediana ulega większym zmianom niż średnia arytmetyczna.
34. Podaj interpretację kwartyla pierwszego i drugiego.
Kwartyl pierwszy dzieli zbiorowość na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu, a 75% równe bądź wyższe od tego kwartyla.
Kwartyl drugi(mediana) dzieli zbiorowość na dwie równe części: połowa zbiorowości ma wartości cechy niższe bądź równe medianie, a połowa wartości cechy równe lub większe od mediany.
35. Na czym polega wykres pudełkowy i kiedy go stosujemy.
wykres pudełkowy stosujemy, gdy znamy parametry pozycyjne. Ocenę tych parametrów uzupełnia wykres pudełkowy, który składa się z prostokąta, którego wysokość wyznaczają Q1 i Q3. Szerokość prostokąta jest dowolna. Wewnątrz prostokąta zaznacza się medianę. W rozkładzie symetrycznym Q1 jest tak samo odległy od mediany, jak Q3. Gdy asymetria jest prawostronna, to odległość pomiędzy Q3 a Q2 jest większa niż pomiędzy Q2 a Q1. Odwrotna sytuacja zachodzi, gdy asymetria jest lewostronna. Wyznaczony prostokąt uzupełniają dwa odcinki: jeden łączy prostokąt na poziomie Q1 z wartością minimalną szeregu, drugi zaś łączy Q3 z wartością maksymalną szeregu.
Wykres pudełkowy składa się z prostokąta, którego długość wyznaczają parametry Q1 i Q3. Wysokość prostokąta jest dowolna. Wewnątrz prostokąta zaznacza się medianę. W rozkładzie symetrycznym pierwszy kwartyl jest tak samo odległy od mediany, jak i trzeci. Gdy asymetria jest prawostronna, to odległość pomiędzy kwartylem trzecim a medianą jest większa niż pomiędzy medianą a kwartylem pierwszym. Gdy asymetria jest lewostronna, to odległość pomiędzy kwartylem pierwszym a medianą jest większa niż pomiędzy medianą a kwartylem trzecim. Rysunek pudełka uzupełniamy po prawej i lewej stronie odcinkami. Lewy koniec lewego odcinka wyznacza najmniejszą wartość w zbiorze, natomiast prawy koniec prawego odcinka to wartość największa. Zaznacza się także obserwacje przypadkowe.
Z diagramów pudełkowych korzysta się przy porównywaniu rozkładów dwóch lub więcej populacji. Pozwalają one szybko zorientować się czy ich mediany i wariancje mogą być jednakowe, a jeśli nie, to jak różnią się między sobą.
36. Jakich ocen można dokonać na podstawie wykresu pudełkowego.
Na podst. wykresu pudełkowego można dokonać oceny dotyczącej:
Wartości przeciętnych(brzegi pudełka określają kwartale, a środek medianę);
Zmienności(wysokość pudełka);
Skośności(położenie linii podziału pudełka w stosunku do brzegów pudełka).
37. Podaj interpretację przedziału typowych obserwacji.
jeśli rozkład jest jednomodalny o umiarkowanej asymetrii to około 2/3 wszystkich jednostek ma wartości cechy należące do tego przedziału.
38. Zakres zmienności czasu obsługi w okienku kasowym jest określony przedziałem (5min - 20min). Co to oznacza?
Oznacza to, że 2/3 wszystkich ludzi jest obsługiwanych w okienku kasowym w czasie od 5 do 20 minut.
39. Co to jest wariancja ogólna i kiedy znajduje zastosowanie.
Wariancja ogólna to wariancja dla całej zbiorowości podzielonej wg określonych kryteriów na r grup. Ma zastosowanie, gdy w każdej grupie znana jest liczebność obserwacji, średnia arytmetyczna i odchylenie standardowe.
40. O czym mówi równość wariancyjna.
Wariancja ogólna nosząca nazwę równości wariancyjnej wyraża się wzorem:
, gdzie:
wariancja wewnątrzgrupowa
określa jaka jest średnia wariancja przypadająca na jedną grupę;
wariancja międzygrupowa
określa jak bardzo średnie w poszczególnych grupach różnią się od średniej w całej zbiorowości.
41. Co określa wariancja międzygrupowa, a co wewnątrzgrupowa.
Wariancja międzygrupowa jest to wariancja średnich grupowych wartości zmiennej.
Wariancja wewnątrzgrupowa jest to średnia arytmetyczna wewnątrzgrupowych wariancji wartości cechy.
42. Rozkład wykazuje umiarkowaną asymetrię prawostronną. Jakie nierówności spełniają mediana, modalna i średnia arytmetyczna?
Mo < Me < xśr
43. Rozkład wykazuje umiarkowaną asymetrię lewostronną. Jakie nierówności spełniają mediana, modalna i średnia arytmetyczna?
xśr < Me < Mo
44. Co można powiedzieć o podstawowych miarach położenia gdy rozkład cechy jest symetryczny?
xśr = Me = Mo
45. Wymień dwa przykłady cech statystycznych dla których korzystny jest rozkład o asymetrii prawostronnej.
Nie wiem.
46. Wymień dwa przykłady cech statystycznych dla których korzystny jest rozkład o asymetrii lewostronnej.
jesli bedzie asymeria lewostronna to wydaje mi sie ze zarobki w firmie pasuja tu.. bo wtedy Mo bedzie wiecej od sredniej czyli najwyzsze wynagrodzenia beda wieksze od sredniej a to chyba dobrze dla pracownikow / pisała Angelika
47. O czym mówi kurtoza i jakie wartości może przyjmować.
Kurtoza, czyli współczynnik skupienia jest miarą skupienia poszczególnych obserwacji wokół średniej. Im wyższa wartość tego współczynnika, tym bardziej wysmukła jest krzywa liczebności, a zatem większa koncentracja wartości cech wokół średniej. Małe wartości wskazują natomiast na spłaszczenie rozkładu zbiorowości względem badanej cechy. Przyjmuje się, że jeżeli zbiorowość ma rozkład normalny, to K=3, bardziej spłaszczony rozkład od normalnego ma K<3, a bardziej wysmukły K>3.
48. Co to jest linia równomiernego podziału?
W przypadku równomiernego rozdziału sumy wartości cech pomiędzy jednostki zbiorowości wszystkie punkty leżałyby na przekątnej kwadratu o boku równym 100. Ta przekątna kwadratu to właśnie linia równomiernego podziału.
49. Co mierzy współczynnik Lorenza i jakie wartości może przyjmować?
Współczynnik koncentracji Lorenza mierzy stosunek pola a do połowy pola kwadratu.
Przyjmuje wartości Kє<0,1>; 0 - brak koncentracji, 1 - całkowita koncentracja.
50. Co mierzy współczynnik Giniego i jakie wartości zwykle przyjmuje?
Współczynnik Giniego mierzy nierównomierność rozkładu zmiennej losowej.
Przyjmuje wartości Gє<0,1>; 0 - pełna nierównomierność.
11. Metody analizy korelacji i regresji ( z listy pyt 51- 67)
51. (11.1) Na czym polega zależność korelacyjna?
Zależność korelacyjna charakteryzuje się tym, że określonym wartościom jednej zmiennej są przyporządkowane ściśle określone średnie wartości drugiej zmiennej. Stopień zależności liniowej pomiędzy cechami określany jest za pomocą współczynnika korelacji rxy
52. (11.2) Co oznacza korelacja dodatnia? Podać przykład cech tak skorelowanych.
Korelacja dodatnia występuje, gdy wzrostowi wartości jednej cechy odpowiada wzrost średnich wartości drugiej cechy.
Np.( Wraz ze wzrostem cen rośnie inflacja, wraz ze wzrostem pkt. Karnych rośnie wartość mandatu??- moje przykłady.)
53. (11.3) Co oznacza korelacja ujemna? Podać przykład cech tak skorelowanych
Wzrostowi wartości jednej cechy odpowiada spadek średnich wartości drugiej cechy. Np. ( Jeżeli rośnie bezrobocie spada wynagrodzenie, Jeżeli rośnie wartość obcej waluty, spada wartość waluty krajowej.?? )
54. (11.4) Co jest miarą siły związku liniowego między cechami statystycznymi?
Współczynnik korelacji Pearsona przyjmujący wartość od [-1;1] jest miarą związku liniowego między cechami
dla szeregu szczegółowego.
55. (11.5) Na czym polega istota metody najmniejszych kwadratów przy szacowaniu parametrów regresji zmiennej X względem Y? Przedstawić to na wykresie.
Metoda najmniejszych kwadratów (MNK) polega na oszacowaniu parametrów funkcji , by dla danych prób był spełniony warunek : poszukajcie sobie ksiazka str 340 nie umiem wzoru zrobić:D wzór (11.9)
56. (11.6) Jaki jest związek miedzy siłą zależności korelacyjnej a kątem między prostymi regresji?
Im bliżej położone są proste regresji (tzn. im mniejszy kąt miedzy nimi ), tym silniejsza jest zależność korelacyjna.
57. (11.7) Współczynnik korelacji między zmiennymi X i Y wynosi zero. Co z tego wynika w odniesieniu do niezależności czy zależności stochastycznej między tymi zmiennymi?
Niezależność stochastyczna pociąga za sobą niezależność korelacyjna. Jeśli dwie zmienne są niezależne korelacyjne to są również niezależne stochastycznie.
58. (11.8) Naszkicuj położenie obydwu prostych jeżeli r=0, r=1 oraz r jest bliskie 1. (Gdy zero zależności brak (11.1 d) gdy jeden 11.4, gdy bliskie 1 1.5)
59. (11.9) X- zysk w tys. Zł, Y- produkcja w tys. Sztuk. Podaj miano parametru a dla prostej regresji zysku względem produkcji oraz interpretację, jeśli wynosi on 2,2
Miano [tys. Zł/tys. Sztuk] Jeżeli a=2,2 - Wzrost produkcji o jedną jednostkę(1 tys, sztuk). prowadzi do wzrostu zysku o 2,2 tys . zł.
60. (11.10) O czym mówi współczynnik determinacji, a o czym współczynnik zbieżności?
Współczynnik determinacji: Informuje o tym, jaka część zmienności zmiennej objaśnianej została wyjaśniona przez model. Jest on więc miarą stopnia, w jakim model wyjaśnia kształtowanie się zmiennej objaśnianej. Można również powiedzieć, że współczynnik determinacji opisuje tę część zmienności objaśnianej, która wynika z jej zależności od uwzględnionych w modelu zmiennych objaśniających. Współczynnik determinacji przyjmuje wartości z przedziału [0;1]. Jego wartości najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość R2 jest bliższa jedności. Wyraża się on wzorem:
Współczynnik zbieżności: Współczynnik zbieżności
określa, jaka część zmienności zmiennej objaśnianej nie została wyjaśniona przez model. Można również powiedzieć, że współczynnik zbieżności opisuje tę część zmienności zmiennej objaśnianej, która wynika z jej zależności od innych czynników niż uwzględnione w modelu. Współczynnik zbieżności przyjmuje wartości z przedziału [0;1]; wartości te najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość
jest bliższa zeru. Wyraża się on wzorem:
,
lub też
61. (11.11) Do czego służy współczynnik korelacji rang Spearmana?
Współczynnik korelacji rang Spearmana służy do opisu siły korelacji dwóch cech w przypadku gdy:
cechy są mierzalne, a badana zbiorowość jest nieliczna,
cechy mają charakter jakościowy i istnieje możliwość ich uporządkowania.
62. (11.12) Co to są empiryczne krzywe regresji zmiennej Y względem zmiennej X?
Są to punkty o współrzędnych (xi;yi)
63. (11.13) Im silniej wartości jednej zmiennej różnicują poziom drugiej zmiennej, tym silniejsza czy słabsza jest zależność korelacyjna? -
Silniejsza. ( im silniej wartości przyjmowane przez jedna zmienna różnicują średni poziom wart. Drugiej zmiennej to zależność korelacyjna większa.
64. (11.14) Dla różnych wartości zmiennej X średnie wartości zmiennej Y są jednakowe. Co to oznacza?
65. (11.15) Współczynnik korelacji Pearsona wynosi -1. Narysuj empiryczną krzywą regresji. ( na podstawie przykładu 11.5)
66. (11.16) X- koszt jednostkowy w zł, Y- produkcja w setkach sztuk. Parametr ax=-9. Jakie miano ma ten parametr i co on oznacza?
Zł / sto sztuk. Parametr ten oznacza, że wraz ze wzrostem produkcji o 100 sztuk, koszt jednostkowy maleje średnio o 9 zł.
67. X- koszt jednostkowy w zł, Y - produkcja w setkach sztuk. Parametr ay=-0,09. Ocenić i zinterpretować rodzaj zależności między X i Y.
Jest to ujemna zależność liniowa. Wraz ze wzrostem kosztu jednostkowego o złotówkę , produkcja spada o 0,09 sztuk.
RODZIAŁ 12
68. Zdefiniować szereg czasowy.
Szereg czasowy to ciąg wyników obserwacji uporządkowanych w czasie, tzn. {t, yt}, przy czym przez t oznaczać będziemy numery kolejnych jednostek czasu, a przez yt wielkość badanej cechy (zjawiska) w momencie t.
Szereg czasowy (dynamiczny, chronologiczny) powstaje w wyniku grupowania typologicznego i wariancyjnego, gdy podstawą grupowania jest zmiana badanego zjawiska w czasie.
69. Jaki to jest szereg czasowy okresów, a jaki momentów?
Rozróżniamy dwa rodzaje szeregów czasowych:
Szeregi czasowe okresów - zawierają informacje o rozmiarach zjawiska w krótszych lub dłuższych okresach (miesiąc, kwartał, rok), np. produkcja w miesiącach, produkt krajowy brutto (PKB) w latach itd.,
Szeregi czasowe momentów - ujmujące wielkości zjawiska w danym momencie, najczęściej na początek lub koniec miesiąca lub roku (np. stan zapasów na 31 grudnia danego roku).
70. Co to jest trend i jakie są metody jego wyznaczania?
Trend wyraża ogólna tendencję rozwojową zjawiska.
Trend, zwany też tendencją rozwojową szeregu czasowego, jest to składowa wyrażająca trwałe i jednakowe oddziaływanie zasadniczych przyczyn głównych na wartości y1, y2, …, yn szeregu czasowego. Długookresowe jednokierunkowe działanie przyczyn zasadniczych powoduje, że trend Tt jest składową reprezentującą trwałą tendencję wzrostu albo też spadku wartości szeregu czasowego w długim okresie.
Trend przedstawia się w najprostszy sposób jako funkcję liniową. Do modelowania trendu nieliniowego stosuje się zwykle - w zależności od badanego szeregu czasowego - takie funkcje znane w teorii ekonomii, jak funkcja wykładnicza, funkcja Gompertza lub funkcja logistyczna.
71. Co to jest średnia ruchoma i do czego służy?
Prosta średnia ruchoma eprezentuje średni poziom cen w danym przedziale czasu. Obliczana jest jako średnia arytmetyczna z N kolejnych cen zamknięcia P. Jeżeli np. chcemy obliczyć prostą średnią ruchomą z ostatnich dwunastu cen zamknięcia należy dodać do siebie wszystkie wartości z tego okresu, a następnie podzielić przez 12.
Średnia ruchoma pozwala określić trend, czyli kierunek w którym podążają ceny. Wskazuje na nastroje rządzące tłumem graczy na giełdzie. Kiedy jest zwyżkująca, tłum staje się coraz bardziej optymistyczny. Kiedy zniżkuje, na rynku zaczynają przeważać nastroje pesymistyczne.
Średnie ruchome
Średnie ruchome należą do najpopularniejszych wskaźników analizy technicznej. Stosowane są jako narzędzie śledzenia trendu, dlatego też najbardziej skuteczne okazują się kiedy istnieje wyraźny trend spadkowy lub wzrostowy. Pozwalają na identyfikację sygnałów o nadchodzących zmianach w kierunkach trendów, a także wysyłają informacje o najlepszych momentach kupna lub sprzedaży akcji.
Do najczęściej stosowanych przez inwestorów średnich ruchomych należą proste średnie ruchome oraz średnie ruchome wykładnicze.
72. Co to są wahania okresowe i jak je dzielimy?
Wahania okresowe są to zmiany powtarzające się w tych samych mniej więcej rozmiarach co pewien (w przybliżeniu) stały okres. Odstęp czasu, w którym występują wszystkie fazy wahań, określa się mianem cyklu.
Wahania okresowe dzielimy na:
Krótkookresowe - czyli takie, w których wszystkie fazy wahań występują w ciągu dnia, doby, miesiąca czy kwartału,
Długookresowe, roczne lub kilkuletnie; są to zwykle wahania sezonowe (zmiany o rocznym cyklu wahań) i koniunkturalne (o cyklu kilkuletnim).
73. Od czego zależy sposób wyznaczania przeciętnego poziomu zjawiska opisanego szeregiem czasowym.
Również nie wiem
74. Co to jest średnia chronologiczna i kiedy ją wyznaczamy?
Przeciętny poziom zjawiska w całym badanym przedziale czasowym dla szeregów momentów wyznacza sie za pomocą średniej chronologicznej, która ma postać:
gdzie n oznacza liczbę obserwacji.
Średnia chronologiczna jest miara mianowana, ma takie miano jak badana cecha Y .
Średnia chronologiczna daje jedynie ogólna orientacje o przeciętnym poziomie badanego zjawiska. Jest ona bowiem tylko wartością przybliżona. Wartość tej średniej jest tym mniej dokładna, im bardziej odległe sa od siebie momenty, w których obserwujemy badane zjawisko. Oczywiście:
ymin <ych ·<ymax:
75. Jaka jest różnica między indeksami jednopodstawowymi a łańcuchowymi?
Miary dynamiki o stałej podstawie służą do określenia zmian, jakie nastąpiły w poziomie zjawiska w kolejnych okresach (momentach) w porównaniu z okresem (momentem) przyjętym jako podstawowy (bazowy).
Miary dynamiki o podstawie ruchomej (tzw. Łańcuchowe) służą do oceny zmian, jakie nastąpiły w poziomie zjawiska z okresu (momentu) na okres (moment).
A więc różnicą jest okres (moment) do jakiego przyrównuje się zjawiska.
76. Do czego służą miary dynamiki o stałej podstawie?
Miary dynamiki o stałej podstawie służą do określenia zmian, jakie nastąpiły w poziomie zjawiska w kolejnych okresach (momentach) w porównaniu z okresem (momentem) przyjętym jako podstawowy (bazowy).
77. Do czego służą indeksy łańcuchowe?
Miary dynamiki o podstawie ruchomej (tzw. Łańcuchowe) służą do oceny zmian, jakie nastąpiły w poziomie zjawiska z okresu (momentu) na okres (moment).
78. Jakie wartości mogą przyjmować indeksy i jak się je interpretuje?
Indeksy mogą być wyrażone w liczbach dziesiętnych lub w procentach. Interpretując indeksy zawsze należy wyrażać je w procentach.
Jeżeli indeks jest mniejszy od 1 (0< i < 1 lub 0% < i < 100%), świadczy to o spadku zjawiska. Jeśli i=100%, oznacza to, że zjawisko pozostało na tym samym poziomie. Jeśli zaś indeks jest większy od i>1 lub i>100% to świadczy to o wzroście zjawiska.
79. Tempo zmian produkcji w kolejnych kwartałach 2004 r. wynosiło odpowiednio: -5%, 2%, 6%, -4% (miesiąc poprzedni= 100). Co to oznacza? Zapisać jak należałoby obliczyć średniokwartalne tempo zmian produkcji?
No to, to chyba każdy wie.
80. Na podstawie danych półrocznych o produkcji otrzymano średnie tempo zmian wynoszące -0,12. Co to oznacza?
Przeciętny półroczny spadek cen wynosił 12%.
81. Indeks mierzący zmiany produkcji i lipcu w porównaniu ze styczniem wyniósł 1,13, natomiast w lipcu w porównaniu z czerwcem 0,79. Zinterpretować te indeksy.
Tego chyba też nie muszę robić.
82.O czym mówi równość indeksowa w przypadku indeksów indywidualnych.
Iw= ip * iq
83. Kiedy należy stosować indeksy agregatowe?
Wskaźniki (indeksy) agregatowe stosowane są w przypadku łącznej analizy większej liczby szeregów czasowych, czyli w celu jednoczesnej analizy różnych cech statystycznych zmieniających się w czasie. Pozwalają one scharakteryzować w sposób syntetyczny dowolnie dużą liczbę zaobserwowanych wartości wielu cech w różnych szeregach.
84. O czym mówią agregatowe indeksy cen, a o czym agregatowe indeksy ilości.
Agregatowy indeks cen mierzy zmiany cen określonej grupy towarów i (lub) usług zachodzące w danym czasie ( od okresu podstawowego do okresu badanego).
Agregatowy indeks ilości obrazuje zmiany wartości ustalonego zespołu jednostek na skutek zmian ilości.
85. Co oznacza agregatowy indeks wartości.
Agregatowy indeks wartości mierzy zmianę wartości określnej grupy towarów i (lub) usług w danym czasie ( od okresu podstawowego do okresu badanego).
Określa jak zmienił się koszt w tych dwóch okresach ze względu na zmiany cen w strukturze i ilości łącznie.
86. Oceniając zmiany sprzedaży w pewnym markecie obliczono agregatowy indeks cen Paaschego, który wyniósł 1,35. Co to oznacza?
Na skutek zmian cen w tym markecie odnotowano 35% wzrost sprzedaży.
87. O czym mówi różnica między licznikiem a mianownikiem w agregatowym indeksie cen Paaschego?
Agregatowy indeks cen Paaschego można traktować jako średnią harmoniczną wartości indeksów indywidualnych, przyjmując wyrażenie pnqn jako wagi.
Jeżeli: licznik < mianownik => oszczędność ( z punktu widzenia konsumenta)
Jeżeli: licznik > mianownik => strata
Kto wie czy to jest dobrze.
88. O czym mówi indeks cen przeciętnych i kiedy jest sens go wyznaczać.
Indeks cen przeciętnych określa jak zmieniła się średnia cena artykułu z powodu zmian w strukturze ilości z pominieńciem asortymentu.
ip= średnia cena w okresie badanym / średnią cenę w okresie podstawowym
89. Podaj równość indeksową w przypadku indeksów agregatowych.
Iw= PIp * LIq = PIq * LIp
90. Co to jest CPI i jak się go wyznacza?
Jest to indeks agregatowy, a dokładnie indeks cen i towarów i usług konsumpcyjnych, na którego podstawie oblicza się płacę minimalną, zasiłek dla bezrobotnych oraz inne.
Przy obliczaniu indeksu bierze się pod uwagę tzw. statystyczny koszyk zakupów. W Polsce, GUS tworzy koszyk na podstawie badań budżetów gospodarstw domowych; co roku ustala ile i czego kupuje "uśrednione" gospodarstwo domowe, a także jaki jest udział poszczególnych produktów i usług w łącznych wydatkach. Na podstawie obserwacji zmian cen tak dobranych towarów i usług (ich lista liczy ok. 2 tys. pozycji, a ceny sprawdza się raz lub dwa razy w miesiącu) GUS oblicza wskaźnik inflacji.
91. Podaj interpretację parametrów a i b w funkcji trendu, jeśli wyznaczono ją na podstawie kwartalnych danych.
a - oznacza okresowe tempo wzrostu (a > 0) lub ubytku (a < 0) wielkości badanego zjawiska
b - oznacza stan zjawiska w okresie wyjściowym
92. Funkcja kosztów oszacowana na podstawie półrocznych danych (w tys. zł) z 5 lat ma postać yt= 12,4t + 36. Zinterpretować parametry a i b, określić koszty dla kolejnego roku.
a - koszty wzrastały średnio o 12,4 tys. zł co pół roku
b - w półroczy poprzedzającym pierwszy badany okres koszty wynosiły 36 tys. zł
93. O czym mówią wskaźniki sezonowości?
Wskaźnik sezonowości określa o ile średnio % poziom badanego zjawiska jest wyższy lub niższy od wartości wynikającej z funkcji trendu, czyli od wartości jaka byłaby gdyby nie było wahań okresowych.
94. Jaka jest różnica między surowymi i oczyszczonymi wskaźnikami sezonowości?
Surowe wskaźniki wahań informują o ile procent poziom zjawiska w danej fazie cyklu jest wyższy ( niższy) od poziomu, jaki byłby osiągnięty, gdyby nie było wahań, a rozwój następował zgodnie z trendem.
Oczyszczone wskaźniki sezonowości są to surowe wskaźniki wahań okresowych podzielone przez średnią arytmetyczną wskaźników surowych..
95. Wymień i opisz składowe szeregu czasowego.
Wyróżnia się następujące składowe szeregów czasowych:
Tendencja rozwojowa, zwana trendem, wyraża długookresową skłonność do jednokierunkowych zmian (wzrostu lub spadku) wartości badanej zmiennej. Jest rozpatrywana jako konsekwencja działania stałego zestawu czynników.
Wahania cykliczne (składowa cykliczna) wyrażają się w postaci długookresowych, rytmicznych wahań wartości szeregu wokół tendencji rozwojowej. Wiąże się je zwykle z cyklem koniunkturalnym gospodarki.
Wahania sezonowe (składowa sezonowa) są wahaniami wartości szeregu wokół jego tendencji rozwojowej o okresie nie przekraczającym jednego roku. Reprezentują efekty powtarzające się z pewną prawidłowością, co roku w tych samych okresach. Odzwierciedlają zwykle wpływ pogody (związane głównie z następstwem pór roku) lub kalendarza. Efekty wynikające z wpływu kalendarza mogą odzwierciedlać: różnice pomiędzy długością (liczbą dni) poszczególnych okresów - 28, 29, 30, 31 dni dla miesięcy, 90, 91, 92, 93 dla kwartałów, różnice pomiędzy liczbą różnych dni tygodnia w okresie, strukturę dni wolnych uwzględniającą święta ruchome i święta narodowe itp.
96. Podaj postać modelu addytywnego szeregu czasowego. Jak go rozpoznać.
Yt= f(t) + w(t) + z(t)
Model ten cechują liniowa funkcja trendu i w przybliżeniu stała amplituda wahań.
97. Podaj multiplikatywną postać modelu szeregu czasowego.
Yt= f(t) w(t) z(t)
98. O czym mówi indeks wszechstronny? Np. indeks wszechstronny w analizie płac przeciętnych wyniósł 1,2. Co to oznacza?
Indeks wszechstronny wyraża zmiany w ogólnym średnim poziomie zmiennej y(średnia y), które są spowodowane równocześnie zmianami cząstkowych poziomów zmiennych x i z.
99. O czym mówi indeks Paaschego wpływu zmian strukturalnych, a co indeks Paaschego stałej strukturze?
Indeks Paaschego o stałej strukturze mówi jak zmieniłaby się płaca, gdyby przyjąć niezmienne zatrudnienie, lecz o poziomie i strukturze z okresu badanego.
Indeks Paaschego wpływu zmian strukturalnych mówi o zmianach dynamiki agregatu, gdyby nie było zmian w indywidualnych poziomach jakiegoś zjawiska, a jedynie w strukturze agregatu.
(Jeśli przyjąć średnie płace w obu zakładach na poziomie okresu badanego, to ogólna przeciętna płaca w przedsiębiorstwie w okresie badanym w stosunku do okresu podstawowego wzrosłaby/ spadłaby o … tylko na skutek zmian w strukturze zatrudnienia.)