Tworzenie zbioru danych (przykład)


1. Tworzenie zbioru danych
Rodzaje danych:
- dane przekrojowe
- szeregi czasowe
- dane panelowe
Aby utworzyć własny zbiór danych statystycznych wybieramy Plik > Tworzenie bazy danych
i następnie musimy wybrać rodzaj danych. Powiedzmy, iż chcemy utworzyć szereg czasowy
składający się z danych rocznych: szeregi czasowe > roczne. Następnie pojawia się okno, w
którym należy wybrać zakres próby:
oraz podać nazwę nowej zmiennej:
Pojawia się edytor danych, który umożliwia wpisanie kolejnych wartości nowo utworzonej
zmiennej. Wartości zmiennych możemy zmieniać, dodawać nowe zmienne lub obserwacje
wchodząc powtórnie w edytor danych: Dane > Edycja wartości. Jeżeli mamy już utworzony
zbiór danych to możemy zapamiętać go w formacie programu gretl (rozszerzenie .gdt) w
następujący sposób: Plik > Zapisz dane jako > format standardowy. Pojawia się okno w
którym musimy wybrać zmienne do zapamiętania:
1
Możliwe jest importowanie do programu gretl danych ze zbiorów w formacie tekstowych
(ASCII) lub danych z arkusza kalkulacyjnego. Najpierw zajmijmy się tym drugim sposobem.
Dane w Excelu muszą mieć następującą strukturę: w pierwszym wierszu znajdują się nazwy
zmiennych, a w kolumnach ich wartości. Wczytujemy plik tego typu w następujący sposób:
Plik > Otwórz dane > Import z pliku > Excel, następnie podajemy ścieżkę dostępu do pliku
oraz numer arkusza z którego mają być importowane dane. Wczytanie danych w formacie
tekstowym odbywa się w podobny sposób: Plik > Otwórz dane > Import z pliku > ASCII.
I znów w pierwszym wierszu muszą znajdować się nazwy zmiennych, natomiast kolejne
kolumny mogą być oddzielone na trzy sposoby: przecinek spacja lub tabulator.
2. Tworzenie opisu zbioru danych i zmiennych. Generowanie nowych zmiennych
Aby zbudować opis zbioru danych postępujemy wybieramy: Dane > Edytuj opis pliku.
Aby obejrzeć opis pliku danych wybieramy: Dane > Opis pliku danych lub Dane > Pełny opis
pliku danych (pojawi się między innymi ścieżka dostępu do pliku).
2
Równie łatwo możemy tworzyć opisy dla konkretnych zmiennych: Zmienna > Edycja
atrybutów.
3. Transformacje zmiennych
Aby dodać nową zmienną do zbioru danych wybieramy: Dane > Dodawanie zmiennych i
wyświetlają się dostępne transformacje (np. podniesienie do kwadratu lub logarytm o
podstawie naturalnej). W przypadku gdy chcemy utworzyć nową zmienną, której konstrukcja
jest bardziej skomplikowana, to wybieramy: Zmienna > Definiowanie nowej zmiennej.
Często w takich sytuacjach będą nam potrzebne operatory logiczne:
! - negacja
& - koniunkcja
| - lub
>, <, =, >=, <=, != - większy, mniejszy, równy, większy lub równy, mniejszy lub równy,
różny.
Rozpatrzmy następujący przykład. Zmienna klm  klasa miejscowości przyjmuje następujące
wartości:
0 = >100 tyś.
1 = 50 tyś.  100 tyś.
2 = 20 tyś.  50 tyś.
3 = 10 tyś.  20 tyś.
4 = 5 tyś.  10 tyś.
5 = 2 tyś.  5 tyś.
6 = poniżej 2 tyś
9 = wieś
Chcemy utworzyć nową zmienną  średnie miasto, która przyjmuje wartość 1 dla miast o
liczbie mieszkańców między 5 tyś. a 20 tyś, oraz wartość 0 w pozostałych przypadkach. W
tym celu użyjemy następującej formuły:
Aby usunąć ze zbioru danych zmienną, najpierw należy ją zaznaczyć, przycisnąć prawy
klawisz myszy i wybrać usuwanie.
3
3. Statystyki opisowe
Aby uzyskać podstawowe statystyki opisowe dla konkretnej zmiennej, najpierw należy ja
zaznaczyć a następnie wybrać Dane > Statystyki opisowe > Wybrane zmienne. Uzyskujemy
następującą tabelę wynikową:
Aby przyjrzeć się rozkładowi zmiennej możemy posłużyć się histogramem: Zmienna >
Wykres częstości > prosty
4
Aby policzyć statystyki opisowe tylko dla wybranej podgrupy obserwacji najpierw należy
stworzyć podpróbę: Próba > Restrykcje dla podpróby i następnie w oknie dialogowym
wpisać wyrażenie logiczne w celu wyselekcjonowania podpróby. I tak jeśli chcemy
wyznaczyć statystyki opisowe dla dochodu wśród osób mieszkających na wsi, to najpierw
wprowadzamy następujące wyrażenie logiczne:
Zadania:
Zad 1.
Za pomocą edytora danych stwórz zbiór zawierający następujące dane:
Wzrost w
pleć
cm
0 175
1 185
1 170
1 179
0 160
1 190
1 175
0 165
0 167
1 183
1 194
0 160
gdzie 1 oznacza mężczyznę, 0  kobieta. Następnie utwórz opis zbioru danych zawierający
informacje o zmiennych jakie znajdują się w zbiorze oraz utwórz opis dla poszczególnych
zmiennych. Zapisz utworzony zbiór w formacie programu gretl. Wyznacz statystyki opisowe
dla wzrostu osobno dla kobiet i mężczyzn. Odpowiedz na pytania:
1. Dla której grupy średnia wzrostu jest wyższa?
2. W której grupie mamy do czynienia z większą dyspersją wzrostu?
Zad 2.
Posługujemy się zbiorem dane_1.xls. Utwórz następujące zmienne:
1) miejsce_zam:
1 - dla osób mieszkających na wsi
2 - dla osób mieszkających w mieście do 20 tyś.
3 - dla osób mieszkających w mieście od 20 tyś. do 100 tyś.
4 - dla osób mieszkających w mieście powyżej 100 tyś.
2) wykształcenie
1 - dla osób mających wykształcenie podstawowe
2 - dla osób mających wykształcenie średnie (policealne, średnie zawodowe, średnie
ogólnokształcące, zasadnicze zawodowe)
5
3 - dla osób mających wykształcenie wyższe
3) stan_ cywilny
1 - jeśli osoba żonata (zamężna)
0  w pozostałych przypadkach
4) żonaty
1- dla żonatych mężczyzn;
0  w pozostałych przypadkach
Następnie wyznacz statystyki opisowe dla zmiennej dochód w zależności od miejsca
zamieszkania, wykształcenia. Odpowiedz na następujące pytania:
1. W której grupie wyróżnionej ze względu na poziom wykształcenia średni dochód był
najwyższy? Która grupa cechowała się największą dyspersją dochodu?
2. W której grupie wyróżnionej ze względu na miejsce zamieszkania średni dochód był
najwyższy? Która grupa cechowała się największą dyspersją dochodu?
6


Wyszukiwarka

Podobne podstrony:
Access 2002 Tworzenie bez danych
projektowanie baz danych PRZYKŁAD
Tworzenie baz danych karta pracy
SPSS tworzenie bazy danych
Projektowanie i tworzenie baz danych
01 Część I Projektowanie i tworzenie bazy danych SQL
4 Tworzenie i import danych
Bazy danych Tworzenie bazy danych
Algorytmy i struktury danych przykład zadań
Tworzenie i wybieranie bazy ( tworzenie bazy danych wybór bazy danych kurs mysql ) webmade org
PHP i Oracle Tworzenie aplikacji webowych od przetwarzania danych po Ajaksa
Tworzenie wykresów w bazach danych
Tworzenie interfejsów do baz danych z wykorzystaniem technologii
2007 04 Tworzenie kopii bezpieczeństwa danych [Administracja]
ArCon przykład tworzenia rysunku

więcej podobnych podstron