Elżbieta Wach 13.12.2010 Rzeszów
II CC DI
Statystyka i opracowanie wyników
Ćwiczenie nr 1
SPRAWOZDANIE Z LABORATORIUM NR 1
ZARZĄDZANIE DANYMI W PROGRAMIE STATISTICA (STATSOFT).
BADANIE EMPIRYCZNEGO ROZKŁADU ZMIENNEJ. CHARAKTERYSTYKI LICZBOWE ROZKŁADU ZMIENNEJ.
1. Wstęp teoretyczny
STATISTICA - to zintegrowany pakiet oprogramowania statystycznego i analitycznego wydany przez firmę StatSoft.
STATISTICA daje szeroki wybór procedur analizy i zarządzania danymi, zapewnia także
wizualizację wyników analizy oraz generowanie raportów.
Statystyka zajmuje sie metodami opisu i analizy liczbowych prawidłowości występujących w zjawiskach masowych tzn. gdy badaniu podlega wystarczająco duża liczba jednostek, aby zaobserwować określone prawidłowości.
Program STATISTICA umożliwia łatwe wykonywanie analiz statystycznych, nawet osobom początkującym w dziedzinie badań statystycznych. W trakcie wykonywania typowej analizy początkujący użytkownik korzysta z następujących dokumentów:
arkusze;
skoroszyty;
wykresy.
W drugiej części ćwiczenia badany jest empiryczny rozkład zmiennej.
Najczęściej stosowaną formą prezentacji rozkładu zmiennej jest szereg rozdzielczy, który przedstawia częstość występowania wartości zmiennej w poszczególnych przedziałach klasowych. Szereg rozdzielczy można przedstawić w postaci tabelarycznej lub graficznej, jako histogram lub dystrybuanta empiryczna.
2. Wykonanie ćwiczenia
Włączono już stworzony plik w programie Statistica o nazwie Azot.
Dodano 1 nową zmienną MASA, którą umieszczono po zmiennej zbiornik.
(ZARZĄDZANIE DANYMI -> DANE -> ZMIENNE -> DODAJ).
Następnie zmieniono położenie naszej danej. Umiejscowiono ją po zmiennej stężenie.
(DANE -> ZMIENNE -> PRZENIEŚ, od zmiennej zbiornik do zbiornik).
Następnie skopiowane zamienną stężenie.
(DANE -> ZMIENNE -> KOPIUJ, stężenie do masa po masa).
Następnie zajęto się przypadkami.
Dodano nowe przypadki ( DANE -> PRZYPADKI -> DODAJ, dodano 3 nowe przypadki po 3 przypadku).
Przeniesiono przypadki (DANE -> PRZYPADKI -> PRZENIEŚ, przypadki od 4 do 6 wstawiono po przypadku 10).
Proces sortowania danych.
Zaznaczono odpowiednia kolumnę z odpowiednimi danymi, następnie DANE -> SORTUJ -> ROSNĄCO.
Proces przekodowania:
Zaznaczono odpowiednie dane, następnie DANE -> PRZEKODUJ.
Do danej odwołujemy się za pomocą literki V, indeks dolny przy niej wskazuje Nam określoną kolumnę w której się zmienna znajduje. W moim przypadku było to V1.
Wpisano: V1 < 30 -> niskie,
V1 => 30 and V1 < 60 -> średnie
V1 => 50 -> wysokie
Proces tworzenia nowych etykiet tekstowych.
Do kolumny zbiornik zamiast B wpisano C. Wyskoczył odpowiedni komunikat, należy wówczas zaznaczyć opcje, aby program utworzył nową etykietę tekstową.
Proces sprawdzania danych:
DANE -> SPRAWDZANIE DANYCH.
Warunek poprawności:
Poprawne, jeśli: V3 = `A' OR V3 = `B'. Została podświetlona linijka, gdzie zostało wpisane C.
Utworzono nowy plik składający się z 10 zmiennych i 2 przypadków (Dzień, Miesiąc, Rok, Data,Rok, Miesiąc). Wpisano przypadkowe liczby.
DANE -> OPERACJE NA DATACH
Wybrano format 17-Mar-98.
Nazwa Data.
Wybrano zmienne źródłowe. Stwórz datę z 2 lub 3 zmiennych. Zapisano do konkretnej kolumny.
Następnie rozdzielono datę na 2 lub 3 zmienne i zapisano do konkretnych kolumn.
Utworzono nowy plik, który posiadał tylko 1 zmienną i 50 przypadków. Nasza zmienna nazywała się ŁADUNEK ELEKTRONU. Wartości zmiennej przepisano z kartki otrzymanej od prowadzącego zajęcia.
Zaznaczono odpowiednią sekwencje, co program musi wykonać.
Ostatecznie otrzymaliśmy tabele, w której były wartości: n ważnych, średnia, mediana, moda, liczność mody, minimum, maksimum, wariancja, odchylenie standardowe, skośność, kurtoza.