Excel for Statistics - Tips and Warnings
(listopad 2000)
Przekład:
Robert Wiśniewski
Excel dla statystyków
Wskazówki i ostrzeżenia
Jest to jeden z serii przewodników przeznaczonych dla badaczy i służb pomocniczych zajmujących się pracami naukowymi związanymi ze źródłami naturalnymi. Poza tym przewodnikiem, pozostałe zawierają informacje z innych dziedzin. Oczekujemy od was komentarzy o tych materiałach.
SPIS TREŚCI
1. Wprowadzenie
1.1. Wstawianie i zarządzanie danymi
1.2. Podstawowe statystyki opisowe
1.3. Tabele przestawne
1.4. Rozkłady prawdopodobieństwa
1.5. Testowanie hipotez statystycznych
1.6. Analiza wariancji
1.7. Regresja i korelacja
2. Uzupełnienia do Excela
3. Wnioski
DODATKI - Korzystanie z Excela do tabel przestawnych
A. Co robią tabele przestawne
B. Tworzenie tabel przestawnych
C. Jak utworzyć tabelę przestawną na podstawie listy danych
D. Tabela przestawna - Przykład 1
E. Wprowadzanie zmian w tabeli przestawnej
F. Zmiana środowiska tabeli przestawnej
G. Dodawanie pól
H. Zmiana właściwości pól
I. Dodawanie lub usuwanie sum
J. Tabele liczebności i procentów
K. Tabela przestawna - Przykład 2
L. Tabele procentów
M. Zagnieżdżanie współczynników w tabeli
N. Formatowanie tabel
O. Szczegółowe informacje o komórkach tabeli
1. Wprowadzenie
Dostępność arkuszy kalkulacyjnych obejmujących zarządzanie danymi i analizę statystyczną zmusiła wiele osób do zmiany sposobu zarządzania informacjami. Jego siła i łatwość korzystania daje nowe możliwości analizy danych, ale również stwarza nowe problemy i wyzwania przed użytkownikiem.
Excel jest powszechnie stosowany do wprowadzania i zarządzania danymi. Niektóre zagadnienia omówione są w tym podręczniku, ale te tematy są dokładniej omówione w dokumencie o nazwie „Poprawne korzystanie z arkuszy do wprowadzania danych”.
W przewodniku tym zwrócimy uwagę na siłę i słabości Excela przy wykonywaniu zadań statystycznych. Przedstawimy tu zarządzanie danymi, statystyki opisowe, tabele przestawne, rozkłady prawdopodobieństwa, testowanie hipotez statystycznych analizę wariancji i analizę regresji. Pokażemy również istotne punkty, na które trzeba zwracać uwagę oraz wskazówki i ostrzeżenia.
Dla tych osób, które wymagają więcej niż pozwala na to Excel, przytoczymy listę innych sposobów, jakie użytkownik może dodać do jego standardowych możliwości lub sposobów korzystania z Excela w połączeniu z innymi programami. W końcu wyciągniemy wnioski o korzystaniu z Excela w pracach statystycznych.
W dodatkach, opiszemy bardziej szczegółowo tabele przestawne. Możliwości Excela w zakresie tabel przestawnych są doskonałe i jest to jego wielka zaleta.
1.1. Wstawianie i zarządzanie danymi
Kluczowym punktem zarządzania danymi jest wprowadzanie danych i ich organizacja w taki sposób, aby miały one format „listy” Excela.
Poniższa tabela pokazuje co to oznacza:
To NIE jest lista To JEST lista
Liczba złożonych jajek
Nioski
Próba a b c d
O 350 288 295 293
E 392 340 343 321
F 379 337 373 282
Poziom cholesterolu we krwi
Nioski
Próba a b c d
O 700,0 1391,6 441,0 609,3
E 1314,2 632,6 476,0 554,3
F 413,6 663,7 1481,8 814,8
|
Nioska Próba Liczba jajek Krew
a O 350 700,0
a E 392 1314,2
a F 379 413,6
b O 288 1391,6
b E 340 632,6
b F 337 663,7
c O 295 441,0
c E 343 476,0
c F 373 1481,8
d O 293 609,3
d E 321 554,3
d F 282 814,8
|
W podanych niżej wskazówkach zwrócimy uwagę głównie na te zagadnienia, które wiążą się ze sposobem zarządzania danymi.
W przewodniku tym jest więcej możliwości wprowadzania danych związanych z tym zagadnieniem.
Wskazówki |
Ostrzeżenia
|
Tam gdzie jest to możliwe, należy korzystać z list do gromadzenia danych |
|
Stosować „nazwy” do odwoływania się do każdej kolumny danych |
|
Tworzyć krótkie nazwy. Niektóre pakiety statystyczne mają problemy z odczytem nazw dłuższych od 8 znaków |
|
Nie mieszać danych z analizami lub wykresami w tym samym arkuszu |
|
Przy korzystaniu z Excela 97 lub starszych wersji, należy zapoznać się z możliwościami wprowadzania danych w menu Dane, a zwłaszcza Formularz oraz Sprawdzanie poprawności |
|
Gdy trzeba wprowadzić dane znakowe:
|
Pamiętać o tym, że Excel obsługuje tylko daty po 1 stycznia 1900 r. |
Stosować kody liczbowe dla dobrze zdefiniowanych zmiennych jakościowych, np. dla płci: 0 = Kobieta; 1 = Mężczyzna |
|
Korzystać z funkcji WYSZUKAJ w połączeniu z kodami liczbowymi do wyświetlania wartości tekstowych dołączonych do liczb |
|
Można korzystać z filtrów do zwrócenia uwagi na podzbiór danych |
|
Opcja sortowania działa poprawnie do maksimum 3 kryteriów |
|
Zapoznać się z korzystaniem z odwołań względnych i bezwzględnych |
|
1.2. Podstawowe statystyki opisowe
Excel ma szeroki zakres bardzo przydatnych funkcji statystycznych. Jednak przed skorzystaniem z nich należy upewnić się czy rozumiemy, co Excel zwraca jako wynik każdej funkcji. Statystyki sumaryczne (opisowe) można uzyskać bezpośrednio za pomocą tych funkcji lub przy korzystaniu z polecenie menu Narzędzia | Analiza danych.
Wskazówki |
Ostrzeżenia
|
Funkcje są bardzo silną możliwością Excela. |
|
Stwierdziliśmy, że wszystkie funkcje statystyczne stosowane w tej pracy działają poprawnie. |
|
Możliwości graficzne Excela są ukierunkowane głownie na zastosowania biznesowe. |
Chociaż niektóre diagramy Excela przydatne są dla prac statystycznych, to niektóre diagramy analiz statystycznych nie są dostępne. |
Istnieje wiele wstępnie wbudowanych narzędzi statystycznych w zestawie Analysis ToolPak. Można zainstalować je w systemie przez wybranie polecenia menu Narzędzia | Dodatki. |
Występują pewne problemy z terminologią. Np. Excel tworzy statystykę opisową o nazwie Poziom ufności dla średniej 95 %, która jest równa połowie szerokości przedziału ufności dla średniej. W statystyce, nazwa poziom ufności na ogół stosowana jest do opisu przedziału ufności, np. 95 %. |
1.3. Tabele przestawne
Zdolność do sumowania danych w tabelach jest bardzo ważna. Tabele przestawne Pivot Tables w Excelu są bardzo silnym narzędziem i ten obszar Excela jest znacznie lepszy niż w i innych pakietach statystycznych. Tabele przestawne są rzadko stosowane, nawet przez tych, którzy korzystają z Excela w parach statystycznych i dlatego ich opis został dołączony w Dodatku, który objaśnia je znacznie dokładniej.
Wskazówki |
Ostrzeżenia
|
Tabele przestawne są najsilniejszym narzędziem sumowania danych w Excelu. Tworzą one tabele przekrojowe oparte na danych zawartych w liście, bazie danych lub w innych tabelach przestawnych. |
|
Niezależnie od możliwości sumowania, tabele przestawne są również przydatne do zmiany organizacji danych. |
|
1.4. Rozkłady prawdopodobieństwa
Funkcje prawdopodobieństwa zawierają wszystko to, co można znaleźć w prostych zestawach tablic statystycznych.
Wskazówki |
Ostrzeżenia
|
Można korzystać z funkcji prawdopodobieństwa zamiast z zestawu tabel statystycznych. Excel tworzy dla nas wartości funkcji gęstości prawdopodobieństwa, wartości skumulowanego prawdopodobieństwa oraz odwrotne wartości prawdopodobieństwa dla wielu typowych rozkładów statystycznych. |
Upewnić się czy wiemy jaka funkcja ma być obliczana i w jakim przedziale. Gdy nie rozumiemy wyników obliczeń oferowanych przez funkcje Excela, program udostępnia niewielką pomoc. Może prowadzić to do błędnych wniosków.
Np. funkcja rozkładu Studenta:
ROZKŁAD.T(1.96, 10, 1) = 0.0392
nie specyfikuje jakie prawdopodobieństwo jest zwracane. Wynik 0.0392 jest jedynie prawdopodobieństwem uzyskania wartości większej lub równiej od 1,96 w rozkładzie-t przy 10 stopniach swobody. Pomocnik Help Excela jest w tym zakresie niepoprawny. |
Gdy rozumiemy wyniki tych funkcji, Excel może być bardzo dokładnym i silnym narzędziem. |
Funkcja ROZKŁAD.FISHER ma zwracać prawdopodobieństwo wystąpienia wartości F w jednostronnym teście dla hipotezy zerowej, że wariancje dwóch próbek są jednakowe. W istocie rzeczy, funkcja ta zwraca wynik testu dwustronnego. |
1.5. Testowanie hipotez statystycznych
Excel zawiera testy porównywania dwóch średnich dla próbek sparowanych i niesparowanych oraz testy porównywania dwóch wariacji.
Wskazówki |
Ostrzeżenia
|
Testowanie hipotezy różnic między średnimi oraz między wariancjami za pomocą funkcji dostępnych w Analysis ToolPak działa poprawnie. |
Nie zalecamy nadużywania statystycznych testów do rozwiązywania problemów jednej i dwóch próbek. Przedziały ufności są również do tego celu bardzo przydatne. Excel udostępnia składniki, na podstawie których można obliczać te przedziały jeśli tylko znamy odpowiednie wzory, ale lepiej jest jeśli Excel oblicza bezpośrednio te przedziały. |
1.6. Analiza wariancji
Możliwości Excela w zakresie analizy wariancji ANOVA wymagają danych w postaci stablicowanej, tak jak to pokazano w rozdziale 1.1. zamiast w postaci listy.
Gdy mamy dane przechowane w formie listy, co jest zalecane dla tabel przestawnych, trzeba je odpowiednio przeorganizować przed korzystaniem z analizy wariancji ANOVA.
Jednak zakres projektu, który ma być analizowany jest ograniczona do jednego lub dwóch czynników. Słabość Excela w tym obszarze oznacza, że zbliżamy się do końca statystycznych możliwości Excela.
Wskazówki |
Ostrzeżenia
|
|
Za wyjątkiem prostej analizy czynnikowej, Excel działa tylko wtedy, gdy liczba powtórzeń jest równa liczbie wszystkich prób (dane zrównoważone). |
|
Nie na możliwości stosowania danych brakujących. |
|
Brak elastyczności w dopasowywaniu modeli regresji. |
|
Niewygodne przechowywanie danych. Wymagany jest dodatkowy nakład pracy na popruwane przechowywania danych. |
|
Stosowanie niewłaściwych nazw przy wykonywanych analizach. |
|
Brak narzędzi diagnostycznych. |
W razie potrzeby wykonania analizy wariancji należy unikać Excela, chyba że mamy do czynienia z bardzo prostymi problemami. |
Program stwarza wrażenie, że można korzystać z Excela do analizy wariancji, podczas gdy w istocie rzeczy jest ona bardzo ograniczona. Jest to wyjątkowo uproszczona próba analizy danych, co jest dla większości potrzeb zupełnie niewystarczające. |
1.7. Regresja i korelacja
Excel oferuje możliwość prostej analizy regresji i regresji wielu zmiennych. Jest ona jednak bardzo ograniczona w porównaniu z możliwościami oferowanymi w wielu pakietach statystycznych, zarówno pod względem dostępnych modeli wykorzystywanych w analizie regresji oraz pod względem diagnostyki, która jest niezbędna do krytycznego sprawdzania uzyskiwanych równań.
Wskazówki |
Ostrzeżenia
|
Przed dopasowaniem linii regresji zaleca się utworzenie wykresu danych. |
Nie przesuwać punktów danych na wykresie punktowym XY (rozproszonym), ponieważ Excel będzie wtedy zmieniał oryginalne wartości w dostosowaniu do nowych położeń punktów. |
Narzędzie regresji działa poprawnie tylko do szacowania współczynników regresji, ich błędów standardowych i analizy wariancji dla zestawu danych nie mających wartości brakujących oraz dla modeli zawierających wyraz wolny. |
Zignorować analizę wariancji ANOVA oraz statystykę analizy regresji przy korzystaniu z narzędzia analizy regresji dla linii prostej przechodzącej przez początek układu współrzędnych. Są one błędne. |
Funkcje regresji np takie jak NACHYLENIE, ODCIĘTA lub Dodaj linię trendu, mogą być bardzo przydatne w badaniach wielu regresji jako początkowe podsumowanie, np. przy badaniach powtarzanych pomiarów. Uzyskane współczynniki regresji mogą stanowić punkt wyjścia do dalszych analiz. |
Narzędzia analizy regresji pozwalają na wykonywania opcjonalnych obliczeń reszt, a reszty standaryzowane mogą być bardzo przydatne. Jednak definicja reszt standaryzowanych nie jest podana ani w dokumentacji, ani w pliku pomocnika. Porównywaliśmy te reszty uzyskane z w Excelu z obliczanymi w oparciu o znane formuły i w żadnym przypadku nie uzyskaliśmy zgodności. |
Można korzystać z filtrów do w celu uzyskiwania obserwacji zawierających wartości brakujące. |
Zwykle stosowane standardowe wykresy reszt wykreślają wartości w funkcji wartości przewidywanych oraz normalne wykresy prawdopodobieństwa. Niestety, żadne z tych wykresów nie są dostępne w narzędziach analizy regresji. |
W razie potrzeby dopasowania modeli regresji należy unikać korzystania do tego celu z Excela |
|
2. Uzupełnienia do Excela
Ogólne wrażenia uzyskane na podstawie powyższych wskazówek i ostrzeżeń jest takie, że Excel jest silnym środowiskiem do manipulacji danych, podsumowywania o tabelaryzowania. Jego możliwości graficzne, chociaż nie omawiane dokładnie w tym przewodniku, są również bardzo silne. Jego słabymi stronami są bardziej zaawansowane metody statystyczne, takie jak analiza wariancji ANOVA oraz analiza regresji. W rozdziale tym zapoznamy się z opcjami dostępnymi dla tych użytkowników, które wymagają większych możliwości statystycznych od dostępnych w Excelu.
Alternatywy obejmują wpisywanie lub tworzenie specjalnych makropoleceń, uzupełniania możliwości Excela za pomocą dodatków add-in korzystanie z pakietów statystycznych które są dostępne w tych dodatkach, lub stosowanie standardowych pakietów statystycznych.
Makra można wpisywać w wbudowanym programie VBA (Visual Basic for Applications). Ich siłą jest łatwość korzystania z VBA co jest dużą niespodzianką dla tych użytkowników, którzy programowali przy korzystaniu z takich języków jak Fortran lub tradycyjny, stary Basic. Mniej przyjemna może być przykra niespodzianka dla tych, którzy nigdy nie programowali i są przyzwyczajeni do tradycyjnego korzystania z Excela. Podkreślamy, że pisanie makr wcale nie jest tak trudne jak się na początku wydaje i powinni to wziąć pod uwagę użytkownicy, który wykonują powtarzające się zadania oraz ci, którzy chcą zautomatyzować zadania trudne do wykonywania w Excelu. Ostrzegamy użytkowników, który chcą pisać własne makra aby zwracali uwagę na słabości możliwości statystycznych Excela, o których była wyżej mowa.
Pisanie makr jest wciągające i może stać się bardzo pracochłonne. Istnieje również groźba, że amatorzy piszący makra będą odkrywali znane już rozwiązania.
Wiele dodatków add-in napisano dla Excela w celu zwiększenia jego możliwości, w tym do tworzenia wykresów skrzynkowych, do poprawiania analizy regresji, itp. Są one na ogół dostępne jako bezpłatne lub bardzo tanie i mogą pomóc użytkownikom, którzy chcą trochę zwiększyć możliwości Excela. Istnieją również niektóre standardowe pakiety statystyczne, które mogą funkcjonować jako dodatki add-in, ale na ogół, gdy są one niezbędne, użytkownik może je łączyć ich stosowanie z Excelem.
Korzystanie z odrębnych pakietów statystycznych nie oznacza zupełnego porzucania Excela. Wielu użytkowników korzysta z Excela do przygotowywania danych, po czy przenosi je do pakietów statystycznych w celu przeprowadzania analiz. Wszystkie standardowe pakiety statystyczne mogą czytać pliki Excela. Wyniki mogą być przedstawiane w sposób bezpośredni, lub transferowane z powrotem do Excela w celu prezentacji w postaci wykresów.
3. Wnioski
Excel oferuje ekscytujące środowisko przeznaczone do manipulacji danych i do wstępnej analizy danych. Jego tabele przestawne są szczególne przydatne do tworzenia tabulacji krzyżowej i do uzyskiwania statystyk sumarycznych (opisowych) oraz stanowią silne narzędzie do podstawowej analizy danych. Dostępne są również inne narzędzia, bardziej zaawansowane narzędzia i kreatory do obliczania funkcji statystycznych.
Istnieją pewne obszary, w których można korzystać z Excela bez zastrzeżeń, taki jak testowania hipotez dla średnich lub funkcje prawdopodobieństwa. Jednak możliwości Excela do analizy wariancji lub analizy regresji stwarzają poważne problemy. Każda próba wykonywania tych analiz ma pewne ograniczenia, których przekroczenie powoduje generowanie błędnych wyników. Przy modelowaniu regresji, w analizie wariancji i w innych, bardziej zaawansowanych analizach statystycznych, lepiej jest opuścić Excela i opierać się na odpowiednich pakietach statystycznych.
DODATKI
Korzystanie z Excela do tabel przestawnych
A. Co robią tabele przestawne
Podsumowują lub tworzą tablice krzyżowe danych o jednym dwóch lub trzech wymiarach.
Mogą być modyfikowane w sposób interaktywny
Oferują szeroki zakres statystyk sumarycznych (opisowych)
Podsumowują dane pochodzące z różnych źródeł.
B. Tworzenie tabel przestawnych
W celu utworzenia tabeli przestawnej, dane muszą być zawarte w formacie listy (bazy danych), np.:
Rekordy (przypadki) jako wiersze
Pola jako kolumny
Pierwszy wiersz z nazwami pól
Brak odstępów między wierszami
C. Jak utworzyć tabelę przestawną na podstawie listy danych
Kliknąć w dowolnej komórce listy lub bazy danych
Wybrać polecenie menu Dane | Raport tabeli przestawnej i wykresu przestawnego
Postępować zgodnie z instrukcjami wyświetlonego kreatora tabeli przestawnej.
W Kroku 1 kreatora tabeli przestawnej wybrać:
Lista lub baza danych MS Excel
Kliknąć przycisk Dalej
Otworzy się okienko dialogowe Kroku 2 podobne do poniższego:
Gdy wszystko jest w porządku, kliknąć przycisk Dalej.
Wskazówka:
Można korzystać z nazwy zakresu zawierającego listę
Otworzy się okienko dialogowe Kroku 3 kreatora tabeli przestawnej.
Jeśli ustawienia domyślne nam odpowiadają, kliknąć przycisk Układ.
Otworzy się główne okienko dialogowe kreatora z układem tabeli przestawnej podobne do pokazanego na poniższym rysunku.
Jego postać zależy od zawartości źródłowej listy danych.
Nazwy pól listy danych pojawiają się w postaci zestawu przycisków po prawej stronie.
Tabela przestawna może być skonstruowana jako jedno, dwu lub trójwymiarowa i składająca się z wierszy, kolumn i stron.
Pola stosowane do definiowania struktury tabeli należy przeciągać do pól zawierających etykiety WIERSZ, KOLUMNA oraz STRONA.
Uwaga:
Pola stosowane do definiowania struktury, normalnie powinny być czynnikami, tzn. zmiennymi dyskretnymi (ilościowe) lub kategoriami (jakościowe), tzn. mogą obejmować zmienne numeryczne, znakowe lub inne typy. Korzystanie ze zmiennych pomiarowych może prowadzić do wielkiej tablicy nonsensów.
Centralna część tabeli z etykietą DANE zawiera zmienne, które chcemy podsumować w tabeli. Pola danych zwykle są liczbowe, ale dozwolone są również inne typu danych w zależności od tego co chcemy podsumować.
D. Tabela przestawna - Przykład 1
Bank korzysta z danych dotyczących zatrudnienia w celu utworzenia tabel przestawnych na podstawie arkusza zawierającego informacje o 474 pracownikach zatrudniony przez dużego pracodawcę. Arkusz ten zawiera dane dotyczące poborów, charakteru pracy i kilka innych zmiennych osobowych.
Dane, o których wyżej mowa znajdują się w pliku Excela o nazwie BANK.XLS.
Przejdziemy teraz przez kroki kreatora w celu utworzenia tabeli aktualnych poborów SALNOW z podziałem na charakter pracy JOB oraz płeć GENDER dla banku danych zatrudnienia.
Przeciągnąć JOB oraz GENDER odpowiednio do pól WIERSZ i KOLUMNA.
Przeciągnąć zmienną SALNOW do pola DANE.
Domyślną statystyką dla danych liczbowych jest suma SUM. Aby to zmienić i wybrać inną specyfikację:
Podwójnie kliknąć przycisk Suma z SALNOW.
Otwiera to poniższe okienko dialogowe pola tabeli przestawnej, stosowane do specyfikowania tego, co ma pojawiać się w komórkach tabeli i jak ma to być sformatowane.
Najpierw zmienić etykietę w polu Nazwa na Suma z Salnow.
Na rozwijalnej liście Podsumowanie według wybrać opcję Średnia.
Kliknąć przycisk Liczby aby otworzyć standardowe okienko dialogowe formatowania liczb. Wybrać w nim opcję Liczbowe i Zero miejsc dziesiętnych (inne opcje dostępne w okienku dialogowym pola tabeli przestawnej będą później omówione).
Po skończeniu specyfikowania pola tabeli przestawnej, klikać przycisk OK aby wrócić do okienka dialogowego Krok 3 kreatora tabeli przestawnej, wybrać jako miejsce wstawienia tabeli przestawnej Nowy arkusz i kliknąć przycisk Zakończ.
W nowo utworzonym arkuszy pojawi się poniższa tabela:
E. Wprowadzanie zmian w tabeli przestawnej
Większość operacji w tabeli przestawnej może być łatwo wykonywana interaktywnie, a więc nie jest ważne w jaki sposób uzyskujemy tą tabelę w pierwszej fazie.
F. Zmiana środowiska tabeli przestawnej
Najlepiej wykonywać to interaktywnie przez przeciąganie etykiet pól.
Jest to trudne do opisania, ale bardzo łatwe do wykonania, a więc trzeba to wypraktykować.
G. Dodawanie pól
W celu wykonania tej i innych typowych operacji, najlepiej jest skorzystać w tym celu z paska narzędzi tabeli przestawnej:
Pierwszy przycisk w tym pasku narzędzi zawiera rozwijalną listą z różnymi opcjami do wyboru.
Trzecia opcja na tej liście pozwala na powrót do kreatora tabeli przestawnej. Można w nim dodawać (lub usuwać) pola w taki sam sposób jak przy konstruowaniu tabeli.
W tym przykładzie spróbujmy dodać podział tabeli na grupy GROUP.
Najpierw kliknąć dowolną komórkę w tabeli (gdy tego nie zrobimy, zostanie utworzona nowa tabela). Następnie kliknąć przycisk Kreator tabeli przestawnej.
Przeciągnąć GROUP do pola STRONA i kliknąć przycisk OK oraz Zakończ.
Zmodyfikowana tabela dzieli średni zarobek na pozycje GROUP, GENDER i JOB.
Wypróbujcie samodzielnie zmianę środowiska tabeli przez przeciągania nazw pól w inne miejsca.
H. Zmiana właściwości pól
Opcja Ustawienia pola na rozwijalnej liście paska narzędzi tabeli przestawnej otwiera okienko dialogowe służące do ustawiania specyfikacji pól.
Zawartość otwieranego okienka dialogowego zależy od tego czy istnieje pole DANE lub pole struktur (WIERSZ, KOLUMNA, albo STRONA).
Najpierw, aby zmienić pole w strukturze tabeli (wiersze, kolumny lub strony),kliknąć na jednej z nazw pół (np. GENDER) lub na jednej z jej etykiet (np. Male lub Female).
Wybrać opcję Ustawienia pola na rozwijalnej liście paska narzędzi tabeli przestawnej. Otworzy się poniższe okienko dialogowe:
Wskazówka: Można również w tym celu kliknąć przycisk Ustawienia pola
w pasku narzędzi.
Korzystając z tych i innych opcji dostępnych na rozwijalnej liście paska narzędzi kreatora tabel można wprowadzić niektóre, niżej wymienione zmiany:
Można usunąć pole
Można zmienić nazwę pola
Można zmienić orientację (chociaż można to wykonać łatwiej przez przeciąganie pól)
Można zmienić statystykę i wybrać sumy częściowe
Pole Pokazuj/Ukryj elementy baz danych jest przydatne gdy chcemy ograniczyć wyświetlanie tabeli do wartości sum częściowych.
Aby edytować pole DANE, należy najpierw kliknąć komórkę danej (lub nazwę jej pola), po czym kliknąć przycisk Ustawienia pola w pasku narzędzi. Otworzy się podobne okienko dialogowe. Można w nim wprowadzić zmiany statystyki, formatu liczb, itp.
I. Dodawanie lub usuwanie sum
Najpierw zaznaczyć tabelę.
Na rozwijalnej kliknąć polecenie Opcje tabeli otworzy się poniższe okienko dialogowe:
Można usunąć zaznaczenia pierwszych dwóch opcji formatowania sum końcowych kolumn i sum końcowych wierszy.
J. Tabele liczebności i procentów
Jedną z najczęściej wymaganych tabel są tablice krzyżowe Crosstabulation zliczające przypadki, trafiające do wszystkich możliwych kombinacji zmiennych i jakościowych (kategorii). Takie tablice oraz inne tabele procentowe można łatwo utworzyć jako tabele przestawne pod warunkiem, że nie zawierają wartości brakujących.
Aby utworzyć tablicę krzyżową liczebności, zaznaczyć dowolne pole, które nie zawiera pustych komórek, np. takie jak DANE, i wybrać statystykę Licznik. Zachowa się to tak jak funkcja arkuszowa ILE.NIEPUSTYCH, która zlicza liczbę niepustych komórek w wybranym zakresie.
Istnieje również inna statystyka o nazwie Licznik.num, która wykonuje podobną operacje jak Licznik, ale zlicza wszystkie komórki zawierające liczby. Statystyka ta zachowuje się podobnie jak funkcja arkuszowa ILE.LICZB. Dla tablic krzyżowych, znacznie bezpieczniej jest korzystać ze statystyki Licznik.
Uwaga:
Cały przypadek (wiersz) odpowiadający pustej komórce w polu danych będzie w tabeli zignorowany.
Przed skorzystaniem z tego polecenia, sprawdzić brak pustych komórek w polu danych.
K. Tabela przestawna - Przykład 2
Aby uzyskać tabelą krzyżową JOB wg GENDER banku danych zatrudnienia:
Najpierw podjąć decyzję, które pole chcemy wykorzystać do zliczania. Jedną z możliwości jest pole identyfikatora ID. Upewnić się czy nie zawiera ono pustych Komorek.
W Kroku 3 kreatora tabel przestawnych wstawić zmienne GENDER i JOB odpowiednio do pola KOLUMNA i WIERSZ.
Przeciągnąć pole ID do obszaru DANE i podwójnie kliknąć pole suma z ID aby otworzyć okienko dialogowe pola tabeli przestawnej. W polu Podsumowanie wg wybrać opcję Licznik, natomiast w polu Nazwa wprowadzić napis Liczba przypadków.
Zakończyć podobnie jak w przykładzie 1 aby uzyskać poniższa tabelę:
Podkreśla się, że przy pustych komórkach pojawią się liczebności zerowe.
L. Tabele procentów
Często bardziej informacyjne jest przedstawianie zliczeń w postaci wartości procentowych. Są to zwykle wartości procentowe wierszy lub kolumn, ale czasem wymagane są inne podstawy procentowe.
Aby kontynuować przykład 2, załóżmy, że chcemy obliczyć wartości procentowe wierszy zamiast zliczania bezwzględnego.
Otworzyć okienko dialogowe pola tabeli przestawnej dla pola DANE.
Kliknąć przycisk Opcje i sprawdzić dostępne opcje na rozwijalnej liście Pokaż dane jako.
Wybrać opcję % wiersza. Kliknąć przycisk Liczby i wybrać format Procentowe oraz 0 cyfr dziesiętnych, po czym kliknąć przycisk OK.
Uzyskamy poniższy wynik:
Aby utworzyć tabelę zawierająca zarówno liczebności jak i wartości procentowe wierszy, należy umieścić dwie kopie pola ID w obszarze DANE tabeli, przy czym jedno z nich będzie zawierało opcje Licznik, a drugie opcję % wiersza.
W okienku dialogowym 3-go Kroku kreatora tabeli przestawnej, obydwa pola DANE zawierają zmienną ID, przy czym pierwsze jest ustawione jako zwykła zliczanie, a drugie jako obliczanie wartości procentowych wierszy.
Uzyskana tabela ma poniższą postać:
M. Zagnieżdżanie współczynników w tabeli
Można korzystać z dwóch lub więcej czynników do wyspecyfikowania wierszy (lub kolumn albo stron) w tabeli.
Efektem tego jest zagnieżdżanie poziomów każdego czynnika wewnątrz czynnika go poprzedzającego w tym samym wymiarze.
Przykładowo:
Uzyskana tabela ma poniższą postać:
N. Formatowanie tabel
Aby sformatować liczby w komórkach tabeli przestawnej, skorzystać z okienka dialogowego pola tabeli przestawnej tak jak w poprzednich przykładach.
Chociaż można do tabeli bezpośrednio stosować wiele standardowych technik formatowania w Excelu, to niektórych operacji nie można w ten sposób wykonać. Przykładowo, nie można zmienić nazwy Suma końcowa.
Aby uzyskać maksymalna elastyczność formatowania, najlepiej utworzyć kopię całej tabeli i wkleić ją korzystając z polecenia menu Edycja | Wklej specjalnie | Wartości. Uzyskaną kopię można formatować tak jak inne zakresy Excela.
Poniżej pokazano tabele przestawną po skopiowaniu i sformatowaniu:
O. Szczegółowe informacje o komórkach tabeli
Można uzyskać pełną listę wszystkich przypadków, które odnoszą się do zaznaczonych komórek (lub do całości) w tabeli przestawnej przez podwójne klikanie tych komórek.
Przykładowo, szczegóły zawarte pod zaznaczoną komórką poniższej tabeli:
są wyświetlane na liście w poniższy sposób:
Uwaga:
Dla każdej listy tworzony jest nowy arkusz.
Centrum usług statystycznych Statistical Services Centre jest częścią Wydziału Statystyki Stosowanej na Uniwersytecie Reading, UK i prowadzi szkolenia oraz udziela konsultacji na zasadzie bezdochodowej dla klientów z poza Uniwersytetu
Niniejszy przewodnik statystyczny został pierwotnie napisany w ramach kontraktu DFID jako materiał szkoleniowy.
Poniżej zestawiono dostępne tytuły tego przewodnika:
Statistical Guidelines for Natural Resources Projects
On-Farm Trials - Some Biometric Guidelines
Data Management Guidelines for Experimental Projects
Guidelines for Planning Effective Surveys
Project Data Archiving - Lessons from a Case Study
Informative Presentation of Tables, Graphs and Statistics
Concepts Underlying the Design of Experiments
One Animal per Farm?
Disciplined Use of Spreadsheets for Data Entry
The Role of a Database Package for Research Projects
Excel for Statistics: Tips and Warnings
The Statistical Background to ANOVA
Moving on from MSTAT (to Genstat)
Some Basic Ideas of Sampling
Modern Methods of Analysis
Confidence & Significance: Key Concepts of Inferential Statistics
Modern Approaches to the Analysis of Experimental Data
Approaches to the Analysis of Survey Data
Mixed Models and Multilevel Data Structures in Agriculture
Powyższe przewodniki są dostępne w postaci drukowanej lub w formie plików komputerowych. W celu uzyskania kopii lub dalszych informacji dotyczących SSC, można kontaktować się korzystając z podanego niżej adresu:
Statistical Services Centre, The University of Reading
P.O. Box 240, Reading, RG6 6FN United Kingdom
tel: SSC Administration +44 118 931 8025
fax: +44 118 975 3169
- 1 -