Lekcja 2.
Temat: Wstęp do analizy danych pomiarowych.
Notatka do lekcji:
Przy wykonywaniu pomiaru ważne jest podanie dokładności. Bardzo często jest to dokładność przyrządu pomiarowego. Jeśli mierzymy długość ksiązki linijką o odstępnie między podziałkami 0,1 cm, możemy zapisać:
30 cm ± 0,1 cm
Czasami jednak przyrząd jest na tyle dokładny albo sposób pomiaru czymś zaburzany, że mierząc wielokrotnie za każdym razem otrzymujemy nieco inne wyniki. Załóżmy że mierzymy 30 krotnie swój czas reakcji na ucieczkę owcy ze stada w aplecie na stronie:
www.bbc.co.uk/science/humanbody/sleep/sheep/reaction_version6.swf
Oczywiście na skutek różnych rozproszeń umysłu wyniki wychodzą różne, ale gdybyśmy zrobili z milion pomiarów i wyciągnęli z nich średnią, mielibyśmy bardzo dokładnie określoną naszą zdolność reakcji.
Wykonując tylko 30 pomiarów, ryzykujemy, że wyliczona średnia niezbyt dokładnie opisuje rzeczywistość i należy oszacować jej odstępstwo od wyniku uzyskanego przy olbrzymiej ilości pomiarów.
Inną interesującą cechą jest zdolność do koncentracji. Jeśli ktoś jest bardzo skoncentrowany wyniki pomiarów skupiają się mocno blisko średniej, jeśli nie potrafi skupić się na zadaniu, raz czas reakcji będzie krótki, innym razem wyraźnie dłuższy, a więc rozrzut wyników będzie większy.
Wyniki możemy przedstawić na wykresie:
Jest to tak zwany wykres słupkowy – histogram. Na osi poziomej czerwonymi punktami zaznaczono wartości pomiarów, a do góry odłożono ile razy pojawił się dany wynik. Akurat trafiły się 4 wyniki powtórzone dwa razy i jeden aż trzy razy. Ale zazwyczaj sytuacja będzie inna – wszystkie wyniki wystąpią jeden raz.
śeby lepiej przeanalizować sytuację dobrze jest podzielić oś X na przedziały( tu co 0,05s) i narysować słupki o wysokości takiej ile wyników padło w danym przedziale, co przedstawia histogram poniżej.
Gdybyśmy zrobili tysiące pomiarów moglibyśmy wziąć mniejsze przedziały na osi X, a na osi pionowej odkładać nie jedności a dziesiątki czy setki. Wtedy „schodki” przestałyby być tak widoczne, a wykres przybrałby kształt dzwonu, który opisuje tzw. rozkład (rozrzut) normalny wyników. Jest przedstawiony niżej.
W zależności od stopnia koncentracji dzwon miałby wyraźniejszy pik albo był szerszy.
Szerokość dzwonu umówiono się liczyć za pomocą „odchylenia standardowego” σ (czytaj sigma) , które podaje w jakim zakresie wokół średniej mieści się ok. 2/3 wyników (dokładniej 0,341 w jedną stronę i 0,341 w drugą).
Ten parametr wyliczamy ze wzoru:
( x − xś )2
r
+ ( x − xś )2
r
+ ... + ( xn − xś )2
1
2
σ =
r
n −1
Jak nietrudno się domyślić dwukrotne zwiększenie ilości pomiarów n powoduje zwiększenie się i licznika i mianownika pod pierwiastkiem przez co wynik ostateczny prawie się nie zmienia, staje się tylko bliższy prawdy. Rozrzut wartości notowany w doświadczeniu zostaje przecież praktycznie niezmieniony, tylko go lepiej wyliczamy.
Jaki sens ma robienie dużej ilości pomiarów? Otóż lepiej wyliczamy nie tylko rozrzut, ale i średnią.
Dwukrotne zwiększenie n około dwukrotnie poprawia precyzję wyliczenia średniej. Błąd średniej to co innego niż rozrzut wyników. Błąd średniej wyliczamy ze wzoru na odchylenie standardowe średniej.
( x − xś )2
r
+ ( x − xś )2
r
+ ... + ( xn − xś )2
1
2
σ =
r
n( n − )
1
Stopień koncentracji na usypianiu owiec podaje oczywiście odchylenie standardowe, natomiast precyzję wyliczenia czasu reakcji odchylenie standardowe średniej.
Jeśli wyliczymy odchylenie standardowe średniej to możemy się spodziewać, że gdybyśmy wszystkie pomiary powtórzyli i znów wyliczyli średnią, to z prawdopodobieństwem około 2/3 uzyskalibyśmy wynik w zakresie wyliczonym poprzednio.
Powyższe rachunki opierają się na skomplikowanej dziedzinie matematyki zwanej statystyką. Dużo prostszą metodą wyliczania błędów jest liczenie odchylenia maksymalnego. W tym celu różnicę między największym i najmniejszym wynikiem dzielimy na dwa. Tak wyliczony błąd maksymalny wraz ze wzrostem ilości pomiarów może niestety tylko wzrosnąć, a nie maleć!
,
0 + 1
,
0 5 + 3
,
0
Mając następujące czasy reakcji: 0,1s , 0,15s i 0,3 s uzyskujemy średnią
= 1
,
0 83 a błąd
3
3
,
0 − 1
,
0
maksymalny:
= ,
0 2 .
2
W takim razie wynik za pomocą błędu maksymalnego zapisujemy jako:
0,183s ± 0,2s
Praca domowa
1. Aby rozumieć co wyznaczasz, zapoznaj się z notatką z lekcji zamieszczoną powyżej.
2. Wejdź na stronę www.bbc.co.uk/science/humanbody/sleep/sheep/reaction_version6.swf 3. Klikając w pole ze strzałką usypiasz owce, które chcą uciec ze stada. Aplet podaje jednorazowo wyniki dla 5 ucieczek i liczy średnią (average time). Jednak twoje zadanie polega na zmierzeniu 30 czasów, obliczeniu z nich czasu średniego oraz jej błędu zwanego odchyleniem standardowym średniej. Przy okazji wyznaczysz też jak mocno potrafisz się skoncentrować wyznaczając odchylenie standardowe swoich wyników od średniej.
4. Uzyskane czasy zapisuj do zeszytu. Będzie to dowód samodzielnego wykonania pracy domowej. Gdy z jakichś powodów zagapiłeś się i owca uciekła komputer wyświetla czas 3 sekundy, podobnie gdy kliknąłeś za wcześnie. Omijaj te wyniki, bo są efektem nieprawidłowo wykonanych pomiarów czyli zawierają tzw. błędy grube.
5. Programem Microsoft Exel otwórz plik opracowanie wyników.xls
6. Do kolumny A w wierszach 2-31 (kolor żółty) wprowadź 30 wyników z pomiarów swego czasu reakcji.
7. W polu B2 (zielonym) pokaże się wtedy wyliczona przez komputer wartość średniej. Zostanie automatycznie powtórzona w całej kolumnie B.
8. Następnie komputer podaje w kolumnie C kwadraty różnic między wartościami pomiarów a średnią, w kolumnie D ukazuje się ich suma (te rzeczy ciebie nie obchodzą), a w E odchylenie standardowe średniej, a w F odchylenie standardowe pomiarów od wartości średniej.
9. Do zeszytu spisz wartość średniej i jej odchylenia standardowego i odchylenia standardowego (rozrzutu) wyników pomiarów.
10. Oblicz błąd maksymalny.