Statystyka i opracowanie wyników
badań
Statystyka i opracowanie wyników
badań
Główne zagadnienia do omówienia
Opis ilościowy próby (statystyka
opisowa)
Prezentacja wyników, liczne zbiory
danych
Zmienne losowe, ich funkcje i
charakterystyka
Formułowanie wniosków statystycznych
Statystyka i opracowanie wyników
badań
Plan pracy w trakcie semestru
15 godzin po 2 godz. w I poł. sem
+ praca własna – 15 godzin !!!
kalkulator,
, tablice statystyczne
sprawdzian pisemny - zaliczenie
Zagadnienia wstępne
Parametry pozycyjne i rozproszenia próby
Wykresy i grupowanie danych
Gęstość i dystrybuanta zmiennej losowej
Proste testy stat. - Istotność wart. oczekiwanej
Błędy grube i pomyłki
Wiele zmiennych – korelacja i regresja
Statystyka i opracowanie wyników
badań
Literatura pomocnicza
D.Bobrowski „Probabilistyka w zastosowaniach
technicznych” WNT
M.Maliński „Weryfikacja hipotez statysty-
cznych wspomagana komputerowo” WPŚl
A.Plucińska, E.Pluciński „Probabilistyka” WNT
S. Brandt „Analiza danych” PWN
L. Kukiełka „Podstawy badań inżynierskich” PWN
W.Klonecki „Statystyka dla inżynierów” PWN
T. Zieliński „Jak pokochać statystykę, czyli STATISTICA
do poduszki” StatSoft Kraków
M.R.Spiegel „Statistics” McGraw-Hill
Statystyka i opracowanie wyników
badań
Badane i opisywane cechy
Cechy
– Jakościowe
• Nominalne (np. preferencje kulinarne)
• Porządkowe (wykształcenie podstawowe, średnie, ...)
– Ilościowe
• Interwałowe (A większe od B o x, np. [
o
C])
• Iloczynowe (A 3 razy większe od B, np. [K])
– Ciągłe
– Dyskretne
Ograniczenia
Statystyka i opracowanie wyników
badań
Wyniki pomiarów jednej cechy
Populacja i próba.
Charakteryzowanie – statystyka
opisowa.
– wartość średnia
– odchylenie standardowe
– współczynniki wyższych rzędów
– mediana, kwantyle
– dominanta
– inne charakterystyki pozycyjne i
rozproszenia
Statystyka i opracowanie wyników
badań
Wartość średnia – funkcja efektu
Funkcja efektu:
Suma
Iloczyn
Suma odwrotności
...
Średnia:
arytmetyczna
geometryczna
harmoniczna
...
)
,
...
,
,
(
)
,
...
,
,
(
.
arg
2
1
n
śr
śr
śr
n
x
x
x
f
x
x
x
f
Typowe błędy i ograniczenia
Statystyka i opracowanie wyników
badań
Wartości średnie
n
i
i
n
i
i
n
i
n
i
i
x
n
x
x
n
x
x
x
na
arytmetycz
1
1
1
1
1
n
n
i
i
n
n
i
i
n
i
n
i
i
x
x
x
x
x
x
na
geometrycz
1
1
1
1
~
~
~
n
i
i
h
h
n
i
i
n
i
h
n
i
i
x
n
x
x
n
x
x
x
a
harmoniczn
1
1
1
1
1
1
1
1
Statystyka i opracowanie wyników
badań
Charakterystyka jednej cechy
(w konkretnej
próbie/populacji)
– odchylenie
standardowe
– współczynnik
skośności
– współczynnik
rozproszenia
3
)
(
1
)
(
1
)
(
1
4
1
4
3
1
3
1
2
s
x
x
n
e
s
x
x
n
a
x
x
n
s
n
i
i
n
i
i
n
i
i
Statystyka i opracowanie wyników
badań
Inne charakterystyki
– rozstęp R = x
max
- x
min
– środek rozstępu x
R
= (x
max
+ x
min
)/2
– dominanta d (wartość występująca
najczęściej – o ile jest taka)
– mediana m
• dane uporządkowane (rosnąco lub malejąco)
• nieparzysta liczba wyników: m=x
(n+1)/2
• parzysta liczba wyników: m=(x
n/2
+x
(n+2)/2
)/2
Statystyka i opracowanie wyników
badań
Prezentacja graficzna jednej cechy
– histogram z danych empirycznych
– dystrybuanta
– graficzne wyznaczanie wybranych
parametrów:
• mediana
• kwantyle
• dominanta
Statystyka i opracowanie wyników
badań
Histogram z danych empirycznych
– duża liczność próby (n > 30)
– decyzja o liczbie klas (k):
(n/2) < k < n
• k 1 + 3,3 log n
• k < 5 log n
• dla j(2 ; k-1) liczność j-tej klasy, n
j
5
– stała szerokość klasy R/k
– początek podziału x
p
<=x
min
; przy czym
x
max
<=x
p
+k
– j-ty przedział klasowy: < x
p
+(j-1); x
p
+j )
– środek j-tego przedziału x
p
+(j-0,5)
Statystyka i opracowanie wyników
badań
Dystrybuanta z danych empirycznych
– podział na klasy jak do histogramu
– liczność skumulowana N
j
j
l
l
j
n
N
1
Alternatywne formy histogramu i
dystrybuanty:
– częstość (liczność względna) f
j
= n
j
/n
– częstość skumulowana F
j
= N
j
/n
Statystyka i opracowanie wyników
badań
Zmienne losowe
Reprezentacja zmiennej losowej
gęstość prawdopodobieństwa
dystrybuanta
Charakteryzowanie zmiennej losowej
wartość oczekiwana
odchylenie standardowe
współczynniki wyższych rzędów
mediana, kwantyle
dominanta
Statystyka i opracowanie wyników
badań
Gęstość prawdopodobieństwa i
dystrybuanta
zmiennej losowej ciągłej
dx
x
dF
x
f
dx
x
f
b
x
P
b
F
dx
x
dP
x
f
dx
x
f
b
x
a
P
b
b
a
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
Statystyka i opracowanie wyników
badań
Gęstość prawdopodobieństwa i
dystrybuanta
zmiennej losowej ciągłej
1
)
(
0
)
(
0
)
(
)
(
1
)
(
;
0
)
(
dx
x
f
x
f
a
F
a
F
F
F
Statystyka i opracowanie wyników
badań
Wartość oczekiwana, odchylenie
standardowe, wsp. skośności i
rozproszenia zmiennej losowej
dx
x
f
x
dx
x
f
x
)
(
)
(
)
(
2
3
)
(
)
(
)
(
)
(
4
4
3
3
dx
x
f
x
dx
x
f
x
Statystyka i opracowanie wyników
badań
Mediana i kwantyle zmiennej losowej
)
(
2
1
)
(
F
m
F
Statystyka i opracowanie wyników
badań
Hipotezy statystyczne
Testowanie prostych hipotez
statystycznych
– poziom ufności, poziom istotności
– błędy pierwszego i drugiego rodzaju
– hipoteza zerowa, dobór hipotezy alternatywnej
– poziom istotności
– obliczanie statystyki
– interpretacja wyników testu - obszar krytyczny,
istotność statystyczna (wartość p)
Statystyka i opracowanie wyników
badań
Eliminacja wyników wątpliwych (1
cecha)
– Błędy grube i pomyłki
– Ograniczenia testu „inżynierskiego”,
zwanego również testem trzech sigma
– Liczność próby, rozkład wartości, kolejne
iteracje, wybór wyników wątpliwych (x
w
) do
testowania
– Uproszczona forma testu statystycznego
– Wynik wątpliwy x
w
odrzucamy, jeśli:
w
w
x
bez
obliczamy
s
i
x
s
x
s
x
x
3
;
3
Statystyka i opracowanie wyników
badań
Pomiary dwóch cech - wstęp
Korelacja
Korelacja
(badanie czy zmienne są
niezależne)
Regresja
Regresja
(dopasowanie zależności funkcyjnej
między cechami)
Wykresy zależności
Wykresy zależności
funkcyjnych
funkcyjnych