Podstawy Metrologii i Technik Eksperymentu
Laboratorium
ANALIZA KORELACYJNA I
REGRESYJNA
Instrukcja do ćwiczenia nr 5
Zakład Miernictwa i Ochrony Atmosfery
Wrocław, listopad 2010 r.
2
x
x
x
Podstawy Metrologii i Technik Eksperymentu Ćwiczenie laboratoryjne nr 5
ANALIZA KORELACYJNA I REGRESYJNA
1.
CEL ĆWICZENIA
Celem ćwiczenia jest wyznaczenie współczynnika korelacji serii pomiarów napięcia
termoelektrycznego w funkcji temperatury dla termoelementu typu K, oraz obliczenie funkcji
regresji.
Dodatkowym celem jest wyznaczenie charakterystyki przetwornika temperatur z
termoelementu typu K oraz błędów systematycznych przetwornika.
2.
WSTĘP [1,2]
Rysunek 1 przedstawia wg [1] wyniki pomiarów dwóch zmiennych (x
1
,y
1
), (x
N
,y
N
) np.
napięcia termoelektrycznego od temperatury, oporu od temperatury dla termometrów
rezystancyjnych metalowych,
zależność napięcia od natężenia przepływającego prądu czy
strumienia objętości przepływającej cieczy od ciśnienia różnicowego na zwężce.
a) b) c)
Rys.1.
Zależności miedzy punktami pomiarowymi [1]: a) liniowe, b) krzywoliniowe, c) brak
zależności
Widać, z niego, że zależność między wielkościami y i x rysunku 1a jest liniowa, na rysunku
1b krzywoliniowa, a na rysunku 1c
występuję brak zależności miedzy nimi. Analiza
korelacyjna pozwala
określić zależności funkcyjne między zmiennymi. W praktyce
pomiarowej często ta zależność jest liniowa, a o liniowej zależności informuje współczynnik
korelacji liniowej oznaczany przez r [2
] i wyrażany tożsamymi równaniami:
r =
∑(x
i
−x�)(y
i
−y�)
�∑(x
i
−x�)
2
∑(y
i
−y�)
2
(1)
r =
∑ x
i
y
i
−Nx �y�
��∑ x
i
2
−Nx�
2
��∑ y
i
2
−Ny�
2
�
(2)
Liczba r
określa stopień zgodności punktów (x
i
, y
i
) z linią prostą i przyjmuje ona wartości z
przedziału <-1,1>. Jeżeli r jest bliskie ±1 to punkty rozłożone są wzdłuż pewnej prostej, jeżeli
r jest bliskie 0 to punkty są nieskorelowane i nie wyznaczają prostej [2].
Jeżeli współczynnik korelacji jest mniejszy niż 1 to z tabeli 1 [2] można obliczyć
prawdopodobieństwo uzyskania współczynnika korelacji r większego od r
0
dla
nieskorelowanych zmiennych x i y w
zależności od liczby danych pomiarowych N, tzn.
𝑃
𝑁
(|𝑟| ≥ 𝑟
0
) .
y
y
y
3
Tabela 1. Prawdopodobieństwo 𝑃
𝑁
(|𝑟| ≥ 𝑟
0
) , że wyniki N pomiarów dwu nieskorelowanych
zmiennych x i y dałybby wspólczynnik korelacji |𝑟| ≥ 𝑟
0
. Podane wartości wyrażają
prawdopodobieństwo procentowe , puste miejsca oznaczają wartości mniejsze niż 0,005 % [2]
Dla przykładu: dla 6 pomiarów (N=6) otrzymaliśmy r
0
= 0,9; z tabeli 1
wynika ,że jeżeli
zmienne są nieskorelowane to prawdopodobieństwo uzyskania współczynnika korelacji
większego od 0,9 wynosi 1%. Innymi słowy, jest bardzo mało prawdopodobne, że zmienne są
nieskorelowane, a więc jest bardzo prawdopodobne że są skorelowane. Dla r
0
= 0,5
prawdopodobieństwo, że zmienne są nieskorelowane wynosi już 31%.
Jeżeli uzyskana wartość współczynnika korelacji potwierdza liniową zależność między
danymi pomiarowymi d
wóch wielkości fizycznych x i y to można poprowadzić między
punktami x
i
i y
i
prostą najlepiej do nich dopasowaną. Metoda analityczna znajdowania linii
prostej, która najlepiej pasuje do szeregu punktów doświadczalnych nazywa się metodą
regresji liniowej
lub metodą najmniejszych kwadratów.
Zasadę tę ilustruje rysunek 2.
Rys.2.
Prosta regresji i między punktami pomiarowymi [1]
Linię regresji prowadzi się tak, aby suma kwadratów różnic między (y
1
a y
’
1
) ….(y
4
a y
’
4
)….
(y
N
a y
’
N
)
była minimalna, tzn. szuka się minimum funkcji [1]:
e = ∑ (y
i
− y
i
′
)
2
=
N
i=1
∑ (y
i
− a − bx
i
)
2
= min
N
i=1
(3)
Wartości a i b otrzymane przez rozwiązanie układu równań
𝜕𝑒
𝜕𝑎
= 0 𝑖
𝜕𝑒
𝜕𝑏
= 0 wynoszą:
b =
∑
x
i
y
i
−
1
N
∑
x
i
∑
y
i
N
i=1
N
i=1
N
i=1
∑
x
i
2
N
i=1
−
1
N
�∑
x
i
N
i=1
�
2
(4)
a =
∑
y
i
N
i=1
−b ∑
x
i
n
i=1
N
(5)
y
x
y
’
=a+bx
i
(x
1
,y
1
)
(x
1
,y
’
1
)
(x
4
,y
4
)
(x
4
,y
’
4
)
y
’
=a+bx
i
4
Można wykazać, że średnie arytmetyczne [1]
x� =
1
N � x
i
N
i=1
i y� =
1
N � y
i
N
i=1
spełniają równanie: 𝑦� = 𝑎 + 𝑏𝑥̅, wtedy stałe a i b wyrażaja się równaniami:
b =
∑
(x
i
−x�)(y
i
−y�)
N
i=1
∑
(x
i
−x�)
2
N
i=1
(6)
a = y� − bx�
(7)
Niepewności standardowe współczynników a i b oraz y
’
wyrażają się równaniami:
u
b
= �
∑
(y
i
−y
′
)
2
N
i=1
N−2
1
�∑
(x
i
−x�)
2
N
i=1
(8)
u
a
= �
∑
(y
i
−y
′
)
2
N
i=1
N−2
�
1
N
+
x�
2
∑
(x
i
−x�)
2
N
i=1
(9)
u
y
′
= �
∑
(y
i
−y
′
)
2
N
i=1
N−2
�
1
N
+
(x
0
−x�)
2
∑
(x
i
−x�)
2
N
i=1
(10)
Gdzie: x
0
-
wartość pomiaru dla którego wyznacza się niepewność np. x
0
= x
1,
x
0
= x
2
itd..
3.
Sposób realizacji ćwiczenia
Ćwiczenie wykonuje się na stanowisku przedstawionymi na rysunku 2 (zasadę
pomiaru temperatur za pomocą termoelementów przedstawiono w instrukcji do ćw. 4). Dla
nastawionych temperatur w piecyku równych odpowiednio: 50
°
C, 100
°
C, 150
°
C, 200
°
C,
250
°
C, 300
°
C i 350
°
C odczytać na multimetrze wartość napięcia termoelektrycznego E/mV
dla spoin odniesienia umieszonych w lodzie t
0
=0
°
C i t
0
równym temperaturze otoczenia, .
Zmianę wartości temperatur spoin odniesienia otrzymuje się poprzez przestawienie
przełącznika wg schematu pomiarowego z pozycji 1 na 4. Dla danej temperatury w piecyku
n
ależy odczytywać również wartości napięcia z woltomierza U
i
.
Następnie:
•
wyznaczyć błąd systematyczny jako różnice między napięciem termoelektrycznym E
’
dla
spoiny odniesienia w otoczeniu
a napięciem termoelektrycznym E(t
0
=0
°
C) dla spoiny
odniesienia w
lodzie; Δ
s
E= E
’
- E(t
0
=0
°
C)
•
dla serii punktów pomiarowych, dla temperatury spoiny odniesienia w lodzie wyznaczyć
współczynnik korelacji liniowej r
•
dla serii punktów pomiarowych, dla temperatury spoiny odniesienia w lodzie wyznaczyć
metodą funkcji regresji równanie analityczne charakterystyki E= a+bt (obliczyć a i b)
• na tle punktów pomiarowych
wykreślić otrzymaną charakterystykę
•
obliczyć niepewności standardowe współczynników a i b
•
dla przykładowego punktów x
0
np. x
0
= 100
°
C wyznaczyć 𝑢
𝑦
′
, następnie odczytać z tablic
rzeczywistą wartość napięcia termoelektrycznego dla tej temperatury E
rz
(x
0
) i sprawdzić czy
E
rz
(x
0
) <= E(x
0
)±
𝑢
𝑦
′
(x
0
)
• dla temperatur t
p
50
°
C, 100
°
C, 150
°
C, 200
°
C, 250
°
C, 300
°
C i 350
°
C nastawianych na piecyku
narysować charakterystykę napięcia uzyskanego z przetwornika, mierzonego woltomierzem,
od temperatury w piecyku tj. U=f(t
p
)
• obliczyć błędy systematyczne w tych punktach temperatury dla przetwornika (napięcie
termoelektryczne/napięcie) w następujący sposób:
5
Schemat stanowiska
Piecyk Fluke: zakres temperatur 35°C -
375°C, rozdzielczość 0,1°C, błąd graniczny: ±0,25°C do temperatury
100°C, ±0,5°C do temperatury 375°C
Multimetr Th1961: ustawiany zakres 100.
0000 mV, rozdzielczość 0,1 µV, błąd graniczny w temperaturze
23±5°C: ±0,0065%wartości wskazywanej + 0,0045%zakresu
Przetwornik temperatura napięcie dla termoelementu typu K : zakres 0°C/0V- 400°C/10V
Woltomierz: ustawiany zakres 0-
10v, rozdzielczość 0,1 V
Rys.2. Schemat stanowiska pomiarowego
t
U
V
Multimetr typ TH1961
mV
Woltomierz
Piecyk FLUKE 9100S
°C
Przełącznik spoin
odniesienia
Przetwornik
temperatura/napięcie
1
4
3
2
t
0
=0°C
t
0
>0°C
Termoelement typ K
S
poi
ny
odni
es
ie
ni
a
+
-
+
-
6
• z równania charakterystyki przetwornika (0°C/0V- 400°C/10V – charakterystyka
liniowa)
t =
400 ∙U
10
obliczyć temperaturę t dla napięcia odczytanego z woltomierza U
•
Obliczyć błąd systematyczny temperatury Δ
s
t = t − t
p
•
Obliczyć błąd systematyczny względny tzn.
Δ
s
t
𝑡
𝑝
∙ 100%
•
Narysować zależność błędu systematycznego względnego
Δ
s
t
𝑡
𝑝
od temperatury w piecyku
t
p
•
zaznaczyć na wykresie zakres w którym błąd jest mniejszy niż 2%
4. PYTANIA KONTROLNE
1. O czym informuje
współczynnik korelacji liniowej?
2. Co oznacza, ze r= ± 1 i r= 0
3. Ogólna zasada wyznaczania funkcji regresji
4.
Definicje błędu systematycznego i poprawki
5.
Napisać równanie charakterystyki przetwornika którego zakres odpowiada 0°C/0V i
400°C/10V
5. LITERATURA
1. Danuta Turzeniecka:
Ocena niepewności wyniku pomiaru, Wydawnictwo Politechniki
Poznańskiej 1977
2. John.R. Taylor:
Wstęp do analizy błędu pomiarowego, PWN, Warszawa 1999
Data wykonania instrukcji:
18.10.2010