Les hypothśses que l'on fait dans la rśgression linśaire sont les
le modele est bien linSaire, conformement a l’equation (1) ci-dessus, sans courbure dans un sens ni dans 1'autre,
'I
suiuantes
(i)
Cii)
les residus sont distribuśs normalement (1) , avec une. variance (2> independante de la valeur de x,
(iii) les residus sont independants les uns des autres : ils ne sont ni correles, ni groupes de quelque raaniere que ce soit,
(iv) les abscisses des points echantillons ne sont pas aleatoires, mais determinees avec certitude.
L'imprimś A2, qui est la reproduction de la ”Statform 11" de DAWKINS (voir bibliographie), montre quelles sont les grahdeurs statistiqu.es a calculer dans la rśgression linśaire simple3 les donnśes de dśpart śtant celles de la figurę A21. Les statistiques les plus importantes sont :
. les coefficients de la rśgression (lignes 11 - 12)
. le rapport ^^.ance. (p observe (3), ligne 181
uarzance rśszduelle y
2
. le carrś du coefficient de corrślation (lł) r • (ligne 22)
. 1'ścart-type rśsiduel (5) (ligne 25)
. et l 'intewalle de oonfiance (6) des estimations de y (lignes 32 - 35).
2
o
Les valeurs de r et de 1'ścart-type rśsiduel sont utiles pour la comparaison des regressions : plus r2 est śleve, plus prścise est la relation ; ‘quand r2 vaut 1, les rśsidus sont tous nuls, c'est-a-dire que les donnśes tom-bent exactement sur la droite. De mśme, plus 1'ścart-type rśsiduel est proche de zśro, plus grandę est la prścision avec laquelle la rśgression permet d'es-timer les valeurs de y. L'intervalle de oonfiance de la rśgression donnę les limites a l'intśrieur desąuelles se trouve, avec la probabilitś 95 %9 la vraie moyenne de m ualeurs de y estimśes par la rśgression d partir de mvaleurs de x ; on a tracę sur la figurę A21 les limites de l'intervalle de oonfiance pour m = \9 c’est-a-dire pour l'estimation par la rśgression de la valeur de y cor-respondant a une valeur de x.
i *
Remarquons que la droite de rśgression passe toujours par le point reprśsentant la moyenne des valeurs obseruśes de x et de y . Les limites de l'intervalle de oonfiance d’une estimation sont courbes et s 'ścartent rapi-dement quand on sort du domaine des donnśes qui ont servi d calculer la rśgression.
(>) |
en |
anglais |
<2) |
en |
anglais |
<3) |
en |
anglais |
(**) |
en |
anglais |
<5) |
en |
anglais |
(6) |
en |
anglais |
normally,[au sens de la "loi normale”] var lance variance ratio correlation coefficient residual standard deviation confidence limits
.i*