100
la moyenne et la matrice de variances-covariances sont estimees.
Trois methodes sont souvent utilisees pour la detection des valeurs aberrantes, pre-mierement la distance de Mahalanobis et deux methodes robustes, Punę basee sur le determinant minimale de la covariance, 1’autre techniąue a pour objectif de minimi-ser le volume de 1’ellipse qui engendre le nuage de points.
Distance de Mahalanobis
La distance de Mahalanobis Crettaz de Roten et Helbling (1996) est definie comme suit :
Di = yJ(xi-T(X)y^(Xi-T(X)), (5.1)
ou T(X) represente la moyenne et E la matrice de covariance empiriąue. La distance de Mahalanobis (notę MD) prend en considśration la dependance entre les variables par la matrice de covariance empiriąue E.
La distance de Mahalanobis utilise 1’espace des composantes principales pour calcu-ler la distance de chaąue sujet par rapport au centre du nuage de points dans cet espace. La projection du nuage de points des individus sur les composantes principales, considere les sujets avec une grandę distance de Mahalanobis, par rapport a 1’origine comme observations aberrantes. Autrement dit, la methode suggere des observations aberrantes qui ont une distance considerable par rapport au centre du nuage de points (voir figurę 5.5). Mais une difficulte majeure de l’ACP provient de sa sensibilite aux valeurs aberrantes. En effet Pestimateur E est efficace lorsąue les donnees sont distribuees suivant une loi normale multivariee. Cependant, il est sen-sible face a des points aberrants, et dans ce cas, les conclusions faites sur la base des composantes principales peuvent etre totalement erronees. Afin de reduire cette sensibilite, d’autres techniąues d’ACP insensibles a ces valeurs aberrantes sont pro-