103
Ellipsoide de yolume minimal (MVE)
Rousseeuw (1985) a introduit la methode robuste MVE pour la detection des valeurs aberrantes dans les donnees multidimensionnelles. C’est une extension multivariee de la methode de la mediane (MCD) qui prend en consideration de multiples ob-servations aberrantes. L’idee de base de cette methode (Abou-Moustafa et Ferrie, 2007; Chen et a/., 2008) est que la distance de Mahalanobis entre deux points x et y s’ecrit D2(x, y) = (x — y)TE~1(x — y). Or la distance de x par rapport a 1’origine est egale a D2(x, 0) = xTE_1x = c2, qui est l’equation d’un ellipsoide centre a 1’origine, avec des axes principaux alignes sur les axes des cordonnees. Ainsi, les observations aberrantes sont des points essentiellement situes sur la limite du volume minimal couvrant 1’ellipsoide. La procedurę de detection des observations aberrantes par l’ap-proche MVE est donnee dans 1’algorithme 5.4.2.
Algorithme de MVE 5.4.2
1 : Pour une matrice de donnees X avec p variables et n observations, tirer un
sous-echantillon de p+1 observations differentes, indexe par J = (ji, ....jjp+j), et calculer la moyenne arithmetique Tj = —Xj et la matrice cova-
riance correspondante Cj = - ^2jeJ(xj — Tj)t(Xj - Tj) ou Cj est non singu-li&re;
2 : Calculer m] = [fo - Tj)Cjl{Xj - Tj)T]fc;n ou h = n + ^+ 1.
3 : Calculer Pj = (det(m2Cj))*;
4 : Repetez la procedurę ci-dessus pour un grand nombre de sous-echantillons J,
et conserver celui avec la plus faible Pj;
5 : Pour ce sous-echantillon retenu J, calculer T(X) = Tj et C(X) = c?{n,p)(xj>t0 5o)~1TnjCj1 ou c2 est un terme de correction calcule comme [1 -ł- j^j]2 et Xp,o.50 est mediane de la distribution de x2 avec p degres de liberte.