3240962865

3240962865



102

sous-echantillon {tr^,... ,2;^} de taille h (1 < h < n), qui minimise le determinant de la matrice de covariance empiriąue parmi tous les sous-echantillons possibles de taille h. L’estimateur MCD de position est alors defini comme

1 h

Tn =

k=l

et 1’estimateur MCD de la matrice de covariance empiriąue est defini par

1 h

£ = dr    - Tn)(xik - Tn)T,

fc= 1

1-a


ou Ci = —-—r (Fx2+2 śtant la fonction de repartition de la loi de x2 ap-h2 degres

Xp+2

de liberte), et qa = Xp,i-a est defini comme le ąuantile (1 — a) de la distribution x2-Generalement, h prend la valeur h = n( 1 — a), avec a = 0.50.

La detection des donnees aberrantes basee sur MCD se resume dans 1’algorithme 5.4.2. La plus grandę valeur possible pour h est donnee par :

,    n-ł-p+1

_h~ 2    •_

Algorithme de MCD 5.4.2

1    : Tous les sous-ensembles de Cardinal h sont formes;

2    : La matrice de covariance pour chacun de ces sous-ensembles est calculee;

3    : Le sous-ensemble dont le determinant de la matrice de covariance est le plus

petit est selectionne;

4    : La moyenne et la covariance de ce sous-ensemble sont utiiisees pour calculer

la distance de chaąue observation par rapport k cette moyenne;

5    : Pour une observation i, si Ą est superieure a un certeiin seuil(Xpi0.975)> elle est

definie comme aberrante, sinon elle est consideree comme observation normale.



Wyszukiwarka

Podobne podstrony:
labyrinthe063 LABYRINTHE Tracę le chemin qui ccnduira le Pere Noel d la maison ca
56 Enfin, precisons que n e echantillon compte des participants qui ont tous un fort Capital de mobi
mćcaniąue de 1’emprunt est tr£s attenuć du fait que virłus avait deja des significations qui rendaie
134 LE CHOLERA documents, remontant jusqu’& 1844, qui, selon lui, se rapportent a la disso-ciati
PROBLEMES D^IMMU^OLOGIE 231 fugeant des cultures de vibrions choleriques sur gelose, ce qui liberait
34 LE CHOLERA Le cholera, qui avait penetre en Italie par Ancone, sevit dans le sud de le peninsule
La matrice des coefficients de correlation vectorielle entre sous-tableaux (fig. 4-29), donnee par l
#999 ]’once d’Or va passer ia barre des 1400 S c’est le signal de la valeur 5 qui indique le debut d
inacceptables, par exemple la reconnaissance de la liberte religieuse, la collegialite qui reduit le
guide graissage terrot Noter, s’il est nćcessaire de dćmonter le piston, que l’ae doi; sortir par l
Les terres t om bant sous lc coup de ces dispo-sitłons devcnaient susceptibles dłćtre achetóes par l
6 (sous toute reserve de revision) offrent des interprśtations pertinentes”.18 En regard de la produ
230 qui constituent le principal element quantitatif du psammon de Wigry; ce milieu presente de si b
242 microorganismes. Dans ce prelevement, qui n est point exception-nel, la densite de la population
172 Un nombre de jours sereins qui n’atteint 3 se trouve dans la region des lacs Prusso-Mazoviens et
mait sa satisfaction en disant que »votre oeuvre, Monseigneur, qui satisfait le desir de mon coeur,
258 CHROŃ 1QUE 2 A la suitę des discussions on a choisi trois categones de sujets qui constitueraien
266 COMPTES RENDUS 6 prose roumaine, Mihail Sadoveanu, qui a refait le rćcit du Roman d’Alexandre>
38 Un instinct qui prend le train d’annćes lumieres. Un royaume de printemps dans Ies souterrains de

więcej podobnych podstron