73
un echantillon de 500 observations :
Xi~MVNi0(0, E.) pour
ou Ez est la matrice de variances-covariances de x. Notez que le choix de simulation de la correlation entre les SNPs par la loi normale multivariee est choisie seulement en raison, d’une part de sa simplicite et d’autre part parce qu’on peut manipuler la correlation entre les SNPs, chose qui n’est pas evidente avec la distribution multino-miale par exemple, mais d’autres techniques existent (voir Ferrari et Barbiero, 2012). Ensuite, les colonnes de la matrice x = (xi,... ,xn)T vont etre converties en geno-types codes en {0,1,2} par une procćdure de discretisation basee sur les probabilites 90% et 95%. Ces quantiles sont selectionnes pour avoir la frequence de 1’allele mineur (pi) des 10 SNPs qui varie entre 0.055 et 0.088. La procedurę est resumee dans l’al-gorithme suivant avec i = 1,..., 500 Tindice des sujets, / = 1,..., L = 10 1’indice des marqueurs dans 1’etude et qi et qi sont les quantiles 90% et 95% de Xj respectivement.
Procedurę de discretisation de la matrice x_
— Generer 10 marqueurs selon la distribution normale multivariee Xi ~ MVN(0} Ex) (i = 1,..., n). Poser x = (xi,..., x„)T.
— Pour chaque marqueur l = 1,..., L, calculer q\ et <72 pour chaque colonne de x.
— Si xu < q\ alors xu = 0.
— Si qi < xu < q2 alors xu = 1.
— Si X{ 1 > q2 alors Xu = 2.
Cet algorithme de discrśtisation sera utilisó chaque fois que les SNPs sont gónśres k partir d’une distribution normale multivarióe. Une fois que la matrice x est genćrśe, l’effet de chaque variante genetique (Z = 1,..., 10) sur chaque caract&re, representó