ł
• »•
Pour contrdler la validitś d'un modele, on compare se$ prśuisions d r l'obseruation de situations rśelles dont on connait 1'histoire aveo prścision ; ces donnśes-tests peuvent prouenir d'expśriences, de placettes d} śchantillonnage permanentes ou temporaires, avec l'une ou 1'autre des deu£ euentualitśs suivantes
m les donnees-tests sont ćgalemen.t celles qui ont servi a 1’ajustement • des diverses fonctions du modele : on parle alors dłauto-validation ;
■les donnees-tests n'ont servi a 1’estimation d’aucun des parametres du modele : on parle alors de validation independante.
• L'auto-validation est ąueląue chose de trśs ordinaire : crest ainsi ąue
l’on juge de la "ąualite" drune rśgression au moyen de diverses statistiąues cal-tculśes d partir des ecarts entre les yaleurs de Y estimśes par le modśle d’une part et obserośes sur les donnśes de l'ajustement d’autre part.
, tfais elle peut etre dangereusement trompeuse. Prenons toujours l'exemple
de la rśgression ; si les hypothśses du modśle statistiąue de la rśgression li-neaire (ścarts residuels non corrślśs, distribuśs normalement et de Dariance uni-forme) ne sont pas vśrifiśes, les statistiąues obtenues sont incorrectes (de rnśme, d'ailleurs, ąue l*estimation des parametres eux-mśmes). Et, de toutes fagons, il est impossible de juger par la seule "ąualite" de la rśgression de la representa-tivite rśelle de 1’echantillon sur leąuel elle est śtablie. C'est Id la grosse faiblesse de l'auto-validation, ąui deuient particuliśrement dangereuse avec des modeles trśs compleres ou ąuand on dispose de peu de donnśes, Avec des modeles simples (disons une ou deux eąuations) et un grand nombre de donnśes-tests, elle deuient plus sftre.
La validation independante est un procśdś beaucoup plus satisfaisant d tous points de vue car elle permet de juger effectivement de 1'efficacitś du mod&le corrne outil de prśuision. La meilleure procedurę, largement adoptee, est ' probablement celle ąui consiste d separer les donnśes en deux groupes, par une methode au hasard, et d utiliser une moitiś des donnśes pour la construction et 1'autre pour la ualidation.
1 »
La rśalitś n’est pas toujours aussi tranchśe entre auto-validation et ualidation indśpendante : on peut par exemple utiliser pour la construction d'un modele une information donnee (hauteur et dge recueillie sur un certain nom
bre de placettes, et utiliser pour sa ualidation une autre information indśpendante de la premiśre (diamśtre moyen mais prouenant des mśmes placettes. De
telles validations, partiellement indśpendantes, sont śvidemment moins satisfai-santes ąu'une ualidation vraiment indśpendante mais plus sures ąue l'auto-oalidaiion.
\
I
r
j
i
*
Ą