previous up next contents index
Previous: 1.2 Le test de Up: 1. Générateurs uniformes Next: 1.4 Méthode des lots   Contents   Index

Subsections

1.3 Le test des paramètres de répartition

1.3.1 Pose du problème

Appelons échantillon de taille maths une suite quelconque de maths nombres réels maths. Le problème général de la qualité d'un générateur de nombres pseudo-aléatoires peut se formuler ainsi : "existe-t-il une méthode plus efficace que le tirage à pile ou face pour déterminer si un échantillon donné a été obtenu par maths itérations du générateur à tester ou par maths instanciations effectivement indépendantes d'une variable aléatoire effectivement uniforme" ?

Une méthode simple à mettre en oeuvre consiste à considérer la "moyenne d'échantillon", définie par maths, ainsi que la "variance d'échantillon", définie par maths. La question est alors de comparer maths avec maths, ainsi que maths avec maths pour voir si les inévitables différences entre les valeurs théoriques et expérimentales sont ou non significatives.

Pour répondre à cette question, le choix de la valeur de maths n'est indifférent. Pour des raisons de statistique, il faut exclure les trop petites valeurs de maths (tout nombre de maths est une bonne instanciation d'une variable aléatoire continue sur cet intervalle). Mais il faut aussi exclure les trop grandes valeurs de maths. En effet, un générateur pseudo aléatoire, étant déterministe sur un ensemble fini est périodique. Pour des générateurs explorant toutes les valeurs de maths avec maths, un échantillon de taille maths vérifie maths et maths, relations qui sont "trop belles pour être vraies". Un compromis raisonnable est maths.

Ainsi, les maths premières valeurs fournies par le générateur lgm() à partir de maths conduisent à maths et maths, ainsi qu'à l'histogramme de la figure 1.4.

Figure 1.4: 40000 tirages uniformes dans maths.
maths

Le fait de ne pas trouver exactement les valeurs théoriques maths et maths est tout à fait naturel, mais il reste à examiner la vraisemblance des écarts constatés, c'est à dire à qualifier l'écart entre les écarts effectivement issus du générateur pseudo-aléatoire et les écarts qui seraient issus d'un générateur effectivement aléatoire.


1.3.2 Le modèle théorique (variables iid)

Dans ce paragraphe (1.3.2), nous considérons un échantillon issu d'un générateur effectivement aléatoire : les maths sont donc des variables aléatoires indépendantes et identiquement distribuées. Il est bien connu qu'en pareil cas on a : maths, c'est à dire que maths est un estimateur non biaisé de maths, et que maths.

Pour ce qui est de l'espérance de maths en tant qu'estimateur de maths, les calculs se simplifient grandement lorsque l'on utilise la variable centrée c'est à dire définie par maths. Convenons en outre de désigner par maths la somme étendue aux maths couples maths tels que maths. On obtient alors :


maths maths maths  
  maths maths  
maths maths maths  

montrant que maths (la variance d'échantillon) est un estimateur non biaisé de la variance globale.

Pour ce qui est de maths, nous avons :


    maths  
    maths  
    maths  
    maths  

En résumé, nous avons les formules suivantes (variances des estimateurs, hypothèse iid) :

maths (1.1)

Pour la loi uniforme, nous avons maths, maths et maths. On en tire maths, maths, maths et maths. Les écarts expérimentaux du paragraphe précédent doivent donc être qualifiés selon les valeurs de leur quotient par les écarts-types correspondants. Pour la moyenne, on a maths et pour la variance maths : ces écarts réduits sont tout à fait acceptables, c'est à dire ne constituent pas un critère de différentiation entre le générateur utilisé et un processus effectivement aléatoire uniforme iid.


previous up next contents index
Previous: 1.2 Le test de Up: 1. Générateurs uniformes Next: 1.4 Méthode des lots   Contents   Index


douillet@ensait.fr
2005-01-04