previous up next_inactive
Up: Return to previous menu

Ensait - E1 - Stats/Probas


Date: Corrigé du 2ème DS (durée 1 h)

1 Calculs élémentaires

  1. Calculez $ Pr\left( 23<X \right) $ si $ X $ est une v.a. $ Norm\left( 20\, ;\, 2.5\right) $. Que valent $ \mathrm{E}\left( X \right) $ et $ \mathrm{var}\left( X \right) $ ?

    1. Par définition $ \mathrm{E}\left( X \right) =20 $ et $ \sigma =2.5 $. On a donc $ \mathrm{var}\left( X \right) =\sigma ^{2}=6.25 $.
    2. Passant à la variable réduite, $ X=23 $ équivaut à $ Z=\frac{23-20}{2.5}=1.2 $. On lit sur la table $ Pr\left( Z<1.2 \right) =.8849 $. Passant au complément, il vient $ Pr\left( 23<X \right) =.1151 $, soit une chance sur $ 9 $.
  2. Calculez $ Pr\left( Y>2 \right) $ si $ Y $ est une v.a. $ Poiss\left( 3\right) $. Que valent $ \mathrm{E}\left( Y \right) $ et $ \mathrm{var}\left( Y \right) $ ?

    1. Par définition $ \mathrm{E}\left( Y \right) =\lim n\, p=\lambda =3 $. Et l'on a $ \mathrm{var}\left( Y \right) =\lim n\, p\, q=\lambda =3 $.
    2. Les valeurs possibles pour $ Y $ sont les nombres entiers. L'événement $ 2<Y $ est donc le complémentaire de l'événement $ Y\in \left\{ 0,\, 1,\, 2\right\} $, dont la probabilité est $ \left( \frac{\lambda ^{0}}{0!}+\frac{\lambda ^{1}}{1!}+\frac{\lambda ^{2}}{2!}...
...ght) \approx \left( 1+3+\frac{9}{2}\right) \exp \left( -3\right) \approx .4232 $. La probabilité du complémentaire est donc $ .5768 $, soit $ 4 $ chances sur $ 7 $.
  3. On mélange une population de $ N_{1}=25 $ individus, ayant une moyenne $ \mu _{1}=13 $ et un écart-type $ \sigma _{1}=3 $ avec une population de $ N_{2}=35 $ individus, ayant une moyenne $ \mu _{2}=11 $ et un écart-type $ \sigma _{2}=4 $. Déterminer la moyenne et l'écart-type de la population totale.

    1. Indexons par $ 0 $ ce qui concerne la population totale. Par définition, on a $ \sum _{j}x=n_{j}\, \mu _{j} $ et, par la formule de Koenig, on obtient $ \sum _{j}x^{2}=n_{j}\left( \sigma _{j}^{2}+\mu _{j}^{2}\right) $. Ces formules sont valables pour $ j=0,\, 1,\, 2 $.
    2. Il est clair que $ \sum _{0}=\sum _{1}+\sum _{2} $. On obtient donc $ n_{0}=n_{1}+n_{2}=60 $. Puis $ \sum _{0}x=13\times 25+11\times 35 $, conduisant à $ \mu _{0}=71/6\approx 11.83 $. Et enfin $ \sum _{0}x^{2}=\left( 13^{2}+3^{2}\right) \times 25+\left( 11^{2}+4^{2}\right) \times 35=9245 $, qui conduit à $ \sigma _{0}^{2}=506/36 $.
    3. On pouvait aussi utiliser directement les formules :

      $\displaystyle \mu =\frac{n_{1}\mu _{1}+n_{2}\mu _{2}}{n_{1}+n_{2}},\quad \sigma...
...( \mu _{1}-\mu \right) ^{2}+n_{2}\left( \mu _{2}-\mu \right) ^{2}}{n_{1}+n_{2}}$

2 Loi normale

  1. Si les âges d'un groupe de personnes sont distribués suivant la loi $ Norm\left( 39,\, 7\right) $, quel est le pourcentage des membres de ce groupe ayant : (a) moins de 51 ans ; (b) au moins 35 ans ; (c) entre 26 et 49 ans ?

    1. $ X=51 $ correspond à $ Z=\frac{51-39}{7}\approx 1.714 $. La table donne $ Pr\left( Z\leq 1.714 \right) =.9568 $. Soit un pourcentage de $ 96\% $.
    2. $ X=35 $ correspond à $ Z=\frac{35-39}{7}\approx -0.571 $. La table montre que $ Pr\left( Z\leq +.571 \right) $ vaut $ .7161 $. Et par symétrie, $ Pr\left( -.571\leq Z \right) =0.7161 $, soit $ 72\% $.
    3. Les événements $ X\leq 26 $ et $ 26<X\leq 49 $ sont incompatibles, et leur réunion est $ X<49 $. On a donc $ Pr\left( 26<X\leq 49 \right) =Pr\left( X\leq 49 \right) -Pr\left( X\leq 26 \right) $. Passant en $ Z $, on a $ Z_{2}=\frac{49-39}{7}=+10/7 $ et $ Z_{1}=\frac{25-41}{8}=-13/7 $. La table donne directement les probabilités en $ Z $ et l'on a donc $ Pr\left( 25<X\leq 49 \right) =.9234-.0316=.8918 $.
  2. On sait que la variable $ X $ suit une loi normale et que $ Pr\left( X<9 \right) =0.17 $ et $ Pr\left( 15<X \right) =0.34 $. Déterminer $ \mu $ et $ \sigma $.

    1. On détermine $ a $ tel que $ Pr\left( Z<a \right) =0.17 $ et $ b $ tel que $ Pr\left( Z<b \right) =1-0.34 $. On trouve $ a=-.6745 $ et $ b=+.4125 $.
    2. On a donc $ 9=\mu +a\, \sigma $ et $ 15=\mu +b\, \sigma $, ce qui se résout en $ \mu \approx 12.723 $ et $ \sigma \approx 5.520 $.
  3. Les âges $ X $ d'un groupe d'étudiants sont répartis suivant la loi $ Norm\left( 22,\, 3\right) $.
    (a) Déterminer les nombres $ a,\, b,\, c $ tels que $ Pr\left( X<a \right) =0.25 $, $ Pr\left( a<X<b \right) =0.25 $, $ Pr\left( b<X<c \right) =0.25 $ et $ Pr\left( c<X \right) =0.25 $.
    (b) Déterminer l'âge moyen $ \mu _{1} $ du quart le plus jeune, i.e. les étudiants vérifiant $ a<X $.
    (c) On donne l'âge moyen $ \mu _{2}=21.03 $ ans des étudiants du deuxième quart, c'est à dire tels que $ a<X<b $. En déduire $ \mu _{3} $ et $ \mu _{4} $, les âges moyens des deux derniers quarts.
    (d) Quelle est la variance des quatre nombres $ \mu _{1},\, \mu _{2},\, \mu _{3},\, \mu _{4} $ ? A quoi la comparer ?

    1. Les nombres $ \alpha ,\, \beta ,\, \gamma $ tels que $ Pr\left( Z<\alpha \right) =1/4 $,   $ Pr\left( \alpha <Z<\beta \right) =1/4 $, $ Pr\left( \beta <Z<\gamma \right) =1/4 $ et $ Pr\left( \gamma <Z \right) =1/4 $ vérifient également $ Pr\left( Z<\beta \right) =2/4 $ et $ Pr\left( Z<\gamma \right) =3/4 $. La table donne $ \alpha \approx -0.6749 $ et l'on a $ \beta =0 $ et $ \gamma =-\alpha $. Les valeurs correspondantes pour $ X $ s'obtiennent par $ X=22+3Z $ (et s'appellent les quartiles de la distribution). On obtient :

      $\displaystyle a=19.977,\quad b=22,\quad c=24.023\qquad (ans)$

    2. La question posée est de calculer la moyenne $ \widehat{\mu } $ des $ Z $ conditionnés par l'événement $ Z<\alpha $. On a donc $ \displaystyle \widehat{\mu }=\int _{-\infty }^{\alpha }\frac{t\, f\left( t\rig...
...=\int _{-\infty }^{\alpha }t\, f\left( t\right) \, \mathrm{d}t\div \frac{1}{4} $, $ f $ étant la densité de probabilité de la loi normale. Le changement de variable $ u=-\frac{1}{2}t^{2} $ conduit à

      $\displaystyle \int _{-\infty }^{t=\alpha }\exp \left( -\frac{t^{2}}{2}\right) t...
...ght) \, \mathrm{d}u=-\exp \left( -\frac{1}{2}\alpha ^{2}\right) \approx -0.7965$

      soit $ \widehat{\mu }=-0.7965\div \left( 4\, \sqrt{2\pi }\right) \approx -1.2711 $. La valeur correspondante pour les âges est $ \mu _{1}=22-3\times 1.2711\approx 18.19 $ années.
    3. On donne $ \mu _{2}=21.03 $. Par symétrie, on a $ \mu _{3}=2\mathrm{E}\left( X \right) -\mu _{2}=22.97 $ et $ \mu _{4}=2\mathrm{E}\left( X \right) -\mu _{1}=25.81 $.
    4. La variance de ces quatre nombres est $ \frac{1}{4}\sum \mu _{j}^{2}-\mu ^{2}\approx 7.75 $. Le fait que ces nombres soient également pondérés vient de ce que les quatre intervalles interquartiles ont la même probabilité d'être atteints.
    5. On obtient une variance inférieure à la variance de la population, car le calcul précédent revient à annuler la variabilité existant à l'intérieur de chaque quartile. Quelques calculs supplémentaires montre que la variance interne au premier quartile est $ 2.174 $ et celle interne au deuxième quartile est $ 0.037 $. La moyenne des variances est donc $ \approx 1.25 $. Ajoutée à la variance des moyennes, on retrouve bien la variance totale.

3 Approximations

  1. La variable $ X $ suit une loi binomiale de paramètres $ n=8 $, $ p=0.4 $. Quelle est la probabilité des événements $ E_{1}\, :\, X\in \left\{ 0,\, 1\right\} $, $ E_{2}\, :\, X\in \left\{ 2,\, 3\right\} $, $ E_{3}\, :\, X\in \left\{ 4,\, 5\right\} $ et enfin $ E_{4}\, :\, X\in \left\{ 6,\, 7,\, 8\right\} $.

    1. On a, par définition, $ Pr\left( X=k \right) =\binom{n}{k}p^{k}\left( 1-p\right) ^{n-k} $. On en déduit les probabilités voulues : $ .1064,\, .4877,\, .3561,\, .0498 $. On vérifie que $ \sum p=1 $.
  2. Décrire le procédé d'approximation par la loi de Gauss, et en donner les résultats.

    1. Le procédé commence par remplacer $ X=k $ par $ k-\frac{1}{2}<X<k+\frac{1}{2} $ (donnant l'épaisseur voulue aux barres de l'histogramme).
    2. On passe ensuite à la variable réduite $ Z=\frac{X-n\, p}{\sqrt{n\, p\, q}} $. Les seuils $ -0.5,\, 1.5,\, 3.5,\, 5.5,\, 8.5 $ deviennent $ -2.6702,\, -1.2269,\, .2165,\, 1.6599,\, 3.8249 $.
    3. On conclut en calculant les différences $ -Pr\left( Z<-2.6702 \right) +Pr\left( Z<-1.2269 \right) $ etc., qui donnent : $ .1061,\, .4758,\, .3658,\, .0484 $.
  3. L'approximation obtenue est-elle convenable ? Commenter.

    1. L'approximation de Gauss est liée au passage à la limite $ n\, p\, q\rightarrow \infty $... et ici $ n\, p\, q=1.92 $ ! On est donc bien loin du domaine de validité.
    2. Néanmoins, les ordres de grandeur soient quand même corrects (phénomène lié au fait que $ p\approx 0.5 $).
    3. Pour quantifier les écarts entre la loi et son approximation, il est naturel de considérer les écarts relatifs, et d'en prendre la moyenne quadratique. Notant $ \beta $ la loi binomiale et $ \alpha $ son approximation, la quantité à examiner est $ \varepsilon ^{2}=\sum \beta \left( j\right) \left( \frac{\beta \left( j\right)...
... \left( j\right) -\alpha \left( j\right) \right) ^{2}}{\beta \left( j\right) } $. Pour le problème considéré, on trouve $ \varepsilon ^{2}\approx 0.0005974 $ soit $ \varepsilon \approx 0.024=2.4\% $.
    4. On obtient une approximation légèrement meilleure en renormalisant les probabilités obtenues à la question précédente, pour tenir compte de ce que $ X\notin \left[ 0..8\right] $ est non pas improbable, mais impossible.


previous up next_inactive
Up: Return to previous menu


douillet@ensait.fr
2002-05-09