previous up next contents
Previous: 6 Variables à densité Up: Statistiques pour l'ingénieur Next: 8 Approximations   Contents

Subsections

7 Loi normale

7.1 Limite de la loi binomiale pour $ \sigma \rightarrow \infty $

  1. Notations. Soit $ J $ une variable binomiale de paramètres $ n$ (le nombre total d'essais) et $ p$ (la probabilité de succès à une épreuve élémentaire). On pose $ q=1-p $ et $ k=n-j $. On a $ Pr\left( J=j \right) =\binom{n}{k}p^{j}  q^{k} $.
  2. Variable réduite. On sait que $ \mathrm{E}\left( J \right) =n  p $ et $ \sigma ^{2}\doteq \mathrm{var}\left( J \right) =n  p  q $. La variable réduite $ X $ associée à $ J $ est $ X=\left( J-\mathrm{E}\left( J \right) \right) \div \sigma _{X} $, soit $ x=\frac{j-n  p}{\sigma } $. On peut vérifier que $ j=\frac{1}{q}\sigma ^{2}+x  \sigma $ et $ k=\frac{1}{p}\sigma ^{2}-x  \sigma $.
  3. Changement de variable. On rappelle que la probabilité se représente par une surface (bâton d'un histogramme, tranche d'Archimède dans un graphe). On a évidemment $ Pr\left( J=j \right) =Pr\left( X=x \right) $. La hauteur des rectangles dans l'histogramme en $ j $ vaut $ \frac{1}{\Delta j}Pr\left( J=j \right) $ et la hauteur des rectangles de l'histogramme en $ x$ (que nous allons noter $ f\left( x\right) $) vaut $ \frac{1}{\Delta x}Pr\left( X=x \right) $. Comme $ \Delta j=1 $ et $ \Delta x=\frac{1}{\sigma }\Delta j $, on part donc de

    $\displaystyle f\left( x\right) =\sigma   \frac{n!}{j!  k!}p^{j}q^{k}$

  4. Formule de Stirling. Version faible : $ \sqrt[n]{n!}\sim \frac{n}{e} $, c'est à dire le quotient de $ n$ par la moyenne géométrique des $ n$ premiers nombres entiers tend vers $ e=2.718\cdots $. Version complète : $ n!\sim \alpha   n^{\left( n+1/2\right) }  \exp \left( -n\right) $, le nombre $ \alpha $ étant une constante (sa valeur sera établie par la suite). Mode de démonstration : développements limités.
  5. Dans ce qui suit, on fixe $ x$ et on fait augmenter $ \sigma $ vers +$ \infty $. On a donc
    $ f\left( x\right) \sim \frac{1}{\alpha }n^{n+1}  p^{j}  \sqrt{p}  q^{k}  \sqrt{q}  j^{-\left( j+1/2\right) }  k^{-\left( k+1/2\right) } $ soit $ f\left( x\right) \sim \frac{1}{\alpha }\left( \frac{n  q}{k}\right) ^{k+1/2}\left( \frac{n  p}{j}\right) ^{j+1/2} $.
  6. Développement limité. En posant $ A_{j}=\left( j+\frac{1}{2}\right) \ln \left( \frac{j}{n  p}\right) $ et $ B_{k}=\left( k+\frac{1}{2}\right) \ln \left( \frac{k}{n  q}\right) $, on obtient $ \ln \left( \alpha   f\left( x\right) \right) =-A_{j}-B_{k} $. En substituant $ j=x  \sigma +\frac{1}{q}\sigma ^{2} $ et $ \frac{j}{n  p}=\frac{j  q}{n  p  q}=\frac{\sigma ^{2}+x  q  \sigma }{\sigma ^{2}}=1+\frac{x  q}{\sigma } $, les techniques usuelles de développement limité donnent :

    $\displaystyle \left\{ \begin{array}{rcl}
A_{j} & = & -\sigma   x-\frac{1}{2} ...
...{1}{\sigma }+\mathrm{O}\left( \frac{1}{\sigma ^{2}}\right)
\end{array}\right. $

  7. On a donc $ f\left( x\right) =\frac{1}{\alpha }\exp \left( -\frac{x^{2}}{2}\right) \exp \l...
...right) \frac{1}{\sigma }+\mathrm{O}\left( \frac{1}{\sigma ^{2}}\right) \right) $, ce qui montre à la fois la convergence $ f\left( x\right) \rightarrow \frac{1}{\alpha }\exp \left( -\frac{x^{2}}{2}\right) $ et le fait que celle-ci est plus lente lorsque $ p$ ou $ q $ est proche de $ 0 $.
  8. La constante $ \alpha $ est déterminée par le fait que $ \int _{\mathbb{R}}f\left( x\right)   \mathrm{d}x=1 $. Posant $ \displaystyle G=\int _{-\infty }^{\infty }\exp \left( -\frac{1}{2}x^{2}\right)   \mathrm{d}x$, on a $ \displaystyle G^{2}=\int _{\mathbb{R}}\exp \left( -\frac{1}{2}x^{2}\right)   ...
...}x\times \int _{\mathbb{R}}\exp \left( -\frac{1}{2}y^{2}\right)   \mathrm{d}y $ $ \displaystyle =\int \int _{plan}\exp \left( -\frac{1}{2}x^{2}\right)   \exp \left( -\frac{1}{2}y^{2}\right)   \mathrm{d}x  \mathrm{d}y $. Passant en polaire, on a donc $ \displaystyle G^{2}=\int \int _{plan}\exp \left( -\frac{1}{2}\rho ^{2}\right) ...
...theta =2  \pi \int _{0}^{\infty }\exp \left( -u\right)   \mathrm{d}u=2  \pi $.

Figure 8: Un exemple avec $ p$ petit.
$ \binom{20}{k}  .1^{k}  .9^{\left( 20-k\right) } $ \resizebox*{0.37\columnwidth}{0.25\textheight}{\includegraphics{figures/lim_bin_1.eps}} \resizebox*{0.37\columnwidth}{0.25\textheight}{\includegraphics{figures/lim_bin_2.eps}}


Figure 9: Sans changer $ p$, mais avec $ n$ plus grand.
$ \binom{80}{k}  .1^{k}  .9^{\left( 80-k\right) } $ \resizebox*{0.37\columnwidth}{0.25\textheight}{\includegraphics{figures/lim_bin_3.eps}} \resizebox*{0.37\columnwidth}{0.25\textheight}{\includegraphics{figures/lim_bin_4.eps}}


Figure 10: Convergence plus rapide lorsque $ p=0.5$.
$ \binom{10}{k}  .5^{k}  .5^{\left( 10-k\right) } $ \resizebox*{0.37\columnwidth}{0.25\textheight}{\includegraphics{figures/lim_bin_5.eps}} \resizebox*{0.37\columnwidth}{0.25\textheight}{\includegraphics{figures/lim_bin_6.eps}}



Table 2: Loi normale (cumulative) : table courte.
\begin{table}\begin{displaymath}
\begin{array}{ccccccccccc}
& -.9 & -.8 & -.7 &...
...9 & .999 & 1 & 1 & 1 & 1 & 1 & 1 & 1
\end{array}\end{displaymath}\par\end{table}



Table 3: Loi normale (cumulative) : table longue.
\begin{table}\begin{displaymath}
\begin{array}{ccccccccccc}
& 0. & .01 & .02 & ...
...9994 & .9994 & .9995 & .9995 & .9995
\end{array}\end{displaymath}\par\end{table}


7.2 Propriétés élémentaires

  1. Définition : loi normale réduite (loi de Gauss). Elle est caractérisée par sa densité :

    $\displaystyle f\left( z\right) =\frac{1}{\sqrt{2\pi }}\exp \left( -\frac{1}{2}z^{2}\right) $

    Il est indispensable de repérer comment obtenir à la calculette les valeurs de $ f\left( z\right) $ et de la fonction de répartition $ F\left( z\right) =\int _{-\infty }^{z}f\left( t\right)   \mathrm{d}t$ .
    exo 52.  Déterminer $ Pr\left( X<0 \right) $, $ Pr\left( 2<X<3 \right) $, $ Pr\left( \left\vert X\right\vert <2 \right) $, $ Pr\left( X<-2\: ou\: 2<X \right) $.
    exo 53.  Déterminer $ x$ tel que $ Pr\left( X<x \right) =0.9625 $, puis $ Pr\left( -x<X<x \right) =0.9625 $, puis $ Pr\left( 0<X<x \right) =0.35 $, et enfin $ Pr\left( -2<X<x \right) =0.50 $.
  2. Remarque : par construction l'espérance de $ z $ est nulle, et sa variance vaut $ 1 $.
  3. Définition : loi normale. La loi normale générale $ Norm\left( \mu ,  \sigma \right) $ est définie par la densité $ f\left( x\right) =\frac{1}{\sigma \sqrt{2\pi }}\exp \left( -\frac{1}{2}\left( \frac{x-\mu }{\sigma }\right) ^{2}\right) $.
    On a donc $ \int _{-\infty }^{+\infty }f\left( t\right)   \mathrm{d}t=1 $, $ \mathrm{E}\left( X \right) =\int _{-\infty }^{+\infty }t  f\left( t\right)   \mathrm{d}t=\mu $ et $ \mathrm{var}\left( X \right) =\sigma ^{2} $.
  4. La loi normale réduite est donc $ Norm\left( 0,  1\right) $.
    exo 54.  Si les âges d'un groupe de personnes sont distribués suivant la loi $ Norm\left( 41,  8\right) $, quel est le pourcentage des membres de ce groupe ayant : (a) moins de 53 ans ; (b) au moins 35 ans ; (b) entre 25 et 49 ans ?
    exo 55.  On sait que la variable $ X $ suit une loi normale et que $ Pr\left( X<8 \right) =0.35 $ et $ Pr\left( 15<X \right) =0.16 $. Déterminer $ \mu $ et $ \sigma $.
    exo 56.  Les âges d'un groupe d'étudiants sont répartis suivant la loi $ Norm\left( 22,  2\right) $. Quel est l'âge moyen du tiers le plus jeune ?
  5. En pratique, on approxime $ Bin\left( n,  p\right) $ par $ Norm\left( n  p,  \sqrt{n  p  q}\right) $ lorsque $ n  p  q>9 $.
  6. Si $ X $ est une variable normale, $ Y=a  X+b $ est aussi une variable normale. On a donc $ a  X+b=Norm\left( a  \mu +b,  \left\vert a\right\vert \sigma \right) $.
  7. Une somme de variables normales indépendantes est encore une variable normale. On a donc $ X_{1}+X_{2}=Norm\left( \mu _{1}+\mu _{2},  \sqrt{\sigma _{1}^{2}+\sigma _{2}^{2}}\right) $.
    exo 57.  Le fameux exercice des plaques de chocolat. Une presse façonne des plaques de chocolat dont le poids $ X $ suit une loi normale d'espérance $ m $ et d'écart-type $ \sigma =3 $ (grammes). Le réglage de la presse permet de modifier $ m $ par pas de $ 0.1 $ grammes sans affecter $ \sigma $.
    Les services du contrôle économique admettent que $ 2.5\% $ du nombre des articles de cette nature puissent peser moins que le poids net mentionné sur l'emballage.
    (a) Déterminer $ m $ pour respecter la tolérance administrative lorsque le poids net marqué est $ 250 $ grammes.
    (b) On met en fabrication $ 100  000 $ plaques de chocolat qui seront vendues par lots de 2 plaques avec pour mention "poids net $ 500 $ grammes". Déterminer $ m $ ainsi que l'économie réalisée.
  8. Règle des sigmas :
    $ 68\% $ ( $ \approx 2/3 $) de l'effectif dans $ \left[ \mathrm{E}\left( X \right) -\sigma   ,  \mathrm{E}\left( X \right) +\sigma \right] $,
    $ 95\% $ de l'effectif dans $ \left[ \mathrm{E}\left( X \right) -2\sigma   ,  \mathrm{E}\left( X \right) +2\sigma \right] $,
    $ 99\% $ de l'effectif dans $ \left[ \mathrm{E}\left( X \right) -2.5\sigma   ,  \mathrm{E}\left( X \right) +2.5\sigma \right] $ et
    $ 99.7\% $ de l'effectif dans $ \left[ \mathrm{E}\left( X \right) -3\sigma   ,  \mathrm{E}\left( X \right) +3\sigma \right] $.

7.3 Théorème central limite

  1. Si $ X_{1},  \cdots ,  X_{n} $ sont des variables indépendantes, de moyennes $ \mathrm{E}\left( X \right) _{j} $ et de variances $ \mathrm{var}\left( X \right) _{j} $, on sait que leur somme $ Y_{n} $ a pour moyenne $ \mu _{n}\doteq \sum \mathrm{E}\left( X \right) _{j} $ et pour variance $ \sigma _{n}^{2}\doteq \sum \mathrm{var}\left( X \right) _{j} $. Si de plus $ \sigma _{n}^{2}\rightarrow \infty $ lorsque $ n\rightarrow \infty $ alors la variable réduite $ Z_{n}=\frac{Y_{n}-\mu _{n}}{\sigma _{n}} $ tend vers la loi normale réduite $ Norm\left( 1,  0\right) $.
  2. En particulier la loi de la moyenne $ Y $ de $ n$ variables indépendantes $ X_{j} $ de même loi (avec $ \mu \doteq \mathrm{E}\left( X \right) _{j} $ et $ \sigma ^{2}\doteq \mathrm{var}\left( X \right) _{j} $) est approximativement $ Norm\left( \mu ,  \sigma \frac{1}{\sqrt{n}}\right) $.
  3. Le théorème central limite redonne la convergence vers la loi normale de la variable réduite d'une loi binomiale.
  4. Moyenne d'échantillon. Soit $ X $ une variable aléatoire et $ n>0 $ un entier fixé. On appelle échantillon un ensemble de $ n$ instanciations indépendantes de la variable $ X $. La moyenne $ \mu $ de cet échantillon est une nouvelle variable aléatoire, d'espérance $ \mathrm{E}\left( X \right) $ et de variance $ \frac{1}{n}\mathrm{var}\left( X \right) $. Le TCL montre que la loi de $ Z=\frac{\mu -\mathrm{E}\left( X \right) }{\sqrt{\mathrm{var}\left( X \right) /n}} $ converge vers la loi normale (sans avoir à supposer que la loi de $ X $ est proche de la loi normale). Comme $ Pr\left( \left\vert Z\right\vert \leq 2 \right) \approx 0.95 $, on voit que $ \mu $ a $ 95\% $ de chances de se trouver dans un intervalle de rayon $ 2\sqrt{\frac{\mathrm{var}\left( X \right) }{n}} $ autour de $ \mathrm{E}\left( X \right) $.


previous up next contents
Previous: 6 Variables à densité Up: Statistiques pour l'ingénieur Next: 8 Approximations   Contents


douillet@ensait.fr
2002-11-20