previous up next contents
Previous: 2. Loi et test Up: Aide à la décision Next: 4. Méthodes de simulation   Contents

Subsections

3. Loi $ t$ de Student-Fischer

3.1 Présentation de la loi de Student-Fischer

Definition 3.1.1   La loi de Student-Fischer à $ \nu$ degrés de liberté est, par définition, la loi du quotient $ t\doteq s/u$ lorsque $ u$ est une variable normale réduite (loi de Gauss) et que $ s^{2}$ est la moyenne des carrés de $ \nu$ variables de Gauss indépendantes (autrement dit $ \nu\, s^{2}$ suit la loi du $ \chi ^{2}$ à $ \nu$ degrés de liberté).

Theorem 3.1.2   La densité de probabilité d'une variable de Student-Fischer est donnée par :

$\displaystyle Student\_ Fischer=\left(1+\frac{t^{2}}{\nu}\right)^{-\left(\nu+1\...
...left(\frac{\nu+1}{2}\right)}{\sqrt{\pi\,\nu}\,\Gamma\left(\frac{\nu}{2}\right)}$ (3.1)

Preuve. Les densités de probabilités $ f$ et $ g$ de $ x=u^{2}$ et de $ y=\nu\, s^{2}$ valent :
$\displaystyle f\left(x\right)$ $\displaystyle =$ $\displaystyle \frac{\exp\left(-x/2\right)}{\sqrt{2\,\pi\, x}}$ (3.2)
$\displaystyle g\left(y\right)$ $\displaystyle =$ $\displaystyle \frac{y^{\left(\nu/2-1\right)}\,\exp\left(-y/2\right)}{2^{\left(\nu/2\right)}\,\Gamma\left(\nu/2\right)}$  

avec $ \Gamma\left(1/2\right)=\sqrt{\pi}$, $ \Gamma\left(3/2\right)=\left(1/2\right)\Gamma\left(1/2\right)$, $ \Gamma\left(5/2\right)=\left(3/2\right)\Gamma\left(3/2\right)$, etc.

Si l'on pose $ \xi=\ln x$, la densité de $ \xi$ vaut $ x\, f\left(x\right)=\exp\xi\, f\left(\exp\xi\right)$. Si l'on pose $ \eta=\ln\left(y/\nu\right)$, la densité de $ \eta$ est $ \nu\, y\, g\left(y\right)=\nu\,\exp\eta\, g\left(\exp\eta\,\nu\right)$. La densité de probabilité de $ \zeta\doteq\eta-\xi$ s'obtient par convolution. Elle vaut donc :

$\displaystyle \int\nu\,\exp\eta\, g\left(\exp\eta\,\nu\right)\times\exp\left(\zeta-\eta\right)\, f\left(\exp\left(\zeta-\eta\right)\right)\,\mathrm{d}\eta$

Posons $ z=y/x=\exp\zeta$. Une transformation exponentielle donne :
$\displaystyle Pr\left(\mathbf{z}\in\left[z,\, z+\mathrm{d}z\right]\right)$ $\displaystyle =$ $\displaystyle \mathrm{d}z\,\nu\,\int_{0}^{\infty}f\left(z\, y\right)\,\mathrm{g}\left(\nu\, y\right)\, y\,\mathrm{dy}$  
  $\displaystyle =$ $\displaystyle \mathrm{d}z\,\left(1+\frac{z}{\nu}\right)^{-\left(\nu+1\right)/2}...
...2}\right)}{\sqrt{\pi\,\nu}\,\Gamma\left(\frac{\nu}{2}\right)}\frac{1}{\sqrt{z}}$  

On obtient le résultat annoncé par un dernier changement de variable, la variable intéressante étant $ t=s/u$ et non $ z=s^{2}/u^{2}=t^{2}$. $ \qedsymbol$

3.2 Rappel du contexte

Definition 3.2.1   Variable réduite. Avec les notations $ \mathrm{E}\left(x\right)=\mu$ et $ \mathrm{var}\left(x\right)=\sigma^{2}$, on pose

$\displaystyle z\doteq\frac{x-\mu}{\sigma}\qquad;\qquad x=\mu+z\,\sigma$

Proposition 3.2.2   Echantillonage de la moyenne. La moyenne $ m$ d'un échantillon est une nouvelle variable aléatoire, d'espérance $ \mathrm{E}\left(m\right)=\mathrm{E}\left(X\right)$. Elle peut donc servir à estimer la moyenne de la population. Le fait que $ \mathrm{var}\left(m\right)=\frac{1}{n}\mathrm{var}\left(X\right)$ montre que la précision augmente avec $ n$. En résumé :

$\displaystyle {\displaystyle \mathrm{E}\left(m\right)=\mathrm{E}\left(X\right)\qquad;\qquad\mathrm{var}\left(m\right)=\frac{1}{n}\mathrm{var}\left(X\right)}$

Theorem 3.2.3   TCL. La variable réduite associée à la moyenne d'échantillon se comporte comme une variable de Gauss lorsque $ x$suit une loi normale ou bien lorsque $ n$ est assez grand (indépendamment de la loi de $ x$). Autrement dit, on a :

$\displaystyle \mu=m+k\,\frac{\sigma}{\sqrt{n}}\quad;\quad k\; variable\: de\: Gauss$ (3.3)

Le facteur de couverture est donné par la "règle des sigmas" : un sigma pour deux tiers, deux sigmas pour $ 95\%$ et trois sigmas pour $ 99.7\%$.

Remark 3.2.4   Si l'on est en train d'estimer $ \mu$, il est peu vraisemblable que l'on connaisse exactement $ \sigma$ !

Proposition 3.2.5   Echantillonage de la variance. La quantité $ s^{2}=s^{2}\doteq\frac{n}{n-1}\sigma_{n}^{2}$ est une nouvelle variable aléatoire (dans cette formule, $ \sigma_{n}^{2}$ désigne la variance de l'échantillon). L'utilisation de $ s^{2}$ comme estimateur de $ \sigma^{2}=\mathrm{var}\left(X\right)$ est fondée sur les formules :

$\displaystyle {\displaystyle \mathrm{E}\left(s^{2}\right)=\mathrm{var}\left(X\r...
...ft(\mathrm{M}^{4}-\frac{\left(n-3\right)}{\left(n-1\right)}\,\sigma^{4}\right)}$

$ \mathrm{M}^{4}=\mathrm{E}\left(\left(X-\overline{X}\right)^{4}\right)$ est le moment d'ordre $ 4$.

3.3 Théorème de Fischer

Theorem 3.3.1 (Fischer)   Pour une population normale, ou pour un échantillon "assez grand", le rapport $ k/\left(s/\sigma\right)$ se comporte comme une variable de Student-Fischer à $ n-1$ degrés de liberté. On a donc :

$\displaystyle \mu=m+t\,\frac{s}{\sqrt{n}}\quad;\quad t\; variable\: de\: Student-Fischer$ (3.4)

Remark 3.3.2   Comme $ s$ est une approximation de $ \sigma$, le facteur de couverture (pour un risque donné) va augmenter, et l'intervalle s'élargir. En outre la distribution de $ t$ dépend de la taille de l'échantillon.

Remark 3.3.3   Tabulation. Il est usuel de donner le facteur de couverture en fonction du seuil de confiance et du nombre de degrés de liberté $ \nu=n-1$.


TAB. 3.1: Facteur de couverture (loi de Student-Fischer)
\begin{tabular}{\vert c\vert\vert c\vert c\vert c\vert c\vert}
\hline
$\nu\diag...
...wline
\hline
1000&
.968&
1.96&
2.58&
3.30\tabularnewline
\hline
\end{tabular}


FIG.: Loi de Student (pour $ \nu=1,\,3,\,5$). En gras, la loi normale ( $ \nu =\infty $).
% latex2html id marker 8752
\includegraphics[%
width=14cm,
height=7cm]{figures/student.eps}

Remark 3.3.4   Conclusion : utiliser $ s$ à la place de $ \sigma$ élargit l'intervalle de couverture. Pour une sécurité à $ 67\%$, trois prélèvements suffisent (facteur $ 1.28)$. Pour une sécurité à $ 99\%$, six prélèvements conduisent à un facteur $ 4$ (au lieu de $ 2.6$).

Example 3.3.5   On a sélectionné l'échantillon $ \left\{ 11,\,12,\,14,\,10\right\} $ au sein d'une population que l'on suppose distribuée selon une loi normale. Que dire de la moyenne de la population ? Les calculs donnent :
$\displaystyle m$ $\displaystyle =$ $\displaystyle 11.75$  
$\displaystyle s^{2}$ $\displaystyle =$ $\displaystyle \frac{1}{3}\sum\left(x-11.75\right)^{2}=2.917=\left(1.71\right)^{2}$  

Si l'on se fixe $ 95\%$ comme seuil de confiance, le facteur de couverture vaut $ t=3.18$ (car $ \nu=3$) et le rayon de l'intervalle est $ 3.18\times1.71/\sqrt{4}=2.72$. On aboutit à $ \mu=11.75\pm2.72$ soit

$\displaystyle 9\leq\mu\leq14.5$

Example 3.3.6   On a sélectionné l'échantillon $ \left\{ 80,\,115,\,101,\,97,\,103\right\} $ au sein d'une population que l'on suppose distribuée selon une loi normale. Que dire de la moyenne de la population ? Les calculs donnent :
$\displaystyle m$ $\displaystyle =$ $\displaystyle 99.20$  
$\displaystyle s^{2}$ $\displaystyle =$ $\displaystyle 160.20=\left(12.66\right)^{2}$  

Si l'on se fixe $ 95\%$ comme seuil de confiance, le facteur de couverture vaut $ t=2.78$ (car $ \nu=4$) et le rayon de l'intervalle est $ 2.78\times12.66/\sqrt{5}=15.73$. On aboutit à $ \mu=99.20\pm15.73$ soit

$\displaystyle 83\leq\mu\leq115$

Exercise 3.3.7   Déterminer la taille de l'échantillon susceptible de donner un encadrement de même largeur, mais au risque de $ 1/1000$.


previous up next contents
Previous: 2. Loi et test Up: Aide à la décision Next: 4. Méthodes de simulation   Contents


douillet@ensait.fr
2007-09-25