previous up next contents
Previous: 2. Loi et test Up: Aide à la décision Next: 4. Méthodes de simulation   Contents

Subsections

3. Loi $ t$ de Student-Fisher

3.1 Rappel du contexte

Fact 3.1.1   Lorsque $ x$ suit approximativement la loi normale avec $ \mathrm{E}\left(x\right)=\mu$ et $ \mathrm{var}\left(x\right)=\sigma^{2}$, alors la variable réduite $ k\doteq\left(x-\mu\right)/\sigma$ suit approximativement la loi de Gauss et la variable $ k^{2}$ suit une loi du $ \chi ^{2}$ à un degré de liberté (Theorem 1.2.19).

Remark 3.1.2   Si l'on est en train d'estimer $ \mu$, il est peu vraisemblable que l'on connaisse exactement $ \sigma$ !

Proposition 3.1.3   L'estimateur $ s^{2}$ issu d'un échantillon de taille $ n$ est relié à la valeur exacte $ \sigma^{2}$ par une loi du $ \chi ^{2}$ à $ \nu=n-1$ degrés de libertés. Plus précisément, lorsque $ n$ est assez grand ou bien lorsque la variable suit approximativement une loi normale, alors $ \nu\, s^{2}/\sigma^{2}$ est une variable $ \chi_{\nu}^{2}$.

Preuve. Cf Proposition 2.2.10. $ \qedsymbol$

Fact 3.1.4   D'après la définition du facteur de couverture et du facteur de Fisher, on a :

$\displaystyle m-\mu=k\,\sigma=t\, s$ (3.1)

3.2 Présentation de la loi de Student-Fisher

Remark 3.2.1   En posant $ X=k$ et $ Y=s/\sigma$ dans (3.1), on a $ \mathrm{E}\left(X^{2}\right)=\mathrm{E}\left(Y^{2}\right)=1$.

Definition 3.2.2   La loi de Student-Fisher à $ \nu$ degrés de liberté est, par définition, la loi du quotient $ t\doteq X/Y$ lorsque $ X$ est une variable normale réduite (loi de Gauss) et que $ y\doteq\nu\, Y^{2}$ est une variable $ \chi ^{2}$ à $ \nu$ degrés de liberté.

Theorem 3.2.3   La densité de probabilité d'une variable de Student-Fisher est donnée par :

$\displaystyle Student\_Fischer=\left(1+\frac{t^{2}}{\nu}\right)^{-\left(\nu+1\r...
...left(\frac{\nu+1}{2}\right)}{\sqrt{\pi\,\nu}\,\Gamma\left(\frac{\nu}{2}\right)}$ (3.2)

Preuve. La variable $ x\doteq X^{2}$ suit la loi $ \chi_{1}^{2}$ et l'on a $ x=t^{2}\, y/\nu$. On peut donc déterminer la loi de $ t$ par la formule des probabilités totales :

$\displaystyle \mathrm{pdf}\left(t\right)=\int_{y=0}^{y=\infty}f\left(\frac{y\, t^{2}}{\nu}\right)\, g\left(y\right)\,\frac{y\,\left\vert t\right\vert}{\nu}\, dy$

Dans cette formule, $ y\,\left\vert t\right\vert/\nu$ est la moitié du jacobien de la transformation $ \left(t,\, y\right)\mapsto\left(x,\, y\right)$ puisque chaque couple $ \left(x,\, y\right)$ possède deux antécédents équiprobables. Les substitutions :

$\displaystyle f\left(x\right)=\frac{1}{\sqrt{2\,\pi\, x}}\,\exp\left(-x/2\right...
...ght)}}{2^{\left(\nu/2\right)}\,\Gamma\left(\nu/2\right)}\,\exp\left(-y/2\right)$

et le changement de variable $ u=y\,\left(1+t^{2}/\nu\right)$ permettent de conclure. $ \qedsymbol$

3.3 Théorème de Fisher

Theorem 3.3.1 (Fisher)   Pour une population normale, ou pour un échantillon "assez grand", le rapport $ k/\left(s/\sigma\right)$ se comporte comme une variable de Student-Fisher à $ n-1$ degrés de liberté. On a donc :

$\displaystyle \mu=m+t\,\frac{s}{\sqrt{n}}\quad;\quad t\; variable\: de\: Student-Fischer$ (3.3)

Remark 3.3.2   Comme $ s$ est une approximation de $ \sigma$, le facteur de couverture (pour un risque donné) va augmenter, et l'intervalle s'élargir. En outre la distribution de $ t$ dépend de la taille de l'échantillon.

Remark 3.3.3   Tabulation. Il est usuel de donner le facteur de couverture en fonction du seuil de confiance et du nombre de degrés de liberté $ \nu=n-1$.


TAB. 3.1: Facteur de couverture (loi de Student-Fisher)
\begin{tabular}{\vert c\vert\vert c\vert c\vert c\vert c\vert}
\hline
$\nu\diag...
...wline
\hline
1000&
.968&
1.96&
2.58&
3.30\tabularnewline
\hline
\end{tabular}


Scilab 3.3.4   La distribution cumulative de la loi de student est cdft('PQ',t,$ \nu$). Se reporter à l'aide en ligne pour les détails de syntaxe.

Exercise 3.3.5   Utiliser Scilab pour retrouver la TAB. 3.1.

FIG.: Loi de Student (pour $ \nu=1,\,3,\,5$). En gras, la loi normale ( $ \nu =\infty $).
% latex2html id marker 9004
\includegraphics[width=14cm,height=7cm]{figures/student}

Remark 3.3.6   Conclusion : utiliser $ s$ à la place de $ \sigma$ élargit l'intervalle de couverture. Pour une sécurité à $ 67\%$, trois prélèvements suffisent (facteur $ 1.28)$. Pour une sécurité à $ 99\%$, six prélèvements conduisent à un facteur $ 4$ (au lieu de $ 2.6$).

Example 3.3.7   On a sélectionné l'échantillon $ \left\{ 11,\,12,\,14,\,10\right\} $ au sein d'une population que l'on suppose distribuée selon une loi normale. Que dire de la moyenne de la population ? Les calculs donnent :
$\displaystyle m$ $\displaystyle =$ $\displaystyle 11.75$  
$\displaystyle s^{2}$ $\displaystyle =$ $\displaystyle \frac{1}{3}\sum\left(x-11.75\right)^{2}=2.917=\left(1.71\right)^{2}$  

Si l'on se fixe $ 95\%$ comme seuil de confiance, le facteur de couverture vaut $ t=3.18$ (car $ \nu=3$) et le rayon de l'intervalle est $ 3.18\times1.71/\sqrt{4}=2.72$. On aboutit à $ \mu=11.75\pm2.72$ soit

$\displaystyle 9\leq\mu\leq14.5$

Example 3.3.8   On a sélectionné l'échantillon $ \left\{ 80,\,115,\,101,\,97,\,103\right\} $ au sein d'une population que l'on suppose distribuée selon une loi normale. Que dire de la moyenne de la population ? Les calculs donnent :
$\displaystyle m$ $\displaystyle =$ $\displaystyle 99.20$  
$\displaystyle s^{2}$ $\displaystyle =$ $\displaystyle 160.20=\left(12.66\right)^{2}$  

Si l'on se fixe $ 95\%$ comme seuil de confiance, le facteur de couverture vaut $ t=2.78$ (car $ \nu=4$) et le rayon de l'intervalle est $ 2.78\times12.66/\sqrt{5}=15.73$. On aboutit à $ \mu=99.20\pm15.73$ soit

$\displaystyle 83\leq\mu\leq115$

Exercise 3.3.9   Déterminer la taille de l'échantillon susceptible de donner un encadrement de même largeur, mais au risque de $ 1/1000$.


previous up next contents
Previous: 2. Loi et test Up: Aide à la décision Next: 4. Méthodes de simulation   Contents


douillet@ensait.fr
2007-12-26