Previous: Tests d'hypothèses
Up: Tests d'hypothèses
Next: 2 Loi et test
  Contents
Subsections
- Définition : échantillon. Un échantillon de taille
est une
suite de
variables indépendantes et identiquement distribuées
(iid). Lorsque l'on prélève un échantillon au sein d'une population
finie, l'indépendance nécessite que l'on puisse sélectionner le même
individu plusieurs fois de suite (tirage avec remise).
- Les probabilités consistent à partir de la distribution supposée connue
de la population
et a en déduire la distribution de
probabilité sur l'ensemble
de tous les
tirages avec remise de taille
: on veut prévoir le comportement
d'un échantillon non encore sélectionné.
- Les statistiques consistent à partir des propriétés d'un échantillon
déjà sélectionné et à en inférer des propriétés de la population totale.
- Remarque : la population initiale n'est rien d'autre que la population
des échantillons de taille
.
- Un calcul. On extrait un échantillon de taille
à partir
d'une population
,
. On trouve
.
On a
et
,
soit une valeur réduite de
.
En appliquant le modèle normal,
.
- Un autre calcul. On suppose que
. Un premier échantillon,
de taille
, donne
et un deuxième échantillon,
de taille
et prélevé indépendamment, donne
.
On pose
. Si les deux échantillons ont été
prélevés dans une même population, on a
et
+
.
La variable réduite est dont
.
Si l'on utilise le modèle normal, les variables
et
sont indépendantes et normales : leur somme est normale... et
est de l'ordre de
.
- Commentaire. Le premier calcul a montré que
,
c'est à dire ne prouvant rien du tout. Le deuxième
calcul a montré que
, prouvant
que
et donc suggérant de rejeter l'hypothèse
.
- Il convient donc de fixer clairement l'hypothèse testée, et de fixer
le seuil de sécurité voulu. La conclusion est alors ``rien ne prouve
qu'il faille rejeter l'hypothèse'' ou bien ``vu le seuil de rejet
fixé, l'hypothèse doit être rejetée''.
- Rappel : dans ce qui suit, on note
la population globale
et
,
ses paramètres
de dispersion. Lorsque cette population est finie, son effectif est
noté
. On rappelle qu'un échantillon
est une
suite de
instanciations indépendantes de
. Le problème posé est de se renseigner sur
(population) à partir de
(échantillon).
- Remarque d'ordre économique. Si l'on procède à un test destructif,
il serait déraisonnable de ne pas avoir
. Dans tout les
cas, le coût du test est proportionnel à
, tandis que la précision
est (le plus souvent) en
, c'est à dire que deux fois
plus précis coûte quatre fois plus cher. Le dimensionnement est l'une
des questions à se poser.
- Théorème : échantillonage de la moyenne. La moyenne
d'un échantillon est une nouvelle variable aléatoire, d'espérance
. Elle peut donc servir à estimer la
moyenne de la population. Le fait que
montre que la précision augmente avec
. En résumé :
 |
(1) |
exo 1. Application aux échantillons formés par
lancers
successifs d'un dé équilibré.
- En outre, le TCL montre que, lorsque
augmente, la loi de
converge vers la loi de
Gauss (sans autre hypothèse que
). Pour
assez grand,
a environ
de chances de se trouver
dans un intervalle de rayon
autour
de
.
exo 2. Application aux échantillons formés par
lancers
successifs d'un dé équilibré.
- Résultat. La variance
des éléments d'un échantillon
de taille
est une nouvelle variable aléatoire. Son espérance
est
.
exo 3. Démontrer ce résultat en partant de
et utilisant la formule de Koenig (en effet,
n'est pas
la moyenne de l'échantillon).
- Théorème : échantillonage de la variance. On définit
par
. C'est une
nouvelle variable aléatoire. Son utilisation comme estimateur de
est fondée sur les formules :
 |
(2) |
où
est le moment d'ordre
.
exo 4. Application aux échantillons formés par
lancers
successifs d'un dé équilibré.
- Remarque :
n'est ni la variance de l'échantillon (
),
ni la variance de la population (
). La quantité
est un estimateur de la variance globale, obtenu à partir
de la variance de l'échantillon.
Previous: Tests d'hypothèses
Up: Tests d'hypothèses
Next: 2 Loi et test
  Contents
douillet@ensait.fr
2002-12-19