Up: Return to previous menu
Ensait - E2 - Tests d'hypothèses
Date: Corrigé du DS du 26/11/2003
Tous documents autorisés, ainsi que les
calculettes conformes aux règlements usuels.
Le sujet comporte deux pages.
On a prélevé un premier échantillon de
objets. La moyenne de cet échantillon est
et son écart-type
est
. Puis on a prélevé un deuxième échantillon de
. La moyenne de cet échantillon est
et son
écart-type est
.
- Calculer la moyenne
et l'écart-type
de l'échantillon constitué de la réunion des deux échantillons précédents.
- Il est évident que
.
- On obtient la moyenne générale par pondération des moyennes
- On obtient la variance générale en ajoutant la moyenne des variances
et la variance des moyennes
. On obtient comme écart-type
de l'échantillon
- Tester l'hypothèse selon laquelle les deux échantillons initiaux
auraient été prélevés au sein d'une même population.
- Selon cette hypothèse, notre meilleure estimation de la variance de
la population est
,
tandis que la moyenne d'un échantillon de taille
a pour variance
.
- La variance de la différences des moyennes de deux échantillons prélevés
indépendamment l'un de l'autre est alors
.
- La variable réduite associée est donc
.
Pour des échantillons de cette taille, les moyennes suivent la loi
normale. Il en est de même pour
(différence de variable
normales indépendantes).
- Comme, pour une variable de Gauss, on a
,
il n'y a aucune raison de rejeter cette hypothèse.
- En supposant que la population est homogène et distribuée normalement,
avec un nombre total d'événements égal à
, estimer le nombre
d'objets (de la population totale) vérifiant
.
- La variable réduite associée vaut
,
et la probabilité
vaut
. On a donc
.
- Si l'on fait le même calcul en supposant qu'il y a deux populations
normales, on trouve respectivement
et
individus.
Soit un total de
, à peine différent.
- Donner un intervalle de confiance à
pour le nombre
.
En utilisant le modèle binomial, on obtient un écart-type de
.
Avec un facteur de couverture égal à
, on obtient
.
Au sein d'une certaine population, on a prélevé l'échantillon
suivant :
et on veut en déduire une estimation de la moyenne
de la population.
- Est-il indispensable pour les calculs qui vont suivre de supposer
que la population est distribuée, au moins approximativement, selon
la loi normale ?
- Les moyennes d'échantillon tendent à se comporter comme des variables
normales, même si la population dont les échantillons sont extraits
ne suit pas cette loi.
- La taille de l'échantillon état faible (11), la "loi des
grands nombres" ne pourra pas amortir un trop grand écart
par rapport à la loi normale.
- Estimer la moyenne
de la population pour les seuils
de confiance
et
.
- On obtient
et
.
La quantité
est notre meilleure estimation possible pour
la variance relative aux individus formant la population. La
variance de
considérée comme une variable aléatoire (sur
les différents échantillons possibles, de taille
) est
.
- Pour
, on utilise
dans les tables de Fischer. Pour
le seuil de
, la table donne
. L'encadrement cherché,
donné par la formule
,
est donc
.
- Au seuil de
, le coefficient de Fischer est
et l'intervalle
est
: on peut tout juste estimer que la
moyenne de la population se situe dans l'amplitude de l'échantillon.
- Estimer la taille
de l'échantillon nécessaire pour obtenir
un intervalle de largeur
autour de
(toujours pour les
seuils
et
).
- Comme le coefficient de Fischer dépend de la taille de l'échantillon,
on commence par utiliser le modèle normal (conduisant à une valeur
sous-estimée pour
).
- Au seuil de
, on a donc
(le facteur
vient de ce que
est le diamètre de l'intervalle
voulu, et non son rayon). En résolvant,
.
- Pour ces valeurs de
et
, le coefficient de Fischer est
quasiment égal au coefficient normal. La valeur "exacte"
est
.
- Au seuil de
, on obtient
,
conduisant à
. D'après la table, le coefficient de
Fischer n'est pas très différent du coefficient normal. On peut se
contenter d'arrondir (par excès) et donc prendre
. Le calcul
"exact" donne
.
- Dans les deux cas, nous obtenons une estimation de
à partir d'une
valeur très inférieure (
). Il serait donc illusoire d'espérer
mieux qu'un ordre de grandeur : une meilleure réponse est donc "environ
", "environ
".
On s'intéresse à la méthode de tir dont les résultats
sont les nombres
et les seuils sont les nombres :
- Quel est le facteur de tir de cette méthode ? Quel est le nombre
moyen de tirs par nombre engendré ? Quelles sont les probabilités
correspondantes ?
- On commence par un dessin :
Figure:
La méthode de tir décrite dans l'énoncé.
|
|
- Le facteur de tir est le nombre moyen de succès par essai. Ici :
- Le nombre moyen de tirs par nombre engendré vaut
.
- Les probabilités sont proportionnelles aux chances de succès. On a
donc :
- Moyenne et écart-type de la population engendrée ?
- Par définition,
.
- De même
.
On en déduit
.
- Peut-on utiliser une méthode de tir plus efficace ?
- Oui, en prenant 1 comme chances de l'événement de probabilité maximale.
- On obtient donc :
- Ce qui donne un facteur de tir de
.
- Déterminer (en donnant les étapes du calcul) la méthode de Walker
associée aux mêmes probabilités.
- La méthode de Walker consiste à obtenir
comme facteur de tir
en "recyclant les échecs". Il faut donc fabriquer
une liste de seuils de décision et une suite de décisions alternatives
(appelées
et
dans ce qui suit).
- On commence par lister les événements avec leurs chances respectives,
en normalisant les chances pour que la chance moyenne soit
(ou
bien encore la somme des chances égale au nombre d'événements, ici
). Il vient :
- L'événement de plus faible chance est le
. On prend donc
.
La décision à prendre en cas de dépassement de ce seuil est l'événement
de plus forte chance. On a donc
.
- On reprend la liste des événements en supprimant l'événement
et en tenant compte des chances déjà attribuées à l'événement
.
Ses chances résiduelles sont maintenant
,
et il devient le moins probable des survivants. Il vient :
- A l'étape suivante,
,
. Et les chances
résiduelles de l'événement
sont maintenant :
.
Il vient :
- Finalement, on obtient le tableau suivant :
| événement |
1 |
2 |
3 |
4 |
5 |
6 |
| seuil |
1.00 |
0.90 |
1.00 |
0.80 |
0.45 |
0.95 |
| autre |
"1" |
6 |
"3" |
3 |
4 |
1 |
- Quelle est l'espérance et la variance de la variable
obtenue
en faisant la somme de deux valeurs successives (selon l'équation
) ?
- De toutes façons
.
- Et, à cause de l'indépendance,
.
- Comment pourrait-on engendrer directement la variable
,
c'est à dire sans calculer les
?
- Le tableau ci-dessous donne les probabilités des couples
.
- La probabilité d'une valeur donnée de
s'obtient par des regroupements
de cas, soit :
- On obtient les valeurs :
- On peut vérifier que la somme vaut
et que l'on retrouve les bonnes
valeurs pour la moyenne et la variance.
- Peut-on accepter l'hypothèse selon laquelle les scores :
ont été obtenus selon un processus aléatoire ayant les probabilités
données au problème précédent ?
- L'effectif de l'échantillon est
. Les scores théoriques sont
donc
fois la probabilité, soit :
Les hypothèses de validité du test (pas de score théorique inférieur
à
) sont vérifiées.
- Le calcul du
donne :
- Comme
, on a
et il n'y a
pas lieu de rejeter l'hypothèse proposée.
- Même question pour les scores :
- L'effectif est
. Les mêmes calculs conduisent à :
- D'où
. Il y a grosso modo
de chances
pour dépasser cette valeur (un calcul exact donne une probabilité
de
). D'où léger doute, mais pas de rejet.
Up: Return to previous menu
douillet@ensait.fr
2004-01-21