Previous: 1 Échantillonage
Up: Tests d'hypothèses
Next: 3 Régressions affine et
  Contents
Subsections
- Définition :
(loi du "khi-deux"
à
degré de liberté) est la loi de
lorsque
est une variable normale réduite. On a donc
soit
 |
(3) |
exo 5. Déterminer la constante.
- Formules. Par définition
. Un peu de
calcul conduit à
.
En résumé :
 |
(4) |
- Définition :
(Chi2 à
ddl) est
la loi de
lorsque les
variables
sont des variables normales réduites indépendantes. On
a donc :
 |
(5) |
 |
(6) |
exo 6. Déterminer la valeur de la constante
exo 7. Déterminer la valeur modale (ayant la plus grande densité
de probabilité).
- Rappel : loi de la somme de deux variables indépendantes. Si
et
sont deux variables aléatoires indépendantes, ayant respectivement
et
comme densités de probabilité, alors la variable
a une densité de probabilité qui est donnée par
![$\displaystyle Pr\left( Z\in \left[ z+\mathrm{d}z\right] \right) =\mathrm{d}z ...
..._{u=-\infty }^{u=+\infty }f\left( u\right) g\left( z-u\right) \mathrm{d}u$](img85.png) |
(7) |
Cette opération s'appelle la convolution et se note
.
exo 8. Démontrer la formule (5) par convolutions
- Proposition. Si
est distribuée selon
,
si
est distribuée selon
et
si de plus
sont indépendantes, alors
est distribuée selon
.
- Dissymétrie. La loi du
est très fortement dissymétrique
pour les valeurs pratiques de
. Il n'est donc pas possible
de modéliser la loi du
réduit par la loi normale
(en tout cas pour
). La FIG. 1
donne les courbes du
pour
de
à
.
Figure:
Loi réduite du
(pour
).
|
|
- Définition. Une "bonne" partition de l'ensemble
des événements possibles est une suite finie de
sous-ensembles
deux à
deux disjoints, recouvrant
i.e.
et tels que les probabilités
soient
toutes non nulles.
- Définition. Soient donnés une variable aléatoire
, une bonne
partition
de l'ensemble de ses valeurs
et
un nombre d'essais. On procède à
tirages de la
variable
et on appelle
le nombre de fois où
la variable
est tombée dans le sous-ensemble
.
Le test de Pearson consiste à calculer
 |
(8) |
et à en conclure quelque chose.
exo 9. On lance un dé équilibré
fois. Les nombres
de visites sont
. Calculer
le
associé.
exo 10. Même question avec
,
puis avec
.
- Remarque : l'espérance de
(sur l'ensemble de tous les
essais possibles) vaut
. Le test consiste donc à calculer
l'écart entre les valeurs probables et les valeurs effectivement obtenues.
- Formules. L'espérance et la variance du
de Pearson
sur l'ensemble des échantillons de taille
donnée sont données
par les formules :
exo 11. On reprend les exercices sur les lots de
lancers
d'un dé équilibré. Calculer les valeurs de la variable réduite associée.
exo 12. Montrer que la valeur minimale de
est
.
- Commentaire. La relation
est
une formule exacte, indépendante de toute hypothèse sur la loi de
la variable
, ainsi que des valeurs prises par les
(c'est à dire indépendante du choix de la partition). La seule chose
qui compte est le nombre
des classes et le fait que
.
- Remarque : il est très peu vraisemblable que
.
Autrement dit, des résultats trop loin des prévisions sont mauvais,
mais des résultats "trop bons" ont vraisemblablement
été falsifiés.
- Une évidence. La connaissance de la loi limite n'a aucun intérêt pratique
si l'on ne sait pas fixer un seuil à partir duquel on peut considérer
que
est assez grand pour que l'on puisse considérer que
.
- Critère. On considère généralement que "la loi du
"
peut être utilisée pour évaluer le résultat d'un test de Pearson lorsque
chacun des
(les espérances des nombres de visite)
vaut au moins
. Dans le cas contraire, il convient de regrouper
des classes.
- Il faut formuler clairement l'hypothèse à tester, AVANT de
commencer le test.
- Rappel préalable sur la loi de Poisson. Il s'agit d'une loi sur les
entiers naturels, avec
Le facteur exponentiel sert à normaliser c'est à dire à avoir
.
On a les résultats suivants :
- Pose du problème : On a une file d'attente. Toutes les cinq minutes,
on note le nombre de clients qui viennent d'arriver. On observe cinq
heures d'affilée, soit
observations. On trouve les valeurs
suivantes :
(nombre de clients) |
0 |
1 |
2 |
3 |
4+ |
| nombre d'observations |
 |
 |
 |
 |
 |
- Premier test : on cherche à vérifier si la loi des arrivées est une
loi de Poisson, de paramètre
.
- On calcule les fréquences théoriques :
| nombre de clients |
0 |
1 |
2 |
3 |
4+ |
 |
 |
 |
 |
 |
 |
- On calcule le
et on trouve
.
D'où la valeur réduite
.
Pas de rejet de l'hypothèse.
- Comme le nombre probable de visites au dernier état vaut environ 2,
il est préférable de regrouper la dernière classe avec la précédente,
donnant lieu à un test à 4 cases et 3 ddl.
- Deuxième test. On se demande si la loi des arrivées est une loi de
Poisson, pour un paramètre ou un autre. Le choix le plus favorable
est alors
.
- On obtient un nouveau tableau théorique :
| nombre de clients |
0 |
1 |
2 |
3 |
4+ |
 |
 |
 |
 |
 |
 |
- On calcule la nouvelle valeur du
et on
trouve
. D'où la valeur réduite
.
Pas de rejet non plus (comme de juste, il est plus probable d'avoir
une loi de Poisson d'un paramètre ou un autre, plutôt que d'avoir
une loi d'un paramètre spécifié).
- Ici aussi, le nombre théorique de visites au dernier état est trop
faible, et il vaut mieux regrouper avec l'avant dernière classe, donnant
lieu à un test à 4 cases et 2 ddl.
Le nombre de ddl diminue chaque fois qu'un paramètre
est estimé à partir de l'échantillon.
- Appliquons cet algorithme au
. Pour
,
la substitution de
et de
, suivie d'une complétion
des carrés, permet de transformer
en :
.
- Résultat : en posant
,
et
,
il vient :
- Interprétation. Les quantités
et
ne sont
pas de simples "artifices techniques" et possèdent
une signification fondamentale. Les événements multinomiaux
,
régis par les probabilités
peuvent être obtenus selon l'algorithme suivant. En un premier temps,
est obtenu en
épreuves de Bernoulli indépendantes,
avec
comme probabilité élémentaire, c.à.d selon
la loi binomiale
. Dans une seconde
étape,
est obtenu en
épreuves de
Bernoulli indépendantes, avec
comme probabilité élémentaire. Dans une troisième étape,
est obtenu en
épreuves de Bernoulli indépendantes,
avec
comme probabilité
élémentaire. Et ainsi de suite, jusqu'à l'obtention de
.
Après quoi,
est obtenu par
.
- Passage à la limite. On voit que les coefficients
sont de limite
, tandis que les variables
finissent
par se comporter comme des variables normales réduites lorsque
.
La loi de répartition du
de Pearson a donc pour limite
à l'infini la "loi du
".
- Rappel du critère pratique : il n'est pas question d'augmenter le
nombre tests jusqu'à obtenir
. On se limite
à exiger
.
Previous: 1 Échantillonage
Up: Tests d'hypothèses
Next: 3 Régressions affine et
  Contents
douillet@ensait.fr
2002-12-19