Previous: 1. Échantillonage
Up: Aide à la décision
Next: 3. Loi de Student-Fischer
  Contents
Subsections
Definition 2.1.1
Une "bonne" partition de l'ensemble

des
événements possibles est une suite finie de

sous-ensembles

deux à deux disjoints, recouvrant

i.e.

et tels que les probabilités

soient toutes non nulle.
Definition 2.1.2
Soient donnés une variable aléatoire

, une bonne partition

de l'ensemble de ses valeurs et

un nombre d'essais. On procède
à

tirages de la variable

et on appelle

le nombre
de fois où la variable

est tombée dans le sous-ensemble

(nombre de visites). L'indicateur de Pearson est défini par :
 |
(2.1) |
Exercise 2.1.3
On lance un dé équilibré

fois. Les nombres de visites sont

,

. Calculer le

associé.
Exercise 2.1.4
Même question avec

, puis avec

.
Remark 2.1.5
L'espérance de

(sur l'ensemble de tous les essais possibles)
vaut

. Le test consiste donc à calculer l'écart entre
les valeurs probables et les valeurs effectivement obtenues.
Theorem 2.1.6
L'espérance et la variance du
de Pearson sur l'ensemble
des échantillons de taille
donnée sont données par les formules :
Exercise 2.1.7
On reprend les exercices sur les lots de

lancers d'un dé équilibré.
Calculer les valeurs de la variable réduite associée.
Exercise 2.1.8
Montrer que, pour

et

fixés, la valeur minimale de

est

.
Remark 2.1.9
La relation

est une formule exacte,
indépendante de toute hypothèse sur la loi de la variable

,
ainsi que des valeurs prises par les

(c'est à dire indépendante
du choix de la partition). La seule chose qui compte est le nombre

des classes et le fait que

.
Remark 2.1.10
Il est très peu vraisemblable que

. Autrement
dit, des résultats trop loin des prévisions sont mauvais, mais des
résultats "trop bons" ont vraisemblablement été
falsifiés.
Definition 2.2.1
Définition :

(loi du "khi-deux"
à

degré de liberté) est la loi de

lorsque

est une variable normale réduite. On a donc

soit
 |
(2.2) |
Exercise 2.2.2
Déterminer la constante dans la formule
2.2.
Proposition 2.2.3
On a :
 |
(2.3) |
Preuve.
Par définition

. Un peu de calcul conduit
à

.
Definition 2.2.4

(Chi2 avec

degrés de liberté) est la loi
de

lorsque les

variables

sont
des variables normales réduites indépendantes.
Theorem 2.2.5
Les paramètres de la loi du
sont :
 |
(2.4) |
 |
(2.5) |
Exercise 2.2.6
Déterminer la valeur de la constante dans la formule (
2.4).
Exercise 2.2.7
Déterminer la valeur modale (ayant la plus grande densité de probabilité).
Exercise 2.2.9
Démontrer la formule (
2.4) en utilisant des convolutions.
Proposition 2.2.10
Si
est distribuée selon
, si
est distribuée selon
et si de plus
sont indépendantes, alors
est distribuée
selon
.
Remark 2.2.11
La loi du

est très fortement dissymétrique pour les valeurs
pratiques de

. Il n'est donc pas possible de modéliser la loi
du

réduit par la loi normale (en tout cas pour

).
La F
IG.2.1 donne les courbes du

pour

de

à

.
FIG. 2.1:
Loi réduite du
(pour
).
|
|
Theorem 2.3.1
Lorsque
, l'indicateur de Pearson tend à se répartir
selon la "loi du
" (ayant le même nombre
de degrés de liberté).
Preuve.
Ce résulta est montré dans l'annexe
B.2.
Remark 2.3.2
Une évidence. La connaissance de la loi limite n'a aucun intérêt pratique
si l'on ne sait pas fixer un seuil à partir duquel on peut considérer
que

est assez grand pour que l'on puisse appliquer cette loi
limite.
Theorem 2.3.3
Critère de Pearson : "la loi du
" peut
être utilisée pour évaluer le résultat d'un test de Pearson lorsque
chacun des
(les espérances des nombres de visite) vaut
au moins
. Dans le cas contraire, il convient de regrouper des
classes.
Remark 2.3.4
Il faut formuler clairement l'hypothèse à tester, AVANT de
commencer le test.
Theorem 2.3.5
Le nombre de d.o.f. diminue chaque fois qu'un paramètre
est estimé à partir de l'échantillon.
- Rappel préalable sur la loi de Poisson. Il s'agit d'une loi sur les
entiers naturels, avec
Le facteur exponentiel sert à normaliser c'est à dire à avoir
.
On a les résultats suivants :
- Pose du problème : On a une file d'attente. Toutes les cinq minutes,
on note le nombre de clients qui viennent d'arriver. On observe cinq
heures d'affilée, soit
observations. On trouve les valeurs
suivantes :
- Premier test : on cherche à vérifier si la loi des arrivées est une
loi de Poisson, de paramètre
.
- On calcule les fréquences théoriques :
- On calcule le
et on trouve
. D'où la
valeur réduite
.
Pas de rejet de l'hypothèse.
- Comme le nombre probable de visites au dernier état vaut environ 2,
il aurait été préférable de regrouper la dernière classe avec la précédente,
donnant lieu à un test à 4 cases et 3 d.o.f..
- Deuxième test. On se demande si la loi des arrivées est une loi de
Poisson, pour un paramètre ou un autre. Le choix le plus favorable
est alors
.
- On obtient un nouveau tableau théorique :
- On calcule la nouvelle valeur du
et on trouve
. D'où la valeur réduite
.
Pas de rejet non plus (comme de juste, il est plus probable d'avoir
une loi de Poisson d'un paramètre ou un autre, plutôt que d'avoir
une loi d'un paramètre spécifié).
- Ici aussi, le nombre théorique de visites au dernier état est trop
faible, et il aurait mieux valu regrouper la dernière classe avec
l'avant dernière classe, donnant lieu à un test à 4 cases et 2 d.o.f..
Exercise 2.4.1
Reprendre ces deux tests en procédant aux regroupements indiqués.
Previous: 1. Échantillonage
Up: Aide à la décision
Next: 3. Loi de Student-Fischer
  Contents
douillet@ensait.fr
2007-09-25