Previous: 1 Distributions statistiques univariées
Up: Statistiques pour l'ingénieur
Next: 3 Probabilités
  Contents
Subsections
- Définition : distribution bivariée. On recense deux caractères. Les
mesures sont donc formées de couples
.
- Définition : DO. Il s'agit de la série brute des données recensées.
- Définition : DG et tableau de contingence. On regroupe les données
de chaque sorte (les
et les
) en classes. Et on présente
le tout dans un tableau, le tableau de contingence.
- Notations. Nous allons suivre l'exemple donné par le tableau ci-dessous
:
- Le caractère
est mesuré par des valeurs isolées (caractère
discret), les
sont mesurés par des intervalles (caractère
continu, discrétisé pour les besoins de la mesure, ou bien par raison
de simplification du recensement)
- Nous indexons les
par la lettre
et ici
.
Nous indexons les
(plus précisément : les centres de classes)
par la lettre
et ici
.
Ainsi
(il serait plus correct d'écrire
).
- L'effectif total se note
(ici
) et l'effectif
de chaque case se note
. Ainsi
veut
dire que le recensement a trouvé, dans la population
,
individus tels que
et
.
- Définition : distribution marginale. S'appelle ainsi parce qu'on note
les valeurs correspondantes dans les marges du tableau. Il s'agit
de la distribution de
seul (en oubliant les valeurs de
),
ou de la distribution de
seul. Les effectifs marginaux se
notent :
et
.
Les fréquences marginales sont
et
.
- Ruse technique. Le calcul des paramètres de dispersion des deux distributions
marginales requiert le calcul des quantités
,
,
,
et
.
On utilise deux méthodes différentes, de façon à contrôler les résultats
obtenus.
- De là
,
et donc
.
Et de même
,
et
.
- Caveat : ne pas confondre avec indépendance linéaire.
- Définition : distribution conditionnelle. La distribution d'une modalité
conditionnée par une valeur effectivement atteinte par l'autre modalité
est la distribution de la sous-population correspondante. Ainsi, la
distribution en fréquence de
conditionnée par
est
.
Celle conditionnée par
est
.
- Définition : indépendance complète. On dit que
et y sont
complètement indépendantes lorsque toutes les distributions de
conditionnées par les diverses valeurs de
sont égales entre
elles.
exo 12. Montrer que ces distributions sont alors égales à la distribution
marginale.
exo 13. Montrer que cette relation est symétrique en
et
.
exo 14. Montrer que l'on peut alors reconstituer le tableau de
contingence à partir des distributions marginales.
- Objectif. On cherche
telle que
soit minimale.
- Définition : covariance. On pose
.
- Résultat. On remarquera la disparition de
qui n'a pas
forcément de signification (lorsque
n'est pas réaliste).
 |
(1) |
- Calcul effectif. On complète le tableau précédent. On remarquera que
la ligne
n'est plus seulement un
élément de vérification du calcul de
,
mais est un élément indispensable pour le calcul de
.
- Dans l'exemple,
, d'où
.
De là
et la droite
de régression est
.
- On peut faire la même chose dans le sens
vers
. Cela
donne le même coefficient de corrélation, mais les droites de tendance
ne sont pas les mêmes.
- Caveat : ne pas confondre avec indépendance totale.
- Théorèmes. Sur l'espace des variables, la moyenne est une forme linéaire.
Sur l'espace des variables centrées, la variance est une forme quadratique,
dont la covariance est la polarisée. On a donc :
- Formule de calcul (Koenig). On a
.
- Définition : coefficient de corrélation. On pose
.
Ce coefficient est une grandeur sans dimensions (c'est à dire un nombre).
exo 15. Montrer
est toujours compris dans l'intervalle
.
- Réduction de variance. L'intervention du caractère
permet
d'expliquer
% de la variance du caractère
.
On a en effet
- Définition. L'indépendance linéaire est
.
- Théorème : en cas d'indépendance linéaire, on a
.
- Dans l'exemple, on a
. Le caractère
intervient dans
de la variance
de
: les caractères
et
sont linéairement
indépendants.
exo 16. On considère les
couples définis par
et par
. Poser les calculs et conclure.
www.obs-vlfr.fr/enseigne/maitp6/poly_exo/corrregr.htm
: Maîtrise BPE (upmc)
exo 17. On considère la série de points :
- Les sommes valent :
- Les paramètres de dispersion valent
- Le facteur de réduction de variance et l'écart-type résiduel valent :
et
- La droite de régression est
Figure:
Exemple de régression affine
|
|
exo 18. On recommence avec les points :
- On trouve
- D'où les paramètres de dispersion :
- Et donc
et
.
- La droite de régression est
Figure:
deuxième exercice
|
|
exo 19. On recommence avec
- On trouve
- D'où
- Puis
et
- La droite est
.
Figure:
Troisième exercice.
|
|
exo 20. On a 50 points
avec
et
. Sur une même ligne du tableau,
est constant.
Sur une même colonne,
est constant :
- Calculer les diverses sommes relatives à cette distribution.
- On obtient
,
,
puis
- Compléter le dessin, en traçant la bande de confiance.
Figure:
Distribution groupée.
|
|
Previous: 1 Distributions statistiques univariées
Up: Statistiques pour l'ingénieur
Next: 3 Probabilités
  Contents
douillet@ensait.fr
2002-11-20