previous up next contents
Previous: A. Compléments Up: Statistiques pour l'ingénieur Next: C. Deux lois utiles   Contents

Subsections


B. Tableau de contingence

B.1 Distribution bivariée, distributions "à la marge"

Definition B.1.1   On appelle "tableau de contingence" une certaine façon de conduire les calculs de régression affine pour une distribution groupée, i.e. une distribution où les données de chaque sorte (les $ x$ et les $ y$) ont été regroupées en classes.

  1. Nous allons suivre l'exemple donné par le tableau ci-dessous :



    $ \downarrow x\quad y\rightarrow$ $ \left]0,\,2\right]$ $ \left]2,\,4\right]$ $ \left]4,\,6\right]$
    $ 1$



    1. Le caractère $ x$ est mesuré par des valeurs isolées (caractère discret), les $ y$ sont mesurés par des intervalles (caractère continu, discrétisé pour les besoins de la mesure, ou bien par raison de simplification du recensement)
    2. Nous indexons les $ x$ par la lettre $ j$ et ici $ j\in\left\{ 1,\,2,\,3\right\} $. Nous indexons les $ y$ (plus précisément : les centres de classes) par la lettre $ k$ et ici $ k\in\left\{ 1,\,2,\,3\right\} $. Ainsi $ y_{2}=3$ (il serait plus correct d'écrire $ \widetilde{y_{2}}=3$).
    3. L'effectif total se note $ N$ (ici $ N=34$) et l'effectif de chaque case se note $ n_{jk}$. Ainsi $ n_{1;3}=2$ veut dire que le recensement a trouvé, dans la population $ \Omega$, $ 2$ individus tels que $ x=1$ et $ 4<y\leq6$.
  2. Les deux distributions marginales s'obtiennent en augmentant le tableau d'une ligne et d'une colonne.



    $ \downarrow x\quad y\rightarrow$ $ \left]0,\,2\right]$ $ \left]2,\,4\right]$ $ \left]4,\,6\right]$ $ n_{j*}$
    $ 1$



B.2 Méthode de calcul

Algorithm B.2.1   Calcul effectif. Dans le cas d'une distribution groupée, il suffit d'ajouter quelques lignes et colonnes au tableau de distribution. La redondance de certains calculs est volontaire (cela permet de vérifier en cours de route). On remarquera que la ligne $ \sum_{j}\, x_{j}\, n_{jk}$ n'est pas seulement un élément de vérification du calcul de $ \sum_{j\, k}\, x_{j}\, n_{jk}$, mais un élément indispensable pour le calcul de $ \sum_{j\, k}\, x_{j}\, y_{k}\, n_{jk}$.

Example B.2.2   : Dans l'exemple ci-dessus, il vient :



$ \downarrow x\quad y\rightarrow$ $ \left]0,\,2\right]$ $ \left]2,\,4\right]$ $ \left]4,\,6\right]$ $ n_{j*}$ $ x_{j}\, n_{j*}$ $ \sum_{k}\, y_{k}\, n_{jk}$ $ x_{j}\,\sum_{k}\, y_{k}\, n_{jk}$
$ 1$



Et l'on obtient : $ \mathrm{moy}\left(x\right)=62/34\approx1.82$, $ \mathrm{moy}\left(x^{2}\right)=\left(1^{2}\times11+2^{2}\times18+3^{2}\times5\right)\div34=128/34$ et donc $ \mathrm{var}\left(x\right)=\frac{128}{34}-\left(\frac{62}{34}\right)^{2}\approx0.44$.
Et de même $ \mathrm{moy}\left(y\right)=86/34\approx2.53$, $ \mathrm{moy}\left(y^{2}\right)=\left(1^{2}\times14+3^{2}\times14+5^{2}\times6\right)\div34=290/34$ et $ \mathrm{var}\left(y\right)=\frac{290}{34}-\left(\frac{86}{34}\right)^{2}\approx2.13$.

Enfin $ \mathrm{moy}\left(x\, y\right)=156/34$, d'où $ \mathrm{cov}\, \frac{156}{34}-\frac{62}{34}\frac{86}{34}\approx-0.024$. De là $ \alpha=\frac{\mathrm{cov}\, }{\mathrm{var}\left(x\right)}\approx-0.055$ et la droite de régression est % latex2html id marker 11579
$ y_{prev}\approx2.13-0.055\left(x-1.82\right)$.


previous up next contents
Previous: A. Compléments Up: Statistiques pour l'ingénieur Next: C. Deux lois utiles   Contents


douillet@ensait.fr
2007-12-14