previous up next_inactive
Up: Return to previous menu

Ensait - A1 - Stats

Corrigé du DS du 10/12/2002

1 Statistiques univariées

Le tableau suivant donne le relevé des temps nécessaires au piqûrage de carpettes dans un atelier de fabrication de tapis.

durée (mn) effectif
0 .. 3 2
3 ..6 6
6 .. 9 32
9 .. 12 57
12 .. 15 42
15 .. 18 9
18 .. 21 2


  1. Diagramme des effectifs cumulés croissants et décroissants. Détermination de la médiane et des quartiles.
    1. Le diagramme des effectifs cumulés croissants porte en abscisse les centres de classe et en ordonnée les effectifs des classes inférieures ou égales à la classe considérée. Le diagramme des effectifs cumulés décroissants part de la plus grande classe vers la plus petite.
    2. On obtient les diagrames de la FIG. 1 (à gauche).

      Figure: Diagrammes des effectifs cumulés versus histogramme.
      \resizebox*{!}{6cm}{\includegraphics{cumuls.eps}} \resizebox*{!}{6cm}{\includegraphics{histogramme.eps}}

    3. La médiane correspond à la valeur occupant la place \( \left( 1+150\right) /2=75.5 \). On atteint l'effectif \( 40 \) en totalisant les quatre premières classes. Il reste à placer un effectif valant \( 35.5 \), soit la fraction \( 35.5/57 \) de la classe en cours. Cela donne une amplitude \( \left( 35.5/57\right) \times 3 \) à ajouter au plancher de la classe, soit :

      \begin{displaymath}
mediane=9+\frac{35.5}{57}\times 3\approx 10.868\end{displaymath}

    4. De la même façon, on détermine les quartiles inférieur (\( 8.77 \)) et supérieur (\( 13.11 \)).
  2. Histogramme. Moyenne, écart-type, visualisation.
    1. Comme il est bien connu, la grandeur en ordonnée n'est pas l'effectif, mais est déterminée de façon à obtenir la bonne surface pour la barre considérée.
    2. Des calculs élémentaires donnent :

      \begin{displaymath}
n=150,\quad m=\mathrm{E}\left( x \right) =10.82,\quad \sigma =\sqrt{\mathrm{var}\left( x \right) }\approx 3.1777\end{displaymath}

    3. Pour visualiser ces deux paramètres, on trace les verticales \( x=m \) et \( x=m\pm \sigma \) (facteur de couverture \( k=1 \)). On aboutit à l'histogramme de la FIG. 1 (à droite).

2 Corrélation (données simples)

On considère la série de points \( \left[ x,  y\right] \) :
\( [5.97,  14.4],  [2.63,  10.0],  [5.53,  16.1],  [3.36,  8.34],  \left[ 2.26,  9.38\right] \)
\( [2.48,  6.28],  [4.30,  8.68],  [2.60,  5.58],  [4.21,  12.2],  [2.33,  5.40] \)
  1. Calculer les paramètres de dispersion de cette série de points.
    1. On constate que \( 2.26\leq x\leq 5.97 \) et \( 5.40\leq y\leq 16.10 \).
    2. On trouve calcule les sommes usuelles :

      \begin{displaymath}
\sum 1=10,\; \sum x=35.67,    \sum y=96.36\end{displaymath}


      \begin{displaymath}
\sum x^{2}=144.0893,    \sum y^{2}=381.8726,  \sum x  y=1048.0272\end{displaymath}

    3. On en déduit les paramètres de dispersion :

      \begin{displaymath}
n=10,  \overline{x}=3.567,\; \overline{y}=9.636,\; \mathrm{...
...5441,\; \mathrm{var}\left( y \right) =11.950224,  cov=3.815648\end{displaymath}

  2. Représentation graphique des points. Visualisation des paramètres de dispersion. Pour chacune des deux variables, on trace les droites correspondant à la moyenne plus ou moins l'écart-type (facteur de couverture \( k=1 \)). On obtient la FIG. 2 (gauche).
  3. Droite de régression. Visualisation.
    1. On trouve \( a=\frac{cov\left( x,  y\right) }{\mathrm{var}\left( x \right) }\approx 2.2639 \), et il est connu que la droite de régression passe par le point moyen.
    2. La qualité de ce résultat est mesurée par le facteur de réduction de variance \( frv=1/\left( 1-r^{2}\right) \approx 3.6081 \). Grosso-modo, les trois quarts de la variance de \( y \) sont explicables par la variabilité de \( x \), tandis qu'un quart reste inexpliqué.
    3. L'écart-type réduit est donc \( \sigma _{red}=\sqrt{\mathrm{var}\left( y \right) /frv}\approx 1.918340726 \), que l'on reporte de part et d'autre de la droite de régression (facteur de couverture \( k=1 \)). On obtient la FIG. 2 (droite).

Figure: Données brutes (à gauche) et corrélation (à droite).
\resizebox*{!}{6cm}{\includegraphics{corr_gauche.eps}} \resizebox*{!}{6cm}{\includegraphics{corr_droite.eps}}

3 Corrélation (données groupées)

On a 70 points \( \left( x,  y\right) \) avec \( x=1,2,3,4 \) et \( y=2,3,4,5 \). Sur une même ligne du tableau, \( y \) est constant. Sur une même colonne, \( x \) est constant :

\( \downarrow y\quad x\rightarrow \) \( 1 \) \( 2 \) \( 3 \) \( 4 \)
\( 5 \) \( 8 \) \( 5 \) \( 2 \) \( 2 \)
\( 4 \) \( 7 \) \( 7 \) \( 8 \) \( 1 \)
\( 3 \) \( 3 \) \( 2 \) \( 9 \) \( 3 \)
\( 2 \) \( 2 \) \( 1 \) \( 3 \) \( 7 \)


  1. Dresser le tableau permettant le calcul des diverses sommes utiles. cf FIG. 3.

    Figure 3: tableau de calcul.
    \begin{figure}\begin{displaymath}
\left[ \begin{array}{crrrrccccc}
& 1 & 2 & 3 ...
... & 198 & 208 & 486 & & & &
\end{array}\right] \end{displaymath}\par\end{figure}

  2. Calcul des paramètres de dispersion de cette série de points.
    1. On trouve \( \mathrm{E}\left( x \right) =\frac{166}{70}\approx 2.3714,\; \mathrm{var}\left( x \right) =\frac{470}{70}-\left( \frac{166}{70}\right) ^{2}\approx 1.0906 \).
    2. De même \( \mathrm{E}\left( y \right) =\frac{168}{70}\approx 2.4,\quad \mathrm{var}\left( y \right) =\frac{486}{70}-\left( \frac{168}{70}\right) ^{2}\approx 1.1829 \).
    3. Enfin la covariance vaut \( \frac{432}{70}-\frac{166}{70}\frac{168}{70} \).
  3. Représentation graphique des points. Visualisation des paramètres de dispersion.
    1. La meilleure représentation graphique consiste à donner une "épaisseur" aux points en proportion de l'effectif.
    2. On trace les horizontales et les verticales indiquant la dispersion de \( x \) et de \( y \).
  4. Droite de régression. Visualisation.
    1. La pente de la droite de régression est donnée par \( a:=cov/\mathrm{var}\left( x \right) \approx .44012 \), et le coefficient de corrélation vaut : \( r=cov/\sqrt{\mathrm{var}\left( x \right)   \mathrm{var}\left( y \right) }\approx .4226 \).
    2. Le facteur de réduction de variance vaut \( frv=1.2174 \) : les deux variables sont dont à peu près indépendantes.

\resizebox*{!}{7cm}{\includegraphics{atrick_05.eps}}


previous up next_inactive
Up: Return to previous menu


douillet@ensait.fr
2003-01-25