previous up next contents
Previous: Bibliography Up: Aide à la décision Next: B. Compléments sur le   Contents

Subsections

A. Rappels et compléments

A.1 Espérances et probabilités

Remark A.1.1   L'objectif ultime de ces deux années de statistiques et probabilités est de fournir des outils d'aide à la décision. Il s'agit donc de transformer l'ensemble de nos connaissances sur une situation donnée (archives statistiques, théorèmes généraux, informations diverses, etc.) en un choix binaire : "on y va" ou bien "on n'y va pas". Le tout premier critère utilisé est celui de l'espérance de résultat.

Definition A.1.2   L'espérance d'une quantité est la moyenne pondérée des résultats possibles :

$\displaystyle \mathrm{E}\left(X\right)=\sum x_{i}\, p_{i}=\int x\,\mathrm{d}p\left(x\right)=\int x\, f\left(x\right)\, \mathrm{d}x$ (A.1)

Les différentes écritures correspondent à différentes façons de poser les calculs, mais expriment les mêmes propriétés (en particulier de linéarité).

Exercise A.1.3   On considère le jeu suivant : un dé est lancé et le joueur gagne $ x$ $ si le $ x$ sort. Quelle est la mise équitable, c'est à dire celle qui, sur le long terme, n'avantage ni le joueur ni le banquier ?

Exercise A.1.4   On considère le jeu suivant (l'entier $ n$ est fixé une fois pour toutes) : on lance $ n$ fois une pièce et le joueur gagne $ 2^{n}$ si pile n'est jamais sorti au cours des $ n$ lancers ? Quelle est la mise équitable ?

Exercise A.1.5   Acceptez vous de jouer au jeu $ n=100$ ? Quel concept mettre en oeuvre pour rendre compte de la différence entre le jeu $ n=1$ et le jeu $ n=100$ ?

Definition A.1.6   La fonction caractéristique $ c_{F}$ d'un sous-ensemble $ F$ d'un ensemble $ E$ est la fonction définie par $ c_{F}\left(x\right)=1$ si $ x\in F$ et par $ c_{F}\left(x\right)=0$ si $ x\in E\setminus F$.

Remark A.1.7   La probabilité peut être perçue comme l'espérance de la fonction caractéristique :

$\displaystyle Pr\left(F\right)=\mathrm{E}\left(c_{F}\right)=\int_{x\in E}c_{F}\left(x\right)\,\mathrm{d}p\left(x\right)=\int_{x\in F}\mathrm{d}p\left(x\right)$

C'est en tout cas la formule que l'on utilise spontanément lorsque l'on a un nombre fini d'événements élémentaires équiprobables : on divise le nombre de cas favorables par le nombre total de cas.

Definition A.1.8   Un histogramme est une représentation graphique où l'on porte en abscisse la variable (unidimensionnelle) étudiée et en surface la probabilité associée. L'ordonnée (quotient de la surface par la variation d'abscisse) s'appelle la densité de la probabilité. Ainsi, sur la FIG.A.1, le nombre $ 1/6$ repère une densité de probabilité, tandis que $ Pr\left(x\leq2\right)=1/3$.

FIG. A.1: Histogramme associé à un lancer de dé.
% latex2html id marker 10538
\includegraphics[width=8cm,height=5cm]{figures/histo_de}

A.2 Espérance et variance

Definition A.2.1   La variable réduite $ z$ associée à une variable $ x$ de moyenne $ \mu$ et de variance $ \sigma^{2}$ se définit par :

$\displaystyle z=\frac{x-m}{\sigma}$

Remark A.2.2   Pour pouvoir comparer différentes répartitions de différentes grandeurs, il faut pouvoir faire abstraction de la nature particulière de ces grandeurs. La variable réduite possède cette propriété. Dans cette formule, $ x$ est la variable "concrète", $ m$ un indicateur de la tendance centrale, $ \sigma$ une mesure de la dispersion et $ z$ la variable "abstraite". Comme $ x,\, m,\,\sigma$ sont de même nature, z est un nombre (sans dimension).

Proposition A.2.3   Formule de l'écart quadratique moyen. Dans le cas où $ x$ est équiprobable dans l'ensemble $ \left\{ a,\, b,\, c\right\} $ on cherche la valeur de $ m$ qui minimise l'écart quadratique moyen, c'est à dire la quantité

$\displaystyle \delta^{2}=\frac{1}{3}\,\left(\left(a-m\right)^{2}+\left(b-m\right)^{2}+\left(c-m\right)^{2}\right)$

On trouve que le choix $ m=\mathrm{E}\left(x\right)$ est le choix optimal.

Preuve. Un calcul élémentaire donne :

% latex2html id marker 10621
$\displaystyle \delta^{2}=\left(m-\frac{a+b+c}{3}\...
...rac{a+b}{2}\right)^{2}+\frac{1}{2}\left(b-\frac{a}{1}\right)^{2}\right)\qedhere$

$ \qedsymbol$

Exercise A.2.4   Écrire la formule analogue pour $ n=4$.

Definition A.2.5   La variance $ \mathrm{var}\left(X\right)$ est l'écart carré moyen de la variable $ X$ par rapport à sa moyenne $ \mathrm{E}\left(X\right)$. On dispose d'une formule de calcul de permettant d'éviter un calcul en deux temps (formule de Koenig):

$\displaystyle \mathrm{var}\left(X\right)\doteq\mathrm{E}\left(\left(X-\mathrm{E...
...}\right)=\mathrm{E}\left(X^{2}\right)-\left(\mathrm{E}\left(X\right)\right)^{2}$ (A.2)

Proposition A.2.6   Formule des "degrés de liberté". On constate que $ \delta^{2}$, qui s'écrit avec $ n$ carrés dans le cas général, peut se réécrire avec $ n-1$ carrés indépendants dans le cas où $ m=\mathrm{E}\left(x\right)$.

Preuve. En effet la définition même de la variance consiste à choisir $ m$ pour que l'un des carrés soit nul. $ \qedsymbol$

Definition A.2.7   La covariance de deux variable aléatoires est :

$\displaystyle \mathrm{cov}\, \left(X,\, Y\right)\doteq\mathrm{E}\left(\left(X-\...
...ght)-\left(\mathrm{E}\left(X\right)\right)\left(\mathrm{E}\left(Y\right)\right)$ (A.3)

Proposition A.2.8   Formule d'addition. Lorsque $ X,\, Y$ sont deux variables, on a

$\displaystyle \mathrm{var}\left(X+Y\right)=\mathrm{var}\left(X\right)+\mathrm{var}\left(Y\right)+2\,\mathrm{cov}\, \left(X,\, Y\right)$

Definition A.2.9   On dit que deux variables sont (totalement) indépendantes lorsqu'aucun renseignement sur l'une ne donne de renseignement sur l'autre. L'indépendance (totale) veut donc dire

$\displaystyle \forall a\,:\,\forall b\,:\,Pr\left(X=a\, et\, Y=b\right)=Pr\left(X=a\right)\times Pr\left(Y=b\right)$

Definition A.2.10   On dit que deux variables sont linéairement indépendantes lorsque $ \mathrm{cov}\, =0$. En pareil cas la variance de la somme est la somme des variances.

Exercise A.2.11   Montrer que l'indépendance totale entraîne l'indépendance linéaire.

Exercise A.2.12   Que vaut la variance de la différence de deux variables indépendantes ?.

A.3 Variables positives

Definition A.3.1   Le coefficient de variation d'une variable positive $ x$ est défini par :

$\displaystyle V_{c}\doteq\frac{\sigma}{\mu}=\frac{\sqrt{\mathrm{var}\left(x\right)}}{\mathrm{E}\left(x\right)}$

Remark   Il est clair que la notion même de coefficient de variation devient absurde si l'on ne suppose pas que la variable est positive. Lorsque cette quantité est bien définie, elle possède l'avantage d'être sans dimension, et de permettre une comparaison standardisée entre deux variables.

Definition A.3.2   On appelle variable observable $ X$ associée à une variable positive $ x$ la nouvelle variable obtenue en sélectionnant les individus proportionnellement à la valeur de $ x$. Les paramètres associés à la variable $ x$ sont appelés paramètres "en nombre" (ou individuels) et ceux associés à la variable $ X$ paramètres "en poids".

Remark   Considérons une population $ \Omega$ dont les individus $ i$ présentent un caractère positif désigné par $ \xi\left(i\right)$. La fonction $ \xi$ est donc une application $ \Omega\hookrightarrow\mathbb{R}^{+}$. Lorsque l'on cherche à déterminer la loi du caractère $ \xi$, il y a deux façons de sélectionner les individus composant l'échantillon d'étude. On peut en effet utiliser comme référence une loi uniforme sur les individus ou bien une loi uniforme sur les valeurs. Le premier choix conduit à la variable $ x$, le deuxième à la variable $ X$.

Exercise A.3.3   On considère un processus d'attente, par exemple l'attente à un passage à niveau. Le temps d'attente moyen lorsque l'on voit se baisser la barrière n'est pas le même que le temps d'attente moyen lorsque la barrière est déjà baissée lorsque l'on arrive. Calculer ces deux moyennes lorsque la loi "en nombre" est déterministe, uniforme sur un intervalle, binomiale, exponentielle.

Exercise A.3.4   On se demande quel est le volume moyen d'une particule dans un mélange de particules. Décrire des protocoles expérimentaux associés aux variables $ x$ et $ X$. De même pour la masse moyenne des molécules d'un polymère.

Proposition A.3.5   Lorsque les chances de la variable $ x$ sont données par $ f\left(x\right)$, les chances de $ X$ sont données par $ x\, f\left(x\right)$. Lorsque $ f$ est la densité de probabilité de $ x$, la densité de probabilité de $ X$ est $ \frac{x}{\mathrm{E}\left(x\right)}\, f\left(x\right)$ et l'on a :

$\displaystyle \mathrm{E}\left(X\right)=\frac{\mathrm{E}\left(x^{2}\right)}{\mathrm{E}\left(x\right)}=\mathrm{E}\left(x\right)\times\left(1+V_{c}^{2}\right)$ (A.4)

Exercise A.3.6   Les polyméristes ont l'habitude de considérer le rapport $ \mathrm{E}\left(X\right)/\mathrm{E}\left(x\right)$ (indice de polydispersité). Lorsque cet indice vaut 2, quelle est la valeur de $ \sigma$ ?


A.4 Loi exponentielle

Definition A.4.1   Une variable exponentielle de paramètre $ \lambda>0$ est une variable positive $ X$ telle que

$\displaystyle Pr\left(X\in\left[t,\, t+\, \mathrm{d}t\right]\right)=Cte\times\exp\left(-\lambda\, t\right)\, \mathrm{d}t$

Proposition A.4.2   Une variable exponentielle vérifie les propriétés suivantes :

$\displaystyle Cte=\lambda,\qquad\mathrm{E}\left(X\right)=\frac{1}{\lambda},\qquad\mathrm{var}\left(X\right)=\frac{1}{\lambda^{2}}$

Preuve. Le changement de variable $ x=\lambda\, t$ montre que la constante vaut $ Cte=\lambda$. En effet

$\displaystyle 1=\int_{t=0}^{t=\infty}Cte\,\exp\left(-\lambda\, t\right)\, \math...
...nfty}\exp\left(-x\right)\frac{1}{\lambda}\, \mathrm{d}x=\frac{1}{\lambda}\, Cte$

On obtient de même :

$\displaystyle \mathrm{E}\left(t\right)=\int_{t=0}^{t=\infty}t\,\exp\left(-\lamb...
...=\infty}\frac{1}{\lambda}x\,\exp\left(-x\right)\, \mathrm{d}x=\frac{1}{\lambda}$

$\displaystyle \mathrm{E}\left(t^{2}\right)=\int_{t=0}^{t=\infty}t^{2}\,\exp\lef...
...1}{\lambda^{2}}x^{2}\,\exp\left(-x\right)\, \mathrm{d}x=\frac{1}{\lambda^{2}}2!$

$ \qedsymbol$

A.5 La loi lognormale

Definition A.5.1   On appelle lognormale une variable positive dont le logarithme suit une loi normale. Nous définissons les paramètres $ M,\, k$ de cette loi par par $ \ln M\doteq\mathrm{E}\left(\ln x\right)$ et $ \ln k\doteq\mathrm{var}\left(\ln x\right)$. La FIG. A.2  donne les densités de la variable $ x$ de paramètres $ M=1000,\, k=\sqrt{2}$ et de la variable "en poids" associée. Les graduations horizontales correspondent à une graduation en écart-types de la variable $ \ln x$.

FIG.: Loi lognormale avec $ M=1000,\, k=\sqrt{2}$.
% latex2html id marker 10946
\includegraphics[width=10cm,height=0.2\paperwidth]{figures/lognormale}

Proposition A.5.2   Lorsque la variable "en nombre" est lognormale avec les paramètres $ M,\, k$, la variable "en poids" est lognormale avec les paramètres $ k\, M,\, k$.

Preuve. Si $ z$ est une variable de Gauss, la variable $ Z$ obtenue par la pondération $ \exp z$ est une variable normale ayant la même loi que $ z+1$. $ \qedsymbol$

Proposition A.5.3   La densité d'une variable lognormale peut s'écrire :

$\displaystyle \frac{1}{x\,\sqrt{2\,\pi\,\ln\left(k\right)}}\,\exp\left(\!-\frac{1}{2}\,\frac{\ln^{2}\left(x/M\right)}{\ln\left(k\right)}\!\right)$

tandis que sa fonction de répartition est $ Norlaw\left(\ln M,\,\sqrt{\ln k},\,\ln x\right)$. En désignant par $ X$ la variable "observable" associée, on a les résultats suivants :

\begin{displaymath}
\begin{array}{ccccccccc}
\mathbf{z} & & \mathrm{E}\left(z\ri...
... & M & M\, k & & M^{2}\, k^{3}\left(k-1\right) & k-1\end{array}\end{displaymath}

Preuve. La densité s'obtient par $ f\left(x\right)\, \mathrm{d}x=\mathrm{gauss}\left(\ln x\right)\,\mathrm{d}\!\left(\ln x\right)$. Un peu de calcul (changement de variable, etc.) conduit à $ \mathrm{E}\left(x^{p}\right)=M^{p}\, k^{p^{2}/2}$. La médiane pour $ x$ est l'image de la médiane pour $ \ln x$. Le mode s'obtient par dérivation.

Les résultats pour $ X$ viennent de Proposition A.5.2. On peut constater que $ \mathrm{E}\left(X\right)$ vérifie A.4. $ \qedsymbol$

Remark A.5.4   Pour la loi lognormale, les variables "en nombre" et "en poids" ont le même coefficient de variation.

Exercise A.5.5   On considère un ensemble de particules en suspension dans un liquide. On suppose que la répartition "en poids" des poids de ces particules suit une loi lognormale de paramètres $ M,\, k$. On suppose en outre que ces particules sont sphériques et ont une densité constante. Que peut-on dire de la répartition "en diamètre" des diamètres de ces particules (passer par l'intermédiaire des répartitions "en nombre").


previous up next contents
Previous: Bibliography Up: Aide à la décision Next: B. Compléments sur le   Contents


douillet@ensait.fr
2007-12-26