previous up next contents
Previous: 3. Probabilités Up: Statistiques pour l'ingénieur Next: 5. Variables à densité   Contents

Subsections

4. Variables aléatoires discrètes

4.1 Loi uniforme sur $ \left\{ 1,\,2,\,\cdots,\, m\right\} $.

Definition 4.1.1   $ Pr\left(X=k\right)=\frac{1}{m}$ si $ k\in\Omega$ et 0 sinon.

Proposition 4.1.2   Formules :

$\displaystyle \mathrm{E}\left(X\right)=\left(m+1\right)\div2\;\mathrm{et}\;\mathrm{var}\left(X\right)=\left(n^{2}-1\right)\div12$

Exercise 4.1.3   Retrouver ces formules. On pourra utiliser une sommation télescopique des relations $ \left(k+1\right)^{2}-k^{2}=2\, k+1$ et $ \left(k+1\right)^{3}-k^{3}=3\, k^{2}+3\, k+1$.

Exercise 4.1.4   Comparer $ \sum_{k=1}^{k=n}k^{2}$ avec les intégrales $ \int_{x=0}^{x=n}\, \mathrm{d}x$ et $ \int_{x=1}^{x=n+1}\, \mathrm{d}x$. Peut-on trouver une meilleure approximation ?

Exercise 4.1.5   Déterminer les moments, c'est à dire les espérances $ \mathrm{E}\left(X^{n}\right)$ pour $ n\in\mathbb{N}$. En déduire les moments centrés, c'est à dire les espérances $ \mathrm{E}\left(\left(X-\mathrm{E}\left(X\right)\right)^{n}\right)$.

4.2 Loi de Bernoulli.

Definition 4.2.1   $ Pr\left(X=1\right)=p$ (succès) et $ Pr\left(X=0\right)=1-p$.

Proposition 4.2.2   Formules : $ \mathrm{E}\left(X\right)=p$ et $ \mathrm{var}\left(X\right)=p\,\left(1-p\right)$.

4.3 Somme de variables indépendantes

Theorem 4.3.1   Si $ X$ et $ Y$ sont deux variables aléatoires discrètes, la loi de la somme $ Z=X+Y$ est

$\displaystyle Pr\left(Z=z\right)=\sum_{x\in\mathbb{Z}}Pr\left(X=x\right)\times Pr\left(Y=z-x\right)$

Definition 4.3.2   Cette loi de composition s'appelle : convolution

Exercise 4.3.3   On lance deux dés. Quelle est la loi de la somme $ A=x+y$ ? Quelle est la loi de la différence $ B=x-y$ ? Quelle est la corrélation entre $ A$ et $ B$ ?

4.4 Séries génératrices

Definition 4.4.1   Séries génératrices. $ S\left(z\right)=\sum_{k}Pr\left(X=k\right)\, z^{k}$ avec $ z\in\mathbb{C}$. Il est clair que cette série converge uniformément pour % latex2html id marker 9466
$ \left\vert z\right\vert\leq1-\varepsilon$.

Exercise 4.4.2   Vérifier que, pour la loi de Bernoulli, $ S\left(z\right)=q+p\, z$.

Theorem 4.4.3   Pour une variable à support fini, on a

$\displaystyle 1=\sum_{k}Pr\left(X=k\right)=S\left(1\right)$

$\displaystyle \mathrm{E}\left(X\right)=\sum_{k}k\,Pr\left(X=k\right)=S'\left(1\right)$

$\displaystyle \mathrm{var}\left(X\right)=S''\left(1\right)+S'\left(1\right)-\left(S'\left(1\right)\right)^{2}$

Preuve. $ S''\left(1\right)=\sum_{k}k\left(k-1\right)Pr\left(X=k\right)=\mathrm{E}\left(X\left(X-1\right)\right)$. $ \qedsymbol$

Exercise 4.4.4   Vérifier ces formules pour la loi de Bernoulli $ S\left(z\right)=q+p\, z$.

Exercise 4.4.5   Vérifier que la série génératrice d'une variable uniforme sur $ \left\{ 1,\,2,\,\cdots,\, m\right\} $ est

$\displaystyle S\left(z\right)=\frac{1}{m}\,\frac{z^{m+1}-z}{z-1}$

Utiliser ce résultat pour retrouver les paramètres de dispersion.

Theorem 4.4.6   La série génératrice de la somme de deux variables aléatoires discrètes INDÉPENDANTES est le produit des séries génératrices.

4.5 Loi binomiale

Definition 4.5.1   $ K=Bin\left(n,\, p\right)$ est la loi du nombre de succès en $ n$ épreuves de Bernoulli indépendantes.

Proposition 4.5.2   Formules :

$\displaystyle Pr\left(K=k\right)={n \choose k}\, p^{k}q^{n-k}\;;\;\mathrm{E}\left(K\right)=n\, p\;;\;\mathrm{var}\left(K\right)=n\, p\, q$

Exercise 4.5.3   Vérifier ces formules par un calcul direct pour $ n=2$, $ n=3$ et $ n=4$.

Exercise 4.5.4   Retrouver ces formules en appliquant les théorèmes généraux sur les espérances et les variances.

Exercise 4.5.5   Déterminer les espérances $ \mathrm{E}\left(K^{n}\right)$ (moments d'ordre $ n$) pour $ n\in\mathbb{N}$. En déduire les espérances $ \mathrm{E}\left(\left(K-\mathrm{E}\left(K\right)\right)^{n}\right)$ (moments centrés d'ordre $ n$).

Exercise 4.5.6   Vérifier que l'on a $ S\left(z\right)=\left(q+p\, z\right)^{n}$. Utiliser ce résultat pour retrouver $ \mathrm{E}\left(K\right)$ et $ \mathrm{var}\left(K\right)$.

Exercise 4.5.7   Tracer les histogrammes correspondants à $ n=5$, $ n=10$, $ n=20$ et $ n=40$ pour $ p=\frac{1}{2}$, puis pour $ p$ choisi de façon que $ n\, p=1$.Que peut-on dire de la somme de deux variables binomiales indépendantes ?

4.6 Loi hypergéométrique

Definition 4.6.1   On prélève, sans remise et avec une probabilité uniforme, un échantillon de taille $ n$ au sein d'une population de $ N$ individus. On s'intéresse à un certain caractère binaire (i.e. présent ou absent), et on appelle $ m$ le nombre d'occurences de ce caractère dans l'échantillon et $ p$ sa prévalence (fréquence) dans la population.

Proposition 4.6.2   La loi hypergéométrique $ Hyp\left(N,\, n,\, p\right)$ est

$\displaystyle Pr\left(M=m\right)={N\, p \choose m}\times{N\, q \choose n-m}\div{N \choose n}$

Proposition 4.6.3   Formules : $ \mathrm{E}\left(X\right)=np$ et $ \mathrm{var}\left(X\right)=n\, p\, q\,\frac{N-n}{N-1}$.

Exercise 4.6.4   Déterminer les moments, c'est à dire les espérances $ \mathrm{E}\left(X^{n}\right)$ pour $ n\in\mathbb{N}$. En déduire les moments centrés, c'est à dire les espérances $ \mathrm{E}\left(\left(X-\mathrm{E}\left(X\right)\right)^{n}\right)$.

Proposition 4.6.5   Si l'on fait $ N\rightarrow\infty$ dans $ Hyp\left(N,\, n,\, p\right)$, on obtient la loi binomiale $ Bin\left(n,\, p\right)$.

4.7 Exercices

Exercise 4.7.1   Soit $ X$ la variable définie par la distribution de probabilité suivante :
$ X$ 1 2 3 4 5 6
$ Pr\left(X\right)$
. Déterminer $ \alpha$. Calculer $ \mathrm{E}\left(X\right)$, $ \mathrm{var}\left(X\right)$ et $ \sigma_{X}$. En déduire les paramètres de dispersion des variables $ Y_{1}=2\, X$, $ Y_{2}=-\frac{1}{2}X$ et $ Y_{3}=X-3$.

Exercise 4.7.2   On joue quatre fois de suite à pile ou face. Quelle est la distribution du nombre $ K$ de fois où l'on a obtenu pile ? Dessin et paramètres de dispersion. Mêmes questions pour $ n=12$ et $ n=20$ (ne pas hésiter à utiliser un ordinateur...).

Exercise 4.7.3   Une jardinerie garantit à tout acheteur de plants de tomates que $ 90\%$ des plants se développeront correctement après repiquage. Quelle est la probabilité d'obtenir au moins $ 18$ pieds de tomate après un achat de $ 20$ plants ? Quelle est la probabilité de perdre au plus $ 50$ plants après un achat de $ 200$ plants ?

Exercise 4.7.4   Concours ENAC. L'épreuve de mathématiques du concours ENAC consiste en un QCM de 50 questions. Pour chacune, 4 réponses sont proposées. Chaque candidat choisit $ 40$ questions et indique la réponse qui lui parait convenir. Une réponse exacte est valorisée de $ 2$ points, chaque réponse inexacte est pénalisée de $ 1$ point.
On considère le sous-ensemble $ \Omega_{1}$ des candidats qui répondent de façon aléatoire (uniforme). Quels sont les paramètres de dispersion $ \mathrm{E}\left(X\right)$ et $ \sigma_{X}$ des notes obtenues ?
On considère le sous-ensemble $ \Omega_{2}$ des candidats qui choisissent uniformément les questions et y répondent avec un taux de succès de $ 80\%$. Donner les paramètres de dispersion correspondants.
On considère enfin le sous-ensemble de $ \Omega_{2}$ constitué de candidats qui savent en outre identifier les 20 questions les plus faciles, et y répondent alors avec un taux de $ 100\%$. Donner les paramètres de dispersion correspondants.


previous up next contents
Previous: 3. Probabilités Up: Statistiques pour l'ingénieur Next: 5. Variables à densité   Contents


douillet@ensait.fr
2008-08-30