previous up next_inactive
Up: Return to previous menu

Ensait - A1 - Stats/Probas

Projet pour l'évaluation du 2007-12-12 à 10h15
durée 2 heures

tous documents autorisés
le sujet comporte deux pages

Descriptif du travail demandé

  1. Chaque étudiant travaillera de façon isolée (avec le libre accès à ses propres documents). Les feuilles de calcul qui auraient été réalisées en binôme lors d'une séance de TP devront avoir été dupliquées dans les répertoires personnels des étudiants concernés.
  2. Le compte-rendu se composera de :
    1. Un compte-rendu mathématique, manuscrit ou imprimé, mettant en valeur les résultats obtenus et les méthodes utilisées.
    2. Ce compte rendu sera appuyé par un ensemble de documents imprimés : graphes, listing (scipad), exécutions (scilex). Sur chacun de ces documents, le nom de l'apprenti doit être imprimé.
    3. Le document complet sera agrafé et paginé.
  3. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessaire pour les impressions. Imprimer les graphiques au fur et à mesure. Ne pas oublier les sauvegardes en cours de travail.
  4. Il va de soi que tous les problèmes de compte informatique (mots de passe, comptes périmés ou autres problèmes) devront avoir été résolus largement avant l'évaluation.
  5. Mention spéciale pour les étudiants utilisant leur portable personnel pour composer : en cas de problèmes réseau spécifiques aux portables, ces étudiants pourront remettre leurs documents sous forme électronique.
  6. L'attention des étudiants est attirée sur le fait que le trafic réseau de leur ordinateur est susceptible d'être enregistré pendant la durée de l'évaluation.

1 Regroupement de deux populations

On mélange une population de $N_{1}=47$ individus, ayant une moyenne $\mu_{1}=60$ et un écart-type $\sigma_{1}=8$ avec une population de $N_{2}=63$ individus, ayant une moyenne $\mu_{2}=35$ et un écart-type $\sigma_{2}=6$. Déterminer la moyenne et l'écart-type de la population totale.

2 Usage des tables de la loi normale

Selon la méthode choisie, on indiquera comment utiliser les tables données dans le polycopié ou bien comment utiliser la fonction cdfnor.
  1. Les durées d'un ensemble de processus sont approximativement distribués suivant la loi $Norm\left(110,\,14\right)$. Quel est le pourcentage de processus ayant une durée : (a) supérieure à $100$ ; ( b) inférieure à $130$ ; (c) comprise entre $90$ et $120$ ?
  2. Pour la distribution précédente, trouver $a,\, b$, placés symétriquement autour de la moyenne, tels que $Pr\left(x\in\left[a,\, b\right]\right)=1/2$.
  3. On sait que la variable $X$ suit une loi normale et que $Pr\left(X<9\right)=0.39$ et $Pr\left(17<X\right)=0.35$. Déterminer $\mu$ et $\sigma$.

3 Somme de variables

Le nombre yyyymmdd ci-dessous est à personnaliser, de sorte que dd/mm/yyyy soit votre date de naissance. On considère deux variables aléatoires indépendantes $X$ et $Y$ distribuées respectivement selon les lois $\Gamma\left(a=2.5\,;\, b=1\right)$ et $\Gamma\left(a=3.7\,;\, b=1\right)$. On s'intéresse à la distribution de la variable $Z=X+Y$.
  1. Au cas où $Z$ serait une variable $\Gamma$, déterminer les paramètres $a$ et $b$ correspondants (utiliser moyenne et écart-type).
  2. Personnaliser le générateur aléatoire par la commande
    grand('setsd', yyyymmdd) 
    Puis engendrer $N=1000$ instanciations de $X$ et de $Y$ (consulter l'aide en ligne de grand pour les détails de syntaxe).
  3. Pour chacune des variables $X,\, Y,\, Z$, tracer l'histogramme des valeurs obtenues (utiliser une répartition en 10 classes). Représenter la moyenne et l'écart-type de ces valeurs.
  4. Sur chacun des graphes, représenter la densité de probabilité de la loi $\Gamma$ correspondante.
  5. Déterminer les nombres $z_{0}=0,\, z_{1},\,\cdots,\, z_{9},\, z_{10}=\infty$ tels que $Pr\left(Z\in\left[z_{i},\, z_{i+1}\right]\right)=1/10$, avec $\forall i\,:\, z_{i}<z_{i+1}$. Sur un nouveau graphique : tracer l'histogramme théorique de la loi $\Gamma_{z}$ correspondant aux classes $\left[z_{i},\, z_{i+1}\right]$. Sur ce graphique, superposer l'histogramme des données expérimentales (pour les mêmes classes).

4 Droite de régression affine

  1. Télécharger le fichier http://www.douillet.info/~douillet/cours/stats/datas/exper.txt et lire les lignes de ce fichier sous Scilab.
  2. Récupérer les valeurs numériques (attention aux virgules et autres "drames de syntaxe") et obtenir une colonne de $x$ et une colonne de $y$. En cas de "drame non résolu", il est toujours possible de retravailler le fichier de données avec un traitement de texte.
  3. Calculer les 6 paramètres de dispersion de la distribution $\left(x,y\right)$. Représenter ces points, représenter les moyennes et les écarts-type.
  4. Calculer la droite de régression et le FRV correspondant. Reporter le tout sur le dessin.

previous up next_inactive
Up: Return to previous menu


douillet@ensait.fr
2007-12-06