previous up next_inactive
Up: Return to previous menu

Ensait - E1 - Stats/Probas

Évaluation du 2008-01-23 à 16h15
durée 2 heures

tous documents autorisés
le sujet comporte deux pages

Descriptif du travail demandé

  1. Le compte-rendu se composera de :
    1. Un compte-rendu mathématique, manuscrit, mettant en valeur les résultats obtenus et indiquant les méthodes utilisées.
    2. Ce compte rendu sera appuyé par un ensemble de documents imprimés : graphes, listing (scipad), exécutions (scilex). Sur chacun de ces documents, le nom de l'étudiant sera imprimé.
    3. Le document complet sera agrafé et paginé.
  2. Chaque étudiant travaillera de façon isolée (avec le libre accès à ses propres documents). Les feuilles de calcul qui auraient été réalisées en binôme lors d'une séance de TP devront avoir été dupliquées dans les répertoires personnels des étudiants concernés.
  3. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessaire pour les impressions. Imprimer les graphiques au fur et à mesure. Ne pas oublier les sauvegardes en cours de travail.
  4. Il va de soi que tous les problèmes de compte informatique (mots de passe, comptes périmés ou autres problèmes) devront avoir été résolus largement avant l'évaluation.
  5. Mention spéciale pour les étudiants utilisant leur portable personnel pour composer : en cas de problèmes réseau spécifiques aux portables, ces étudiants pourront remettre leurs documents sous forme électronique.
  6. L'attention des étudiants est attirée sur le fait que le trafic réseau de leur ordinateur est susceptible d'être enregistré pendant la durée de l'évaluation.

1 Regroupement de deux populations

  1. Copier/coller et exécuter sous scilab les commandes suivantes, en remplaçant ddmmaa par les valeurs telles que dd/mm/19aa soit votre date de naissance :
    grand('setsd', ddmmaa)  
    N1= grand(1,'uin',30,40), N2= grand(1,'uin',40,50)  
    m1= grand(1,'uin',20,24), m2= grand(1,'uin',15,19) 
    s1= grand(1,'uin',10,14), s2= grand(1,'uin',5,9) 
    Ces valeurs sont à utiliser dans la question suivante.
  2. On mélange deux populations disjointes. L'une se compose de $N_{1}$ individus, ayant une moyenne $m_{1}$ et un écart-type $s_{1}$ et l'autre se compose de $N_{2}$ individus, ayant une moyenne $m_{2}$ et un écart-type $s_{2}$. Déterminer la moyenne et l'écart-type de la population totale.

2 Usage des tables de la loi normale

Selon la méthode choisie, on indiquera comment utiliser les tables données dans le polycopié ou bien comment utiliser la fonction cdfnor.
  1. Les durées d'un ensemble de processus sont approximativement distribués suivant la loi $Norm\left(95, 13\right)$. Quel est le pourcentage de processus ayant une durée : (a) supérieure à $97$ ; ( b) inférieure à $105$ ; (c) comprise entre $80$ et $110$ ?
  2. Pour la distribution précédente, trouver $a,  b$, placés symétriquement autour de la moyenne, tels que $Pr\left(x\in\left[a,  b\right]\right)=1/2$.
  3. On sait que la variable $X$ suit une loi normale et que $Pr\left(X<10\right)=0.34$ et $Pr\left(17<X\right)=0.47$. Déterminer $\mu$ et $\sigma$.

3 Somme de variables

Le nombre ddmmaa ci-dessous est à personnaliser, de sorte que dd/mm/19yy soit votre date de naissance. On considère deux variables aléatoires indépendantes $X$ et $Y$ distribuées respectivement selon les lois gamma réduites : $Gamma\left(a_{1}=2.3,  b_{1}=1\right)$ et $Gamma\left(a_{2}=2.7,  b_{2}=1\right)$. On s'intéresse à la distribution de la variable $Z=X+Y$.
  1. Rappeler quels sont les paramètres de dispersion d'une variable distribuée selon une loi $Gamma\left(a,  b\right)$.
  2. Au cas où $Z$ serait une variable $Gamma\left(a,  b\right)$, déterminer les paramètres correspondants.
  3. Initialiser à nouveau le générateur aléatoire par la commande
    grand('setsd', ddmmaa) 
    Puis engendrer $N=1100$ instanciations de $X$, puis $N$ instanciations de $Y$ (consulter l'aide en ligne de grand pour les détails de syntaxe, et utiliser 'gam' avec : shape=$a$, scale=$1/b$).
  4. Pour chacune des variables $X,  Y,  Z$, tracer l'histogramme des valeurs obtenues (utiliser une répartition en 11 classes). Représenter la moyenne et l'écart-type de ces valeurs.
  5. Sur chacun des graphes, représenter la densité de probabilité de la loi $Gamma\left(a, 1\right)$ correspondante.
  6. Utiliser cdfgam (cf. l'aide en ligne) pour déterminer les nombres $z_{0}=0,  z_{1}, \cdots,  z_{10},  z_{11}=+\infty$ tels que $Pr\left(Z\in\left[z_{i},  z_{i+1}\right]\right)=1/11$, avec $\forall i :  z_{i}<z_{i+1}$. Sur un nouveau graphique : tracer l'histogramme théorique de la loi de $Gamma\left(a,  b\right)$ correspondant aux classes $\left[z_{i},  z_{i+1}\right]$ (remplacer $z_{11}$ par une valeur "raisonnable"). Sur ce graphique, superposer l'histogramme des données expérimentales (pour les mêmes classes).

4 Droite de régression affine

  1. Télécharger le fichier http://www.douillet.info/~douillet/cours/stats/datas/football.txt et lire les lignes de ce fichier sous Scilab.
  2. Récupérer les valeurs numériques (attention aux virgules et autres "drames de syntaxe"). Sélectionner les colonnes jnum et wt (weight=poids). En cas de "drame non résolu", il est toujours possible de retravailler le fichier de données avec un traitement de texte.
  3. Calculer les 6 paramètres de dispersion de la distribution $\left(jnum,  wt\right)$. Représenter ces points, représenter les moyennes et les écarts-type.
  4. Calculer la droite de régression et le FRV correspondant. Reporter le tout sur le dessin.
  5. Mêmes questions avec les colonnes jnum et ht et la distribution de $\left(jnum,  ht\right)$. Que remarque-t-on ?

previous up next_inactive
Up: Return to previous menu


douillet@ensait.fr
2008-01-23