Up: Return to previous menu
Ensait - E1 - Maths. Assistées par Ordinateur
Date: Évaluation du 13/12/2004 - durée 2h00
tous documents autorisés
- Chaque étudiant travaillera de façon isolée (avec le
libre accès à ses propres documents). Les feuilles de calcul qui auraient
été réalisées en binôme lors d'une séance de TP devront avoir été
dupliquées dans les répertoires personnels des étudiants concernés.
- Le compte-rendu se composera de :
- Un compte-rendu expérimental, sous forme d'un listing
imprimé et paginé, contenant les procédures, les graphes et les calculs.
- Un compte-rendu mathématique, manuscrit ou imprimé, mettant
en valeur les résultats obtenus et les méthodes utilisées.
- Le document complet sera agrafé et paginé. Vu
les lenteurs des imprimantes mises à disposition, imprimer une page
par feuille.
- Une bonne gestion du temps fait partie des compétences
évaluées. Prévoir le temps nécessaire pour les impressions. Faire
un essai d'impression dès la première heure. Ne pas oublier les sauvegardes
en cours de travail.
- Il va de soi que tous les problèmes de compte informatique
(mots de passe, comptes périmés ou autres problèmes) devront avoir
été résolus largement avant l'évaluation.
- L'attention des étudiants est attirée sur le
fait que le trafic réseau de leur ordinateur est susceptible d'être
enregistré pendant la durée de l'évaluation.
1 Données statistiques et visualisation
- Vérifier que les bibliothèques pldx et simul sont chargées sur
l'ordinateur et que les numéros de version sont
Définir la commande chargée de tracer les histogrammes par
macro(histo=xhisto). Ne pas utiliser macro(histo=stats[statplots,
histogram]).
- Faire ce qu'il faut pour transférer les données contenues dans le
fichier
http://www.douillet.info/~douillet/maotp/maotp_ds10/dat_maotp_ds10x.txt
vers un objet
de type liste.
Les données étaient différentes pour les deux groupes. Elles sont
actuellement accessibles sous les noms dat_maotp_ds10a.txt
et dat_maotp_ds10b.txt.
Un exemple de mise en oeuvre des méthodes indiquées en TP est disponible
à l'adresse :
http://www.douillet.info/~douillet/maotp/maotp_ds10/maotp_ds10_.html.
- Déterminer l'effectif
, le domaine de valeurs
, la valeur moyenne
et la variance
de cette liste de données.
- On trouve
,
,
et
.
- On trouve
,
,
et
.
- Déterminer "à vue" quel est le nombre de barres donnant
le "meilleur histogramme possible". On tracera les
trois histogrammes histo(li2, area=1, numbars=x)
avec
,
, et
"au mieux".
Justifier votre choix.
Il faut à la fois avoir "assez de barres" pour donner
l'impression d'une courbe régulière et avoir "assez de points"
par barre pour que la fréquence soit correctement estimée. Pour le
cas traité, numbars=40 convient.
- Faire apparaître moyenne et écart-type sur le meilleur histogramme.
L'une des questions à résoudre est celle de la hauteur des traits.
2 Modèle lognormal
- Déterminer les paramètres
et
de la loi lognormale la plus susceptible
de "coller" avec les données. Utiliser à cet effet
les formules
http://www.douillet.info/~douillet/cours/stats/node12.html.
On estime les paramètres de la population par ceux de l'échantillon
et on applique les formules données en référence.
- On trouve
et
.
- On trouve
et
.
- Superposer la courbe de cette loi lognormale
sur l'histogramme.
On utilise la formule indiquée (cette formule exprime le fait que
suit une distribution "normale" avec les
paramètres
et
). On a donc :
3 Loi "en masse"
- Appliquer la procédure newcode:=
unapply(Weight(z,z/m), z);
à chacun des objets composant
. Dresser l'histogramme
de l'objet
ainsi obtenu.
Un minimum de bon sens conduisait à ne pas afficher cet objet (et
encore moins à l'imprimer). Donc :
li3 := map( newcode, li2 ) :
- Expliquer quelle est l'action de newcode. Pourquoi
divise-t-on par
?
Cette procédure change les poids (Weight) relatifs des différents
objets. Dans le nouvel objet, les valeurs les plus fortes vont compter
plus. La division par
a pour objectif de ne pas changer le poids
total de la distribution. Autrement dit, les commandes nmb(li2)
et nmb(li3) donnent la même chose.
- Calculer moyenne
et variance
de la nouvelle distribution.
Examiner si les formules générales liant loi en nombre et loi en masse
se vérifient sur l'exemple traité. En particulier, remarque-t-on une
différence de comportement entre cette procédure newcode
et la procédure recode utilisée en TP
?
- On trouve
,
et
.
- On trouve
,
et
.
La relation sur les moyennes
est valable pour toute distribution positive. On a donc
.
Par contre la relation
est particulière à la loi lognormale (exacte). Pour les données utilisées,
la vérification n'est que partielle
- Visualiser
et
sur l'histogramme
. Superposer la courbe
de la loi lognormale
correspondante.
On obtient un bon accord en utilisant les paramètres
et
(en tout cas bien meilleur à ce que donnerait l'emploi de
).
- On définit la procédure suivante :
macro(ran= stats[describe, range], nmb= stats[describe,
count]);
cut:= proc(li, num);
stats[transform, split[num]](stats[transform,
statsort](li)):
map(z-> Weight(ran(z), nmb(z)), %);
end;
- On définit les objets tal2:= cut(li2,
20) ; tal3:= cut(li3, 20);
Dresser les histogrammes de ces deux objets. Comparer avec les
histogrammes obtenus respectivement en 2.2
et 3.4.
On obtient des classes ayant toutes le même effectif (ici
).
- Que remarquez-vous concernant les partitions obtenues à la question
précédente ? Avez-vous une amélioration à proposer ?
Les classes ne sont pas jointives. Il faudrait prendre comme frontières
la moyenne entre le 50ème et le 51ème élément, pûis la moyenne entre
le 100ème et le 101ème, etc.
- Utiliser la fonction de répartition de la loi lognormale pour déterminer
l'histogramme associé à la loi
et à la partition associée
à tal3.
Up: Return to previous menu
douillet@ensait.fr
2004-12-13