Un compte-rendu mathématique, manuscrit, mettant en valeur
les résultats obtenus et indiquant les méthodes utilisées.
Ce compte-rendu sera appuyé par des documents imprimés
: graphes, listing (scipad), exécutions (scilex). Sur chacun de ces
documents, le nom de l'étudiant sera imprimé.
Le document complet sera agrafé et paginé.
Chaque étudiant travaillera de façon isolée (avec le
libre accès à ses propres documents). Les feuilles de calcul qui auraient
été réalisées en binôme lors d'une séance de TP devront avoir été
dupliquées dans les répertoires personnels des étudiants concernés.
Une bonne gestion du temps fait partie des compétences
évaluées. Prévoir le temps nécessaire pour les impressions. Imprimer
les graphiques au fur et à mesure. Ne pas oublier les sauvegardes
en cours de travail.
Il va de soi que tous les problèmes de compte informatique
(mots de passe, comptes périmés ou autres problèmes) devront avoir
été résolus largement avant l'évaluation.
Mention spéciale pour les étudiants utilisant leur portable
personnel pour composer : en cas de problèmes réseau spécifiques
aux portables, ces étudiants pourront remettre leurs documents sous
forme électronique.
L'attention des étudiants est attirée sur le
fait que le trafic réseau de leur ordinateur est susceptible d'être
enregistré pendant la durée de l'évaluation.
Un compte-rendu mathématique manuscrit était demandé. Il semble qu'un
certain nombre d'étudiants ont rencontré un problème pour configurer
leur stylo à bille.
Un document est destiné à être lu. Si vous pensez que vos résultats
ne valent pas la peine d'être rédigés, attendez vous à ce que votre
lecteur vous fasse confiance à ce sujet.
Trier les documents remis par question et paginer le tout, améliore
le confort du lecteur. Il est bien possible que cela améliore aussi
l'évaluation. Ne pas hésiter à faire des couper-coller avec des ciseaux
et de la colle.
Utilisez le format NOM Prénom pour identifier votre copie.
Imprimez votre nom sur chaque sortie d'ordinateur, en particulier
les graphiques.
Ceux qui intitulent leur manuscrit "DS de Scilab"
au lieu de "DS de Statistiques" sont assez souvent
ceux qui ne savent pas se servir de l'outil scilab (ou d'un autre)
pour traiter les questions posées.
Trouvé sur une copie : "Je n'ai pas de calculatrice".
Signalons que les boites métalliques posées sur les tables et qui
font des bruits de ventilateur ne sont pas seulement des appareils
de chauffage.
Enfin, il est anormal d'obtenir un écart-type négatif ou une variance
négative et ne pas s'en étonner.
Les notes attribuées vont de 3 à 20, avec une moyenne de 12.5 et un
écart-type de 4.
Copier/coller et exécuter sousscilables
commandes suivantes, en remplaçantddmmaapar
les valeurs telles que dd/mm/19aa soit votre date de naissance : grand('setsd', ddmmaa) N1= grand(1,'uin',30,40), N2= grand(1,'uin',40,50) m1= grand(1,'uin',20,24), m2= grand(1,'uin',15,19) s1= grand(1,'uin',10,14), s2= grand(1,'uin',5,9) Ces valeurs sont à utiliser dans la question suivante.
Les étudiants utilisant (par exemple) ddmmaa=10041987 sont-ils
réellement nés au 192 ème millénaire (de l'Empire Galactique ?).
On mélange deux populations disjointes. L'une se compose de
individus, ayant une moyenne et un écart-type
et l'autre se compose de individus, ayant une moyenne
et un écart-type . Déterminer la moyenne et l'écart-type de
la population totale.
On passe par l'intermédiaire des grandeurs et
qui sont associatives.
N=N1+N2; m=(N1*m1+N2*m2)/N; tmp=N1*(m1^2+s1^2)+N2*(m2^2+s2^2);
s=sqrt(tmp/N-m^2); printf('\n N= %d, m= %f, s= %f\n',N,m,s);
donne : N= 80, m= 18.900000, s= 10.197549
Selon la méthode choisie, on indiquera comment utiliser les
tables données dans le polycopié ou bien comment utiliser la fonction
cdfnor.
Les durées d'un ensemble de processus sont approximativement
distribués suivant la loi
. Quel est le pourcentage
de processus ayant une durée : (a) supérieure à ; ( b) inférieure
à ; (c) comprise entre et ?
On décrit la loi utilisée
[m,s]=(90,12)
Puis on utilise cdfnor pour obtenir les
x=95; printf('la proportion des x >%3d est: %f\n',.. . x, 1-cdfnor('PQ',x,m,s)) x=100; printf('la proportion des x <%3d est: %f\n',.. . x, cdfnor('PQ',x,m,s)) x=80; y=110; printf('la prop. des %3d< x <%3d est: %f\n',.. . x, y, cdfnor('PQ',y,m,s)-cdfnor('PQ',x,m,s)).
On obtient :
la proportion des x > 95 est: 0.338461 la proportion des x <100 est: 0.797672 la prop. des 80 < x <110 est: 0.749881
D'où les réponses 34%, 80%, 75%.
Imprimer [p,q]=cdfnor(qsp) ne va pas, sauf à indiquer lequel
des deux nombres donne la réponse voulue.
Pour la distribution précédente, trouver , placés symétriquement
autour de la moyenne, tels que
.
Cela revient à dire que
a= 81.906123, b= 98.093877
On sait que la variable suit une loi normale et que
et
. Déterminer et .
On en déduit les valeurs réduites
et
.
On résoud
Il vient
et
Pour ceux qui ont voulu utiliser des matrices :
prob= [0.34; 1-0.47], mb=[10; 17] z=cdfnor('X', zeros(prob), ones(prob), prob, 1-prob); ma=[z; ones(z)]; tmp=inv(ma)*mb printf('z= [%f, %f], mea= %f, sig=%f\n\n',
z(1), z(2), tmp(2), tmp(1))
Le nombre ddmmaa ci-dessous est à personnaliser,
de sorte que dd/mm/19yy soit votre date de naissance. On considère
deux variables aléatoires indépendantes et distribuées respectivement
selon les lois gamma réduites :
et
. On s'intéresse à la distribution
de la variable .
Rappeler quels sont les paramètres de dispersion d'une variable
distribuée selon une loi
.
Les paramètres de dispersion d'une distribution sont la moyenne (espérance)
et l'écart-type.
On a
et
Au cas où serait une variable
, déterminer
les paramètres correspondants.
On a
(toujours)
et
(indépendance)
Au cas où serait une variable gamma, on a nécessairement
et .
D'ailleurs, le cours montre que la somme de deux variables gamma réduites
est une variable gamma réduite.
Initialiser à nouveau le générateur aléatoire par la commande grand('setsd', ddmmaa) Engendrer instanciations de , puis instanciations
de (consulter l'aide en ligne de grand
pour les détails de syntaxe, et utiliser 'gam'
avec : shape=, scale=).
L'aide en ligne indique :
Y= grand(m,n,'gam',shape,scale) generates random variates
from the gamma distribution with parameters shape (real > 0) and scale (real
> 0)
Pour chacune des variables , tracer l'histogramme
des valeurs obtenues (utiliser une répartition en 10 classes). Représenter
la moyenne et l'écart-type de ces valeurs.
On réutilise le programme contenu dans stats.sce :
curfig=scf(1); clf(); histplot(10, lesx); xtitle(sprintf('X : %d instanciations, loi gamma (%4.2f,1)',
N,aa)) curax=gca(); curax.title.font_size=4; curax.sub_ticks=[0,0];
De même pour et .
Sur chacun des graphes, représenter la densité de probabilité
de la loi
correspondante.
Ne pas utiliser la distribution normale (l'exercice a changé...).
Utiliser cdfgam (cf. l'aide en ligne)
pour déterminer les nombres
tels que
, avec
.
Sur un nouveau graphique, tracer l'histogramme théorique de la loi
de
correspondant aux classes
(remplacer par une valeur "raisonnable").
Sur ce graphique, superposer l'histogramme des données expérimentales
(pour les mêmes classes).
Il faut commencer par indiquer où se trouve le fichier :
repert='~/docs/Ensait/stats/datas/' fich=repert+"football.txt"
Puis on lit tout en bloc. Ne pas mélanger lecture et interprétation :
hndl=mopen(fich,'r'); brut=mgetl(hndl); mclose(hndl);
Récupérer les valeurs numériques (attention aux virgules et
autres "drames de syntaxe"). Sélectionner les colonnes
ht (height=taille) et wt (weight=poids). En cas de "drame
non résolu", il est toujours possible de retravailler le
fichier de données avec un traitement de texte.
Stratégie générale : remplacer les virgules par des séparateurs.
tmp=strsubst(brut,',',' '); datas=msscanf(-1, brut(2:$), "%d%s%d%d%s")
Stratégie de repli : procéder aux remplacements dans un traitement
de texte avant lecture sous scilab.
Stratégie "glorieuse" : en lisant la doc, on trouvait :
datas=msscanf(-1, brut(2:$), "%d,%[A-Za-z\-],%d,%d,%[A-Z]")
Autre statégie possible : lire ligne par ligne, en faisant une boucle.
Sélection des bonnes colonnes :
ht=datas(:,3); wt=datas(:,4);
Calculer les 6 paramètres de dispersion de la distribution
.
Représenter ces points, représenter les moyennes et les écarts-type.