previous up next_inactive
Up: Return to previous menu

Ensait - A2 - Plans d'expérience


Date: Corrigé du DS du 05/11/2003 - durée 2h00

Durée : 2 heures. Tous documents autorisés.
L'usage d'un ordinateur (et des programmes indiqués en cours) est recommandé.
Le listing des calculs fait sur ordinateur sera joint (deux pages par feuille, folioté).
Le commentaire écrit fera des références précises à cette feuille de calcul.
Dans ce corrigé, les commandes Maple sont en caractères typewriter et les "réponses Maple" au format équation. Il nous a semblé que l'on pouvait améliorer la lisibilité de ces listings par une commande sayval, dont le résultat est d'afficher côte à côte la question et la réponse.
sayval:= proc(z::uneval); z= eval(z) ; end:
Comme il se doit, un commentaire en langage ordinaire accompagne le tout. Un des objectif de ce commentaire est le formatage des résultats, destiné à ne pas afficher avec douze décimales un résultat dont dix décimales sont incertaines.

1 Calculs élémentaires

  1. maths est une v.a. maths. Que valent maths , maths et maths ?
    Calculez maths.
    m,s:=17, 2.9 ; esp=m, sd=s, var=s2 ; sayval(1-Norlaw(m,s,18)) ; 

    maths

    maths

    Cette probabilité est donc de 37%.
  2. Si les âges d'un groupe de personnes sont distribués suivant la loi maths, quel est le pourcentage des membres de ce groupe ayant : (a) moins de 27 ans ; ( b) au moins 26 ans ; (c) entre 21 et 24 ans ?
    m,s:=25, 4 ; esp=m, sd=s, var=s2 ; sayval(Norlaw(m,s,27)); sayval(1-Norlaw(m,s,26)) ; sayval(Norlaw(m,s,24)-Norlaw(m,s,21)) ;

    maths

    maths

    maths

    maths

    Les réponses sont donc respectivement : 69%, 40% et 24%.
  3. Déterminer maths et maths sachant que la variable maths suit une loi normale et que maths et maths.
    '{IGauss(0.31)=(7-mu)/sigma, IGauss(1-0.44)=(18-mu)/sigma}' ;  solve(rhs(%));

    maths

    Conduisant à :

    maths

2 Loi binomiale et loi normale

On considère une variable maths distribuée selon la loi binomiale avec pour paramètres maths et maths.
  1. Donner la formule de maths.
    n,p,q:= 8, 0.4, 1-'p' ; psi:= unapply( binomial(n,k)*pk*q(n-k),k) ; 

    maths

    maths

  2. Donner les valeurs à six décimales de maths pour maths.
    seq(psi(k),k=0..n) ; 

    maths

  3. Rappeler les formules de calcul de l'espérance et de la variance d'une variable aléatoire discrète. Utiliser ces formules et les valeurs de Q2 pour calculer des valeurs approchées maths et maths.
    sayval(sum(psi(k), k=0..n)) ;  sayval(sum(k*psi(k), k=0..n)) ; mu:= rhs(%) : sayval(sum(k2*psi(k), k=0..n)-mu2) ; sigma:= sqrt(rhs(%)) :  sayval([mu=n*p, sigma2=n*p*q]) ; 

    maths

    maths

    maths

  4. Comparer avec les valeurs exactes (rappeler les formules valables pour une variable suivant la loi binomiale). Un histogramme est demandé. On sait que les valeurs théoriques sont maths. En reportant, on retrouve les valeurs obtenues. L'histogramme est obtenu en choisissant des classes centrées sur les valeurs réellement obtenues.
    tal:= [seq(Weight(k-1/2..k+1/2, psi(k)), k=0..n)] :  pla:= stats[statplots, histogram](tal) :  plb:= plot([[mu+sigma,t,t=0..0.4/sigma],[mu-sigma,t,t=0..0.4/sigma]],      color=red, linestyle=16) : display(pla,plb) ;
    La hauteur probable du trait (maths) est obtenue par référence au modèle normal. On obtient la figure 1.

    Figure 1: Histograme de la loi binomiale maths.
    maths

  5. Quelles sont les valeurs des paramètres de la variable normale maths présentant la meilleure ressemblance avec la variable binomiale étudiée ci-dessus ? Donner les valeurs à trois décimales de maths pour cette variable normale. Histogramme.
    1. On sait que pour maths "assez grand" la loi de la variable réduite associée converge vers la loi de Gauss. La variable maths suit donc, de façon approchée, une loi normale ayant maths et maths comme paramètres. Les probabilités maths sont donc données par les variations de la fonction de répartition.
      'phi(k)=Norlaw(mu, sigma, k+1/2)-Norlaw(mu, sigma, k-1/2)' ;  phi:= unapply(rhs(%),k) : seq(psi(k),k=0..n) ; 

      maths

      maths

    2. Il convient de tenir compte du phénomène suivant. La loi normale prend ses valeurs sur maths tout entier, alors que la loi binomiale est à support fini. Il peut donc sembler utile de renormaliser les probabilités obtenues en divisant par la masse totale (ici maths). Une autre façon de faire serait de prolonger à l'infini les deux classes extrêmes.
      sayval(sum(phi(k), k=0..n)) ; masse:= rhs(%) :  sayval(sum(k*phi(k), k=0..n)/masse) ; mu1:= rhs(%) :  sayval(sum(k2*phi(k), k=0..n)/masse-mu12) ; sigma1:= sqrt(rhs(%)) : sayval([mu=mu1, sigma2=sigma12]) ; 

      maths

      maths

      maths

      On obtient alors maths comme paramètres de dispersion.
    3. Représentant tout cela sur un histogramme, on obtient la figure 2.
    [seq(Weight(k-1/2..k+1/2, phi(k)), k=0..n)] :  plc:= stats[statplots, histogram](%) : display(pla,plb, plc) ; 

    Figure: Histogramme de la loi normale associée.
    maths

  6. Comment comparer les valeurs de maths et maths ? Par un test de maths. On constate que les deux distributions (gaussienne et gaussienne renormalisée) obtiennent le même score.
    sayval(sum((phi(k)-psi(k))2/psi(k), k=0..n)) ; sayval(sum((phi(k)/masse-psi(k))2/psi(k), k=0..n)) ; 

    maths

    maths

3 Test d'hypothèses (1)

On a prélevé un premier échantillon de maths objets. La moyenne de cet échantillon est maths et son écart-type est maths. Puis on a prélevé un deuxième échantillon de maths. La moyenne de cet échantillon est maths et son écart-type est maths. Reprenant les données, on obtient :
N:=10000 : n, s:='n', 's' : n[1]:=650 : m[1]:=98 : s[1]:= 13 :  n[2]:=1000-n[1] : m[2]:=103 : s[2]:=14 : [seq([n[j],m[j],s[j]],j=1..2)] : N, Matrix(%) ; 

maths

  1. Calculer la moyenne maths et l'écart-type maths de l'échantillon constitué de la réunion des deux échantillons précédents.
    n[0]:=n[1]+n[2] ; m[1]*n[1]+m[2]*n[2] : m[0]:= %/n[0]*1. ; s[1]2*n[1]+s[2]2*n[2] : mvar:= %/n[0]*1. :  varm:= (n[1]*(m[1]-m[0])2+n[2]*(m[2]-m[0])2)/n[0] :  s[0]:= sqrt(mvar+varm);

    maths

    maths

    maths

    La variance totale est la somme de la moyenne des variances (ici maths) et de la variance des moyennes (ici maths).
  2. Tester l'hypothèse selon laquelle les deux échantillons initiaux auraient été prélevés au sein d'une même population.
    sayval(s[0]2*(n[0])/(n[0]-1)*(1/n[1]+1/n[2])) ;  rhs(%) : sayval((m[1]-m[2])/sqrt(%)) ; 

    maths

    maths

    Sous l'hypothèse donnée, notre meilleure de la variance de la population est maths. Les variances des moyennes d'échantillon sont alors respectivement mathset maths. La variance d'une différence (de variables indépendantes) étant la somme des variances, on arrive à une valeur maths pour la variable réduite associée, valeurs totalement improbable. L'hypothèse est à rejeter.
  3. En supposant que la population est homogène et distribuée normalement, avec un nombre total d'individus égal à maths, estimer le nombre maths d'objets (de la population totale) vérifiant maths.
    t:= 98. : sayval(Norlaw(m[0], s[0], t)) ; p:= rhs(%) :

    maths

    L'espérance de maths vaut donc maths
  4. En supposant que la population est constituée de deux populations indépendantes, homogènes et distribuées normalement, avec un nombre total d'individus égal à maths, estimer le nombre maths d'objets (de la population totale) vérifiant maths.
    sayval(Norlaw(m[1], s[1], t)) ; p1:= rhs(%) : sayval(Norlaw(m[2], s[2], t)) ; p2:= rhs(%) : sayval(N*(n[1]/n[0]*p1+n[2]/n[0]*p2)) ; centre:= rhs(%) : 

    maths

    maths

    maths

    En supposant que les tailles des échantillons ont été choisies proportionnellement aux tailles des sous-populations, on a maths, conduisant maintenant à maths.
  5. Donner, dans les deux cas, un intervalle de confiance à maths pour le nombre maths. Comparer les résultats obtenus.
    sayval(N*p-2*sqrt(N*p*(1-p))..N*p+2*sqrt(N*p*(1-p))) ;  

    maths

    sayval(N*(n[1]/n[0]*p1*(1-p1)+n[2]/n[0]*p2*(1-p2))) ; centre -2*sqrt(rhs(%))..centre +2*sqrt(rhs(%)) ;

    maths

    maths

4 Test d'hypothèses (2)

Au sein d'une population distribuée selon une loi normale, on a prélevé l'échantillon suivant

maths

(les données ont été arrondies pour alléger les calculs...)
  1. Estimer la moyenne maths de la population pour les seuils de confiance maths et maths (une certaine table a été complétée sur le site web pour contenir les informations nécessaires).
    n:= nops(vals) : mu:= add(k, k=vals)/n*1. : s:= sqrt(add(k2, k=vals)/n*1.-mu2)*n/(n-1) :  'n'=n, 'mu'=mu, 's'=s; 

    maths

    On commence par calculer la moyenne de l'échantillon, ainsi que le prédicteur de variance maths. Puis on utilise les tables de Student-Fischer pour obtenir les coefficients maths et maths permettant de faire le calcul. On aboutit aux intervalles maths et maths. Pour tenir compte du nombre exact de degrés de liberté, il faudrait recourir à la fonction de Student-Fischer par :
    tau:=.999 : mu + stats[statevalf, icdf, studentst[n-1]]((1+tau)/2)*s ; 
  2. Estimer la taille de l'échantillon nécessaire pour obtenir un intervalle de largeur maths autour de maths (toujours pour les seuils maths et maths).
    3=4*sigma, sigma='s'/sqrt(N) : %, solve({%}) ; 

    maths

    3=6.6*sigma, sigma='s'/sqrt(N): %, solve({%}) ; 

    maths

    On commence par l'approximation normale (maths dépend de la taille, tandis que maths n'en dépend pas). Le rayon de l'intervalle à 95% étant maths, sa largeur est de maths et on trouve maths. Pour une fiabilité à 99.9%, la largeur de l'intervalle (en maths) est maths, conduisant à maths Pour ces dimensions, la correction de Fischer est inutile. On peut le vérifier en posant les calculs "exacts", qui consuisent à maths.
    stats[statevalf, icdf, studentst[285]]((1+.999)/2) : 3=2*%*sigma, sigma='s'/sqrt(N) : %,  solve({%}) ; 

    maths


previous up next_inactive
Up: Return to previous menu


douillet@ensait.fr
2004-09-06