previous up next contents
Previous: 3.1 Importance des hypothèses Up: 3. Improving Next: 3.3 Surfaces de réponse   Contents

Subsections

3.2 Calcul des incertitudes

3.2.1 Régression affine

Calculer une droite de régression affine est équivalent au jeu de rôles suivant. Alice dispose de deux coefficients $ \alpha,\,\beta$, de $ n$ réels $ \left(x_{i}\right)_{1..n}$ fixés ainsi que d'un générateur aléatoire centré $ \nu$ (de variance $ \sigma_{\nu}^{2}$). Alice calcule les $ y_{i}$ par $ \forall i\,:\, y_{i}=\alpha\, x_{i}+\beta+\nu\left(i\right)$ et transmet les couples $ \left(x_{i},\, y_{i}\right)$ à Bob. Le problème de Bob est maintenant de trouver une estimation de $ \alpha$ et de $ \beta$, sous la forme d'un intervalle de confiance autour d'une "meilleure valeur probable". Ce problème se résoud en cherchant le couple $ a,\, b$ qui minimise :

$\displaystyle \chi^{2}\doteq\frac{1}{n}\,\sum_{1}^{n}\left(y_{i}-a\, x_{i}-b\right)^{2}$

En utilisant les notations du Theorem 1.3.18, nous avons :

$\displaystyle \raisebox{0.5 em}{\normalfont\textsf{t}}{A}=\begin{array}{cccc}
x...
...& y_{n}\end{array}\quad;\quad f=\left(\begin{array}{c}
b\\
a\end{array}\right)$

et, par conséquent, nous obtenons :

$\displaystyle S\doteq\raisebox{0.5 em}{\normalfont\textsf{t}}{A}\, .\, A=\frac{...
...{array}\right)\quad;\quad a=\frac{cov}{var_{x}}\quad;\quad b=\bar{y}-a\,\bar{x}$    
$\displaystyle \chi_{min}^{2}=var_{y}\left(1-\frac{cov_{xy}^{2}}{var_{x}\, var_{y}}\right)$    

3.2.2 Incertitudes

Theorem 3.2.1   Pour un plan de $ n$ essais conduisant à un modèle avec $ p$ coefficients, la variance résiduelle $ \chi_{min}^{2}$ est un estimateur biaisé (sous-estimé) de $ \sigma_{\nu}^{2}$. Un estimateur non biaisé est obtenu en prenant en compte le nombre réel de degrés de liberté. Il vient :

$\displaystyle est\left(\sigma_{\nu}^{2}\right)=\frac{n}{n-p}\,\chi_{min}^{2}$

Preuve. $ \chi_{min}^{2}$ est une forme quadratique en les variables $ v_{j}$ et elle se réduit, par définition, en $ \left(n-p\right)$ termes indépendants. $ \qedsymbol$

Proposition 3.2.2   Dans le cas d'une régression affine, $ a$ est fonction affine des $ \nu_{j}$. De même, pour $ X$ fixé, $ Y\doteq a\, X+b$ est une fonction affine des $ \nu_{j}$ et l'on a :

$\displaystyle \sigma_{a}^{2}=\sigma_{\nu}^{2}\times\frac{1}{n}\,\frac{1}{var_{x}}\approx\chi_{min}^{2}\times\frac{1}{n-2}\,\frac{1}{var_{x}}$

$\displaystyle \sigma_{Y}^{2}=\sigma_{\nu}^{2}\times\frac{1}{n}\left(1+\frac{\le...
...}\times\frac{1}{n-2}\,\left(1+\frac{\left(X-\bar{x}\right)^{2}}{var_{x}}\right)$

Dans ces formules, $ \sigma_{a}^{2}$ et $ \sigma_{Y}^{2}$ sont les variances de $ a$ et de $ Y$ calculées sur un grand nombre de répétitions de la procédure.

Theorem 3.2.3   Dans le cas général, la variance de l'estimation $ Y=X\, .\, f$ faite au point $ X$ en utilisant la formule des moindres carrés est :

$\displaystyle \sigma_{Y}^{2}=X\, .\, S^{-1}\, .\, \raisebox{0.5 em}{\normalfont\textsf{t}}{X}$

Preuve. Les hypothèses font que $ f$, calculé par (1.1), puis $ Y$ sont des fonctions affines des variables iid $ \nu_{i}$. On obtient donc

$\displaystyle \sigma_{Y}^{2}=\sum\left(\frac{\partial\, Y}{\partial\, v_{i}}\right)^{2}\sigma_{\nu}^{2}$

et il est immédiat que la colonne des $ \partial Y/\partial\nu_{i}$ vaut $ X\, .\, S^{-1}\, .\, \raisebox{0.5 em}{\normalfont\textsf{t}}{A}$. $ \qedsymbol$

Remark 3.2.4   Les résultats précédents ont été obtenus sans faire aucune hypothèse sur la loi de répartition des écarts entre le modèle et la réalité à part le fait qu'ils soient iid et de moyenne nulle. Par contre, il est essentiel que les $ x$ soient tous exactement connus.

Remark 3.2.5   Si l'on suppose en outre que le bruit est "normal", le rapport $ est\left(\sigma_{\nu}^{2}\right)/\sigma_{\nu}^{2}$ suit une loi de Student-Fischer à $ n-p$ degrés de liberté, permettant de calculer des intervalles de confiance.


previous up next contents
Previous: 3.1 Importance des hypothèses Up: 3. Improving Next: 3.3 Surfaces de réponse   Contents


douillet@ensait.fr
2008-01-22