Previous: 1 Programmation non linéaire
Up: 1 Programmation non linéaire
Next: 1.2 Optimisation sans contrainte
Subsections
On a réalisé
expériences (indexées par
,
consistant chacune en la mesure d'un résultat
et de
paramètres
. On cherche, parmi toutes les descriptions linéaires
,
celle qui sera optimale au sens des moindres carrés, c'est à dire donnant la
meilleure corrélation linéaire possible. On veut donc minimiser
la quantité
.
La valeur minimale obtenue s'appelle la variance réduite de
.
On se demande quelle est la droite qui "passe au mieux" parmi
points
.
- On pose
et l'on cherche à déterminer les constantes
pour que l'écart quadratique
entre
et
soit minimal.
- On a
.
Une première condition requise est donc
.
Définissant
par
, il vient :
Autrement dit : la droite de meilleure approximation passe nécessairement par
le point moyen de la distribution.
- Introduisons maintenant les variables centrées :
et
et posons
,
et
.
On a
et donc
. On en déduit
:
- Il très important de quantifier la réduction de variance obtenue par ce procédé.
En reportant, il vient
,
soit :
- L'écart-type réduit, qui est la racine carrée de la variance réduite, détermine
l'épaisseur de la bande à placer de part et d'autre de la droite de régression
pour obtenir une "probabilité raisonnable" de localisation
des points mesurés.
- Prenons pour exemple la suite de points
,
,
,
et
: on a
et
. Les calculs donnent
,
,
,
. De là
,
et
. On trouve donc
et le facteur de réduction
de variance est
. La droite
de régression linéaire "rend compte" de
de la
variance.
- Prenons maintenant pour exemple la suite
et
,
on trouve une covariance nulle et, pour ce nouvel exemple, "l'explication
linéaire" n'explique plus rien et la droite "de régression"
est horizontale.
Figure:
Régressions linéaires : efficace et inefficace.
|
|
- Prenons pour exemple
,
,
et
. L'objectif est de minimiser
où l'on a posé
.
- On a
et donc
vaut
.
- Les dérivées partielles par rapport aux paramètres valent :
.
En les égalant à
, on trouve
,
ce qui conduit à
, alors que l'on avait
.
- On explique donc environ
de la variance, ce qui n'est pas si mal.
- On a
.
En effet
est un nombre et est donc égal à son transposé
.
- Faisons varier
pour le faire devenir
. Par linéarité,
vaut
. Comme les nombres
et
sont transposés l'un de l'autre, ils sont
égaux, on a
,
tandis que le terme de deuxième ordre n'est autre que
qui est positif : les points critiques conduisent donc à un minimum.
- La sémantique du problème conduit à
: il n'y aurait pas grand sens
à introduire beaucoup de "variables explicatives" pour expliquer
un petit nombre de points. La taille des matrices
et
est donc petite (respectivement
et
).
- Dans le présent problème, le seul cas critique serait
, c'est
à dire la non-indépendance (sur-abondance) des paramètres ``explicatifs''.
- Dans l'exemple choisi, on a
et
. D'où
.
- On cherche ``le'' point ``déterminé'' par les conditions
,
et
. En fait, on veut minimiser la somme des carrés
des distances.
- Quelle est la signification ``géométrique'' de ce point ?
- Que se passe-t-il lorsque l'on prend quatre droites ?
Previous: 1 Programmation non linéaire
Up: 1 Programmation non linéaire
Next: 1.2 Optimisation sans contrainte
douillet@ensait.fr
2001-11-21