On représente une série statistique à deux variables par un nuage de points et on cherche une droite passant « le plus près possible » des points du nuage.
X et Y sont deux variables statistiques numériques dont les valeurs relevées sont respectivement x1, x2, …, xn et y1, y2, …, yn.
I Nuage de points et point moyen
Définition : Dans le plan muni d'un repère orthogonal, le nuage de points associé à la série statistique est l'ensemble des points Mi(xi ; yi), i entier entre 1 et n.
Définition : Le point moyen est , où et sont les moyennes des séries :
II Ajustement affine
1 Droite de Mayer
On répartit, par abscisses croissantes, les points en deux sous-nuages de même effectif, éventuellement à une unité près ; G1 et G2 sont les points moyens des deux sous-nuages. La droite (G1G2) est appelée droite de Mayer.
2 Droite de régression de y en x ou droite des moindres carrés
La somme des carrés des distances de chaque point du nuage au point de même abscisse de la droite de regression de y en x est minimale.
Cette droite, déterminée par la méthode des moindres carrés, passe par le point moyen G et a pour équation réduite y = ax + b, avec :
et
où et
Application : Si y = ax + b est l'équation réduite d'une droite d'ajustement du nuage, on peut faire une estimation de la valeur v de Y associée à une valeur u de X autre que x1, x2, …, xn en posant v = au + b.
Méthode
Déterminer deux ajustements affines d'une série statistique à deux variables
Le tableau ci-dessous donne l'évolution du nombre de PACS (pacte civil de solidarité), en milliers, conclus en France entre 2004 et 2010.
Tous les résultats numériques seront arrondis au centième.
conseils
solution
Avec l'équation y = 29,38x + 28,45, pour x = 3,17, on a y = 121,58, valeur voisine de l'ordonnée de G.