Statistique à deux variables

Merci !

Fiches
Classe(s) : Tle STMG | Thème(s) : Statistique descriptive à deux variables

Statistique à deux variables

On observe que, dans certains cas, il semble exister un lien entre les deux caractères d’une série statistique à deux variables, par exemple entre le poids et la taille d’un nouveau né, entre le chiffre d’affaires et le montant des charges d’une société, entre la consommation et la vitesse d’une voiture…

Il est alors intéressant d’étudier simultanément deux caractères d’une même population. Nous pouvons alors présenter les résultats sous forme de tableaux ou de graphique.

1Tableaux de données, nuages de points

A Tableaux de données

Exemple

Le tableau suivant donne le nombre d’habitants d’une ville nouvelle entre les années 1985 et 2015.

PB_9782216129348_T_STMG_08_Maths_Tab_15

B Nuage de points

Le plan étant muni d’un repère, nous pouvons associer au couple (xi, yi) de la série statistique double, le point Mi de coordonnées xi et yi.

L’ensemble des points Mi obtenus constitue le nuage de points représentant la série statistique.

12934_Math_26_stdi

Exemple

Avec l’exemple du A, on obtient le nuage de points ci-contre.

Dans cet exemple, on peut penser, qu’en première approximation, une droite 𝔇 peut être tracée « le plus près possible » des sept points du nuage. C’est le problème de l’ajustement affine.

C Point moyen

Lorsqu’on pense pouvoir réaliser un ajustement affine d’un nuage, il peut sembler intéressant, avant de tracer la droite d’ajustement, de placer le point G dont l’abscisse est la moyenne x¯ des abscisses xi et l’ordonnée, la moyenne y¯ des ordonnées yi.

Définition

On appelle point moyen d’un nuage de n points Mi de coordonnées (xi, yi) le point G de coordonnées : xG=x¯ et yG=y¯.

Exemple

On vérifie que, dans l’exemple du paragraphe A, le point moyen G a pour coordonnées : (15, 32). Le point G a été placé sur la figure du paragraphe B.

2Ajustement affine

A Ajustement affine par une méthode graphique

Exemple

On reprend le nuage de points de l’exemple du paragraphe A. On se propose de faire des prévisions pour le nombre d’habitants de la ville nouvelle à partir des données relevées entre 1985 et 2015.

Un moyen d’y parvenir est de tracer « au jugé » une droite 𝔇 passant le plus près possible des points du nuage et d’admettre que les nombres d’habitants yi et les rangs de l’année xi sont liés par l’équation yaxb de 𝔇.

On peut, par exemple, prendre pour droite 𝔇 la droite passant par le point moyen G et par le point A(5, 21). Une équation de cette droite est y = 1,1x + 15,5. La droite 𝔇 est tracée sur la figure au B.

En remplaçant x par 35 dans l’équation de 𝔇, on obtient y = 54. On peut estimer à 54 000 le nombre d’habitants en 1 985 + 35 = 2 020.

On peut choisir une autre droite…

B Ajustement affine par la méthode des moindres carrés

12934_Math_27_stdi

Exemple

Une entreprise s’intéresse au lien entre ses dépenses publicitaires et son chiffre d’affaires : elle recueille les données suivantes, exprimées en millions d’euros, portant sur cinq périodes où les dépenses publicitaires sont notées x1, x2, …, x5 et les chiffres d’affaires y1, y2, …, y5.

PB_9782216129348_T_STMG_08_Maths_Tab_14

Représentons ces données par cinq points Mi dans un repère où des dépenses publicitaires xi sont en abscisse et les chiffres d’affaires yi en ordonnée. Le point moyen du nuage est G(3,1 ; 65,8).

Vérifiez-le !

La méthode des moindres carrés consiste à prendre pour droite d’ajustement du nuage de points une droite 𝔇 telle que la somme des carrés P1M12 + … + P5M52 soit minimale.

D’où le nom : « moindre carrés ».

L’équation de la droite 𝔇, aussi appelée droite de régression de y en x s’obtient directement avec une calculatrice ou un tableur. En arrondissant les coefficients à 10–3, on obtient dans cet exemple y = 12,768x + 26,219.

Voir l’exemple du paragraphe .

C Déterminer une équation de la droite de régression à l’aide d’une calculatrice

Exemple

Une enquête du service commercial d’un fabriquant de matériel médical a permis de connaître l’évolution de la demande yi d’unités d’un certain matériel, selon le prix xi auquel il est proposé :

PB_9782216129348_T_STMG_08_Maths_Tab_13

12934_Math_28_stdi

Comment réaliser un ajustement affine avec une calculatrice

Calculatrice de marque CASIO

On entre dans le menu de statistique en faisant MENU STAT EXE puis on procède à l’effacement éventuel des données présentes dans les listes en se plaçant dans une colonne puis en faisant DEL A YES EXE (appuyer sur F6 en cas d’icône caché).

12934_Math_29

Ensuite, on entre les valeurs xi en colonne List 1 et les valeurs yi en colonne List 2.

PB_9782216129348_T_STMG_08_Maths_Tab_12

Le réglage des listes s’effectue par CALC SET puis :

2Var X List : List 1

2Var Y List : List 2

2 Var Freq : 1 EXE.

L’affichage des résultats de la « régression linéaire » (c’est une autre appellation de l’ajustement affine), se fait par REG X.

12934_Math_32

Vous devez obtenir un affichage semblable à celui montré ci-dessus.

Calculatrice de marque Texas Instruments (instructions en français en bleu) :

On entre dans le menu de statistique en appuyant sur la touche STAT ou statspuis on procède à l’effacement éventuel des données présentes dans les listes en faisant EDIT 4:ClrList ENTER L1, L2 ou 4:EffListe entrer L1, L2 (on obtient L1 et L2 au clavier par la touche 2nd ou 2nde).

PB_9782216129348_T_STMG_08_Maths_Tab_11

Pour saisir les données, on fait STAT EDIT 1: Edit ENTER ou 1:Edite entrer puis on entre les valeurs xi en colonne L1 et les valeurs yi en colonne L2.

12934_Math_35

L’affichage des résultats de la « régression linéaire » (ou ajustement affine), se fait par STAT CALC 4:LinReg(ax+b) ENTER L1, L2 ou stats CALC 4 :RegLin(ax+b) entrer L1, L2.

PB_9782216129348_T_STMG_08_Maths_Tab_10

Vous devez obtenir un affichage semblable à celui montré ci-dessus.

En arrondissant les coefficients a et b à 10–2, on obtient l’équation y = – 4,55x + 883,11.

On peut alors estimer la demande, par exemple, pour un prix proposé de 130 € :

d = – 4,55 × 130 + 883,11 ≈ 292.