Exercice corrigé Ancien programme

représentativité d'un échantillon

L'indice de masse corporelle, IMC, se calcule par la formule :

.

D'après l'OMS (Organisation Mondiale de la Santé), une personne est en surpoids si son IMC est supérieur à 25.

Soucieux de la santé de ses administrés, le Maire d'une commune lance une étude pour estimer le pourcentage p d'individus en surpoids dans sa ville : deux instituts de sondages interrogent respectivement 750 individus et 900 individus, pris au hasard dans la population et calculent leur IMC. Le premier institut trouve 29% d'individus en surpoids et le deuxième 21 %.

1. Le Maire s'étonne de l'écart entre ces deux résultats : est-ce légitime ?

On pourra comparer les intervalles de confiance au niveau 0,95 pour le pourcentage de personnes en surpoids dans cette commune dans chacune des deux études.

 

Voir le cours, VI et le savoir-faire 4.

 

2. Pour expliquer cette différence, le Maire met en cause la représentativité des échantillons interrogés. Le premier comptait 370 hommes et 380 femmes, le second 390 hommes et 510 femmes. Le pourcentage d'hommes dans cette commune étant de 47 %, mettriez-vous en cause la représentativité des échantillons interrogés, et si, oui, à laquelle des deux études le Maire devrait-il, selon vous, se fier ?

On pourra déterminer les intervalles de fluctuation asymptotique au seuil de 95 % pour la proportion d'hommes dans des échantillons de taille 750 et 900 et comparer avec les fréquences observées dans les deux échantillons interrogés.

 

Voir le cours, V et le savoir-faire 3.

 

 

 

 

1. Pour le premier institut de sondage, le nombre d'individus interrogés , la fréquence de personnes observées en surpoids est

Ainsi

et donc l'intervalle de confiance au niveau 0,95 pour la proportion de personnes en surpoids dans la population totale de la ville est ,

soit en arrondissant les bornes à 0,001 près.

De même pour le deuxième institut de sondage, le nombre d'individus interrogés est , la fréquence de personnes observées en surpoids est .

Ainsi et donc l'intervalle de confiance au niveau 0,95 pour la proportion p de personnes en surpoids dans la population totale de la ville est ,

soit en arrondissant les bornes à 0,001 près.

Ces deux intervalles sont disjoints, donc on peut conclure, au niveau de confiance 0,95, que ces deux études sont contradictoires. La surprise du Maire est légitime au niveau de confiance 0,95.

2.Notons la proportion effective des hommes dans la population totale de la ville. Sur un échantillon de taille :

et , donc l'intervalle de fluctuation asymptotique au seuil de 95 % pour la fréquence des hommes dans un échantillon de 750 personnes prises aléatoirement dans la population totale est :

en arrondissant les bornes à 0,001 près.

La proportion observée d'hommes dans l'échantillon interrogé par le premier institut est égale à près : cette proportion est dans l'intervalle de fluctuation asymptotique au seuil de 95 %, donc on peut conclure que l'échantillon est bien représentatif de la population totale.

Sur un échantillon de taille , on a toujours et , donc l'intervalle de fluctuation asymptotique au seuil de 95 % pour la fréquence des hommes dans un échantillon de 900 personnes prises aléatoirement dans la population totale est :

en arrondissant les bornes à 0,001 près.

La fréquence des hommes observée sur l'échantillon interrogé par le deuxième institut est près : cette proportion n'est pas dans l'intervalle de fluctuation asymptotique au seuil de 95 %, donc on peut conclure que l'échantillon n'est pas représentatif de la population totale.

Le Maire devrait plutôt se fier au résultat du premier institut de sondage.

Accéder à tous les contenus
dès 6,79€/mois

  • Les dernières annales corrigées et expliquées
  • Des fiches de cours et cours vidéo/audio
  • Des conseils et méthodes pour réussir ses examens
  • Pas de publicités
S'abonner