Sincérité dans les sondages

Merci !

Annales corrigées
Classe(s) : Tle S | Thème(s) : Estimation
Type : Exercice | Année : 2016 | Académie : Afrique


Afrique • Juin 2016

Exercice 3 • 5 points

Sincérité dans les sondages

Un institut effectue un sondage pour connaître, dans une population donnée, la proportion de personnes qui sont favorables à un projet d’aménagement du territoire. Pour cela, on interroge un échantillon aléatoire de personnes de cette population, et l’on pose une question à chaque personne.

Les trois parties sont relatives à cette même situation, mais peuvent être traitées de manière indépendante.

Partie A : Nombre de personnes qui acceptent de répondre au sondage

On admet dans cette partie que la probabilité qu’une personne interrogée accepte de répondre à la question est égale à 0,6.

▶ 1. L’institut de sondage interroge 700 personnes. On note X la variable aléatoire correspondant au nombre de personnes interrogées qui acceptent de répondre à la question posée.

a) Quelle est la loi de la variable aléatoire ? Justifier la réponse.

b) Quelle est la meilleure valeur approchée de P(X  400) parmi les nombres suivants ?

0,92 0,93 0,94 0,95

2. Combien de personnes l’institut doit-il interroger au minimum pour garantir, avec une probabilité supérieure à 0,9, que le nombre de personnes répondant au sondage soit supérieur ou égal à 400 ?

Partie B : Proportion de personnes favorables au projet dans la population

Dans cette partie, on suppose que n personnes ont répondu à la question, et on admet que ces personnes constituent un échantillon aléatoire de taille n (où n est un entier naturel supérieur à 50).

Parmi ces personnes, 29 % sont favorables au projet d’aménagement.

▶ 1. Donner un intervalle de confiance, au niveau de confiance de 95 %, de la proportion de personnes qui sont favorables au projet dans la population totale.

▶ 2. Déterminer la valeur minimale de l’entier n pour que l’intervalle de confiance, au niveau de confiance de 95 %, ait une amplitude inférieure ou égale à 0,04.

Partie C : Correction due à l’insincérité de certaines réponses

Dans cette partie, on suppose que, parmi les personnes sondées qui ont accepté de répondre à la question posée, 29 % affirment qu’elles sont favorables au projet.

L’institut de sondage sait par ailleurs que, la question posée pouvant être gênante pour les personnes interrogées, certaines d’entre elles ne sont pas sincères et répondent le contraire de leur opinion véritable.

Ainsi, une personne qui se dit favorable peut :

soit être en réalité favorable au projet si elle est sincère ;

soit être en réalité défavorable au projet si elle n’est pas sincère.

Par expérience, l’institut estime à 15 % le taux de réponses non sincères parmi les personnes ayant répondu, et admet que ce taux est le même quelle que soit l’opinion de la personne interrogée.

Le but de cette partie est, à partir de ces données, de déterminer le taux réel de personnes favorables au projet, à l’aide d’un modèle probabiliste.

On prélève au hasard la fiche d’une personne ayant répondu, et on définit :

F l’événement « la personne est en réalité favorable au projet » ;

F¯ l’événement « la personne est en réalité défavorable au projet » ;

A l’événement « la personne affirme qu’elle est favorable au projet » ;

A¯ l’événement « la personne affirme qu’elle est défavorable au projet ». Ainsi, d’après les données, on a P(A) = 0,29.

▶ 1. En interprétant les données de l’énoncé, indiquer les valeurs de PF(A) et P F¯(A).

▶ 2. On pose = P(F).

matT_1606_01_00C_02

a) Reproduire sur la copie et compléter l’arbre de probabilité ci-contre.

b. En déduire une égalité vérifiée par le réel x.

▶ 3. Déterminer, parmi les personnes ayant répondu au sondage, la proportion de celles qui sont réellement favorables au projet.

Les clés du sujet

Durée conseillée : 55 minutes.

Les thèmes clés

Loi binomiale • Intervalle de confiance • Arbre pondéré.

Les outils dont vous avez besoin

Les références en rouge renvoient à la boîte à outils en fin d’ouvrage.

Loi binomiale  E39 • C2  Partie A

Intervalle de confiance  E44  Partie B

Arbre pondéré  E37  Partie C, 2. a) et 2. b)

Nos coups de pouce

Partie A

 2. Justifiez que la contrainte imposée s’écrit P(Xn400)>0,9Xn est une variable aléatoire à définir au préalable (n désignant un entier naturel non nul). Concluez à l’aide d’une calculatrice par tabulation des valeurs de P(Xn400),n étant la variable.

Partie B

 2. Traduisez la condition imposée sur l’amplitude de l’intervalle de confiance à l’aide d’une inéquation dont l’inconnue est n.

Partie C

 2. b) Exprimez la probabilité de l’événement A en fonction du réel x en utilisant l’arbre pondéré. N’oubliez pas une donnée de l’énoncé pour conclure.

Corrigé

Corrigé

partie a : nombre de personnes qui acceptent de répondre au sondage

▶ 1. a) Justifier la loi suivie par une variable aléatoire

Pour chaque personne interrogée au hasard dans cette population, deux issues sont possibles : la personne interrogée accepte de répondre à la question (événement noté S) et la personne n’accepte pas (événement S¯), la probabilité de l’événement S étant admise égale à 0,6. Les 700 personnes constituant un échantillon aléatoire de cette population d’après l’énoncé, leurs choix sont implicitement indépendants les uns des autres (« tirage avec remise ») et identiques. X suit donc la loi binomiale de paramètres n=700 et p=0,6.

b) Déterminer une probabilité avec une loi binomiale

L’événement contraire de {X400} étant l’événement {X<400}qui est aussi l’événement {X399}, on a :

Notez bien

Calcul de P(Xa) avec XB(n,p).

Syntaxe pour la TI 83 Plus.fr :

binomFRép(n,p,a).

Syntaxe pour la CASIO Graph 75 :

BinominalCD(a,n,p).

P(X400)=1P(X399).

À l’aide de la calculatrice, nous avons :

TI 83 Plus.fr

CASIO Graph 75

matT_1606_01_00C_09

matT_1606_01_00C_10

La plus proche valeur de P(X400) parmi les nombres proposés est 0,94.

> 2. Déterminer un paramètre sous contrainte

Ici, le nombre de personnes interrogées n’est pas nécessairement égal à 700. Notons n ce nombre et considérons la variable aléatoire Xn qui, à n personnes interrogées dans cette population, associe le nombre de personnes qui acceptent de répondre à la question. Similairement à la question 1. a), nous pouvons justifier que la variable aléatoire Xn suit la loi binomiale de paramètres n et p=0,6.

La contrainte de l’énoncé, à savoir « la probabilité que le nombre de personnes répondant à la question soit supérieur ou égal à 400, est supérieure à 0,9 », se traduit alors, à l’aide de la variable aléatoire Xn, par P(Xn400)>0,9. Grâce à la question précédente, nous savons que la valeur minimale de l’entier naturel n vérifiant une telle contrainte n’excédera pas 700, soit n700.

Comme l’événement contraire de {Xn400} est l’événement{Xn399}, nous avons la relation P(Xn400)=1P(Xn399). Puis, à l’aide de la calculatrice, nous avons :

TI 83 Plus.fr

CASIO Graph 75

Touche f(x)

Y1=1−binomFRép(X,0.6,399)

Menu Table

Y1=1−BinominalCD(399,X,0.6)

matT_1606_01_00C_11amatT_1606_01_00C_11b

matT_1606_01_00C_12amatT_1606_01_00C_12bmatT_1606_01_00C_12c

Pour répondre à la contrainte, l’institut doit alors interroger au minimum 694 personnes.

partie b : proportion de personnes favorables au projet dans la population

▶ 1. Donner un intervalle de confiance

Parmi les n personnes qui ont répondu à la question, 29 % sont favorables au projet d’aménagement. Comme n est un entier naturel supérieur à 50, nous avons n30 ; n×0,2950×0,2914,55 et n×(10,29)50×0,7135,55. Les conditions étant vérifiées, l’intervalle de confiance au niveau de confiance 0,95 est bien défini et donné par :

[0,291n ; 0,29+1n].

▶ 2. Déterminer la taille d’un échantillon sous contrainte

L’amplitude de l’intervalle de confiance précédemment défini est égale à :

(0,29+1n)(0,291n)=2n.

La contrainte « l’intervalle de confiance a une amplitude inférieure ou égale à 0,04 » se traduit alors par l’inéquation suivante : 2n0,04. Or, par équivalence, nous avons :

2n0,044n0,042n410,042n40,0016n2500.

La valeur minimale de l’entier n pour que l’intervalle de confiance, au niveau de confiance 0,95, ait une amplitude inférieure ou égale à 0,04 est 2 500.

partie c : correction due à l’insincérité de certaines réponses

▶ 1. Indiquer des probabilités conditionnelles

La probabilité PF(A) est une probabilité conditionnelle : probabilité que l’événement A se réalise sachant que l’événement F est réalisé. Dans notre contexte, c’est la probabilité qu’une personne ayant répondu au sondage dont la fiche a été prélevée au hasard affirme qu’elle est favorable au projet sachant qu’elle y est réellement favorable. La réponse de cette personne serait ainsi sincère. Par conséquent, PF(A)=10,15=0,85.

La probabilité PF¯(A) est également une probabilité conditionnelle. C’est la probabilité qu’une personne ayant répondu au sondage dont la fiche a été prélevée au hasard affirme qu’elle est favorable au projet sachant qu’en réalité, elle y est défavorable. La réponse de cette personne serait ainsi non sincère. Par suite, PF¯(A)=0,15.

▶ 2. a) Compléter un arbre pondéré

Notez bien

La somme des probabilités indiquées sur les branches issues d’un même nœud est égale à 1.

Au nœud F, d’après la question précédente, PF(A)=0,85. Par suite :

PF(A¯)=1PF(A)=10,85=0,15.

De même, au nœud F¯, d’après la question précédente, PF¯(A)=0,15. Par suite :

PF¯(A¯)=1PF¯(A)=10,15=0,85.

L’arbre de probabilité dûment complété est donc :

matT_1606_01_00C_13

b) Établir une égalité

D’une part, l’événement A étant associé aux deux feuilles FA et F¯A, nous avons d’après la formule des probabilités totales :

P(A)=P(FA)+P(F¯A)        =P(F)×PF(A)+P(F¯)×PF¯(A)        =x×0,85+(1x)×0,15        =0,7x+0,15.

D’autre part, d’après l’énoncé, nous avons P(A)=0,29.

Ainsi, le réel x vérifie l’égalité suivante : 0,7x+0,15=0,29.

▶ 3. Résoudre une équation

D’après la question précédente, nous avons 0,7x+0,15=0,29.

Or, par équivalence :

0,7x+0,15=0,290,7x=0,14x=0,140,7=0,2.

Parmi les personnes ayant répondu au sondage, la proportion de celles qui sont réellement favorables au projet serait de 20 %.