Lois de probabilité
matT_1604_12_10C
Ens. spécifique
32
Pondichéry • Avril 2016
Exercice 1 • 4 points
Internet et les jeunes…
Les deux parties A et B peuvent être traitées de façon indépendante.
Partie A
Des études statistiques ont permis de modéliser le temps hebdomadaire, en heures, de connexion à internet des jeunes en France âgés de 16 à 24 ans par une variable aléatoire T suivant une loi normale de moyenne μ = 13,9 et d'écart type σ.
La fonction densité de probabilité de T est représentée ci-dessous :
▶ 1. On sait que .
En exploitant cette information :
a) Hachurer, sur le graphique ci-dessus, deux domaines distincts dont l'aire est égale à 0,023.
b) Déterminer . Justifier le résultat.
Montrer qu'une valeur approchée de σ au dixième est 4,1.
▶ 2. On choisit un jeune en France au hasard.
Déterminer la probabilité qu'il soit connecté à internet plus de 18 heures par semaine. Arrondir au centième.
Partie B
Dans cette partie, les valeurs seront arrondies au millième.
La Hadopi (Haute Autorité pour la diffusion des œuvres et la protection des droits sur internet) souhaite connaître la proportion en France de jeunes âgés de 16 à 24 ans pratiquant au moins une fois par semaine le téléchargement illégal sur internet. Pour cela, elle envisage de réaliser un sondage.
Mais la Hadopi craint que les jeunes interrogés ne répondent pas tous de façon sincère. Aussi, elle propose le protocole (P) suivant :
On choisit aléatoirement un échantillon de jeunes âgés de 16 à 24 ans. Pour chaque jeune de cet échantillon : le jeune lance un dé équilibré à 6 faces l'enquêteur ne connaît pas le résultat du lancer l'enquêteur pose la question : « Effectuez-vous un téléchargement illégal au moins une fois par semaine ? » si le résultat du lancer est pair alors le jeune doit répondre à la question par « Oui » ou « Non » de façon sincère si le résultat du lancer est « 1 » alors le jeune doit répondre « Oui » si le résultat du lancer est « 3 ou 5 » alors le jeune doit répondre « Non ». |
Grâce à ce protocole, l'enquêteur ne sait jamais si la réponse donnée porte sur la question posée ou résulte du lancer de dé, ce qui encourage les réponses sincères.
On note p la proportion inconnue de jeunes âgés de 16 à 24 ans qui pratiquent au moins une fois par semaine le téléchargement illégal sur internet.
▶ 1. Calculs de probabilités
On choisit aléatoirement un jeune faisant partie du protocole (P).
On note : R l'événement « le résultat du lancer est pair »
O l'événement « le jeune a répondu Oui ».
Reproduire et compléter l'arbre pondéré ci-dessous :
En déduire que la probabilité q de l'événement « le jeune a répondu Oui » est :
.
▶ 2. Intervalle de confiance
a) À la demande de la Hadopi, un institut de sondage réalise une enquête selon le protocole (P). Sur un échantillon de taille 1 500, il dénombre 625 réponses « Oui ».
Donner un intervalle de confiance, au niveau de confiance de 95 %, de la proportion q de jeunes qui répondent « Oui » à un tel sondage, parmi la population des jeunes français âgés de 16 à 24 ans.
b) Que peut-on en conclure sur la proportion p de jeunes qui pratiquent au moins une fois par semaine le téléchargement illégal sur internet ?
Les clés du sujet
Durée conseillée : 50 minutes.
Les thèmes clés
Arbre pondéré • Lois de probabilité • Intervalle de confiance.
Les outils dont vous avez besoin
Les références en rouge renvoient à la boîte à outils en fin d'ouvrage.
Lois de probabilité E40a • E40e → Partie A, 1. a), 1. b) et 2.
Arbre pondéré E37 → Partie B, 1.
Intervalle de confiance E44 → Partie B, 2. a) et 2. b)
Calculatrice
Probabilités avec la loi normale C3 → Partie A, 2.
Nos coups de pouce
Partie A
▶ 1. a) Pour hachurer le premier domaine, simplement à l'aide de la définition, traduisez en termes d'aire la probabilité précisée dans l'énoncé. Pour identifier le deuxième domaine, prenez en compte la symétrie de la courbe représentative de la densité.
Partie B
▶ 2. b) Traduisez, en termes d'appartenance à un intervalle, l'estimation de la proportion q par intervalle de confiance (question 2. a)). Remémorez-vous le lien entre la proportion p et la proportion q établi à la question 1. pour conclure.
Corrigé
partie a
▶ 1. a) Traduire une probabilité en termes d'aire
Par définition, la probabilité de l'événement {T ≥ 22} est l'aire, en unités d'aire, du domaine délimité par la courbe représentative de la densité associée à T et l'axe des abscisses, et situé à la droite de la droite d'équation x = 22.
Par propriété, la courbe représentative de la densité associée à T est symétrique par rapport à la droite d'équation x = μ (ici μ = 13,9). Par conséquent :
P(T ≥ 22) = P(T ≥ μ + 8,1) = P(T ≤ μ - 8,1) = P(T ≤ 5,8).
Cette probabilité est alors également l'aire, en unités d'aire, du domaine délimité par la courbe représentative de la densité associée à T et l'axe des abscisses, et situé à la gauche de la droite d'équation x = 5,8.
b) Calculer une probabilité et estimer un écart type
On a (événement contraire). Mais, d'après la question précédente :
.
On en conclut que : P(5,8 ≤ T ≤ 22) = 1 - 2 × 0,023 = 0,954.
Par propriété (loi normale), on a (valeur approchée par défaut). Or, d'après ce qui précède, P(5,8 ≤ T ≤ 22) qui s'écrit aussi P(13,9 - 8,1 ≤ T ≤ 13,9 + 8,1) ou encore P(μ - 2 × 4,05 ≤ T ≤ μ + 2 × 4,05) est égale à 0,954. Par identification, la valeur de σ serait proche de 4,05.
Une valeur approchée de σ au dixième est donc 4,1.
▶ 2. Calculer une probabilité
Notez bien
Calcul de P(a ≤ b) avec X ~ N(μ σ2).
Syntaxe pour la TI 83 Plus.fr : NormalFRép (a, b, μ, σ).
Syntaxe pour la CASIO Graph 75 : NormCD(a, b, σ, μ)
La probabilité qu'un jeune en France choisi au hasard soit connecté à internet plus de 18 heures par semaine est P(T > 18). Comme nous sommes dans le cadre d'une loi continue, P(T > 18) = P(T ≥ 18). De plus, par propriété de la densité associée à une loi normale, on a :
P(T > 18) = 0,5 - P(μ ≤ T ≤ 18) = 0,5 - P(13,9 ≤ T ≤ 18).
À l'aide d'une calculatrice, on obtient 0,16 comme valeur approchée de cette probabilité au centième.
partie b
▶ 1. Compléter et utiliser un arbre pondéré
L'événement R, « le résultat du lancer est pair », est réalisé par les issues 2, 4 ou 6, le dé lancé étant un dé classique à six faces. Comme ce dé est équilibré, toutes les issues sont équiprobables et ainsi . Comme la somme des probabilités indiquées sur les branches issues d'un même nœud est égale à 1, on a :
.
Si le résultat du lancer est pair, autrement dit si l'événement R se réalise, le jeune interrogé doit répondre de manière sincère. Dans ce cas, ce jeune répondra « oui » avec une probabilité p inconnue, et « non » avec une probabilité 1 - p (événement contraire).
Notez bien
Pour tout événement A, .
Ainsi, on a et .
Par contre, si le résultat du lancer est impair, autrement dit si l'événement se réalise, la réponse du jeune interrogé dépendra du chiffre impair obtenu (1, 3 ou 5).
Ce jeune répondra « oui » si le résultat du lancer est 1, sinon il répondra « non ».
Les issues 1, 3 et 5 étant équiprobables, on a et .
Il en découle l'arbre pondéré suivant :
On en déduit (probabilité de la feuille ).
De même, (probabilité de la feuille ).
L'événement O étant associé aux deux feuilles et , on a (formule des probabilités totales) : .
Ainsi, la probabilité de l'événement O, « le jeune a répondu oui », est .
▶ 2. a) Estimer une proportion
D'après l'énoncé, sur un échantillon de taille n = 1500, 625 ont répondu « oui ». La fréquence observée f de jeunes qui ont répondu « oui » sur cet échantillon est alors telle que : .
Comme n = 1 500 ≥ 30, n × f = 625 ≥ 5 et n × (1 - f) = 875 ≥ 5, l'intervalle de confiance est bien défini et donné par :
b) Exploiter une estimation par intervalle
D'après la question 1. de cette partie, la probabilité de l'événement « le jeune a répondu oui » est . Or, d'après la question 2. a), estimation par intervalle, cette probabilité q se situerait dans l'intervalle avec un niveau de confiance 0,95.
Or, on a les équivalences suivantes :
La proportion p de jeunes qui pratiquent au moins une fois par semaine le téléchargement illégal sur internet se situerait entre (environ 0,448) et (environ 0,552) avec un niveau de confiance 0,95.