Dépistage du chikungunya

Merci !

Annales corrigées
Classe(s) : Tle S | Thème(s) : Estimation
Type : Exercice | Année : 2015 | Académie : Amérique du Sud


Amérique du Sud • Novembre 2015

Exercice 3 • 5 points

Dépistage du chikungunya

Les trois parties A, B et C peuvent être traitées de façon indépendante.

Partie A

Le chikungunya est une maladie virale transmise d’un être humain à l’autre par les piqûres de moustiques femelles infectées.

Un test a été mis au point pour le dépistage de ce virus. Le laboratoire fabriquant ce test fournit les caractéristiques suivantes :

la probabilité qu’une personne atteinte par le virus ait un test positif est de 0,98 ;

la probabilité qu’une personne non atteinte par le virus ait un test positif est de 0,01.

On procède à un test de dépistage systématique dans une population « cible ». Un individu est choisi au hasard dans cette population. On appelle :

M l’événement : « L’individu choisi est atteint du chikungunya » ;

T l’événement : « Le test de l’individu choisi est positif ».

On notera 4726793-Eq1 (respectivement 4726793-Eq2) l’événement contraire de l’événement M (respectivement T).

On note 4726793-Eq3) la proportion de personnes atteintes par la maladie dans la population cible.

▶ 1. a) Recopier et compléter l’arbre de probabilité ci-dessous.

matT_1511_03_03C_01

b) Exprimer P(M T), 4726793-Eq4 puis P(T) en fonction de p.

▶ 2. a) Démontrer que la probabilité de M sachant T est donnée par la fonction f définie sur [0 ; 1] par : 4726793-Eq5.

b) Étudier les variations de la fonction f.

▶ 3. On considère que le test est fiable lorsque la probabilité qu’une personne ayant un test positif soit réellement atteinte du chikungunya est supérieure à 0,95.

En utilisant les résultats de la question 2., à partir de quelle proportion p de malades dans la population le test est-il fiable ?

Partie B

En juillet 2014, l’institut de veille sanitaire d’une île, en s’appuyant sur les données remontées par les médecins, publie que 15 % de la population est atteinte par le virus. Comme certaines personnes ne consultent pas forcément leur médecin, on pense que la proportion est en réalité plus importante.

Pour s’en assurer, on se propose d’étudier un échantillon de 1 000 personnes choisies au hasard dans cette île. La population est suffisamment importante pour considérer qu’un tel échantillon résulte de tirages avec remise.

On désigne par X la variable aléatoire qui, à tout échantillon de 1 000 personnes choisies au hasard, fait correspondre le nombre de personnes atteintes par le virus et par F la variable aléatoire donnant la fréquence associée.

▶ 1. a) Sous l’hypothèse = 0,15, déterminer la loi de X.

b) Dans un échantillon de 1 000 personnes choisies au hasard dans l’île, on dénombre 197 personnes atteintes par le virus. Quelle conclusion peut-on tirer de cette observation à propos du chiffre de 15 % publié par l’institut de veille sanitaire ? Justifier. (On pourra s’aider du calcul d’un intervalle de fluctuation au seuil de 95 %.)

▶ 2. On considère désormais que la valeur de p est inconnue.

En utilisant l’échantillon de la question 1. b), proposer un intervalle de confiance de la valeur de p, au niveau de confiance de 95 %.

Partie C

Le temps d’incubation, exprimé en heures, du virus peut être modélisé par une variable aléatoire T suivant une loi normale d’écart type σ = 10.

On souhaite déterminer sa moyenne μ.

La représentation graphique de la fonction densité de probabilité de T est donnée ci-dessous.

matT_1511_03_03C_02

Courbe représentative de la fonction densité de la loi normale N(μ ; 102)

▶ 1. a) Conjecturer, à l’aide du graphique, une valeur approchée de μ.

b) On donne p(T < 110) = 0,18. Hachurer sur le graphique un domaine dont l’aire correspond à la probabilité donnée.

▶ 2. On note 4726793-Eq6 la variable aléatoire égale à 4726793-Eq7.

a) Quelle loi la variable aléatoire 4726793-Eq8 suit-elle ?

b) Déterminer une valeur approchée à l’unité près de la moyenne μ de la variable aléatoire T et vérifier la conjecture de la question 1.

Les clés du sujet

Durée conseillée : 60 minutes.

Les thèmes clés

Arbre pondéré • Lois de probabilités • Intervalles de fluctuation et de confiance.

Les outils dont vous avez besoin

Les références en rouge renvoient à la boîte à outils en fin d’ouvrage.

Arbre pondéré  E37 Partie A, 1. a) et 1. b)

Probabilité conditionnelle  E35 Partie A, 2. a)

Dérivation  E6c • E6e • E6f Partie A, 2. b)

Lois de probabilité  E39 • E40a • E40e Partie B, 1. a) ; Partie C, 1. a), 1. b) et 2. a)

Intervalles de fluctuation et de confiance  E43 • E44 Partie B, 1. b) et 2.

Nos coups de pouce

Partie A

 2. a) Rappelez la définition de la probabilité conditionnelle à calculer, puis remplacez les probabilités qui apparaissent dans cette formule à l’aide de la question précédente et enfin factorisez par 4726793-Eq9 pour conclure.

 3. Résolvez l’inéquation 4726793-Eq10 et concluez.

Partie B

 1. b) Vérifiez que les conditions sur 4726793-Eq11 et 4726793-Eq12 sont respectées pour définir l’intervalle de fluctuation asymptotique. Concluez selon l’appartenance ou non à cet intervalle de la fréquence observée sur l’échantillon.

Corrigé

Corrigé

Partie A

 1. a) Compléter un arbre de probabilité

Notez bien

Pour tout événement A, 4726793-Eq13.

D’après l’énoncé, la probabilité qu’une personne, sachant qu’elle est atteinte par le virus, ait un test positif est de 0,98, et la probabilité qu’une personne ait un test positif sachant qu’elle est non atteinte par le virus, est de 0,01. Ainsi, 4726793-Eq14 et 4726793-Eq15. Comme la somme des probabilités indiquées sur les branches issues d’un même nœud est égale à 1 : 4726793-Eq16 et 4726793-Eq17.

La proportion de personnes atteintes par la maladie étant égale à 4726793-Eq18 on a 4726793-Eq19 et 4726793-Eq20 (événement contraire). Il en découle l’arbre pondéré suivant :

matT_1511_03_03C_03

b) Calculer des probabilités à l’aide d’un arbre

On a 4726793-Eq21 (probabilité de la feuille 4726793-Eq22).

De même, 4726793-Eq23 (probabilité de la feuille 4726793-Eq24).

L’événement T étant associé aux deux feuilles 4726793-Eq25 et 4726793-Eq26, on a (formule des probabilités totales) : 4726793-Eq27. Ainsi, 4726793-Eq28.

 2. a) Déterminer une probabilité conditionnelle

La probabilité de M sachant T est notée 4726793-Eq29. Par définition, on a :

4726793-Eq30.

À noter que la probabilité 4726793-Eq31 est bien différente de zéro : 4726793-Eq32.

Par la question 1. b), on en déduit que :

4726793-Eq33.

b) Étudier les variations d’une fonction

Notez bien

Soit 4726793-Eq34 et 4726793-Eq35 deux fonctions dérivables sur un intervalle 4726793-Eq36 avec 4726793-Eq37 ne s’annulant pas sur 4726793-Eq38, alors 4726793-Eq39 est dérivable sur 4726793-Eq40 et 4726793-Eq41.

La fonction 4726793-Eq42 est le quotient de deux fonctions dérivables sur [0 ; 1], 4726793-Eq43 et 4726793-Eq44. Comme 4726793-Eq45 ne s’annule pas sur cet intervalle (question 2. a)), la fonction 4726793-Eq46 est également dérivable sur [0 ; 1] et sa dérivée 4726793-Eq47 est définie par :

4726793-Eq48

Comme pour tout réel 4726793-Eq49 de [0 ; 1], 4726793-Eq50 et 4726793-Eq51, alors 4726793-Eq52.

Par conséquent, 4726793-Eq53 est strictement croissante sur [0 ; 1].

3. Résoudre une inéquation

La probabilité qu’une personne ayant un test positif soit atteinte de la maladie est 4726793-Eq54. D’après la question 2. a), cette probabilité est égale à 4726793-Eq55. Le test sera donc considéré comme fiable à la condition que 4726793-Eq56. Or, on a :

4726793-Eq57

Le test sera fiable si la proportion 4726793-Eq58 de malades dans la population dépasse 4726793-Eq59 soit environ 0,16 (valeur approchée à 0,01 par défaut).

Partie B

 1. a) Déterminer une loi de probabilité

Pour chaque personne choisie au hasard, deux issues sont possibles : la personne est atteinte par le virus (événement noté M) et la personne ne l’est pas (événement 4726793-Eq60), la probabilité de l’événement M étant supposée être égale à 0,15. Les choix des 1 000 personnes constituant l’échantillon sont indépendants les uns des autres (« tirage avec remise ») et identiques. 4726793-Eq61suit donc la loi binomiale de paramètres 4726793-Eq62et 4726793-Eq63.

b) Prendre une décision

Comme 4726793-Eq64, 4726793-Eq65 et 4726793-Eq66 l’intervalle de fluctuation asymptotique est bien défini et donné par :

4726793-Eq67.

Or, la fréquence observée sur l’échantillon considéré 4726793-Eq68 est égale à 4726793-Eq69

Cette fréquence n’appartenant pas à l’intervalle de fluctuation, on peut remettre en cause l’observation de l’institut sanitaire.

 2. Estimer une proportion

D’après la question 1. b), la fréquence observée de personnes atteintes du virus sur l’échantillon est de 0,197. Comme 4726793-Eq70, 4726793-Eq71 et 4726793-Eq72, l’intervalle de confiance est bien défini et donné par :

4726793-Eq73

Partie C

 1. a) Conjecturer la valeur d’une espérance

La fonction de densité de probabilité de la variable 4726793-Eq75 est, par propriété, symétrique par rapport à la droite d’équation 4726793-Eq76.

On conjecture ainsi que l’espérance 4726793-Eq77 est proche de 119.

b) Identifier l’aire d’un domaine

Par définition, la probabilité que 4726793-Eq78 prenne des valeurs inférieures à 110 est l’aire du domaine délimité par la courbe représentative de la densité de 4726793-Eq79 et l’axe des abscisses, et situé à la gauche de la droite d’équation 4726793-Eq80

matT_1511_03_03C_04

 2. a) Déterminer une loi de probabilité

La variable 4726793-Eq81 a été centrée 4726793-Eq82 puis réduite (division par 4726793-Eq83

La variable 4726793-Eq84 suit donc la loi normale centrée réduite 𝒩4726793-Eq85.

b) Valider ou corriger une conjecture

On a, d’après l’énoncé, 4726793-Eq86. En centrant et en réduisant, cela revient à écrire que 4726793-Eq87.

On a ainsi à résoudre l’équation 4726793-Eq884726793-Eq89 est un réel à déterminer et où 4726793-Eq90 suit la loi normale centrée réduite.

À l’aide de la calculatrice, on a :

TI 83 Plus.fr

CASIO Graph 75

matT_1511_03_03C_05

matT_1511_03_03C_06

Notez bien

Syntaxe pour la TI 83 Plus.fr : FracNormale 4726793-Eq914726793-Eq92 et 4726793-Eq93.

Syntaxe pour la CASIO Graph 75 : InvNormCD 4726793-Eq944726793-Eq95 et 4726793-Eq96.

Ainsi, 4726793-Eq97. Par identification, on peut maintenant écrire que 4726793-Eq98 soit 4726793-Eq99

Une valeur approchée à l’unité près de l’espérance 4726793-Eq100 de la variable aléatoire 4726793-Eq101 est donc 119 et la conjecture de la question 1. est vérifiée.