Probabilités

Merci !

Fiches
Classe(s) : Tle STI2D - Tle STL | Thème(s) : Probabilités et statistique

Probabilités

$

1Rappels

A Calcul des probabilités

La probabilité d’un événement A d’un univers fini Ω est la somme des probabilités des événements élémentaires qui constituent A. La probabilité de Ω est 1.

Pour tout événement A, 0 ≤ P(A) ≤ 1.

L’équiprobabilité correspond au cas où tous les événements élémentaires ont la même probabilité. Dans ce cas, la probabilité d’un événement élémentaire est :

1nombre d’éléments de Ω et pour tout événement A,

P(A)=nombre d’éléments de Anombre d’éléments de Ω =nombre de cas favorablesnombre de cas possibles.

Pour tous événements disjoints A, B, P(A B) = P(A) + P(B).

Pour tout événement A, P(A)=1P(A). En particulier P(Ø) = 0.

Pour tous événements A, B, P(A B) = P(A) + P(B) – P(A B).

B Épreuve de Bernoulli

Une épreuve de Bernoulli de paramètre p (nombre réel compris entre 0 et 1) est une épreuve aléatoire comportant deux issues :

11779_76_stdi

Exemple

Une urne contient 7 boules vertes et 3 boules noires. On tire une boule au hasard de l’urne. Tous les tirages sont équiprobables. Si on appelle « succès » obtenir une boule verte, le tirage d’une boule de l’urne est une épreuve de Bernoulli de paramètre p = 0,7.

Si on appelle « succès » obtenir une boule noire, p = 0,3.

C Schéma de Bernoulli

Un schéma de Bernoulli de paramètres n et p est une épreuve aléatoire consistant à répéter n fois, de façon identique et indépendante, une épreuve de Bernoulli de paramètre p.

2Loi binomiale

A Définition

• La loi binomiale de paramètres n et p notée (n, p) est la loi de la variable aléatoire X qui donne le nombre de succès dans la répétition, de façon identique et indépendante, de n épreuves Bernoulli de paramètre p.

B Justifier qu’une variable aléatoire suit une loi binomiale

Justifier qu’une variable aléatoire suit une loi binomiale

Énoncé

Un éditeur produit en grande série un certain type de CD-Rom. Au cours de la fabrication de ce produit, un défaut de gravure, a, peut se produire.

Dans ce qui suit, les résultats approchés sont à arrondir à 10–2.

On note E l’événement : « Un disque prélevé au hasard dans un stock important présente le défaut a ». On a P(E) = 0,025. On prélève au hasard un stock de 50 disques dans le stock pour vérification de leur gravure. Le stock est assez important pour que l’on puisse assimiler ce prélèvement à un tirage avec remise de 50 disques.

On considère la variable aléatoire X qui, à tout prélèvement de 50 disques, associe le nombre de disques de ce prélèvement présentant le défaut a.

Justifier que la variable aléatoire X suit une loi binomiale dont on déterminera les paramètres.

solution

Mettre en évidence une épreuve de Bernoulli.

Chaque épreuve élémentaire, le tirage d’un disque au hasard dans le stock peut déboucher sur deux résultats et deux seulement : le disque présente le défaut a, événement de probabilité p = 0,025 et le disque ne présente pas le défaut a, événement de probabilité :

q = 1 – p = 0,975. (C’est une épreuve de Bernoulli de paramètre p = 0,025).

Mettre en évidence un schéma de Bernoulli.

• Chaque prélèvement de 50 disques est constitué par la répétition 50 fois, de façon identique et indépendante, de l’épreuve élémentaire, puisque le prélèvement est associé à un tirage avec remise. (C’est un schéma de Bernoulli de paramètres n = 50 et p = 0,025.)

En déduire l’existence de la loi binomiale.

• Donc la variable aléatoire X qui associe à ces tirages le nombre de disques présentant le défaut a suit la loi binomiale de paramètres n = 50 et p = 0,025.

Méthode

On peut utiliser ce modèle de solution pour les évaluations.

C Déterminer P(X = k), P (Xk)

En STI2D-STL, on utilise une calculatrice ou un logiciel pour calculer directement P(X = k) ou P(X ≤ k).

Exemples

On considère une variable aléatoire X suivant la loi binomiale de paramètres n = 100 et p = 0,05. On se propose de déterminer avec une calculatrice P(X = 2) et P(X ≤ 2).

Méthode

Procédure sur une calculatrice TI

On accède au menu « ­distribution » par 2nde / Distrib (ou DISTR).

Pour calculer P(X = k), on utilise l’instruction binomFdp ou binompdf.

Pour calculer P(X ≤ k), on utilise l’instruction binomFRép.

Procédure à suivre sur une calculatrice CASIO

On se place dans le Menu STAT.

On accède à la loi binomiale par DIST / BINM.

Pour calculer P(X = k), on utilise l’instruction Bpd.

Pour calculer P(X ≤ k), on utilise l’instruction Bcd.

11779_78

11779_77

En arrondissant à 10–3, on lit : P(X = 2) ≈ 0,081 et P(X ≤ 2) ≈ 0,118.

D Espérance, variance, écart type

Soit X une variable aléatoire suivant la loi binomiale (n, p).

• L’espérance de X est : E(X) = np.

• La variance de X est : V(X) = np(1 – p).

• L’écart type de X est : σ(X)=np(1p).

Exemple

On reprend l’exemple du paragraphe B.

E(X) = 50 × 0,025 = 1,25

V(X) = 50 × 0,025 × 0,975 = 1,21875

σ(X) ≈ 1,10.

Exemple d’interprétation de E(X)

On reprend l’exemple du paragraphe B.

Si on réalise un très grand nombre de prélèvements de 50 disques, le nombre moyen de disques défectueux par prélèvement est 1,25.

3Loi uniforme sur [a, b]

Une variable aléatoire X suit la loi uniforme sur [a, b] si et seulement si, pour tout intervalle I inclus dans [a, b], la probabilité de l’événement « X ∈ I » est l’aire du domaine {M(x, y) ; x ∈ I et 0 ≤ y ≤ f(x)} où f:x1ba est la fonction de densité de la loi uniforme sur [a, b].

Soit X une variable aléatoire suivant la loi uniforme sur [a, b].

Pour tout [x1, x2] inclus dans [a, b], P(X[x1,x2])=x2x1ba.

L’espérance de X est E(X)=a+b2.

La variance de X est V(X)=(ba)212.

Exemple

On considère une variable aléatoire X suivant une loi uniforme sur l’intervalle [0, 5].

• La fonction de densité de X est la fonction f définie sur [0, 5] par f(x)=150=15.

P(X ∈ [0, 1]) est l’aire du rectangle en orange et P(X ∈ [3, 5]) est l’aire durectangle en vert sur la figure ci-dessous.

11924_chap09_AC_13

P(X[0,1])=(10)×15=15. P(X[3,5])=(53)×15=25.

E(X)=a+b2=52=2,5.

4Loi exponentielle

La loi exponentielle de paramètre λ, où λ > 0, est la loi à densité dont la fonction de densité est définie sur [0, + ∞[ par : f(t) = λeλt.

Soit X une variable aléatoire suivant la loi exponentielle de paramètre λ.

Pour tout [x1, x2] inclus dans [0, + ∞[, P(X[x1,x2])=x1x2leλtdt.

En particulier, pour tout x ≥ 0, P(XÔøΩx)=0xleλtdt.

L’espérance de X est E(X)=1l.

Exemple

On note T la variable aléatoire qui, à tout composant électronique d’un certain type, prélevé au hasard dans un stock, associe sa durée de fonctionnement (en heure) avant une défaillance.

On suppose que T suit la loi exponentielle de paramètre 0,000 5.

• La fonction de densité de T est définie pour t > 0 par f(t) = 0,0005 e–0,0005t.

• On note A l’événement : « la durée de bon fonctionnement du composant prélevé est inférieure à 1 000 heures ».

P(A) = P(T ≤ 1 000) = 010000,0005e0,0005tdt=1e0,50,393.

• On note B l’événement : « la durée de bon fonctionnement du composant prélevé est comprise entre 500 et 1 000 heures.

P(B)=50010000,0005e0,0005tdt=e0,25e0,50,172.

E(T)=1λ, donc ici E(T)=10,0005=2000.

Pour un très grand nombre de composants prélevés, la moyenne de leur temps de bon fonctionnement est voisine de 2 000 heures.

5Loi normale

La loi normale 𝒩(µ, σ) d’espérance ou de moyenne µ et d’écart type σ est la loi à densité dont la fonction de densité est définie sur par :

f(t)=1s2πe12tμσ2.

Soit X une variable aléatoire suivant la loi normale 𝒩(µ, σ) de fonction de densité f.

• Chaque couple (μ, σ) correspond à une « courbe en cloche ».

P(aXb) et P(Xx) sont les aires des parties coloriées en jaune sur les deux figures.

11924_chap09_AC_38

Les valeurs numériques de a, b et x étant données, on obtient les valeurs numériques de P(aXb) ou P(Xx) en utilisant une calculatrice ou un tableur et en remarquant, si nécessaire, que P(aXb)=P(Xb)P(Xa).

Si la variable aléatoire suit la loi normale 𝒩(µ, σ),

P(X [µ – σ, µ + σ])  0,68 ; P(X [µ – 2σ, µ + 2σ])  0,95 ; P(X [µ – 3σ, µ + 3σ])  0,997.

Exemple d’utilisation d’une calculatrice

Sur le compte rendu d’analyse de sang d’un laboratoire d’analyses biologiques, on peut lire la « plage de normalité » suivante, concernant le taux de cholestérol total :

« Taux de cholestérol total (g/L) N : 1,30 – 2,30 ».

On désigne par X la variable aléatoire qui associe à un adulte pris au hasard dans la population son taux de cholestérol total, exprimé en g/L. On admet que X suit la loi normale de moyenne 1,8 et d’écart type 0,25.

On se propose de déterminer avec une calculatrice les probabilités P(1,3 ≤ X ≤ 2,3) et P(X ≤ 1,6).

méthode

Procédure sur une calculatrice TI

On accède au menu « distribution » par 2nde / Distrib (ou DISTR). Pour calculer

P(aX ≤ b), on utilise normalFRép ou normalcdf. Si l’une des bornes a ou b est absente, on la remplace par –1E99 ou 1E99.

Procédure sur une calculatrice CASIO

On se place dans le Menu STAT.

On accède à la loi normale par DIST / NORM.

Pour calculer P(aXb), on utilise Ncd.

Si l’une des bornes a ou b est absente, on la remplace par –1E99 ou 1E99.

11924_chap09_TP3_01

11924_chap09_TP3_02

11924_chap09_TP3_03

11924_chap09_TP3_04

11924_chap09_TP3_05

11924_chap09_TP3_06

11924_chap09_TP3_07

On lit sur l’écran que P(1,3X2,3)0,954 et P(X1,6)0,212.

6Approximation d’une loi binomiale par une loi normale

Si n est « grand » et si p n’est « ni trop voisin de 0 ni trop voisin de 1 », alors la loi binomiale (n, p) admet pour approximation la loi normale 𝒩(µ, σ) de même espérance et de même écart type :

µ = np et s=np(1p).

Exemple

La loi binomiale (30 ; 0,1) peut être approchée par la loi normale 𝒩(µ, σ) avec μ=30×0,1=3 et σ=30×0,1(10,1), σ=2,71,643.

7Intervalle de fluctuation, à environ 95 % d’une fréquence avec une loi binomiale

L’intervalle de fluctuation à 95 % d’une fréquence correspondant à la réalisation, sur un échantillon aléatoire de taille n, d’une variable aléatoire X de loi binomiale, est l’intervalle an,bn défini par :

a est le plus petit entier tel que P(X ≤ a) > 0,025 ;

b est le plus petit entier tel que P(X ≤ b) ≥ 0,975.

Exemple

On considère une ligne aérienne entre deux villes pour laquelle :

– tous les avions utilisés ont 50 places ;

– 53 réservations sont vendues pour chaque vol ;

– chaque personne ayant réservé une place a 9 chances sur 10 de se présenter à l’embarquement (et 1 chance sur 10 de ne pas s’y présenter) ;

– chaque personne ayant réservé une place se présente ou non à l’embarquement indépendamment des autres personnes ayant réservé sur le même vol.

On désigne par X la variable qui, à tout vol pris au hasard sur cette ligne, associe le nombre de personnes se présentant à l’embarquement.

Justifiez-le.

On admet que la variable aléatoire X suit la loi binomiale de paramètres n = 53 et p = 0,9.

Déterminons, à l’aide de la loi binomiale suivie par la variable aléatoire X, un intervalle de fluctuation, à environ 95 %, du pourcentage de personnes se présentant à l’embarquement parmi celles ayant effectué une réservation pour ce vol. Les bornes de l’intervalle seront arrondies à 0,1 %.

Table des probabiltés cumulées

PB_9782216133727_T_STI2D-STL_01_Maths_Tab_3

L’intervalle de fluctuation, à environ 95 %, du pourcentage correspondant à la réalisation, sur un échantillon aléatoire de taille n = 53, de la variable aléatoire X de loi binomiale (53 ; 0,9), est l’intervalle an,bn défini par :

a est le plus petit entier tel que P(X ≤ a) > 0,025 ;

b est le plus petit entier tel que P(X ≤ b) ≥ 0,975.

On lit sur la table :

Déterminer le nombre entier a par lecture d’une table de probabilités cumulées.

P(X ≤ 42) = 0,0145 et P(X ≤ 43) = 0,0355.

Donc a = 43.

On lit sur la table :

Déterminer de même le nombre entier b.

P(X ≤ 51) = 0,9741 et P(X ≤ 52) = 0,9962.

Donc b = 52.

Un intervalle de fluctuation, à environ 95 %, du pourcentage de personnes se présentant à ­l’embarquement parmi celles ayant effectué une réservation pour ce vol est :

4353,5253 = [79,2 % ; 98,1 %].

Remarque

Ce résultat signifie que si on prend au hasard un vol sur cette ligne, il y a 95 chances sur 100 pour qu’entre 79,2 % et 98,1 % des personnes ayant réservé une place se présentent à l’enregistrement.

8Intervalle de fluctuation asymptotique à environ 95 % d’une fréquence avec la loi normale

L’intervalle de fluctuation asymptotique à environ 95 % d’une fréquence obtenue sur un échantillon de taille n est p1,96p(1p)n,p+1,96p(1p)np est la proportion connue dans la population.

Exemple

Par exemple, avec p = 0,88 et n = 50, on obtient : [0,79 ; 0,97].

9Prise de décision à l’aide d’un intervalle de fluctuation lié à la loi binomiale

Méthode :

• Repérer dans l’énoncé l’hypothèse faite sur une proportion ou une fréquence dans la population.

• Chercher l’intervalle de fluctuation, à environ 95 %, an,bn de la fréquence des échantillons aléatoires de taille n, à l’aide de la loi binomiale : voir le paragraphe .

• Énoncer la règle de décision :

si la fréquence observée f appartient à l’intervalle de fluctuation au seuil de 95 % an,bn, on accepte l’hypothèse selon laquelle la proportion est p dans la population ; sinon, on rejette l’hypothèse selon laquelle cette proportion vaut p.

• Appliquer la règle de décision.

PB_9782216133727_T_STI2D-STL_01_Maths_Tab_2

Exemple d’exercice résolu

Énoncé

On s’intéresse à la surréservation sur une nouvelle ligne aérienne pour laquelle les données figurant avant les questions de l’activité préparatoire 2 sont conservées, à l’exception du troisième tiret : on ignore la proportion ou le pourcentage ayant réservé qui se présente à l’embarquement.

Le responsable de la ligne affirme : « les trois quarts des personnes ayant réservé sur cette ligne se présentent à l’embarquement ».

Or sur un vol choisi au hasard parmi les vols de cette ligne, on constate que seulement 65 % des personnes ayant réservé se sont présentées à l’embarquement.

Peut-on considérer, au seuil de 5 %, que ce résultat remet en cause l’affirmation du responsable de la ligne ?

solution

On fait l’hypothèse : les trois quarts des personnes ayant réservé sur cette ligne se présentent à l’embarquement : p=34=0,75.

Énoncer l’hypothèse faite sur la proportion étudiée dans la population

Sous cette hypothèse, la variable aléatoire qui, à tout vol choisi au hasard sur cette ligne associe le nombre de passagers ayant réservé qui se présentent à l’embarquement, suit la loi binomiale (53 ; 0,75).

Un intervalle de fluctuation, à environ 95 %, du pourcentage de personnes se présentant à l’embarquement parmi celles ayant effectué une réservation pour ce vol est :

3353,4653 = [62,3 % ; 86,8 %].

Au seuil de 5 %, si le pourcentage observé de personnes se présentant à l’embarquement parmi celles ayant effectué une réservation pour ce vol est compris entre 62,3 % et 86,8 %, on accepte l’affirmation du responsable ; sinon on rejette cette affirmation.

Énoncer la règle de décision.

Pour le vol observé, ce pourcentage est 65 %. Il est compris entre 62,3 % et 86,8 % ; on accepte donc l’affirmation du responsable : « les trois quarts des personnes ayant réservé sur cette ligne se présentent à l’embarquement ».

Appliquer la règle de décision au cas de l’échantillon considéré.

10Prise de décision à l’aide d’un intervalle de fluctuation lié à la loi binomiale ou d’un intervalle de fluctuation asymptotique lié à la loi normale

Méthode :

• Repérer dans l’énoncé l’hypothèse faite sur une proportion ou une fréquence dans la population.

• Chercher l’intervalle de fluctuation correspondant, à environ 95 %, de la fréquence des échantillons aléatoires de taille n.

• Énoncer la règle de décision :

si la fréquence observée f appartient à l’intervalle de fluctuation considéré au seuil de 95 %, on accepte l’hypothèse selon laquelle la proportion est p dans la population ; sinon, on rejette l’hypothèse selon laquelle cette proportion vaut p.

• Appliquer la règle de décision.

Exemple d’exercice résolu

Énoncé

Un mois avant l’élection où il se présente, le candidat A affirme que 52 % des électeurs veulent voter pour lui. Son adversaire B commande immédiatement un sondage portant modestement sur 100 personnes prises au hasard parmi les électeurs.

Le résultat de ce sondage donne 47 de votes favorables au candidat A.

Peut-on considérer au seuil de 5 % que l’affirmation du candidat A est vraie ?

11Intervalle de confiance d’une proportion

L’intervalle f1,96f(1f)n,f+1,96f(1f)n, où f est une fréquence obtenue sur un échantillon de taille n, est un intervalle de confiance, au niveau de confiance 95 %, pour la proportion p dans la population.

Exemple

La pression artérielle diastolique d’une personne (P.A.D.) est la pression artérielle lorsque son cœur est au repos.

Dans une clinique importante, on prélève au hasard un échantillon de 100 personnes parmi la population des malades et on mesure la pression artérielle diastolique (P.A.D.) de chacune de ces 100 personnes.

On constate que 24 personnes ont une P.A.D. strictement inférieure à 8, ce qui correspond à une fréquence f=24100=0,24.

On se propose d’estimer la proportion p de personnes dont la P.A.D. est strictement inférieure à 8 parmi la population constituée de l’ensemble des malades de la clinique.

= 0,24 et n = 100, l’intervalle de confiance, au niveau de confiance 95 %, pour la proportion des malades de la clinique ayant une P.A.D. strictement inférieure à 8 est [0,156 ; 0,324].

12Comparaison de deux proportions à l’aide d’intervalles de confiance

La différence entre les deux fréquences observées fA et fB est considérée comme significative quand les intervalles de confiance à 95 % IA et IB sont disjoints.

On juge alors que les deux proportions pA et pB sont différentes (avec un petit risque d’erreur).

Dans le cas contraire, on juge que les deux proportions pA et pB sont égales (avec un petit risque d’erreur).

Exemple d’exercice résolu

Énoncé

Une importante société de vente au détail de matériel informatique veut juger de l’impact d’une campagne publicitaire menée dans les médias pour une tablette numérique particulière.

Dans un échantillon, considéré comme prélevé au hasard et avec remise, de 200 ventes de tablettes effectuées avant la campagne publicitaire, on observe que 44 ventes concernent cette tablette.

Dans un nouvel échantillon de même taille et prélevé dans les mêmes conditions après la campagne publicitaire, on observe que 66 ventes concernent cette tablette.

1. Déterminer un intervalle de confiance, avec un niveau de confiance de 95 %, pour la proportion des ventes de cette tablette avant la campagne publicitaire.

2. Même question après la campagne publicitaire.

3. La différence entre les deux fréquences observées avant et après la campagne publicitaire est-elle significative ?

4. Le responsable de la campagne publicitaire affirme : « Les deux échantillons montrent que les ventes de cette tablette ont augmenté de 50 % ; donc la campagne publicitaire a été très efficace ». Qu’en pensez-vous ?

solution

1. L’intervalle de confiance, avec un niveau de confiance 95 %, pour la proportion pA des ventes de cette tablette avant la campagne publicitaire est :

Utiliser la définition d’un intervalle de confiance.

IA=fA1,96fA(1fA)n,fA+1,96fA(1fA)n où fA=44200 et n = 200.

IA = [0,163 ; 0,277].

Utiliser la définition d’un intervalle de confiance.

2. De même fB=66200, n = 200 et IB = [0,265 ; 0,395].

3. Les deux intervalles IA = [0,163 ; 0,277] et IB = [0,265 ; 0,395] ne sont pas disjoints car IA ∩ IB = [0,265 ; 0,277].

Utiliser la définition d’une différence significative de fréquences observées.

Au seuil de 5 %, la différence entre les deux fréquences observées fA et fB avant et après la campagne publicitaire n’est donc pas significative.

4. fBfAfA=0,330,220,22=0,5=50%.

Le responsable de la campagne a raison d’affirmer que pour les deux échantillons les ventes de cette tablette ont augmenté de 50 %.

Cependant, comme la différence entre fA et fB n’est pas significative, on juge que les deux proportions pA et pB sont égales (avec un petit risque d’erreur).

Le responsable de la campagne publicitaire ne peut donc pas affirmer, sur la seule base de ces deux échantillons, que la campagne publicitaire a été très efficace.