Bac S 2014 Maths France Métropole Exercice 2

Enoncé

Les parties A et B peuvent être traitées indépendamment.

Partie A

Un laboratoire pharmaceutique propose des tests de dépistage de diverses maladies. Son service de communication met en avant les caractéristiques suivantes :

  • la probabilité qu’une personne malade présente un test positif est 0,99 ;
  • la probabilité qu’une personne saine présente un test positif est 0,001.

Question 1

Pour une maladie qui vient d’apparaître, le laboratoire élabore un nouveau test. Une étude statistique permet d’estimer que le pourcentage de personnes malades parmi la population d’une métropole est égal à 0,1%. On choisit au hasard une personne dans cette population et on lui fait subir le test.
On note M l’évènement « la personne choisie est malade » et T l’évènement « le test est positif ».

a. Traduire l’énoncé sous la forme d’un arbre pondéré.

Pour construire un arbre pondéré, il suffit de lire soigneusement l’énoncé et de traduire le texte « petit à petit » en s’intéressant aux événements mentionnés par l’énoncé, « la personne choisie est malade » et « le test est positif ».

Une étude statistique permet d’estimer que le pourcentage de personnes malades parmi la population d’une métropole est égal à 0,1%. On choisit au hasard une personne dans cette population et on lui fait subir le test.

Il s’agit d’une information qui porte sur l’événement M : dire que le pourcentage de personnes malades est de 0,1%, c’est dire que « sur 100 personnes de cette population (« nombre de cas possibles »), 0,1 personne est malade (« nombre de cas favorables ») ».

Or :

On considère un événement E. Un cas est dit favorable lorsque l’événement E est observé.

Par ailleurs, p(E) = \dfrac{nombre~de~cas~favorables}{nombre~de~cas~possibles}.

Ici, on en déduit donc que p(M) = \dfrac{nombre~de~cas~favorables}{nombre~de~cas~possibles} = \dfrac{0,1}{100} = 0,001.

Mais ce n’est pas fini : qui dit « personne malade » dit aussi « personne non malade ». Autrement dit, il faut également s’intéresser à l’événement \overline{M}. Ici, une propriété fondamentale du cours va nous être utile :

On considère un événement E.
p(\overline{E}) = 1 - p(E)

Ici, cela donne donc : p(\overline{M}) = 1 - p(M) = 1 - 0,001 = 0,999.

Ce résultat nous permet alors d’initialiser l’arbre pondéré :

Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-1

Continuons à examiner l’énoncé :

la probabilité qu’une personne malade présente un test positif est 0,99

Cette fois-ci, on s’intéresse à l’événement T à travers une probabilité conditionnelle : sachant que la personne est malade, la probabilité que le test soit positif est de 0,99. Autrement dit,  p_M(T) = 0,99 .

Comme précédemment, il faut également s’intéresser à l’événement contraire :  p_M ( \overline{T} ) = 1 - p_M(T) = 1 - 0,99 = 0,01 .

On peut donc compléter notre arbre :

Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-2
la probabilité qu’une personne saine présente un test positif est 0,001.

Ici encore, on nous indique une probabilité conditionnelle. Le fait qu’une personne soit saine correspond à l’événement \overline{M}. On en déduit donc que  p_{\overline{M}}(T) = 0,001 .

…et il faut également s’intéresser à l’événement contraire p_{\overline{M}} ( \overline{T}) !

Je vois que ça commence à rentrer ! Effectivement, il faut également s’intéresser à l’événement contraire :  p_{\overline{M}} ( \overline{T} ) = 1 - p_{\overline{M}} (T) = 1 - 0,001 = 0,999 .

On peut alors finir de compléter notre arbre :

Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-3

b. Démontrer que la probabilité p(T) de l’évènement T est égale à 1,989 \times 10^{-3}.

Pour calculer p(T) on va utiliser les règles suivantes :

Pour calculer la probabilité d’un événement à partir d’un arbre de probabilité, il suffit d’additionner les probabilités de chacun des chemins qui « mènent » à cet événement.

La probabilité d’un chemin est le produit des probabilités des branches qui le composent.

Ici, nous allons donc sommer les probabilités de deux chemins :

Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-4

On peut donc écrire :

En nous appuyant sur l’arbre pondéré, la probabilité de l’évènement T vaut :
 p(T) = \underbrace{0,001 \times 0,99}_{chemin~1} + \underbrace{0,999 \times 0,001}_{chemin~2} = 1,989 \times 10^{-3}, ce qui est bien le résultat souhaité.

c. L’affirmation suivante est-elle vraie ou fausse ? Justifier la réponse.
Affirmation : « Si le test est positif, il y a moins d’une chance sur deux que la personne soit malade ».

Il s’agit ici de voir si p_T(M) est inférieur à 0,5. Pour calculer une probabilité conditionnelle, vous devez immédiatement penser à la formule suivante :

p_A(B) = \dfrac{p(A \cap B)}{p(A)}

Ici, cela donne :

p_T(M) = \dfrac{ p(T \cap M) }{p(T)}
On a calculé  p(T) à la question précedente, mais comment va-t-on faire pour trouver  p(T \cap M) ?

Réponse : nous allons exploiter l’arbre de probabilités que nous venons de construire. En effet, la probabilité d’une intersection est aisée à déterminer à partir d’un tel arbre :

Sur un arbre pondéré, la probabilité de l’intersection de deux événements est obtenue en multipliant les probabilités figurant sur les branches contenant ces deux événements.

Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-5

En exploitant l’arbre de probabilité de la première question, on voit que  p(T \cap M) = 0,001 \times 0,99 .

Cela nous permet de conclure :

D’où  p_T(M) = \dfrac{0,001 \times 0,99 }{1,989 \times 10^{-3}} \simeq 0,498 ~\textless ~0,5.

Donc, l’affirmation est donc vraie.


Question 2

Le laboratoire décide de commercialiser un test dès lors que la probabilité qu’une personne testée positivement soit malade est supérieure ou égale à 0,95. On désigne par x la proportion de personnes atteintes d’une certaine maladie dans la population.
A partir de quelle valeur de x le laboratoire commercialise-t-il le test correspondant ?

Personnellement, lorsque je lis ceci :

Le laboratoire décide de commercialiser un test dès lors que la probabilité qu’une personne testée positivement soit malade est supérieure ou égale à 0,95.

je le traduis immédiatement en notation mathématique… et c’est un réflexe que vous devez également avoir ! Ce que l’énoncé nous dit, c’est que le laboratoire décide de commercialiser un test dès lors que p_T(M) \geq 0,95.

Par ailleurs, lorsque l’énoncé indique que :

On désigne par x la proportion de personnes atteintes d’une certaine maladie dans la population.

cela signifie que le quotient du nombre de personnes personnes malades sur le nombre de personnes totales vaut x. Autrement dit, relativement à l’événement M, le nombre de cas favorables sur le nombre de cas possibles vaut x. Donc p(M) = x.

Ainsi, l’objet de la question est de déterminer p(M) tel que p_T(M) \geq 0,95.

Pour ce faire, commençons par adapter l’arbre pondéré à la nouvelle valeur de p(M) :

Si on désigne par x la proportion de personnes atteintes d’une certaine maladie dans la population, cela signifie que p(M) = \dfrac{nombre~de~cas~favorables}{nombre~de~cas~possibles} = x.

Ainsi, la nouvelle situation peut être représentée par l’arbre pondéré suivant :
Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-6

Déterminons donc p_T(M) en fonction de x en nous appuyant sur cet arbre pondéré.

Comme d’habitude, on commence par appliquer la formule de calcul des probabilités conditionnelles :

p_T(M) = \dfrac{p(T \cap M)}{p(T)}

Or, calculer p(T \cap M) et p(T) en s’appuyant sur l’arbre pondéré, on sait faire !

Calculons d’abord p(T \cap M) :

Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-7

p(T \cap M) = 0,99x

Puis calculons p(T) :

Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-8

p(T) = \underbrace{0,99x}_{chemin~1} + \underbrace{0,001(1-x)}_{chemin~2} = 0,99x + 0,001 - 0,001x = 0,989x + 0,001

D’où :

On en déduit que p_T(M) = \dfrac{p(T \cap M)}{p(T)} = \dfrac{0,99x}{0,989x + 0,001}.

On cherche alors x tel que  p_T(M) \geq 0,95 :

D’où :
 p_T(M) \geq 0,95 \Leftrightarrow \dfrac{ 0,99 x }{0,989x + 0,001} \geq 0,95

Pour continuer, il faut remarquer que :

Or, la quantité au dénominateur est une probabilité, donc positive. D’où multiplier l’inégalité de part et d’autre par cette quantité ne change pas son sens.

Ainsi, on peut écrire que :

On en déduit :
p_T(M) \geq 0,95 \Leftrightarrow 0,99x \geq 0,95 (0,989x + 0,001)

\Leftrightarrow 0,99x \geq 0,93955x + 0,00095

 

 \Leftrightarrow 0,05045x \geq 0,00095

 

 \Leftrightarrow x \geq \dfrac{0,00095}{0,05045}
 \Leftrightarrow x \geq \dfrac{19}{1009}

On peut alors conclure :

Le test est donc commercialisé dès lors que la proportion x de personnes malades est supérieur ou égal à  \dfrac{19}{1009} \simeq 0,01883 .

Partie B

La chaîne de production du laboratoire fabrique, en très grande quantité, le comprimé d’un médicament.

Question 1

Un comprimé est conforme si sa masse est comprise entre 890 et 920 mg. On admet que la masse en milligrammes d’un comprimé pris au hasard dans la production peut être modélisée par une variable aléatoire X qui suit la loi normale \mathcal{N}(\mu, \sigma^2), de moyenne \mu = 900 et d’écart-type \sigma = 7.

a. Calculer la probabilité qu’un comprimé prélevé au hasard soit conforme.
On arrondira à 10^{-2}.

Ici, un comprimé est conforme si sa masse est comprise entre 890 et 920 mg donc il s’agit de calculer P(890 \le D \le 920).

Lorsque l’on considère une loi normale, s’il s’agit de calculer une probabilité du type P(a \le X \le b), il suffit d’utiliser directement la calculatrice.

Ici, je vais vous montrer comment faire avec une TI-89 (je choisis la TI-89 parce que c’est la calculatrice que j’avais quand j’étais moi-même en Terminale) :

Commandes à effectuer Résultat obtenu
1. Allumer la calculatrice. 😀
Puis cliquer sur la touche « APPS ». Les applications installées sur la calculatrice apparaissent.
Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-9
2. Choisir Stats/List Editor et cliquer sur « ENTER ».

L’application « Stats/List Editor » est normalement incluse dans toutes les calculatrices TI-89 depuis 2004. Si ce n’est pas le cas, vous pouvez la télécharger gratuitement ici.
Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-10
3. A moins d’être un utilisateur « avancé » de la TI-89 (auquel cas vous savez quoi faire à cette étape), cliquer simplement sur « ENTER ». Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-11
4. Cliquer sur F5 > 4.
L’interface de renseignement des valeurs nécessaires au calcul de la probabilité cherchée apparaît.
Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-12
5. Renseigner les valeurs nécessaires.

Ici, on cherche à calculer P(760 \le D \le 840) donc :

  • Lower Value : 890 ;
  • Upper Value : 920.

De plus, il s’agit d’une loi normale d’espérance \mu = 900 et d’écart-type \sigma = 7 donc :

  • \mu : 900 ;
  • \sigma : 7.
Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-14
6. Cliquer sur « ENTER ».
La valeur cherchée est la valeur « Cdf ».
Bac S 2014 Maths France Métropole Exercice 2 2014-fm-exo2-13

On peut donc directement noter le résultat sur la copie :

D’après la calculatrice, on a P(890 \le D \le 920) = 0,92 à 10^{-2} près.

b. Déterminer l’entier positif h tel que P(900-h \leq X \leq 900+h) \simeq 0,99 à 10^{-3} près.

Déterminer les bornes a et b telles que P(a \leq X \leq b) = p où :

  • X est une variable aléatoire qui suit une loi normale \mathcal{N}(\mu, \sigma^2) ;
  • p une probabilité donnée qui vaut, soit 0,99, soit 0,95 ;

est un savoir-faire qui suit des étapes bien précises :

\textsuperscript{\textcircled{\tiny{1}}} Introduire la variable aléatoire Z = \dfrac{X - \mu}{\sigma}.
On pose Z = \dfrac{X - \mu}{\sigma}.
\textsuperscript{\textcircled{\tiny{2}}} Indiquer que Z suit une loi normale centrée \mathcal{N}(0, 1).

En effet, il faut savoir que :

Si X suit une loi normale \mathcal{N}(\mu, \sigma^2), alors Z = \dfrac{X - \mu}{\sigma} suit une loi normale centrée réduite \mathcal{N}(0, 1).
Puisque X suit une loi normale \mathcal{N}(\mu, \sigma^2), alors Z = \dfrac{X - \mu}{\sigma} suit une loi normale centrée réduite \mathcal{N}(0, 1).
\textsuperscript{\textcircled{\tiny{3}}} Exploiter le fait que Z suive une loi normale centrée réduite :

  • Si p = 0,99 : en déduire que P(-u_{0,01} \leq Z \leq u_{0,01}) = 1 - 0,01 = 0,99u_{0,01} = 2,58 ;
  • si p = 0,95 : en déduire que P(-u_{0,05} \leq Z \leq u_{0,05}) = 1 - 0,05 = 0,99u_{0,05} = 1,96.

Il s’agit ici de tirer profit du théorème suivant pour en déduire l’encadrement de Z qui convient :

Soient X une variable aléatoire qui suit une loi normale centrée réduite \mathcal{N}(0,1) et \alpha un réel appartenant à l’intervalle ]0 ; 1[.
Il existe un unique réel positif u_{\alpha} tel que P(-u_{\alpha} \leq X \leq u_{\alpha}) = 1 - \alpha.

Vous l’aurez compris : on exploite ce théorème avec \alpha valant 0,01 ou 0,05.

Pourquoi les valeurs 0,01 et 0,05 uniquement ?

Car, comme vous allez le voir, la suite du raisonnement nécessite de connaître la valeur de u_{alpha}. Or, le programme n’exige de vous que nous n’en connaissiez que deux :

u_{0,01} = 2,58 et u_{0,05} = 1,96

On peut donc écrire :

D’où P(-u_{0,01} \leq Z \leq u_{0,01}) = 1 - 0,01 = 0,99u_{0,01} = 2,58.
\textsuperscript{\textcircled{\tiny{4}}} Déduire de l’encadrement -u_{\alpha} \leq Z \leq u_{\alpha} un encadrement de X : les bornes de cet encadrement sont les réels a et b cherchés.

C’est parti pour l’encadrement de X :

-u_{0,01} \leq Z \leq u_{0,01} \Leftrightarrow -u_{0,01} \leq \dfrac{X - \mu}{\sigma} \leq u_{0,01}

\Leftrightarrow -\sigma u_{0,01} \leq X - \mu \leq \sigma u_{0,01}
\Leftrightarrow \mu - \sigma u_{0,01} \leq X \leq \mu + \sigma u_{0,01}

Etant donné que \mu = 900 et que l’on cherche un encadrement de X de la forme 900 - h \leq X \leq 900 + h, il est temps de remplacer les expressions littérales par leurs valeurs :

... \Leftrightarrow 900 - 7 \times 2,58 \leq X \leq 900 + 7 \times 2,58 \

\Leftrightarrow 900 - 18,06 \leq X \leq 900 + 18,06

Donc le réel qui convient est 18,06. Mais comme on demande de déterminer h entier positif, il faut prendre h = 18 :

D’où P(900 - h \leq X \leq 900 + h) \simeq 0,99 pour h = 18.

Question 2

La chaine de production a été réglée dans le but d’obtenir au moins 97 % de comprimés conformes. Afin d’évaluer l’efficacité des réglages, on effectue un contrôle en prélevant un échantillon de 1 000 comprimés dans la production. La taille de la production est supposée suffisamment grande pour que ce prélèvement puisse être assimilé à 1 000 tirages successifs avec remise.
Le contrôle effectué a permis de dénombrer 53 comprimés non conformes sur l’échantillon prélevé.
Ce contrôle remet-il en question les réglages faits par le laboratoire ? On pourra utiliser un intervalle de fluctuation asymptotique au seuil de 95 %.

En résumé, la question est la suivante : on estime qu’avec les réglages effectués, la probabilité que les comprimés soient conformes est de 97%. Il s’agit de déterminer si cette estimation est juste. C’est une question on ne peut plus classique !

Tout d’abord, apprenez par coeur ceci :

Soient X_n une variable aléatoire qui suit une loi binomiale \mathcal{B}(n,p) et F_n = \dfrac{X_n}{n} la variable aléatoire qui représente la fréquence des succès. Si

  • n \ge 30
  • np \ge 5
  • n(1 - p) \ge 5

alors l’intervalle de fluctuation asymptotique de la variable aléatoire F_n au seuil de 95 % vaut I_n = \left[p-1.96\dfrac{\sqrt{p(1 - p)}}{\sqrt{n}};p+1.96\dfrac{\sqrt{p(1 - p)}}{\sqrt{n}}\right].

Et maintenant, voici la démarche pour répondre à cette question :

\textsuperscript{\textcircled{\tiny{1}}} Repérer une épreuve de Bernoulli dans la situation proposée et indiquer quel événement constitue le « succès ». Introduire alors la variable aléatoire X pour représenter le nombre de succès.
Prélever un comprimé est une expérience aléatoire qui ne compte que deux issues possibles : « le comprimé prélevé est conforme », de probabilité estimée p = P(C) = 0,97 ou « le comprimé prélevé n’est pas conforme », de probabilité 1 - p = 1 - 0,97 = 0,03. Il s’agit donc d’une épreuve de Bernoulli dont le succès est l’événement « le comprimé prélevé est conforme ». On pose X la variable aléatoire qui représente le nombre de succès.
\textsuperscript{\textcircled{\tiny{2}}} Remarquer que cette épreuve de Bernoulli est répétée dans des conditions d’indépendance et en déduire que nous nous trouvons donc dans le cadre d’un schéma de Bernoulli.
Ici, l’énoncé nous indique que le prélèvement peut être assimilé à 1000 tirages successifs avec remise donc cela peut être assimilé à 1000 répétitions de l’épreuve de Bernoulli dans des conditions d’indépendance : il s’agit alors d’un schéma de Bernoulli.
\textsuperscript{\textcircled{\tiny{3}}} En déduire que X suit une loi binomiale dont les paramètres sont :

  • n, où n est le nombre de répétitions de l’épreuve de Bernoulli ;
  • p, où p est la probabilité de l’événement qui a été désigné comme « succès ».
Donc X suit une loi binômiale de paramètres n = 1000 et p = 0,97.
\textsuperscript{\textcircled{\tiny{4}}} Vérifier que les conditions requises à l’application de la formule de l’intervalle de fluctuation à 95 % sont remplies, à savoir :
  • n \ge 30
  • np \ge 5
  • n(1 - p) \ge 5

Aucune difficulté ici, une fois que l’on a déterminé les paramètres de la loi binomiale :

Or :
  • n = 1000 \ge 30
  • np = 1000 \times 0,97 = 970 \ge 5
  • n(1 - p) = 1000 \times (1 - 0,97) = 30 \ge 5
\textsuperscript{\textcircled{\tiny{5}}} Conclure sur l’intervalle de fluctuation.
Donc l’intervalle de fluctuation de la proportion de comprimés conformes dans un échantillon de taille 1000 vaut I = \left[p-1,96\dfrac{\sqrt{p(1 - p)}}{\sqrt{n}};p+1,96\dfrac{\sqrt{p(1 - p)}}{\sqrt{n}}\right] = [0,959427 ; 0,980573].
\textsuperscript{\textcircled{\tiny{6}}} Calculer la fréquence des succès dans l’échantillon considéré. Si elle appartient à l’intervalle de fluctuation, alors l’estimation (= la probabilité annoncée pour les succès) est considérée comme exacte. Sinon, elle est considérée comme inexacte.

Calculons donc la fréquence des succès dans l’échantillon prélevé :

Sur l’échantillon de 1000 comprimés, 53 étaient non conformes. Autrement dit, 1000 - 53 = 947 étaient conformes. Donc, la fréquence des succès vaut \dfrac{947}{1000} = 0,947 \notin I.

D’où la conclusion à cette partie :

Donc l’estimation est fausse : le contrôle remet en question les réglages faits par le laboratoire.

Fin de l’épreuve du Bac S 2014 Maths France Métropole Exercice 2.

Exprimez vous!