Estimation d'une proportion et prise de décision statistique – Fiche BAC Terminale Maths

Définition

L'estimation d'une proportion consiste à déterminer un intervalle de confiance pour une proportion $p$ inconnue dans une population, à partir d'un échantillon de taille $n$. Cet intervalle, appelé intervalle de confiance, est une plage de valeurs qui, avec une certaine probabilité (le niveau de confiance), contient la vraie proportion $p$. La prise de décision statistique, basée sur cet intervalle, permet de valider ou de rejeter une hypothèse sur la valeur de $p$.

💡 Bon réflexe : Toujours vérifier les conditions d'application avant de calculer l'intervalle de confiance et bien interpréter la conclusion en fonction de l'appartenance ou non de $p_0$ à cet intervalle.

Méthode — Estimation d'une proportion et prise de décision statistique

1. Calcul de la fréquence observée

À partir d'un échantillon de taille $n$, on calcule la fréquence observée $f = \frac{k}{n}$, où $k$ est le nombre d'individus de l'échantillon possédant la caractéristique étudiée.

2. Vérification des conditions d'application

Pour pouvoir construire un intervalle de confiance asymptotique au niveau de confiance de 95%, les conditions suivantes doivent être remplies :

$n \geq 30$
$n × f \geq 5$
$n × (1-f) \geq 5$

Si ces conditions ne sont pas respectées, l'intervalle de confiance asymptotique n'est pas valide.

3. Construction de l'intervalle de confiance

Si les conditions sont remplies, un intervalle de confiance asymptotique au niveau de confiance de 95% pour la proportion $p$ est donné par : $$I_c = \left[ f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}} \right]$$ Cet intervalle est une approximation de l'intervalle de confiance exact.

4. Prise de décision statistique

Pour prendre une décision sur une proportion $p_0$ donnée (valeur théorique ou attendue) :

Si $p_0 \in I_c$, on considère que l'hypothèse que la proportion est $p_0$ est compatible avec les données de l'échantillon au niveau de confiance de 95%.
Si $p_0 \notin I_c$, on rejette l'hypothèse que la proportion est $p_0$ au niveau de confiance de 95%. On peut alors affirmer, avec un risque d'erreur de 5%, que la proportion réelle est différente de $p_0$.

Exemple résolu

Une entreprise fabrique des ampoules. Elle annonce que la proportion d'ampoules défectueuses est de 2%. Pour vérifier cette affirmation, un contrôleur prélève un échantillon aléatoire de 1000 ampoules et constate que 35 d'entre elles sont défectueuses. Que peut-on en conclure au niveau de confiance de 95% ?

1. Calcul de la fréquence observée

La taille de l'échantillon est $n = 1000$. Le nombre d'ampoules défectueuses est $k = 35$. La fréquence observée est $f = \frac{k}{n} = \frac{35}{1000} = 0,035$.

2. Vérification des conditions d'application

$n = 1000 \geq 30$ (condition vérifiée)
$n × f = 1000 × 0,035 = 35 \geq 5$ (condition vérifiée)
$n × (1-f) = 1000 × (1 - 0,035) = 1000 × 0,965 = 965 \geq 5$ (condition vérifiée)

Les conditions sont remplies, l'intervalle de confiance asymptotique est applicable.

3. Construction de l'intervalle de confiance

L'intervalle de confiance asymptotique au niveau de confiance de 95% est : $$I_c = \left[ f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}} \right]$$ $$I_c = \left[ 0,035 - \frac{1}{\sqrt{1000}} ; 0,035 + \frac{1}{\sqrt{1000}} \right]$$ On calcule $\frac{1}{\sqrt{1000}} \approx \frac{1}{31,62} \approx 0,0316$. $$I_c \approx [0,035 - 0,0316 ; 0,035 + 0,0316]$$ $$I_c \approx [0,0034 ; 0,0666]$$

4. Prise de décision statistique

L'entreprise annonce une proportion d'ampoules défectueuses de $p_0 = 2\% = 0,02$. Nous comparons cette valeur à l'intervalle de confiance $I_c \approx [0,0034 ; 0,0666]$. On constate que $p_0 = 0,02$ appartient à l'intervalle $I_c$ car $0,0034 \leq 0,02 \leq 0,0666$.

Puisque la proportion annoncée par l'entreprise ($p_0 = 0,02$) appartient à l'intervalle de confiance calculé $[0,0034 ; 0,0666]$, on peut considérer que l'affirmation de l'entreprise est compatible avec les données de l'échantillon au niveau de confiance de 95%. Il n'y a pas de raison de remettre en cause la proportion de 2% d'ampoules défectueuses.

⚠️ Piège fréquent au BAC — Interprétation de l'intervalle

Confondre l'intervalle de confiance avec l'intervalle de fluctuation. L'intervalle de confiance est pour estimer $p$ à partir de $f$, l'intervalle de fluctuation est pour estimer $f$ à partir de $p$.
Oublier de vérifier les conditions d'application ($n \geq 30$, $nf \geq 5$, $n(1-f) \geq 5$) avant de construire l'intervalle.
Mal interpréter la conclusion : si $p_0 \in I_c$, on ne prouve pas que $p=p_0$, mais que $p_0$ est une valeur plausible pour $p$. Si $p_0 \notin I_c$, on rejette $p_0$ avec un risque d'erreur de 5%, on ne prouve pas que $p \neq p_0$ de manière absolue.
Arrondir trop tôt les valeurs, en particulier pour les bornes de l'intervalle, ce qui peut fausser la décision finale.

Exercice type BAC

Une association de consommateurs souhaite vérifier l'affirmation d'un fabricant de yaourts qui prétend que 80% de ses produits contiennent au moins 100 millions de ferments lactiques par gramme.

L'association prélève un échantillon aléatoire de 200 yaourts et constate que 140 d'entre eux contiennent au moins 100 millions de ferments lactiques par gramme. Calculer la fréquence observée $f$ de yaourts conformes dans cet échantillon.
Déterminer un intervalle de confiance asymptotique au niveau de confiance de 95% pour la proportion $p$ de yaourts conformes dans la production du fabricant. On veillera à vérifier les conditions d'application.
Que peut-on conclure quant à l'affirmation du fabricant au niveau de confiance de 95% ? Justifier la réponse.

Calcul de la fréquence observée :
La taille de l'échantillon est $n = 200$. Le nombre de yaourts conformes est $k = 140$.
La fréquence observée est $f = \frac{k}{n} = \frac{140}{200} = 0,7$.
Détermination de l'intervalle de confiance :
Vérifions les conditions d'application de l'intervalle de confiance asymptotique :
- $n = 200 \geq 30$. La condition est vérifiée.
- $n × f = 200 × 0,7 = 140 \geq 5$. La condition est vérifiée.
- $n × (1-f) = 200 × (1 - 0,7) = 200 × 0,3 = 60 \geq 5$. La condition est vérifiée.
Toutes les conditions sont remplies. L'intervalle de confiance asymptotique au niveau de confiance de 95% est donné par :
$$I_c = \left[ f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}} \right]$$
En remplaçant $f = 0,7$ et $n = 200$ :
$$I_c = \left[ 0,7 - \frac{1}{\sqrt{200}} ; 0,7 + \frac{1}{\sqrt{200}} \right]$$
Calculons $\frac{1}{\sqrt{200}}$ : $\frac{1}{\sqrt{200}} = \frac{1}{10\sqrt{2}} = \frac{\sqrt{2}}{20} \approx \frac{1,414}{20} \approx 0,0707$.
$$I_c \approx [0,7 - 0,0707 ; 0,7 + 0,0707]$$$$I_c \approx [0,6293 ; 0,7707]$$
L'intervalle de confiance asymptotique au niveau de confiance de 95% est $[0,6293 ; 0,7707]$.
Conclusion quant à l'affirmation du fabricant :
Le fabricant affirme que la proportion de yaourts conformes est de 80%, soit $p_0 = 0,8$.
Nous comparons cette valeur à l'intervalle de confiance calculé $I_c \approx [0,6293 ; 0,7707]$.
On constate que $p_0 = 0,8$ n'appartient pas à l'intervalle $I_c$, car $0,8 > 0,7707$.
Puisque la proportion annoncée par le fabricant ($p_0 = 0,8$) n'appartient pas à l'intervalle de confiance, on peut rejeter l'affirmation du fabricant au niveau de confiance de 95%. Il y a un risque d'erreur de 5% en affirmant que la proportion réelle de yaourts conformes est différente de 80%.

Questions fréquentes

Quelle est la différence entre un intervalle de confiance et un intervalle de fluctuation ?

L'intervalle de confiance est utilisé pour estimer une proportion $p$ inconnue dans une population à partir d'une fréquence $f$ observée sur un échantillon. L'intervalle de fluctuation est utilisé pour vérifier si une fréquence $f$ observée sur un échantillon est compatible avec une proportion $p$ connue dans la population. En Terminale, on utilise l'intervalle de confiance pour la prise de décision.

Pourquoi le niveau de confiance est-il souvent de 95% ?

Le niveau de confiance de 95% est une convention courante en statistiques. Il signifie que si l'on répétait l'expérience un grand nombre de fois, 95% des intervalles de confiance ainsi construits contiendraient la vraie proportion $p$. Le risque d'erreur (rejeter une hypothèse vraie) est alors de 5%.

Que se passe-t-il si les conditions d'application ne sont pas vérifiées ?

Si les conditions $n \geq 30$, $n × f \geq 5$ et $n × (1-f) \geq 5$ ne sont pas vérifiées, l'intervalle de confiance asymptotique donné par la formule $I_c = \left[ f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}} \right]$ n'est pas fiable. Il faudrait alors utiliser des méthodes statistiques plus complexes ou augmenter la taille de l'échantillon.

Peut-on dire que la proportion $p$ est égale à $f$ ?

Non, la fréquence $f$ est une estimation ponctuelle de la proportion $p$. L'intervalle de confiance nous donne une plage de valeurs plausibles pour $p$. Il est très peu probable que $p$ soit exactement égale à $f$, mais $f$ est la meilleure estimation que nous ayons à partir de l'échantillon.

Pour aller plus loin

Vous bloquez sur ce chapitre ?

Adil accompagne les lycéens en Terminale Spécialité, en ligne ou à domicile dans le Val d'Oise. Résultats en 1 séance.

📞 Appeler Cours Terminale →