L'intervalle de confiance d'une proportion – Fiche BAC Terminale Maths

Q: Pourquoi utilise-t-on 95% comme niveau de confiance ?

Le niveau de confiance de 95% est une convention statistique courante. Il signifie que si l'on répétait l'expérience un très grand nombre de fois, 95% des intervalles de confiance ainsi construits contiendraient la vraie proportion $p$. D'autres niveaux de confiance (comme 90% ou 99%) peuvent être utilisés, mais 95% est le plus fréquent en Terminale Spécialité.

Q: Que se passe-t-il si les conditions d'application ne sont pas remplies ?

Si les conditions ($n \geq 30$, $n × f \geq 5$, $n × (1-f) \geq 5$) ne sont pas remplies, la formule simplifiée de l'intervalle de confiance au niveau de 95% n'est pas applicable. Dans ce cas, l'approximation de la loi binomiale par la loi normale n'est pas justifiée, et l'intervalle calculé ne serait pas fiable. Il faudrait utiliser d'autres méthodes statistiques plus complexes ou augmenter la taille de l'échantillon.

Q: L'intervalle de confiance donne-t-il la vraie proportion $p$ ?

Non, l'intervalle de confiance ne donne pas la vraie proportion $p$ avec certitude. Il fournit une plage de valeurs dans laquelle on estime que $p$ se trouve, avec un certain niveau de confiance (ici 95%). La vraie proportion $p$ est une valeur fixe mais inconnue. L'intervalle est une estimation qui varie d'un échantillon à l'autre.

Q: Comment la taille de l'échantillon $n$ influence-t-elle l'intervalle de confiance ?

La taille de l'échantillon $n$ influence directement la largeur de l'intervalle de confiance. Plus $n$ est grand, plus la valeur $\frac{1}{\sqrt{n}}$ est petite. Cela signifie que la marge d'erreur diminue et l'intervalle de confiance devient plus étroit et donc plus précis. Un échantillon plus grand permet une meilleure estimation de la proportion de la population.

Définition

Soit $p$ la proportion inconnue d'un caractère dans une population. À partir d'un échantillon de taille $n$ ($n \geq 30$) prélevé au hasard et avec remise (ou dans une population de taille suffisamment grande), on observe une fréquence $f$ de ce caractère. Un intervalle de confiance de la proportion $p$ au niveau de confiance de 95% est un intervalle qui, sur un grand nombre de prélèvements d'échantillons, contient la vraie proportion $p$ dans au moins 95% des cas. Il est donné par la formule : $$I_c = \left[f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}}\right]$$ sous certaines conditions d'application.

💡 Bon réflexe : Toujours vérifier les conditions d'application avant de calculer l'intervalle de confiance, et interpréter le résultat en termes de niveau de confiance.

Méthode — L'intervalle de confiance d'une proportion

Vérifier les conditions d'application

Avant de calculer l'intervalle de confiance, il est impératif de vérifier les trois conditions suivantes :
1. La taille de l'échantillon $n$ doit être suffisamment grande : $n \geq 30$.
2. Les effectifs $n × f$ et $n × (1-f)$ doivent être supérieurs ou égaux à 5 : $n × f \geq 5$ et $n × (1-f) \geq 5$. Ces conditions garantissent que l'approximation de la loi binomiale par la loi normale est pertinente.

Calculer la fréquence observée $f$

La fréquence $f$ est la proportion du caractère observé dans l'échantillon. Si $k$ est le nombre d'individus présentant le caractère dans l'échantillon de taille $n$, alors $f = \frac{k}{n}$.

Appliquer la formule de l'intervalle de confiance

Une fois $f$ et $n$ connus, et les conditions vérifiées, on utilise la formule de l'intervalle de confiance au niveau de 95% : $$I_c = \left[f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}}\right]$$ Il est important de bien calculer la valeur de $\frac{1}{\sqrt{n}}$.

Interpréter l'intervalle de confiance

L'intervalle obtenu est une estimation de la proportion $p$ de la population. On peut affirmer qu'avec un risque d'erreur de 5% (ou un niveau de confiance de 95%), la proportion $p$ de la population appartient à cet intervalle. Il ne s'agit pas d'une certitude, mais d'une estimation probabiliste.

Exemple résolu

Une entreprise fabrique des ampoules. Sur un lot de production, on prélève au hasard un échantillon de 1000 ampoules. Parmi celles-ci, 40 sont défectueuses. On souhaite estimer la proportion d'ampoules défectueuses dans l'ensemble de la production avec un niveau de confiance de 95%.

Vérifier les conditions d'application

1. Taille de l'échantillon : $n = 1000$. On a $n = 1000 \geq 30$. La première condition est vérifiée.
2. Fréquence observée : $f = \frac{40}{1000} = 0,04$.
Effectifs : $n × f = 1000 × 0,04 = 40$. On a $40 \geq 5$.
$n × (1-f) = 1000 × (1-0,04) = 1000 × 0,96 = 960$. On a $960 \geq 5$.
Les trois conditions sont vérifiées, on peut donc calculer l'intervalle de confiance.

Calculer la fréquence observée $f$

Le nombre d'ampoules défectueuses dans l'échantillon est $k = 40$. La taille de l'échantillon est $n = 1000$.
La fréquence observée est $f = \frac{k}{n} = \frac{40}{1000} = 0,04$.

Calculer la marge d'erreur

La marge d'erreur est donnée par $\frac{1}{\sqrt{n}}$.
$\frac{1}{\sqrt{1000}} \approx \frac{1}{31,62} \approx 0,0316$.
Arrondissons à $0,032$ pour la clarté, ou gardons plus de décimales pour la précision.

Appliquer la formule de l'intervalle de confiance

L'intervalle de confiance est $I_c = \left[f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}}\right]$.
$I_c = [0,04 - 0,0316 ; 0,04 + 0,0316]$
$I_c = [0,0084 ; 0,0716]$.

Interpréter l'intervalle de confiance

Avec un niveau de confiance de 95%, la proportion d'ampoules défectueuses dans l'ensemble de la production est comprise entre 0,84% et 7,16%.

L'intervalle de confiance au niveau de 95% pour la proportion d'ampoules défectueuses est $[0,0084 ; 0,0716]$.

⚠️ Piège fréquent au BAC — Conditions d'application

Oublier de vérifier les conditions d'application ($n \geq 30$, $n × f \geq 5$, $n × (1-f) \geq 5$) avant de calculer l'intervalle. Si elles ne sont pas remplies, la formule n'est pas valide.
Confondre la fréquence $f$ de l'échantillon avec la proportion $p$ de la population. L'intervalle de confiance estime $p$, il ne donne pas $p$ avec certitude.
Arrondir trop tôt les valeurs intermédiaires, en particulier $\frac{1}{\sqrt{n}}$, ce qui peut entraîner une imprécision de l'intervalle final.
Mal interpréter l'intervalle : il ne signifie pas que la probabilité que $p$ soit dans l'intervalle est de 95%, mais que 95% des intervalles construits de cette manière contiennent $p$.

Exercice type BAC

Une association de consommateurs souhaite évaluer la proportion de téléphones portables défectueux d'une certaine marque. Pour cela, elle teste un échantillon aléatoire de 400 téléphones neufs de cette marque. Parmi ces 400 téléphones, 28 sont jugés défectueux.

Calculer la fréquence $f$ des téléphones défectueux dans cet échantillon.
Vérifier que les conditions d'application pour construire un intervalle de confiance de la proportion au niveau de 95% sont remplies.
Déterminer l'intervalle de confiance de la proportion $p$ de téléphones défectueux dans la production de cette marque, au niveau de confiance de 95%. On arrondira les bornes de l'intervalle à $10^{-3}$.
L'entreprise affirme que la proportion de téléphones défectueux est inférieure à 5%. Que peut-on penser de cette affirmation à l'aide de l'intervalle de confiance calculé ?

Calcul de la fréquence $f$ :
La taille de l'échantillon est $n = 400$. Le nombre de téléphones défectueux est $k = 28$.
La fréquence observée est $f = \frac{k}{n} = \frac{28}{400} = 0,07$.
Vérification des conditions d'application :
1. La taille de l'échantillon est $n = 400$. On a $n = 400 \geq 30$. La première condition est vérifiée.
2. Calcul des effectifs $n × f$ et $n × (1-f)$ :
- $n × f = 400 × 0,07 = 28$. On a $28 \geq 5$.
- $n × (1-f) = 400 × (1-0,07) = 400 × 0,93 = 372$. On a $372 \geq 5$.
Les trois conditions sont vérifiées, on peut donc construire l'intervalle de confiance.
Détermination de l'intervalle de confiance :
L'intervalle de confiance au niveau de 95% est donné par la formule : $$I_c = \left[f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}}\right]$$
On a $f = 0,07$ et $n = 400$.
Calculons $\frac{1}{\sqrt{n}}$ : $\frac{1}{\sqrt{400}} = \frac{1}{20} = 0,05$.
Maintenant, calculons les bornes de l'intervalle :
- Borne inférieure : $0,07 - 0,05 = 0,02$.
- Borne supérieure : $0,07 + 0,05 = 0,12$.
L'intervalle de confiance est $[0,02 ; 0,12]$.
Arrondi à $10^{-3}$, l'intervalle est $[0,020 ; 0,120]$.
Analyse de l'affirmation de l'entreprise :
L'entreprise affirme que la proportion de téléphones défectueux est inférieure à 5%, c'est-à-dire $p < 0,05$.
L'intervalle de confiance calculé est $[0,02 ; 0,12]$. Cet intervalle contient des valeurs supérieures ou égales à 0,05 (par exemple, 0,06 ou 0,10). En effet, la borne supérieure de l'intervalle est $0,12$, ce qui est bien supérieur à $0,05$.
Puisque l'intervalle de confiance contient des proportions supérieures à 5%, on ne peut pas confirmer l'affirmation de l'entreprise avec un niveau de confiance de 95%. Il est possible que la proportion réelle de téléphones défectueux soit supérieure à 5%.

Questions fréquentes

Pourquoi utilise-t-on 95% comme niveau de confiance ?

Le niveau de confiance de 95% est une convention statistique courante. Il signifie que si l'on répétait l'expérience un très grand nombre de fois, 95% des intervalles de confiance ainsi construits contiendraient la vraie proportion $p$. D'autres niveaux de confiance (comme 90% ou 99%) peuvent être utilisés, mais 95% est le plus fréquent en Terminale Spécialité.

Que se passe-t-il si les conditions d'application ne sont pas remplies ?

Si les conditions ($n \geq 30$, $n × f \geq 5$, $n × (1-f) \geq 5$) ne sont pas remplies, la formule simplifiée de l'intervalle de confiance au niveau de 95% n'est pas applicable. Dans ce cas, l'approximation de la loi binomiale par la loi normale n'est pas justifiée, et l'intervalle calculé ne serait pas fiable. Il faudrait utiliser d'autres méthodes statistiques plus complexes ou augmenter la taille de l'échantillon.

L'intervalle de confiance donne-t-il la vraie proportion $p$ ?

Non, l'intervalle de confiance ne donne pas la vraie proportion $p$ avec certitude. Il fournit une plage de valeurs dans laquelle on estime que $p$ se trouve, avec un certain niveau de confiance (ici 95%). La vraie proportion $p$ est une valeur fixe mais inconnue. L'intervalle est une estimation qui varie d'un échantillon à l'autre.

Comment la taille de l'échantillon $n$ influence-t-elle l'intervalle de confiance ?

La taille de l'échantillon $n$ influence directement la largeur de l'intervalle de confiance. Plus $n$ est grand, plus la valeur $\frac{1}{\sqrt{n}}$ est petite. Cela signifie que la marge d'erreur diminue et l'intervalle de confiance devient plus étroit et donc plus précis. Un échantillon plus grand permet une meilleure estimation de la proportion de la population.

Pour aller plus loin

Vous bloquez sur ce chapitre ?

Adil accompagne les lycéens en Terminale Spécialité, en ligne ou à domicile dans le Val d'Oise. Résultats en 1 séance.

📞 Appeler Cours Terminale →