Définition
Soit $p$ la proportion inconnue d'un caractère dans une population. À partir d'un échantillon de taille $n$ ($n \geq 30$) prélevé au hasard et avec remise (ou dans une population de taille suffisamment grande), on observe une fréquence $f$ de ce caractère. Un intervalle de confiance de la proportion $p$ au niveau de confiance de 95% est un intervalle qui, sur un grand nombre de prélèvements d'échantillons, contient la vraie proportion $p$ dans au moins 95% des cas. Il est donné par la formule : $$I_c = \left[f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}}\right]$$ sous certaines conditions d'application.
Méthode — L'intervalle de confiance d'une proportion
Vérifier les conditions d'application
Avant de calculer l'intervalle de confiance, il est impératif de vérifier les trois conditions suivantes :
1. La taille de l'échantillon $n$ doit être suffisamment grande : $n \geq 30$.
2. Les effectifs $n × f$ et $n × (1-f)$ doivent être supérieurs ou égaux à 5 : $n × f \geq 5$ et $n × (1-f) \geq 5$. Ces conditions garantissent que l'approximation de la loi binomiale par la loi normale est pertinente.
Calculer la fréquence observée $f$
La fréquence $f$ est la proportion du caractère observé dans l'échantillon. Si $k$ est le nombre d'individus présentant le caractère dans l'échantillon de taille $n$, alors $f = \frac{k}{n}$.
Appliquer la formule de l'intervalle de confiance
Une fois $f$ et $n$ connus, et les conditions vérifiées, on utilise la formule de l'intervalle de confiance au niveau de 95% : $$I_c = \left[f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}}\right]$$ Il est important de bien calculer la valeur de $\frac{1}{\sqrt{n}}$.
Interpréter l'intervalle de confiance
L'intervalle obtenu est une estimation de la proportion $p$ de la population. On peut affirmer qu'avec un risque d'erreur de 5% (ou un niveau de confiance de 95%), la proportion $p$ de la population appartient à cet intervalle. Il ne s'agit pas d'une certitude, mais d'une estimation probabiliste.
Exemple résolu
Une entreprise fabrique des ampoules. Sur un lot de production, on prélève au hasard un échantillon de 1000 ampoules. Parmi celles-ci, 40 sont défectueuses. On souhaite estimer la proportion d'ampoules défectueuses dans l'ensemble de la production avec un niveau de confiance de 95%.
2. Fréquence observée : $f = \frac{40}{1000} = 0,04$.
Effectifs : $n × f = 1000 × 0,04 = 40$. On a $40 \geq 5$.
$n × (1-f) = 1000 × (1-0,04) = 1000 × 0,96 = 960$. On a $960 \geq 5$.
Les trois conditions sont vérifiées, on peut donc calculer l'intervalle de confiance.
La fréquence observée est $f = \frac{k}{n} = \frac{40}{1000} = 0,04$.
$\frac{1}{\sqrt{1000}} \approx \frac{1}{31,62} \approx 0,0316$.
Arrondissons à $0,032$ pour la clarté, ou gardons plus de décimales pour la précision.
$I_c = [0,04 - 0,0316 ; 0,04 + 0,0316]$
$I_c = [0,0084 ; 0,0716]$.
L'intervalle de confiance au niveau de 95% pour la proportion d'ampoules défectueuses est $[0,0084 ; 0,0716]$.
⚠️ Piège fréquent au BAC — Conditions d'application
- Oublier de vérifier les conditions d'application ($n \geq 30$, $n × f \geq 5$, $n × (1-f) \geq 5$) avant de calculer l'intervalle. Si elles ne sont pas remplies, la formule n'est pas valide.
- Confondre la fréquence $f$ de l'échantillon avec la proportion $p$ de la population. L'intervalle de confiance estime $p$, il ne donne pas $p$ avec certitude.
- Arrondir trop tôt les valeurs intermédiaires, en particulier $\frac{1}{\sqrt{n}}$, ce qui peut entraîner une imprécision de l'intervalle final.
- Mal interpréter l'intervalle : il ne signifie pas que la probabilité que $p$ soit dans l'intervalle est de 95%, mais que 95% des intervalles construits de cette manière contiennent $p$.
Exercice type BAC
Une association de consommateurs souhaite évaluer la proportion de téléphones portables défectueux d'une certaine marque. Pour cela, elle teste un échantillon aléatoire de 400 téléphones neufs de cette marque. Parmi ces 400 téléphones, 28 sont jugés défectueux.
- Calculer la fréquence $f$ des téléphones défectueux dans cet échantillon.
- Vérifier que les conditions d'application pour construire un intervalle de confiance de la proportion au niveau de 95% sont remplies.
- Déterminer l'intervalle de confiance de la proportion $p$ de téléphones défectueux dans la production de cette marque, au niveau de confiance de 95%. On arrondira les bornes de l'intervalle à $10^{-3}$.
- L'entreprise affirme que la proportion de téléphones défectueux est inférieure à 5%. Que peut-on penser de cette affirmation à l'aide de l'intervalle de confiance calculé ?
Calcul de la fréquence $f$ :
La taille de l'échantillon est $n = 400$. Le nombre de téléphones défectueux est $k = 28$.
La fréquence observée est $f = \frac{k}{n} = \frac{28}{400} = 0,07$.
Vérification des conditions d'application :
1. La taille de l'échantillon est $n = 400$. On a $n = 400 \geq 30$. La première condition est vérifiée.
2. Calcul des effectifs $n × f$ et $n × (1-f)$ :
- $n × f = 400 × 0,07 = 28$. On a $28 \geq 5$.
- $n × (1-f) = 400 × (1-0,07) = 400 × 0,93 = 372$. On a $372 \geq 5$.
Les trois conditions sont vérifiées, on peut donc construire l'intervalle de confiance.
Détermination de l'intervalle de confiance :
L'intervalle de confiance au niveau de 95% est donné par la formule : $$I_c = \left[f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}}\right]$$
On a $f = 0,07$ et $n = 400$.
Calculons $\frac{1}{\sqrt{n}}$ : $\frac{1}{\sqrt{400}} = \frac{1}{20} = 0,05$.
Maintenant, calculons les bornes de l'intervalle :
- Borne inférieure : $0,07 - 0,05 = 0,02$.
- Borne supérieure : $0,07 + 0,05 = 0,12$.
L'intervalle de confiance est $[0,02 ; 0,12]$.
Arrondi à $10^{-3}$, l'intervalle est $[0,020 ; 0,120]$.
Analyse de l'affirmation de l'entreprise :
L'entreprise affirme que la proportion de téléphones défectueux est inférieure à 5%, c'est-à-dire $p < 0,05$.
L'intervalle de confiance calculé est $[0,02 ; 0,12]$. Cet intervalle contient des valeurs supérieures ou égales à 0,05 (par exemple, 0,06 ou 0,10). En effet, la borne supérieure de l'intervalle est $0,12$, ce qui est bien supérieur à $0,05$.
Puisque l'intervalle de confiance contient des proportions supérieures à 5%, on ne peut pas confirmer l'affirmation de l'entreprise avec un niveau de confiance de 95%. Il est possible que la proportion réelle de téléphones défectueux soit supérieure à 5%.
Questions fréquentes
Pourquoi utilise-t-on 95% comme niveau de confiance ?
Que se passe-t-il si les conditions d'application ne sont pas remplies ?
L'intervalle de confiance donne-t-il la vraie proportion $p$ ?
Comment la taille de l'échantillon $n$ influence-t-elle l'intervalle de confiance ?
Pour aller plus loin
Vous bloquez sur ce chapitre ?
Adil accompagne les lycéens en Terminale Spécialité, en ligne ou à domicile dans le Val d'Oise. Résultats en 1 séance.