Partant d’un échantillon pour déduire le comportement de la population, la statistique inférentielle incorpore toujours une notion de confiance dans les mesures.
L'intervalle de confiance est un outil crucial en statistiques inférentielles, permettant de déterminer dans quelle mesure nous pouvons avoir confiance dans les valeurs estimées à partir d'un échantillon. Il répond à la question fondamentale : "À quel niveau puis-je être sûr de mes conclusions ?"
La réponse s’obtient par le calcul des intervalles de confiance. Il est important de préciser ce qu'un intervalle de confiance n'est pas : il ne s'agit pas de l'intervalle où la véritable valeur du paramètre se situe avec certitude. En réalité, la variable aléatoire peut potentiellement prendre n'importe quelle valeur dans les limites des lois de la physique. L'intervalle de confiance représente plutôt la plage où se trouve, avec une probabilité choisie, "très probablement" la véritable valeur (qui restera à jamais inconnue) du paramètre étudié dans la population.
Dans son utilisation, un intervalle repose sur le calcul d’un seuil de confiance, d’une marge d’erreur et d’un coefficient de marge. Ces éléments dépendent :
Appelé aussi Niveau de confiance ou encore Taux de confiance, il représente le niveau de confiance que l’on souhaite garantir à la mesure. Par exemple, avec un seuil de confiance de 90%, cela signifie 10% de risque de se tromper. Généralement, la bonne pratique est de choisir un seuil de confiance de 95%.
Par conséquent, au plus le seuil de confiance est grand (donc le coefficient de marge – voir ci-dessous), au plus la taille d’échantillon est grand.
Le coefficient de marge est un indicateur déduit directement du seuil de confiance via la table de la loi normale (si n > 30) ou la table de Student (si n < 30). Le tableau ci-dessous donne quelques exemples pour les valeurs les plus courantes.
Taux de confiance s | Coefficient de marge si n > 30 |
---|---|
80% | 1,28 |
85% | 1,44 |
90% | 1,645 |
95% | 1,96 |
96% | 2,05 |
98% | 2,33 |
99% | 2,575 |
Dans le cas où nous souhaitons estimer la moyenne d’une population à partir d’un échantillon de celle-ci, on va devoir estimer un intervalle de confiance. Celui-ci, nous permettra de dire à quel niveau je peux être confiant sur le fait que la moyenne de population est comprise dans l’intervalle de moyenne calculé sur la base de l’échantillon. Le calcul de l’intervalle de confiance dépend de la taille de l’échantillon et de la loi que suit la variable. Sur le principe la formule est la suivante :
La valeur de t va dépendre de la taille de l’échantillon :
Un fabriquant d’ampoule souhaite étudier la durée de vie de sa production. Pour cela, il grille 25 ampoules (on prend donc le confient de marge de la loi de Student) et défini ainsi une distribution normale de moyenne 860 heures et d’écart type 30. A un niveau de confiance de 95%, on déduit l’intervalle suivant :
Nombre n d'individu de l'échantillon | 25 |
Moyenne de l'échantillon | 860 |
Ecart type de l’échantillon | 30 |
Taux de confiance s souhaité | 95% |
Borne inférieure | 847,617 |
Borne supérieure | 872,383 |
On souhaite estimer la proportion de pièces défectueuses d’une fabrication à partir d’un échantillon. On va donc estimer un intervalle de confiance à partir des valeurs de l’échantillon. Le calcul de cet intervalle suit le principe de la formule suivante :
La valeur du coefficient de marge va dépendre de la taille de l’échantillon :
On souhaite estimer l’écart type du diamètre d’usinage d’une fabrication à partir d’un échantillon. On va donc estimer un intervalle de confiance à partir des valeurs de l’échantillon. Le calcul de cet intervalle suit le principe de la formule suivante :
La valeur du coefficient de marge va dépendre de la taille de l’échantillon :
R. Veysseyre (2014) – Statistique et probabilité pour les ingénieurs
J. C. Breton (2008) – Statistiques
M. Genin (2009) – Théorie de l’estimation
P. ardilly (1994) – Les techniques de sondages
G. Saporta (1990) – Probabilités – Analyse des données
D. Schwartz (1996) – Méthodes statistiques à l’usage des médecins et des biologistes
F. Yates (1951) – Méthodes de sondage pour recensements et enquêtes
M. R. Tekaya (2006) – Calcul d’intervalle de confiance pour la moyenne dans une population asymétrique