Catégories

Intervalle de confiance

Partant d’un échantillon pour déduire le comportement de la population, la statistique inférentielle incorpore toujours une notion de confiance dans les mesures.

Introduction

L'intervalle de confiance est un outil crucial en statistiques inférentielles, permettant de déterminer dans quelle mesure nous pouvons avoir confiance dans les valeurs estimées à partir d'un échantillon. Il répond à la question fondamentale : "À quel niveau puis-je être sûr de mes conclusions ?"

La réponse s’obtient par le calcul des intervalles de confiance. Il est important de préciser ce qu'un intervalle de confiance n'est pas : il ne s'agit pas de l'intervalle où la véritable valeur du paramètre se situe avec certitude. En réalité, la variable aléatoire peut potentiellement prendre n'importe quelle valeur dans les limites des lois de la physique. L'intervalle de confiance représente plutôt la plage où se trouve, avec une probabilité choisie, "très probablement" la véritable valeur (qui restera à jamais inconnue) du paramètre étudié dans la population.

Dans son utilisation, un intervalle repose sur le calcul d’un seuil de confiance, d’une marge d’erreur et d’un coefficient de marge. Ces éléments dépendent :

  • De la variabilité des caractéristiques que l’on mesure
  • La taille de l’échantillon : plus celui-ci est grand, plus la précision est grande
  • La méthode d’échantillonnage choisie

Les indicateurs pour calculer un intervalle de confiance

Le seuil de confiance – s

Appelé aussi Niveau de confiance ou encore Taux de confiance, il représente le niveau de confiance que l’on souhaite garantir à la mesure. Par exemple, avec un seuil de confiance de 90%, cela signifie 10% de risque de se tromper. Généralement, la bonne pratique est de choisir un seuil de confiance de 95%.

Par conséquent, au plus le seuil de confiance est grand (donc le coefficient de marge – voir ci-dessous), au plus la taille d’échantillon est grand.

Le coefficient de marge

Le coefficient de marge est un indicateur déduit directement du seuil de confiance via la table de la loi normale (si n > 30) ou la table de Student (si n < 30). Le tableau ci-dessous donne quelques exemples pour les valeurs les plus courantes.

Taux de confiance sCoefficient de marge si n > 30
80%1,28
85%1,44
90%1,645
95%1,96
96%2,05
98%2,33
99%2,575

Intervalle de confiance sur une moyenne

Dans le cas où nous souhaitons estimer la moyenne d’une population à partir d’un échantillon de celle-ci, on va devoir estimer un intervalle de confiance. Celui-ci, nous permettra de dire à quel niveau je peux être confiant sur le fait que la moyenne de population est comprise dans l’intervalle de moyenne calculé sur la base de l’échantillon. Le calcul de l’intervalle de confiance dépend de la taille de l’échantillon et de la loi que suit la variable. Sur le principe la formule est la suivante :

  • La borne inférieure de l’intervalle = moyenne de l’échantillon – coefficient de marge * erreur standard d’une moyenne
  • La borne supérieure de l’intervalle = moyenne de l’échantillon + coefficient de marge * erreur standard d’une moyenne

La valeur de t va dépendre de la taille de l’échantillon :

  • n > 30 : coefficient de marge de la loi normale (appelé z)
  • n < 30 : coefficient de marge de la loi de Student (appelé t) pour n-1

Exemple

Un fabriquant d’ampoule souhaite étudier la durée de vie de sa production. Pour cela, il grille 25 ampoules (on prend donc le confient de marge de la loi de Student) et défini ainsi une distribution normale de moyenne 860 heures et d’écart type 30. A un niveau de confiance de 95%, on déduit l’intervalle suivant :

  • Borne inférieure : 847,6
  • Borne supérieure : 872,4

Nombre n d'individu de l'échantillon25
Moyenne de l'échantillon860
Ecart type de l’échantillon30
Taux de confiance s souhaité95%

Borne inférieure847,617
Borne supérieure872,383

Intervalle de confiance pour une proportion

On souhaite estimer la proportion de pièces défectueuses d’une fabrication à partir d’un échantillon. On va donc estimer un intervalle de confiance à partir des valeurs de l’échantillon. Le calcul de cet intervalle suit le principe de la formule suivante :

  • La borne inférieure de l’intervalle = fréquence moyenne – coefficient de marge * erreur standard d’un pourcentage
  • La borne supérieure de l’intervalle = fréquence moyenne + coefficient de marge * erreur standard d’un pourcentage

La valeur du coefficient de marge va dépendre de la taille de l’échantillon :

  • n*p > 5 : on prend le coefficient de marge de la loi normale (appelé z)
  • n*p < 5 : on prend le coefficient de marge de la loi de poisson (appelé μ)

Intervalle de confiance pour un écart-type

On souhaite estimer l’écart type du diamètre d’usinage d’une fabrication à partir d’un échantillon. On va donc estimer un intervalle de confiance à partir des valeurs de l’échantillon. Le calcul de cet intervalle suit le principe de la formule suivante :

  • La borne inférieure de l’intervalle = écart-type de l’échantillon – coefficient de marge * erreur standard d’un écart-type
  • La borne supérieure de l’intervalle = écart-type de l’échantillon + coefficient de marge * erreur standard d’un écart-type

La valeur du coefficient de marge va dépendre de la taille de l’échantillon :

  • n > 30 : on prend le coefficient de marge de la loi normale (appelé z)
  • n < 30 : on prend le coefficient de marge de la loi de Student (appelé t)

Source

R. Veysseyre (2014) – Statistique et probabilité pour les ingénieurs

J. C. Breton (2008) – Statistiques

M. Genin (2009) – Théorie de l’estimation

P. ardilly (1994) – Les techniques de sondages

G. Saporta (1990) – Probabilités – Analyse des données

D. Schwartz (1996) – Méthodes statistiques à l’usage des médecins et des biologistes

F. Yates (1951) – Méthodes de sondage pour recensements et enquêtes

M. R. Tekaya (2006) – Calcul d’intervalle de confiance pour la moyenne dans une population asymétrique