Notion d'échantillonnage

Nous voyons durant ce cours la notion d'échantillonnage, qui consiste à étudier des échantillons, pour en déduire ou prédire certaines valeurs. 

 

En échantillonnage, deux entités statistiques sont à différencier. D’un côté la population d’intérêt, de l’autre un échantillon représentatif de cette population. La différence fondamentale à absolument maîtriser est que dans la population générale, on définit des valeurs vraies (aussi appelées réelles, théoriques), tandis que dans l'échantillon que l'on extrait de cette population, on définit des valeurs observées.

On note les valeurs observées avec des lettres minuscules (\(p \) pour la proportion, \(m\) pour la moyenne, \(s\) pour l'écart-type) et on note les valeurs vraies avec des lettres grecques (\(\pi \) pour la proportion, \(\mu \) pour la moyenne, \(\sigma\) pour l'écart-type).

 

Il résulte deux applications à cette notion :

  • Intervalle de confiance : à partir d'un échantillon duquel on relève des valeurs observées, on peut réaliser un intervalle qui a une certaine probabilité de contenir la valeur réelle. Dans le cas d'une proportion, l'intervalle qui a 95% de chances de contenir la proportion réelle (vraie, théorique) est :

\(IC_{0,95}=\left[p-1,96\sqrt{\frac{p(1-p)}n}\ ;\ p+1,96\sqrt{\frac{p(1-p)}n}\right]\)

  • Intervalle de pari: en connaissant une valeur théorique dans la population, on peut réaliser un intervalle qui à une certaine probabilité de contenir la grandeur que l'on va observer dans la population. On peut donc prédire avec une certaine probabilité une valeur que l'on va observer. Dans le cas d'une proportion, l'intervalle qui a 95% de contenir la proportion que l'on va observer dans un échantillon de taille \(n\) est :

\(IP_{0,95}=\left[\pi-1,96\sqrt{\frac{\pi(1-\pi)}n}\ ;\ \pi+1,96\sqrt{\frac{\pi(1-\pi)}n}\right]\)

En résumé : l'intervalle de confiance permet d'encadrer avec une certaine probabilité une proportion théorique à partir d'une proportion observée dans un échantillon de taille \(n\), alors que l'intervalle de pari permet d'encadrer avec une certaine probabilité une proportion que l'on va observer dans un échantillon de taille \(n\) à partir d'une proportion théorique.

 

Application

Un quatrième QCM est corrigé dans cette séance, pour présenter une application concrète à ces deux notions fondamentale, qui sont à la base de l'étude des phénomènes populationnels à large échelle.