Beruflich Dokumente
Kultur Dokumente
quantitative L’inférence
statistique
Le sommaire
1. De l’échantillon à la population
2. Les paramètres de la population
et les statistiques de l’échantillon
3. Inférer, c’est comparer
4. La démarche vers l’inférence statistique
5. Les erreurs d’échantillonnage
6. Les intervalles de confiance
7. La statistique : la science de l’incertitude
8. Oups ! J’ai fait une erreur !
La représentativité de l’échantillon
tient à
la nature des individus,
en plus de leur nombre
par rapport à la population.
Population Échantillons
Paramètres
et statistiques 100 % 20 % 40 % 80 %
562385 56381
1437539 2351 28545927 43572
2578641 578641
Moyenne 4,70 2,75 (1,95) 5,25 (0,50) 4,69 (0,01)
Écart-type 2,36 1,71 (0,65) 2,60 (0,24) 2,27 (0,09)
Population Échantillons
Paramètres
et statistiques 100 % 20 % 20 % 20 %
562385
1433579 5 1 4 7 2 4 5 7 1 5 7 9
2578641
Moyenne 4,70 4,25 4,50 5,50
Écart-type 2,36 2,50 2,08 3,41
Le fait que l’échantillon soit petit ne nous empêche pas de mener la recherche.
La science de la statistique s’est attaquée à ce problème fondamental de
l’échantillonnage. L’aventure a débouché sur des tables de probabilité qui nous
permettent de déterminer pour chaque taille d’échantillon à quel point les
statistiques peuvent varier en fonction de l’erreur d’échantillonnage. C’est ainsi
qu’il est possible de décider quand la moyenne d’un échantillon diffère
réellement de la population et quand cette différence s’explique par des erreurs
d’échantillonnage.
Cet exemple porte sur une situation où nous comparons les résultats d’un
échantillon avec ceux de la population entière. Un quelconque critère s’avère
nécessaire dans ce cas-là. Vous avez déduit aussi que cette comparaison
population-échantillon surgit dans un contexte hypothético-déductif de
recherche. Il n’y a pas grand mérite à décrire seulement les résultats d’un
échantillon : un score absolu signifie bien peu de choses. Un score
relatif, par contre, prend une toute autre
Prétendons que les deux groupes sont égaux en tous points au départ. Même si
des analyses statistiques particulières nous permettent de niveler des différences
initiales, nous allons contourner divers aspects de l’expérience afin d’éviter les
complications inutiles.
1. Question de recherche
Le rendement des élèves de 7e année en rédaction anglaise va-t-il différer
selon que la méthode d’enseignement est traditionnelle ou nouvelle ?
2. Hypothèse de recherche
Le rendement des élèves de 7e année en rédaction anglaise ne diffèrera pas
selon que la méthode d’enseignement est traditionnelle ou nouvelle.
3. Échantillon
Deux classes d’élèves de 7e année de la même école
sont équivalentes selon de nombreux facteurs.
4. Expérimentation
Le même nombre d’heures d’enseignement est accordé à chacune des deux
classes. Cependant, les activités pédagogiques diffèrent entre elles. De toute
évidence, ce schème expérimental invite l’effet placebo à se manifester !
5. Analyses statistiques
La comparaison entre les groupes se fera quant à leur moyenne respective
obtenue à une rédaction en langue anglaise.
6. Inférence statistique
Les résultats permettront d’accepter ou de rejeter l’hypothèse nulle. Si elle est
rejetée, l’un de deux groupes montrant un rendement supérieur à l’autre, on
conclura que les méthodes d’enseignement produisent cette différence
au-delà de l’échantillonnage à lui seul.
La science de la statistique offre même des tables qui nous permettent d’estimer
un intervalle de confiance pour divers niveaux de probabilité (par ex. 0,01, 0,05,
0,10). On découvre ainsi que, dans 95 % des cas (0,05), la moyenne
prédite de la population se situe entre 45 et 55 lorsque la moyenne
observée de l’échantillon est de 50.
Pour l’échantillon 1, on voit bien que la distance entre les scores est grande
puisque l’écart-type est plus grand que la moyenne. Et que dire de l’intervalle de
confiance !
Pour l’échantillon 10, par contre, la variabilité entre les scores est réduite, ce qui
diminue l’erreur-type de mesure et rétrécit l’intervalle de confiance. Cet
échantillon est-il vraiment représentatif de la population des 9 scores ?
Constatez-vous que la plupart des échantillons comportent des déficiences ?
Comment peut-on expliquer ce phénomène ? S’il est vrai que plus l’échantillon
Souvent, les résultats confirment une hypothèse sans l’ombre d’un doute.
Parfois, cette confirmation n’est pas aussi définitive. Il y a un risque de se
tromper. Par exemple, vos résultats démontrent qu’il n’y a pas de différence
significative entre un groupe témoin et un groupe expérimental. Il est possible,
cependant, que ces deux groupes soient vraiment différents l’un de l’autre. Plus
forte est la probabilité qu’une hypothèse soit vraie plus faible est la
probabilité qu’elle soit fausse.
Échantillon Population
(prédiction) (résultats)
Décision correcte Décision incorrecte
Hypothèse nulle
1-α (erreur de Type 2 = β )
Décision incorrecte Décision correcte
Hypothèse alternative
(erreur de type 1 = α) 1-β