Inference Statistique

Approche
quantitative L’inférence
statistique
Les objectifs pédagogiques

Approfondir la notion de représentativité d’un échantillon
Comprendre la relation entre les caractéristiques de la population
et celles de l’échantillon
Connaître les conditions qui améliorent la représentativité d’un échantillon
Connaître la signification réelle de l’erreur d’échantillonnage
Connaître la démarche générale pour parvenir à l’inférence statistique
En savoir plus sur les intervalles de confiance
Mieux comprendre l’influence de la variabilité des scores
et de la taille de l’échantillon sur l’erreur-type de l’échantillonnage
S’initier à la notion d’erreur de Type 1 et de Type 2
Le sommaire
1. De l’échantillon à la population
2. Les paramètres de la population
et les statistiques de l’échantillon
3. Inférer, c’est comparer
4. La démarche vers l’inférence statistique
5. Les erreurs d’échantillonnage
6. Les intervalles de confiance
7. La statistique : la science de l’incertitude
8. Oups ! J’ai fait une erreur !
Page 1 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

(CRDE) Université de Moncton longd@umoncton.ca (506) 858-4886
Vous arrive-t-il parfois à l’épicerie de
1. De l’échantillon goûter à un raisin avant d’acheter toute
à la population la grappe ? Quelle que soit votre
décision, elle découlera d’une inférence.
Vous attribuerez à la grappe les
caractéristiques du raisin que vous avez goûté. L’inférence statistique est
nécessaire tout simplement parce que la plupart du temps nous étudions la
population entière par le biais d’un échantillon. Et, ce faisant, l’estimation
s’accompagne d’erreurs. Le rôle véritable de la statistique est justement de
mesurer le degré d’erreur de ces estimations.
Un synonyme populaire de l’inférence est la généralisation. Dans les deux cas,

il s’agit d’attribuer à la population les caractéristiques connues de l’échantillon.
Cette attribution est d’autant plus pertinente et réaliste que l’échantillon a été tiré
selon des règles strictes qui régissent l’échantillonnage. Un échantillon simple
aléatoire, par exemple, est le type d’échantillon qui représente le mieux la
population. Cependant, d’autres types d’échantillon permettent des
généralisations tout aussi valables.
La validité de l’inférence à toute la population en s’appuyant sur les données de

l’échantillon dépend de la représentativité de l’échantillon. Si votre échantillon
se compose des élèves de 5e année d’une seule école de votre district scolaire, il
est probable que les résultats que vous obtiendrez auprès de cet échantillon ne
pourront être généralisés à tous les élèves de 5e année de la province. Tout au
plus pourront-ils être généralisés aux élèves des autres classes de 5e année de
votre district. Et, là, l’erreur d’estimation pourrait être importante.
Grosso modo, pour s’assurer que l’échantillon représente le plus fidèlement

possible la population, il est nécessaire que les individus soient tirés de cette
population en nombre suffisant. Plus le nombre d’individus dans un échantillon
s’approche de celui de la population dont il est tiré, moins grande est l’erreur
d’estimation des paramètres de la population.
La représentativité de l’échantillon
tient à
la nature des individus,
en plus de leur nombre
par rapport à la population.
Dans le tableau ci-après, l’échantillon 1 est formé de 25 % de chacun des cinq

icônes différents constituant la population totale d’icônes. La proportion de
chaque catégorie d’icônes dans la population a été respectée dans l’échantillon
1. Par contre, dans l’échantillon 2, ces proportions n’ont pas été conservées.

L’un de ces icônes de la population ne fait même pas partie de l’échantillon.
Alors, dans ce dernier cas, la nature de la population n’est pas fidèlement
représentée dans l’échantillon. Et que dire des proportions !
Population Échantillon 1 Échantillon 2
Afin de s’assurer de la faisabilité d’une recherche, on doit se contenter la plupart

du temps d’étudier une partie de la population. Bien des facteurs nous
empêchent de faire appel à toute la population dans chacune des recherches que
nous voulons mener. Comme l’échantillon ne peut être identique à la population,
les statistiques de l’échantillon diffèrent des paramètres de la population.
2. Les paramètres de la population

Shavelson (1996) énonce l’affirmation suivante : « en généralisant à une

population, nous sommes intéressés à décrire des caractéristiques de la
population, telles que la moyenne et l’écart-type, à partir des caractéristiques
de l’échantillon ».
Pour rendre plus concrets certains concepts, servons-nous de l’exemple suivant.

Supposons que notre population totale soit composée de 20 nombres qui vont de
1 à 9. À l’aide de l’ordinateur, 3 échantillons différents ont été choisis. Le
premier représente 20 % de la population des 20 nombres, le deuxième, 40 %, et
le troisième 80 %. Le résultat de cette sélection aléatoire se trouve dans le
tableau qui suit.
Population Échantillons
Paramètres
et statistiques 100 % 20 % 40 % 80 %
562385 56381
1437539 2351 28545927 43572
2578641 578641
Moyenne 4,70 2,75 (1,95) 5,25 (0,50) 4,69 (0,01)
Écart-type 2,36 1,71 (0,65) 2,60 (0,24) 2,27 (0,09)

Pour chacun d’eux nous avons calculé la moyenne et l’écart-type. Ensuite, nous
avons calculé la différence de chacune de ces statistiques avec les paramètres de
la population. La moyenne estimative de l’échantillon de 20 % est de 2,75 et sa
différence avec la moyenne de la population (4,70) est de 1,95. En fait, l’erreur
d’échantillonnage quant à la moyenne est de 1,95.
Par ailleurs, quant à l’échantillon de 80 %, l’erreur d’échantillonnage est

minime, 0,01. On observe que, plus l’échantillon se rapproche de la population,
moins appréciables sont les différences entre les paramètres et les statistiques.
Cette fois-ci, tirons 3 échantillons successifs de 20 % chacun. Nous serons,

ainsi, en mesure de constater si la variation entre les statistiques seulement est
minime ou considérable.
Population Échantillons
Paramètres
et statistiques 100 % 20 % 20 % 20 %
562385
1433579 5 1 4 7 2 4 5 7 1 5 7 9
2578641
Moyenne 4,70 4,25 4,50 5,50
Écart-type 2,36 2,50 2,08 3,41
Les résultats obtenus pour le 3e échantillon à la droite du tableau montrent bien à

quel point il est nécessaire de ne pas trop se fier aux statistiques d’un échantillon
restreint et peu représentatif. En fait, si l’échantillon est restreint, il risque fort
d’être peu représentatif.
La représentativité d’un échantillon

ne relève ni de l’intuition
ni d’une boule de cristal,
mais de calculs précis.
C’est l’écart entre
les paramètres de la population
qui confère à l’échantillon un degré
plus ou moins élevé de représentativité.
Quelles sont les caractéristiques principales que nous souhaitons connaître à

propos de la population ? Parmi les nombreuses caractéristiques, il y a, bien sûr

la moyenne et l’écart-type, qui sont respectivement des mesures de tendance
centrale et de dispersion des scores dans une distribution.
Caractéristiques Population Échantillon

Moyenne µ X = ΣX ÷ N
Écart-type σ2 s = Σx2 ÷ (N-1)
2
Les formules statistiques créées pour estimer les paramètres de la population à

partir des données de l’échantillon s’appellent des estimateurs. On leur attribue
des qualités ou des caractéristiques particulières. Shavelson (1996) insiste sur les
trois caractéristiques suivantes :
1. L’impartialité. Un estimateur de la moyenne de la population est impartial si,

pour un nombre indéfini et large d’échantillons, la moyenne de l’échantillon sera
égale à la moyenne de la population. Si vous tirez d’innombrables échantillons
d’une population, la moyenne des moyennes de tous ces échantillons sera égale
à celle de la population.
2. La consistance. L’estimateur se rapproche de plus en plus du paramètre de la

population à mesure que l’échantillon augmente.
3. L’efficacité. L’estimateur d’un paramètre de la population est le plus efficace

quand les estimations ne varient pas d’un échantillon à l’autre.
Est-il besoin de répéter que,

plus un échantillon aléatoire est grand,
plus il sera représentatif,
moins il y aura d’erreurs d’estimation
et plus les distributions de scores se
rapprocheront de la normalité ?
Jusqu’à présent, nous avons vu

comment des valeurs statistiques 3. Inférer
calculées à partir d’observations faites
auprès d’un échantillon nous
c’est comparer
permettent d’estimer les
caractéristiques de la population. Nous savons, par ailleurs, qu’il existe
toujours un écart entre un échantillon et sa population. Nous pouvons
réduire cet écart surtout par l’augmentation de la taille de l’échantillon ainsi que
par la technique d’échantillonnage

Nous avons vu aussi qu’il existe des différences marquées entre les statistiques
de plusieurs échantillons tirés de la même population. Il existe souvent tellement
de variations entre ces échantillons qu’on se rend compte que les estimations des
paramètres de la population ne sont pas des certitudes, mais des événements qui
se produisent avec un degré de probabilité. Consolons-nous en disant ceci : plus
un échantillon est grand plus la probabilité est élevée que les statistiques
seront équivalents aux paramètres.
Le fait que l’échantillon soit petit ne nous empêche pas de mener la recherche.
La science de la statistique s’est attaquée à ce problème fondamental de
l’échantillonnage. L’aventure a débouché sur des tables de probabilité qui nous
permettent de déterminer pour chaque taille d’échantillon à quel point les
statistiques peuvent varier en fonction de l’erreur d’échantillonnage. C’est ainsi
qu’il est possible de décider quand la moyenne d’un échantillon diffère
réellement de la population et quand cette différence s’explique par des erreurs
d’échantillonnage.
Dès que nous tirons un échantillon d’une population, la sempiternelle question

suivante se pose : À quel point cet échantillon déroge-t-il de sa population-
mère? Nous avons donc besoin d’un critère quelconque pour déterminer la
différence entre les deux.
La moyenne d’une classe d’élèves de 12e

année à leur examen d’anglais de fin
d’année est de 73. Cette moyenne diffère-t-
elle de la moyenne de tous les élèves de 12e
année qui ont passé cet examen ? Si vous
avez accès aux résultats scolaires de l’année
précédente, vous êtes en mesure de calculer
que la moyenne de la population des élèves
de 12e année à un examen similaire est de
77. La différence entre les deux peut-elle s’expliquer par le hasard de
l’échantillonnage ? La moyenne d’autres classes aurait-elle été différente de
73? L’écart entre les deux moyennes s’explique-t-il aisément par le hasard ? Un
autre facteur interviendrait-il ?
Cet exemple porte sur une situation où nous comparons les résultats d’un
échantillon avec ceux de la population entière. Un quelconque critère s’avère
nécessaire dans ce cas-là. Vous avez déduit aussi que cette comparaison
population-échantillon surgit dans un contexte hypothético-déductif de
recherche. Il n’y a pas grand mérite à décrire seulement les résultats d’un
échantillon : un score absolu signifie bien peu de choses. Un score
relatif, par contre, prend une toute autre

signification. Il est mis en relation avec un autre score, un critère de
comparaison.
Au départ, une question a été posée de manière formelle. Le rendement en

anglais des élèves de cette classe de 12e année est-il inférieur, équivalent ou
supérieur à celui de tous les élèves de 12e année ? À la question posée une
solution, une hypothèse, est donc proposée : par exemple, il n’y a pas de
différence entre la moyenne en anglais de cette classe de 12e année et celle de la
population totale des élèves de 12e année. Cette démarche particulière s’inscrit
dans un schème de pensée comparatif, hypothético-déductif.
L’exemple précédent portait sur la comparaison d’un résultat statistique d’un

échantillon avec un critère d’une population. L’exemple suivant porte plutôt sur
la comparaison entre les statistiques de deux échantillons.
Nous n’avons pas seulement les résultats

d’une classe, mais de deux classes de 12e
année. La moyenne en anglais obtenue par
cette autre classe est de 78. La différence
avec la moyenne de l’autre classe est de 5.
La différence statistique entre ces deux
échantillons est-elle significative ? En
comparant une multitude de classes de 12e
année, cette différence de 5 apparaîtrait à
quelle fréquence ? Si les tables de probabilité indiquent qu’une telle différence
survient 14 fois sur 100, cet événement n’est pas rare. Il aurait fallu que cette
différence survienne au plus 5 fois sur 100.
Les comportements que nous avons mesurés sont donc

considérés comme des événements probabilistes, et non
des certitudes immuables. On jetterait par-dessus bord ces tables de
probabilité sans le moindre regret si nous possédions des données sur tous les
comportements imaginables et analysables de la population. Ce qui n’est pas le
cas. Néanmoins, lorsque l’accumulation des recherches précédentes nous permet
d’établir des critères ou la valeur des paramètres, il est avantageux de s’y référer
plutôt que de faire appel aux tables de probabilité.
Bref, dans un environnement hypothético-déductif,

on compare
un échantillon à la population,
ou deux échantillons entre eux.

Puisque la comparaison
4. La démarche entre des échantillons ou
vers des groupes est monnaie
courante en recherche,
l’inférence statistique voyons, grâce à un exemple
concret, comment s’inscrit
l’inférence statistique dans le processus d’une recherche.
Les autorités scolaires sont désireuses de vérifier si une nouvelle

pédagogie de l’enseignement de la langue seconde en 7e année serait
plus efficace que l’enseignement traditionnel. Vous consentez à
appliquer cette nouvelle pédagogie, alors que votre collègue
enseignera toujours selon l’approche traditionnelle. À la fin de
l’année scolaire, diverses mesures sont utilisées pour comparer le
rendement de ces classes. Pour l’occasion, nous utiliserons
la note en pourcentage obtenue à une rédaction.
Prétendons que les deux groupes sont égaux en tous points au départ. Même si
des analyses statistiques particulières nous permettent de niveler des différences
initiales, nous allons contourner divers aspects de l’expérience afin d’éviter les
complications inutiles.
1. Question de recherche
Le rendement des élèves de 7e année en rédaction anglaise va-t-il différer
selon que la méthode d’enseignement est traditionnelle ou nouvelle ?
2. Hypothèse de recherche
Le rendement des élèves de 7e année en rédaction anglaise ne diffèrera pas
selon que la méthode d’enseignement est traditionnelle ou nouvelle.
3. Échantillon
Deux classes d’élèves de 7e année de la même école
sont équivalentes selon de nombreux facteurs.
4. Expérimentation
Le même nombre d’heures d’enseignement est accordé à chacune des deux
classes. Cependant, les activités pédagogiques diffèrent entre elles. De toute
évidence, ce schème expérimental invite l’effet placebo à se manifester !
5. Analyses statistiques
La comparaison entre les groupes se fera quant à leur moyenne respective
obtenue à une rédaction en langue anglaise.
6. Inférence statistique
Les résultats permettront d’accepter ou de rejeter l’hypothèse nulle. Si elle est
rejetée, l’un de deux groupes montrant un rendement supérieur à l’autre, on
conclura que les méthodes d’enseignement produisent cette différence
au-delà de l’échantillonnage à lui seul.

L’inférence pourrait conduire à la généralisation des résultats à toute la
population des élèves de 7e année. Cependant, il faudra bien d’autres
expériences à l’aide de nombreux échantillons avant de tirer des conclusions
définitives sur la valeur respective de chacune de ces méthodes d’enseignement.
Vous avez compris aussi que cet exemple a été choisi uniquement pour montrer
à quel point les étapes de la recherche entre la formulation du problème et
l’inférence statistique s’imbriquent les unes dans les autres.
Quand est-il plus convenable de formuler une hypothèse nulle

? au lieu d’une hypothèse directionnelle ?
L’hypothèse nulle convient lorsqu’on ne peut prévoir les résultats.
L’hypothèse directionnelle convient mieux lorsque
R les résultats des recherches précédentes indiquent sans équivoque
la direction que prendront les résultats.
Que signifie l’expression erreur

5. Les erreurs d’échantillonnage ? Elle consiste en
d’échantillonnage un ou plusieurs facteurs insolites et
imprévus qui modifient les statistiques
de l’échantillon : en fait, c’est une
erreur qui survient au cours de la formation d’un échantillon. Il serait préférable
de réserver l’expression erreur d’échantillonnage aux erreurs reliées aux
techniques d’échantillonnage. Les erreurs qui surviennent à d’autres étapes de la
recherche devraient être regroupées sous d’autres appellations spécifiques et
pertinentes quant à leur nature intrinsèque. Voici quelques exemples d’erreurs
d’échantillonnage.
Des exemples d’erreur d’échantillonnage

Un des groupes comprend deux fois plus de garçons que les autres.
Le chercheur a omis d’équilibrer les groupes en fonction de
caractéristiques sociodémographiques importantes.
Pour un groupe, certains participants ont été substitués par des
volontaires. Les membres des autres groupes ont été choisis au hasard.
L’influence d’une erreur d’échantillonnage

est moindre si elle est présente
chez tous les groupes
également.

L’erreur d’échantillonnage échappe le plus souvent au contrôle du
chercheur. Cependant, ignorer les erreurs d’échantillonnage ne
signifie pas pour autant qu’elles n’existent pas. En connaissant
les principales sources d’erreur, il est possible d’en éliminer
quelques-unes ou même de les distribuer uniformément entre les
groupes de manière à annuler leur effet pervers sur un groupe au détriment d’un
autre.
Vous administrez un programme de développement socioaffectif à

des adolescentes et à des adolescents de trois centres
communautaires de votre ville. L’un de ces centres est situé dans un
quartier où le taux de pauvreté et de criminalité est beaucoup plus
élevé que dans les deux autres. Les trois échantillons diffèrent entre
eux quant à plusieurs caractéristiques. Il est impérieux alors de
mesurer ces caractéristiques avant l’application du programme. Les
analyses statistiques en cours d’expérience et à la toute fin devraient
tenir compte de ces différences initiales. Il y a fort à parier que les
conclusions prendront une toute autre allure par le fait même.
L’erreur d’échantillonnage est-elle constante ? Certes, l’erreur d’échantillonnage

est toujours présente à divers degrés : en ce sens, elle est constante. Cependant,
elle varie d’un échantillon à l’autre. Aussi bien dire que l’erreur
d’échantillonnage varie surtout en fonction de la variabilité de la caractéristique
que nous mesurons. Plus grande est la variabilité de cette caractéristique dans la
population, plus grande est l’erreur d’échantillonnage.
L’erreur d’échantillonnage peut être fortuite ou systématique. Une erreur est

systématique lorsqu’elle survient avec régularité. Par exemple, lors de votre
enquête téléphonique, tous vos appels dans les foyers sont faits au cours de la
journée. Vous éliminez ainsi de votre échantillon la plupart des travailleuses et
des travailleurs. Une erreur est fortuite lorsqu’elle est irrégulière. Par exemple,
au cours de la même enquête téléphonique qui se déroule du lundi au vendredi,
la journée de vendredi est un congé férié. La nature des répondantes et des
répondants durant cette journée sera différente par rapport aux quatre premières
journées de votre enquête.
L’erreur fortuite d’échantillonnage est-elle plus lourde de conséquence que

l’erreur systématique ? Non, parce que nous pouvons prétendre que les erreurs
fortuites d’échantillonnage seront réparties également entre les échantillons.
L’erreur systématique est conçue comme celle qui agit de manière différentielle
auprès d’un groupe ou d’un échantillon : cette erreur est plus à craindre que
l’erreur fortuite.

Que mesure vraiment l’erreur-type d’échantillonnage ?
Q
Elle mesure, en fait, le degré de précision
R de chacune des statistiques de l’échantillon.
Votre recherche comprend cinq groupes choisis de manière aléatoire. Vous

comparez ces groupes entre eux quant à une statistique précise, soit le salaire
moyen. La moyenne des salaires variera d’un groupe à l’autre. Si la variation est
grande, l’erreur-type de la moyenne sera grande aussi. Si vous aviez choisi un
grand nombre de groupes pour votre recherche, l’erreur-type aurait été
certainement moins grande, se rapprochant de plus en plus de zéro à mesure que
le nombre de groupes augmente et que la variabilité diminue entre eux.
En réalité, il est impossible de savoir vraiment si le salaire moyen d’un groupe

correspond ou non au salaire moyen de la population dont il est tiré, à moins de
calculer le salaire moyen de la population entière. Pour cette raison, nous faisons
appel aux règles de la probabilité pour estimer à quel point une statistique de
l’échantillon se rapproche d’un paramètre de la population. Comme ce n’est pas
possible de savoir à quel point chacune des moyennes de vos cinq groupes se
rapproche de la vraie moyenne, celle de la population, nous pouvons délimiter
des étendues de valeurs entre lesquelles cette vraie moyenne se situe
probablement, et non véritablement.
Aucun d’entre nous n’aime se tromper

6. Les intervalles dans ses prédictions, surtout lorsque
notre amour-propre est en jeu. Pour
de confiance améliorer notre prédiction nous
préférons le plus souvent donner une
étendue de valeurs plutôt qu’une seule valeur. En parlant de la température, vous
direz qu’il fait environ de 22 à 26 degrés Celsius. En estimant la valeur de votre
auto, vous prétendrez qu’elle vaut de 13 000 à 15 000 $. Plus vous agrandissez
l’étendue des valeurs probables, moins vous risquez de vous tromper. Votre
stratégie est louable.
Cette étendue de valeurs s’appelle un intervalle de confiance. Plus grand est

votre intervalle de confiance, plus grande est la probabilité que la vraie valeur
soit comprise à l’intérieur de ces limites. De plus, pour chaque grandeur
d’intervalle de confiance il est possible d’associer une probabilité spécifique
que la vraie valeur se trouve à l’intérieur de ces limites.
Le tableau suivant montre deux graphiques qui illustrent deux distributions de

scores dont la moyenne est de 50. Pour le graphique de gauche, l’intervalle de
confiance situé entre 47 et 53 a été colorié. Pour le graphique de droite, cet

intervalle se situe entre les valeurs 35 et 65. Supposons que ces résultats soient
ceux obtenus à une épreuve de satisfaction au travail dont le score maximum est
de 70. Des milliers de travailleurs et de travailleuses ont passé cette épreuve.
Nous allons prétendre même que la moyenne obtenue est de 50.
Si vous faites passer l’épreuve à un autre groupe de travailleurs, vous

constaterez qu’il est plus facile de prédire la moyenne de ce nouveau groupe
pour l’intervalle de confiance situé entre les valeurs 35 et 65 qu’entre les valeurs
de 47 et 53. La probabilité que la moyenne du nouveau groupe se situe à
l’intérieur des limites de 35 à 65 est plus élevée par rapport aux limites plus
restrictives de 47 et 53.
La science de la statistique offre même des tables qui nous permettent d’estimer
un intervalle de confiance pour divers niveaux de probabilité (par ex. 0,01, 0,05,
0,10). On découvre ainsi que, dans 95 % des cas (0,05), la moyenne
prédite de la population se situe entre 45 et 55 lorsque la moyenne
observée de l’échantillon est de 50.
Les valeurs des tables de probabilité

ne sont valides que si l’échantillon a été constitué
en respectant
les règles fondamentales de l’échantillonnage.
La grandeur de l’erreur-type de l’échantillon dépend de deux facteurs

particuliers :
1. La variabilité de la caractéristique dans la
population. Si nous mesurons l’âge de la population entière, nous savons fort
bien qu’il s’étendra de 0 à plus de 100 ans. Par contre, si nous mesurons le
nombre de voyages effectués à l’extérieur du pays au cours de l’année dernière,
la variabilité sera beaucoup plus réduite que dans le cas de l’âge.

2. La taille de l’échantillon. Plus l’échantillon s’agrandit, plus
les statistiques se rapprochent des paramètres de la population. En augmentant la
taille de l’échantillon, on diminue l’erreur-type de l’échantillonnage qui peut
être perçue comme un indicateur de variabilité entre d’innombrables
échantillons. Pour mieux saisir ces concepts, examinons le tableau suivant.
Voici comment ce tableau a été construit. D’abord, imaginons une population

composée des nombres de 1 à 9. Ensuite, 10 échantillons de 5 nombres ont été
choisis au hasard. Pour chacun de ces échantillons, les statistiques suivantes ont
été calculées : la moyenne, l’écart-type, l’erreur-type de la moyenne et les
intervalles de confiance. Voyons comment ces statistiques sont reliées entre
elles.
Échantillon Scores Moyenne Écart- Erreur- Intervalles de

bruts type type de la confiance
moy.
1 1,2,3,7,8 3,40 3,85 1,72 0,03 - 7,22
2 4,5,7,8,9 5,60 3,65 1,63 2,02 - 5,28
3 1,2,3,4,8 2,80 3,35 1,50 1,85 - 4,85
4 2,3,5,8,9 3,80 4,38 1,96 2,42 - 6,34
5 1,4,5,6,9 2,60 3,97 1,78 2,19 - 5,75
6 2,3,4,8,9 4,60 3,85 1,72 2,13 - 5,57
7 1,2,4,6,7 2,60 2,97 1,33 1,64 - 4,30
8 1,3,6,7,8 3,00 4,12 1,84 2,28 - 5,96
9 2,5,6,7,8 3,40 3,85 1,72 2,13 - 5,57
10 2,4,7,8,9 6,00 2,92 1,30 1,62 - 4,22
Total 3,78 3,69 1,65
Lorsqu’on examine la moyenne de chaque échantillon, on comprend à quel point

la variation est grande entre les échantillons. Les moyennes varient de 2,60 à
6,00. La moyenne des moyennes s’établit à 3,78. Plus on augmenterait le
nombre d’échantillons, plus cette moyenne générale se rapprocherait
progressivement de 5,00.
Pour l’échantillon 1, on voit bien que la distance entre les scores est grande
puisque l’écart-type est plus grand que la moyenne. Et que dire de l’intervalle de
confiance !
Pour l’échantillon 10, par contre, la variabilité entre les scores est réduite, ce qui
diminue l’erreur-type de mesure et rétrécit l’intervalle de confiance. Cet
échantillon est-il vraiment représentatif de la population des 9 scores ?
Constatez-vous que la plupart des échantillons comportent des déficiences ?
Comment peut-on expliquer ce phénomène ? S’il est vrai que plus l’échantillon

augmente en taille, plus il se rapproche d’une distribution normale, alors, plus
l’échantillon est réduit plus il s’éloigne de la normalité.
Un écart-type réduit est-il plus valide

Q qu’un écart type agrandi ?
Plus de variabilité est préférable à moins de variabilité.
Mais, attention, ne simplifions pas trop !
Assurons-nous d’abord que l’échantillon
R n’est pas exagérément petit
et que quelques scores extrêmes
ne biaisent pas la représentativité de l’échantillon.
Un litre de lait, un litre d’eau 7. La statistique :

ou un litre de jus de fruit,
c’est toujours un litre de
la science de
liquide. En statistique, par l’incertitude
contre, une moyenne de 5,69 n’a de véritable valeur que lorsqu’on la compare à
une mesure, à un test ou à un critère quelconque. Par exemple, votre ami est
content de son score de 74 au dernier test de français. Quel était le score
maximal à ce test ? Étais-ce 80, 100 ou un autre score ?
À vrai dire, les statistiques de l’échantillon ne prennent de la valeur que

lorsqu’ils sont comparés aux paramètres de la population. Il existe une
autre situation où les statistiques de l’échantillon renferment une signification
particulière. C’est lorsque nous comparons deux ou plusieurs échantillons entre
eux. Par exemple, la moyenne de 72 obtenue par les élèves de Madame Letendre
au test d’anglais est-elle significativement plus élevée que la moyenne de 69
obtenue par les élèves de Monsieur Legendre ? La différence entre les deux
moyennes est-elle attribuable à la supériorité réelle de la pédagogie de Madame
Letendre ou bien à divers autres facteurs ?
En d’autres termes, une statistique tire sa valeur de la comparaison avec

un paramètre de la population ou avec la statistique d’un autre
échantillon. La plupart des recherches adopteront l’une ou l’autre de ces deux
démarches.
La relativité des statistiques ne doit jamais être perdue de vue. On pourrait à

raison parler de la statistique comme la science de l’incertitude : tout est relatif.
Comment peut-on faire pour savoir si les scores qu’on obtient sont valides ou
non valides ? Chaque score qu’on obtient doit être perçu comme l’un des scores
possibles. Un autre score inférieur pourrait bien être le vrai score, ou un autre
score supérieur pourrait être le bon score. Par conséquent, chaque score ou

statistique doit être considéré comme un représentant d’une étendue de
scores tout aussi valides les uns que les autres.
Pour abaisser ce degré d’incertitude une solution consiste à choisir un

échantillon d’aussi grande taille que possible. Il ne faut pas croire, par ailleurs,
que les données d’une recherche sont toujours erronées. Ces données ne sont
jamais des certitudes absolues. Il s’agit de réduire le plus possible les variations
dues à l’échantillonnage. Consolez-vous, car, la science de la statistique a plus
d’un tour dans son sac : il est possible de calculer à quel point les données de
notre recherche sont bel et bien de vraies données.
Si vous choisissez un échantillon, vous

8. Oups ! prévoyez faire des prédictions quant à la
J’ai fait population. Vous allez donc formuler des
une erreur ! hypothèses quant aux résultats de votre
recherche. Comme il s’agit, la plupart du
temps, de comparer des échantillons entre eux, vous allez prédire soit qu’il n’y
aura pas de différence entre vos échantillons (hypothèse nulle), ou soit qu’il y
aura une différence statistiquement significative entre eux (hypothèse
directionnelle).
Souvent, les résultats confirment une hypothèse sans l’ombre d’un doute.
Parfois, cette confirmation n’est pas aussi définitive. Il y a un risque de se
tromper. Par exemple, vos résultats démontrent qu’il n’y a pas de différence
significative entre un groupe témoin et un groupe expérimental. Il est possible,
cependant, que ces deux groupes soient vraiment différents l’un de l’autre. Plus
forte est la probabilité qu’une hypothèse soit vraie plus faible est la
probabilité qu’elle soit fausse.
Dans la plupart des manuels de base en statistiques, on retrouve le tableau qui

suit. Ce tableau met en relation l’échantillon avec la population, l’hypothèse
avec les résultats, la probabilité qu’une hypothèse soit vraie avec la probabilité
qu’elle soit fausse.
Échantillon Population
(prédiction) (résultats)
Décision correcte Décision incorrecte
Hypothèse nulle
1-α (erreur de Type 2 = β )
Décision incorrecte Décision correcte
Hypothèse alternative
(erreur de type 1 = α) 1-β

Reprenons l’exemple de la comparaison de la classe de Madame Letendre avec
celle de Monsieur Legendre. La moyenne obtenue par les élèves de Mme
Letendre est de 72, alors que la moyenne de ceux de Monsieur Legendre est de
69. Avant d’obtenir les résultats une hypothèse nulle a été formulée. Comme
rien ne permettait de croire que les élèves d’une classe réussiraient mieux que
ceux de l’autre classe, il a été prédit qu’il n’y aura pas de différence entre les
deux.
La probabilité que la décision de confirmer l’hypothèse nulle alors qu’il n’y a

vraiment pas de différence entre les deux classes est de 1 - α (1 - .05 = .95). Il y
a 95 % de chances que cette décision soit correcte, et 5 % de chance qu’elle soit
incorrecte. Il existe donc 5 chances sur 100 de rejeter l’hypothèse nulle alors
qu’il y a une différence réelle entre les deux groupes.
Le même raisonnement s’applique lorsqu’il s’agit de l’hypothèse alternative. Il

suffit pour l’instant de mentionner que la valeur de α ou de β peut être
déterminée par le chercheur de façon arbitraire ou estimée à partir des résultats
des recherches précédentes.


Inference Statistique

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Inference Statistique

Hochgeladen von

Copyright:

Verfügbare Formate

Approche

Les objectifs pédagogiques

Page 1 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Un synonyme populaire de l’inférence est la généralisation. Dans les deux cas,

La validité de l’inférence à toute la population en s’appuyant sur les données de

Grosso modo, pour s’assurer que l’échantillon représente le plus fidèlement

Dans le tableau ci-après, l’échantillon 1 est formé de 25 % de chacun des cinq

Page 2 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Population Échantillon 1 Échantillon 2

Afin de s’assurer de la faisabilité d’une recherche, on doit se contenter la plupart

2. Les paramètres de la population

Shavelson (1996) énonce l’affirmation suivante : « en généralisant à une

Pour rendre plus concrets certains concepts, servons-nous de l’exemple suivant.

Page 3 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Par ailleurs, quant à l’échantillon de 80 %, l’erreur d’échantillonnage est

Cette fois-ci, tirons 3 échantillons successifs de 20 % chacun. Nous serons,

Les résultats obtenus pour le 3e échantillon à la droite du tableau montrent bien à

La représentativité d’un échantillon

Quelles sont les caractéristiques principales que nous souhaitons connaître à

Page 4 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Caractéristiques Population Échantillon

Les formules statistiques créées pour estimer les paramètres de la population à

1. L’impartialité. Un estimateur de la moyenne de la population est impartial si,

2. La consistance. L’estimateur se rapproche de plus en plus du paramètre de la

3. L’efficacité. L’estimateur d’un paramètre de la population est le plus efficace

Est-il besoin de répéter que,

Jusqu’à présent, nous avons vu

Page 5 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Dès que nous tirons un échantillon d’une population, la sempiternelle question

La moyenne d’une classe d’élèves de 12e

Page 6 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Au départ, une question a été posée de manière formelle. Le rendement en

L’exemple précédent portait sur la comparaison d’un résultat statistique d’un

Nous n’avons pas seulement les résultats

Les comportements que nous avons mesurés sont donc

Bref, dans un environnement hypothético-déductif,

Page 7 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Les autorités scolaires sont désireuses de vérifier si une nouvelle

Page 8 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Quand est-il plus convenable de formuler une hypothèse nulle

Que signifie l’expression erreur

Des exemples d’erreur d’échantillonnage

L’influence d’une erreur d’échantillonnage

Page 9 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Vous administrez un programme de développement socioaffectif à

L’erreur d’échantillonnage est-elle constante ? Certes, l’erreur d’échantillonnage

L’erreur d’échantillonnage peut être fortuite ou systématique. Une erreur est

L’erreur fortuite d’échantillonnage est-elle plus lourde de conséquence que

Page 10 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Votre recherche comprend cinq groupes choisis de manière aléatoire. Vous

En réalité, il est impossible de savoir vraiment si le salaire moyen d’un groupe

Aucun d’entre nous n’aime se tromper

Cette étendue de valeurs s’appelle un intervalle de confiance. Plus grand est

Le tableau suivant montre deux graphiques qui illustrent deux distributions de

Page 11 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Si vous faites passer l’épreuve à un autre groupe de travailleurs, vous

Les valeurs des tables de probabilité

La grandeur de l’erreur-type de l’échantillon dépend de deux facteurs

Page 12 L’inférence statistique Donald Long Centre de recherche et de développement en éducation

Voici comment ce tableau a été construit. D’abord, imaginons une population

Échantillon Scores Moyenne Écart- Erreur- Intervalles de

Total 3,78 3,69 1,65

Lorsqu’on examine la moyenne de chaque échantillon, on comprend à quel point