Beruflich Dokumente
Kultur Dokumente
gnralits
quelques dfinitions
La statistique : ensemble des instruments et de recherches mathmatiques permettant de dterminer les caractristiques d'un ensemble de donnes. Une statistique : un nombre calcul partir d'observations. Les statistiques : produit des analyses reposant sur l'usage de la statistique.
gnralits
mesure partir dchantillons principe du sondage : on travaille sur un chantillon que lon suppose reprsentatif.
exemples : prlvement dun chantillon de sang tude dune population de cellules
gnralits
gnralits
trois tapes principales : 1 - la collecte des donnes
2 - le traitement des donnes collectes caractriser la relation entre variables Statistiques descriptives 3 - l'interprtation des donnes partir des donnes obtenus sur lchantillon, infrer les caractristiques de la population dorigine estimer si plusieurs chantillons proviennent ou non dune mme population Statistiques infrentielles ou infrences statistiques s'appuie sur la thorie des sondages et la statistique mathmatique
pour chaque individu, on dispose dun ou plusieurs paramtres. la dfinition statistique de lindividu est diffrence de sa dfinition courante la dfinition de lindividu dpend des paramtres tudis
exemple 1 : paramtre tudi : note dun tudiant dans un groupe de TD un individu = un tudiant exemple 2 : paramtre tudi : note moyenne de chaque groupe de TD dtudiant inscrit dans une licence. un individu = un groupe de TD
population (dfinition statistique) = ensemble dindividus sur lequel on tudie des paramtres
ex : ensemble des patients recevant un traitement lhpital ensemble des tudiants inscrits un master biologie-sant ensemble de cellules
on peut ne pas connaitre tous les individus qui composent une population
exemple : population humaine les globules rouges de souris
une ou plusieurs variables peuvent tre associes sur un individu les variables peuvent tre de nature varie : Variables qualitatives et quantitatives Variables indpendantes et variables dpendantes Variables contrles et non contrles
variable qualitative = variable statistique dont les valeurs s'expriment de faon littrale (ou par un codage), sur lesquelles les oprations arithmtiques comme le calcul de la moyenne n'ont pas de sens.
exemples : mortalit dans une population de cellules, par la coloration au bleu trypan. sexe des patients recevant un traitement lhpital.
attention! un codage chiffr en transforme pas une variable qualitative en variable quantitative. Un chiffre nest pas forcment un nombre
ex : sudoku
variable quantitative = variable statistique dont les valeurs s'expriment par des nombres, sur lequel les oprations arithmtiques comme le calcul de la moyenne ont un sens.
exemples : concentration calcique cytosolique dune cellule ge des patients recevant un traitement lhpital dose dun traitement administr des patients exemple : concentration calcique cytosolique dune cellule
variable continue : peut prendre toute valeur relle variable discrte : ne peut prendre dun nombre fini de valeurs
exemple : nombre denfants par femme
attention! une variable chiffre nest pas forcment une variable quantitative (le chiffre peut tre un codage) On peut transformer une variable quantitative en variable qualitative, avec une perte dinformation.
ex: dose dun traitement administr des patients en fonction de la dose, classement en catgories : trs faible dose, faible dose, dose normale, forte dose, trs forte dose.
variable indpendante = variable statistique dont les valeurs sont indpendantes des autres variables tudies variable indpendante = variable statistique dont les valeurs sont dpendantes des autres variables tudies
exemples : on tudie leffet de deux substances potentiellement cytotoxiques sur des cellules cancreuses en culture, et on mesure la survie des cellules en fonction de la substance administre. variabledpendante : survie de la cellule variable indpendante : substances cytotoxiques appliques la cellule
variable contrle = variable statistique dont les valeurs sont imposes par lexprimentateur exprimentation (experiment) Dans les tudes dexprimentation, les variables indpendantes sont contrles
exemples : - effet de ladrnaline sur la frquence cardiaque. - dtermination sur la souris de la quantit minimale contaminante de cerveau de bovin atteint dESB.
variable non contrle = variable statistique dont les valeurs dpendent pas de lexprimentateur observation (survey) Dans les tudes dobservations, les variables indpendantes ne sont pas contrles.
exemples : - frquence des cancers de la thyrode aprs laccident de Tchernobyl, dans une zone gographique donne. - admission aux urgences pour problmes respiratoires en fonction de lintensit de la pollution atmosphrique
donnes statistiques : individu, variable, population dans chacun des exercices suivants, dterminer : lindividu (statistique) la population (statistique) la ou les variables le caractre de chaque variable : qualitatif ou quantitatif; indpendant ou dpendant, contrl ou non contrl. exercice 1 : rponse calcique de cellules isoles stimules position du problme : on analyse la rponse calcique de cellules une stimulation par la cafine. On mesure lamplitude du pic calcique grce une sonde fluorescente, dont lintensit de fluorescence dpend du calcium. Aprs calibration, la concentration en calcium est calcule en nM. La mesure est effectue sur 39 cellules.
exercice 2 : dtermination par Western blot du niveau dexpression de la protine P sur culture de cellules position du problme : sur des cellules en culture, on analyse par Western blot le niveau dexpression de la protine P. Les suspensions de cellules sont broyes et les protines extraites par centrifugation. Le niveau dexpression estr valu par lintensit de la bande correspondante la protine P, normalise par rapport lactine. Les mesures sont rptes sur 6 lots de cellules. exercice 3 : influence du Ca2+ extracellulaire sur la rponse contractile danneaux de bronches position du problme : on analyse la rponse contractile danneaux de bronches une stimulation par lactylcholine. Chasue anneau est reli un transducteur de force qui mesure la force dveloppe par lanneau, (exprime en % dune rponse de rfrence), lorsque lactylcholine est introduite dans la cuve. Pour dterminer le rle possible du Ca2+ extracellulaire dans la rponse, des mesures sont faites sur 7 anneaux avec du Ca2+ extracellulaire et sur 8 anneaux sans Ca2+ extracellulaire.
exercice 4 : relation entre la dose d'un mdicament et la pression artrielle position du problme : on analyse leffet de 4 doses diffrentes dun mme traitement sur la pression artrielle dun lot de 23 rats. La pression artrielle est mesure au niveau de la carotide, et est exprime en mmHg. exercice 5 : analyse de la frquence cardiaque au repos et l'effort dans un groupe H/F position du problme : on mesure la frquence cardiaque dun groupe de 31 tudiants, en effectuant sur chaque individu, dont on note le sexe, une mesure au repos et aprs effort.
time (sec)
la variabilit des rsultats est diffrente de lerreur instrumentale la marge dimprcision destimation de la tendance centrale est un intervalle de probabilit
en elles-mmes, les donnes brutes donnent peu dinformations utiles. dcrire mathmatiquement la ralit observe dcrire = rsumer et reprsenter les donnes
1,14596 1,0461 0,67606 0,57967 1,16159 0,64212 1,01782 0,66019 1,20027 0,71591 0,54514 0,90245 0,61038 1,32689
contraction (g)
force (g) 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3 2,5
frquence 2 5 2 6 4 4 4 0 1 1 0
frquence
5 4 3 2 1 0 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3
force (g)
pour les variables continues, lanalyse de la distribution ncessite de regrouper les valeurs en classes
frquence
5 4 3 2 1 0 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3
force (g)
loi de distribution de probabilit, dfinie par une fonction de densit de probabilit de la forme :
f ( x) =
1 2
( x )
2 2
8000 nombre de genres 7000 6000 5000 4000 3000 2000 1000 0 20 40 60 80 100 120 140 dure de vie (en millions dannes) 160
les distributions ne sont pas forcment gaussiennes (les variables ne suivent pas forcment une courbe en cloche )
frquence
5 4 3 2 1 0 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3
Force (g)
force (g)
frquence
5 4 3 2 1 0 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3
intrts et limites : trs utilise en statistiques descriptive et infrentielle souvent, pas toujours, la mesure la plus pertinente de la tendance centrale
force (g)
moyenne = 1,21 g
frquence
5 4 3 2 1 0 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3
intrts et limites : intrt thorique : dans certains cas, bonne manire de dcrire la tendance centrale peu utilise pour les calculs de signification statistique
force (g)
moyenne = 1,21 g
frquence
intrts et limites : force (g) facile dterminer difficile manipuler mathmatiquement (pour tester statistiquement des hypothses) intrt thorique : dans certains cas, bonne manire de dcrire la tendance centrale
0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3
moyenne = 1,21 g
mode = 1,1 g
6 5 4 3 2 1 0 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3
force (g)
si la distribution est symtrique, moyenne, mdiane et mode sont similaires dans la plupart des cas : moyenne
range n 1.68079 29
frquence
force (g)
plus les points scartent de la moyenne, plus lcart-type est grand, indpendamment du nombre de valeurs. Lcart-type a la mme unit que la variable tudie.
= x x
( )2 n
mF
F mF (g) (F-mF)2 (g2) -0,07 0,00459 -0,17 0,0281 ..... ..... (F-mF)2 5,849
= x x
( )2 n
intrts et limites : Aprs standardisation, permet de comparer la position de plusieurs variables entre elles, mme si les units de mesure de ces variables sont diffrentes. quasiment la seule mesure de la dispersion utilise
figure 1 : mesure de la contraction danneaux de bronches de rats (en g). La colonne noire est la moyenne de 29 anneaux. La barre derreur reprsente lcart-type.
statistiques infrentielles
types de questions
estimation des caractristiques dune population partir dun chantillon frquence de distribution moyenne et cart-type de la population prcision de lestimation intervalle de confiance comparaison des diffrences entre plusieurs populations, partir dchantillons comparaison une population thorique comparaison de plusieurs (2 ou plus) chantillons entre eux tests statistiques estimation des erreurs risque de premire espce (a) risque de deuxime espce (b)
statistiques infrentielles
variables qualitatives
estimation
estimation de la frquence de distribution
la frquence estime de la variable dans la population est la frquence observe dans lchantillon
exemple : rpartition hommes/femmes dans un chantillon dune population 18 16 14 12 nombre 10 8 6 4 2 0 femmes hommes
chantillon (mesure) : n = 31 femmes = 18 homme = 13 frquence (observe) femmes = 58,06 % homme = 41,94 % population (estimation) : femmes = 58,06 % homme = 41,94 %
statistiques infrentielles
variables quantitatives
estimation
estimation de la moyenne
la moyenne estime de la variable dans la population est la moyenne observe dans lchantillon
exemple : mesure de la frquence cardiaque sur un chantillon de 31 tudiants de lUFR des Sciences de la vie moyenne de lchantillon (mesure) : 86 battements/min la frquence cardiaque moyenne mesure sur un chantillon de 31 tudiants de lUFR des Sciences de la vie tait de 86 battements/min moyenne de la population (estime) : 86 battements/min la frquence cardiaque moyenne estime des tudiants de lUFR des Sciences de la vie est de 86 battements/min
statistiques infrentielles
variables quantitatives
estimation
estimation de lcart-type
lcart-type estim de la variable dans la population est lcart-type observ dans lchantillon augment dun facteur de correction
cart-type estim de la population ~> cart-type calcul de lchantillon cart-type estim de la population : S cart-type calcul de lchantillon :
n-1 : degr de libert
n n 1
exemple : mesure de la frquence cardiaque sur un chantillon de 31 personnes moyenne de lchantillon (mesure) : 86 battements/min cart-type de lchantillon (mesur) : 13,04 battements/min moyenne de la population (estime) : 86 battements/min cart-type de la population (estim) : 13,25 battements/min
statistiques infrentielles
prcision de lestimation
estimation
principes gnraux
variable quantitative : la prcision de lestimation de la moyenne dune variable partir dun chantillon dpend de la fluctuation de la moyenne de lchantillon
Moins, dun chantillon un autre, la valeur moyenne fluctue, plus grande est la prcision de lestimation de la moyenne de la population.
exemple : on mesure 2 variables A et B sur une srie dchantillons de plusieurs individus. On rpte ces mesures sur 6 chantillons diffrents. On obtient les valeurs suivantes : la fluctuation est plus faible pour la variable A. La prcision de son estimation partir dun chantillon est plus grande que pour B moyenne cart-type de la moyenne n lot 1 2 3 4 5 6 A 12,36 10,10 7,28 7,90 10,16 8,99 9,47 1,67 B 18,94 8,93 6,51 9,36 17,70 4,16 10,93 5,50
statistiques infrentielles
prcision de lestimation
estimation
principes gnraux
variable qualitative : la prcision de lestimation de la frquence dune variable partir dun chantillon dpend de la fluctuation de la frquence de lchantillon
Moins, dun chantillon un autre, la valeur de la frquence fluctue, plus grande est la prcision de lestimation de la frquence de la population.
exemple : on mesure 2 variables A et B sur 2 sries dchantillons. Pour chaque variable, on rpte ces mesures sur 7 chantillons diffrents. On obtient les valeurs suivantes : n Lot 1 2 3 4 5 6 7 A 40 % 100 % 60 % 60 % 20 % 80 % 40 % n Lot 1 2 3 4 5 6 7 moyenne B 40 % 53 % 47 % 73 % 60 % 33 % 53 % 51 % 12 %
la fluctuation de la frquence est plus faible pour la variable B. La prcision de son estimation partir dun chantillon est plus grande que pour A.
statistiques infrentielles
prcision de lestimation
estimation
principes gnraux
variable quantitative : la prcision de lestimation de la moyenne partir dun chantillon dpend de la fluctuation de la moyenne de lchantillon
Moins, dun chantillon un autre, la valeur moyenne fluctue, plus grande est la prcision de lestimation de la moyenne de la population.
variable qualitative : la prcision de lestimation de la frquence partir dun chantillon dpend de la fluctuation de la moyenne de lchantillon
Moins, dun chantillon un autre, la valeur de la frquence fluctue, plus grande est la prcision de lestimation de la frquence de la population.
La prcision de lestimation de la moyenne ou de la frquence dune variable dpend de lcart-type de la moyenne de la variable.
statistiques infrentielles
prcision de lestimation
estimation
principes gnraux
la prcision de lestimation de la moyenne ou de la frquence dune variable partir dun chantillon dpend de la fluctuation de la moyenne de lchantillon
la fluctuation de la moyenne (ou de la frquence) entre plusieurs
de la taille de lchantillon
plus lchantillon est gros, plus la prcision est bonne
lcart-type de la moyenne
statistiques infrentielles
prcision de lestimation
estimation
principes gnraux
la prcision de lestimation de la moyenne ou de la frquence dune variable partir dun chantillon dpend de la fluctuation de la moyenne de lchantillon
la fluctuation de la moyenne (ou de la frquence) entre plusieurs
lcart-type de la moyenne
pb : comment calculer lcart-type de la moyenne - rpter lexpriences sur plusieurs chantillons - estimer lcart-type de la moyenne sur un seul chantillon loi de probabilit de la moyenne ?
statistiques infrentielles
prcision de lestimation
estimation
loi de probabilit de la moyenne
si la loi de probabilit des variables des individus suit une loi normale, alors la loi de probabilit de la moyenne est galement une loi normale si la loi de probabilit des variables des individus nest pas une loi normale, la loi de probabilit de la moyenne est une loi normale, si la taille de lchantillon est assez grande (n > 30 ) ex : loi binomiale
18 16 14 12 10 8 6 4 2 0
0,16 0,14 0,12 probabilit 0,10 0,08 0,06 0,04 0,02 0,00
nombre
femmes
hommes
10
15
20
25
30
statistiques infrentielles
prcision de lestimation
variable quantitative
estimation
cart-type de la moyenne (SEM)
estimation de la fluctuation de la moyenne : cart-type de la moyenne = standard error of the mean (SEM) cart-type estim sur lchantillon ( fluctuation de la variable) taille de lchantillon
SEM =
s n
exemple : frquence cardiaque moyenne de la population (estime) : 86 battements/min cart-type de la population (SD) (estim) : 13,25 battements/min SEM = 3,38 battements/min
statistiques infrentielles
prcision de lestimation
variable qualitative
estimation
cart-type de la moyenne (SEM)
estimation de la fluctuation de la moyenne : cart-type de la moyenne = standard error of the mean (SEM) p : frquence estime de la variable dans lchantillon q = 1-p
SEM =
pq n
taille de lchantillon
homme = 41,94 %
statistiques infrentielles
prcision de lestimation
estimation
intervalle autour de la moyenne calcule de lchantillon dans lequel la moyenne de la population a une probabilit donne de se trouver.
exemple : intervalle de confiance 95 % : la valeur moyenne de la population dont est issu lchantillon a 95 chances sur 100 de se trouver dans lintervalle.
dpend : de la SEM du % de confiance voulu du degr de libert (ddl) ex : ddl > 30 intervalle de confiance 95 % = m 1,96 SEM
loi normale
0,5 0,4 0,3 0,2 0,1 0,0 -4 -3 -2 -1 0 1 2 3 4
SEM IC95
risque alpha : probabilit que la valeur de la population (vraie valeur) soit en dehors de lintervalle de confiance
statistiques infrentielles
prcision de lestimation
variable quantitative
estimation
exemple : frquence cardiaque mesure sur 31 personnes (n = 31) moyenne de lchantillon (mesure) : 86 battements/min cart-type de lchantillon (mesur) : 13,04 battements/min moyenne de la population (estime) : 86 battements/min cart-type de la population (estim) : 13,25 battements/min SEM = 3,38 battements/min n = 31 (ddl = 30) intervalle de confiance 95 % (IC 95 %) = 86 6,7 battements/min
statistiques infrentielles
prcision de lestimation
variable quantitative
calcul avec les fonctions dExcel ou dOpenOffice :
estimation
moyenne de lchantillon (mesure) : fonction MOYENNE cart-type de lchantillon (mesur) : fonction ECARTTYPEP moyenne de la population (estime) : fonction MOYENNE cart-type de la population (estim) : fonction ECARTTYPE SEM = pas de fonction disponible : calculer en utilisant la formule : = ECARTTYPE(donnes)/RACINE(taille) intervalle de confiance 95 % (IC 95 %) : fonction INTERVALLE.CONFIANCE indiquer alpha : 0,05 indiquer lcartype estim indiquer la taille de lchantillon
vrai si n>30
statistiques infrentielles
prcision de lestimation
variable qualitative
exemple : sex ratio mesur sur un chantillon de 31 personnes sex ratio de lchantillon (mesure) : femmes = 18 (58,06 %) homme = 13 (41,94 %) sex ratio de la population (estimation) : femmes = 58,06 % homme = 41,94 % SEM = 8,86 % (n = 31 ; ddl = 30)
estimation
vrai si n>30
statistiques infrentielles
prcision de lestimation
variable qualitative
calcul avec les fonctions dExcel ou dOpenOffice :
estimation
sex ratio de lchantillon (mesure) : femmes = 18 homme = 13 n = 31 (ddl = 30) calcul des proportions : femmes : 0,5806 (p) hommes : 0,4194 (q = 1-p) sex ratio de la population (estimation) : femmes = 58,06 % homme = 41,94 % SEM = pas de fonction disponible : calculer en utilisant la formule : = RACINE((p*(1-p)/n)) intervalle de confiance 95 % (IC 95 %) = fonction INTERVALLE.CONFIANCE NB : calcul prliminaire : cart-type estim = RACINE((p*(1-p)) indiquer alpha : 0,05 indiquer lcartype estim (voir calcul prliminaire) indiquer la taille de lchantillon
vrai si n>30
statistiques infrentielles
principe des tests
comparaisons statistiques
Les statistiques infrentielles permettent dassigner une probabilit lobtention dun rsultat pour une hypothse donne.
exemple : intervalle de confiance 95 % on fait lhypothse que la moyenne ou la frquence dune variable se trouve dans lintervalle de confiance, dont on a calcul que la probabilit tait de 0,95 (95 %). (exemple des sondages dopinion)
statistiques infrentielles
principe des tests
hypothse nulle (null hypothesis)
comparaisons statistiques
lhypothse nulle
Le principe des tests statistiques est de postuler lhypothse nulle : on fait lhypothse que les diffrences observes entre des valeurs observes ou entre une valeur observes et une valeur thorique est due aux fluctuations dchantillonnage.
exemple : effet de la prsence de calcium extracellulaire sur la contraction danneau de bronche. hypothse nulle : le calcium extracellulaire na pas deffet. = les deux chantillons danneaux de bronches proviennent de la mme population le test statistique calcule la probabilit que les diffrences de valeur de contraction entre les deux chantillons soient dues aux fluctuations dchantillonnage dans une mme population
statistiques infrentielles
principe des tests
hypothse nulle (null hypothesis)
comparaisons statistiques
lhypothse nulle
Le principe des tests statistiques est de postuler lhypothse nulle : on fait lhypothse que les diffrences observes entre des valeurs observes ou entre une valeur observes et une valeur thorique est due aux fluctuations dchantillonnage.
statistiques infrentielles
principe des tests
comparaisons statistiques
lhypothse nulle
sex ratio mesur sur un chantillon de 31 tudiants de biologie sex ratio de lchantillon (mesure) : femmes = 18 (58,06 %) homme = 13 (41,94 %) question : y a-t-il significativement plus de femmes que dhommes en biologie, par rapport lensemble de la population?
a) formulation de lhypothse nulle : la population thorique dont le groupe dtudiants est un chantillon reprsentatif nest pas diffrente de la population gnrale dont on connat les valeurs thoriques : sex ratio de 50 %
statistiques infrentielles
principe des tests
comparaisons statistiques
lhypothse nulle
exemples : b) comparaison des frquences cardiaques de groupes dtudiants la frquence thorique normale de 70 battements/minute
exemple : frquence cardiaque mesure sur 31 personnes (n = 31) moyenne : 86 battements/min cart-type (estim) : 13,25 battements/min SEM = 3,38 battements/min n = 31 (IC 95 %) = 86 6,7 battements/min question : la frquence cardiaque des tudiants en biologie est-elle significativement diffrente de celle de lensemble de la population?
b) formulation de lhypothse nulle : la population thorique dont le groupe dtudiants est un chantillon reprsentatif nest pas diffrente de la population gnrale dont on connat les valeurs thoriques : frquence cardiaque de 70 batt/min.
statistiques infrentielles
principe des tests
comparaisons statistiques
lhypothse nulle
exemples : c) comparaison des frquences cardiaques des hommes et des femmes dans un groupe dtudiants.
exemple : frquence cardiaque mesure sur 31 tudiants en biologie (n = 31), 18 femmes et 13 hommes. On calcule la frquence cardiaque chez les hommes et chez les femmes question : la frquence cardiaque des tudiantes en biologie est-elle significativement diffrente de celle des tudiantes en biologie ?
c) formulation de lhypothse nulle : la population thorique dont les tudiants masculins sont un chantillon reprsentatif est identique la population thorique dans les tudiants fminins sont un chantillon reprsentatif.
statistiques infrentielles
principe des tests
comparaisons statistiques
Si la probabilit de lhypothse nulle est trop faible, on la rejette, et on accepte lhypothse non nulle : les chantillons compars proviennent de populations diffrentes. Il existe une diffrence statistiquement significative. Par convention, on fixe en gnral le seuil de signification 5 % p<0,05 : diffrences statistiquement significatives p<0,01 : diffrences statistiquement hautement significatives p<0,001 : diffrences statistiquement trs hautement significatives le seuil de signification est dtermin avant deffectuer le test ; le degr de signification est dtermin par le test (= probabilit de rejeter lhypothse nulle si elle est vraie). La diffrence est significative si le degr de signification est infrieur au seuil de signification.
statistiques infrentielles
principe des tests
comparaisons statistiques
exemple : On a mesur leffet de la prsence de calcium extracellulaire sur la contraction danneaux de bronche. Les valeurs, exprimes en % dune valeur de rfrence, sont donnes sous la forme : moyenne SEM (n = taille de lchantillon). Les diffrences sont considres comme significatives si P<0,05. rsultats: En prsence et en absence de calcium extracellulaire, la contraction tait de 13,66 1,53 (n = 8) et de 7,95 1,71 (n = 7), respectivement. Le degr de signification (P) tait de 0,029.
statistiques infrentielles
principe des tests
risques derreur
comparaisons statistiques
statistiques infrentielles
principe des tests
risques derreur
comparaisons statistiques
risque a (risque de 1re espce) (type 1 error) risque de rejeter lhypothse nulle si est est vraie. risque b (risque de 2e espce) (type 2 error) risque daccepter lhypothse nulle alors quelle est fausse. Les deux types de risques sont antagonistes. Si on diminue le risque de 1re espce, on augmente le risque de 2e espce. tant donn que le risque de 2e espce nest pas connu la diffrence du risque de 1re espce en absence de diffrence significative, on ne peut pas conclure labsence de diffrence, car on ne contrle pas le risque derreur attach cette conclusion. Il y a une diffrence souvent oublie entre ne pas conclure quil existe une diffrence, et conclure quil nexiste pas de diffrence.
statistiques infrentielles
mthodologie
poser une question mettre une hypothse
comparaisons statistiques
laborer une procdure exprimentale de test de lhypothse (NB : test confirmation) un protocole exprimental nest pas une manire de prouver quune explication donne est correcte, mais plutt un systme par lequel les explications alternatives sont limines . Lumley & Benjamin. Research: some grounds rules = critre de rfutation (Karl Popper. La logique de la dcouverte scientifique, Conjectures et rfutations)
statistiques infrentielles
procdure exprimentale
comparaisons statistiques
constitution dun ou de plusieurs chantillons les techniques statistiques dpendent de la slection au hasard de sujets (chantillon) dans une population dfinie. Lumley & Benjamin !attention au biais dans la constitution des chantillons! choix des procdures exprimentales choix des procdures statistiques dfinition de lhypothse nulle choix du seuil de signification choix du test Le choix de la procdure statistique approprie est une partie importante de la procdure exprimentale et ne devrat jamais tre fait aprs la rcolte des donnes. Lumley & Benjamin
statistiques infrentielles
procdure exprimentale
comparaisons statistiques
constitution dun ou de plusieurs chantillons les techniques statistiques dpendent de la slection au hasard de sujets (chantillon) dans une population dfinie. Lumley & Benjamin !attention au biais dans la constitution des chantillons! choix des procdures exprimentales choix des procdures statistiques dfinition de lhypothse nulle choix du seuil de signification choix du test Le choix de la procdure statistique approprie est une partie importante de la procdure exprimentale et ne devrat jamais tre fait aprs la rcolte des donnes. Lumley & Benjamin
statistiques infrentielles
choix du test
types de variables qualitatives / quantitatives nombre de variables taille de lchantillon
comparaisons statistiques
loi de rpartition normale ou non (+galit des variances...) mesures rptes ou non / nombre de facteurs
statistiques infrentielles
choix du test
comparaison de deux moyennes
comparaisons statistiques
comparaison de deux moyennes observes comparaison dun moyenne observe une moyenne thorique
options du test :
- comparaison dun moyenne observe et dune moyenne thorique (one population) ou de deux moyennes observes (two populations) - mesures apparies (paired) ou non apparies (unpaired) - comparaison unilatrale (one-tailed) ou bilatrale (two-tailed)
statistiques infrentielles
choix du test
comparaison de deux moyennes
comparaisons statistiques
les effectifs sont suffisamment grands (n>30) ou la loi de rpartition est normale (faire ventuellement un test de normalit) test t de Student one population / two population appari/ non appari tests non paramtriques options : sries non apparies : test W de Wilcoxon = test U de Mann et Whitney test C1 de Fisher-Yates-Terry sries apparies : test T de Wilcoxon Les effectifs sont faibles et la rpartition nest pas normale (faire ventuellement un test de normalit) tests non paramtriques
statistiques infrentielles
choix du test
comparaison de plusieurs ( 2) moyennes
comparaisons statistiques
tape 1 : on effectue une comparaison globale, pour tester lexistence dune diffrence significative entre certains chantillons tape 2 : si ltape 1 montre lexistence duen diffrence significative, on effetue des comparaisons 2 2 pour dterminer entre quels chantillons se trouvent ces diffrences. tests post-hoc
statistiques infrentielles
choix du test
comparaison de plusieurs ( 2) moyennes
comparaisons statistiques
la loi de rpartition de probabilit est normale pour la variable mesure (faire ventuellement un test de normalit) Analyse de la variance (ANOVA) tests non paramtriques Kruskall-Wallis : non appari Friedman : apparie
options :
ANOVA plusieurs facteurs tests post-hoc : Mthode de Bonferonni (test t) Mthode de Tukey (test t) Mthode de Dunnet Mthode de Sheff (test F)
statistiques infrentielles
choix du test
comparaison de plusieurs ( 2) moyennes
comparaisons statistiques
la loi de rpartition de probabilit est normale pour la variable mesure (faire ventuellement un test de normalit) Analyse de la variance (ANOVA) tests non paramtriques la loi de rpartition de probabilit nest pas normale pour la variable mesure tests non paramtriques
statistiques infrentielles
choix du test
comparaisons statistiques
chantillon de taille normale (effectifs calculs > 5) : test du 2 (chi2). chantillon de taille rduite (effectifs calculs > 3) : 2 corrig (correction de Yates) chantillon de taille trs rduite (effectifs calculs < 3) : test exact
statistiques infrentielles
choix du test
exemple
Linear Regression Y=A+B*X Parameter Value Error ----------------------------------A 70,94 4,39668 B 1,416 0,11966 ----------------------------------R SD N ----------------------------------0,94133 5,98312 20 variable dpendante (UA) 160 140 120 100 20
comparaisons statistiques
25
une des deux distributions lies au moins est normale avec une variance constante test de corrlation (ou de rgression) dtermine si la pente est statistiquement significative de 0 si aucune des variables lies nest normale et de variance constante (petits chantillons) test non paramtrique de corrlation des rangs (test de Spearman)
statistiques infrentielles
choix du test
comparaisons statistiques
statistiques (BU)
R. Salamon. Statistique mdicale, Masson, Paris, 1988. Petit livre de base contenant lessentiel des notions en statistiques, et une introduction au calcul des probabilits (BU) D. Schwartz. Mthodes statistiques lusage des mdecins et des biologistes, 4e dition, Flammarion, Paris, 1994. ouvrage franais de rfrence (BU) T. H. Wonnacot & R. J. Wonnacot. Statistique, 4e ed, Economica, Paris, 1991. Ouvrage dtaill (900 p) sur la statistique en conomie, gestion, sciences et mdecine, avec exercices dapplications (BU) J. S. P. Lumley & W. Benjamin. Resarch: some ground rules, Oxford University Press, Oxford, 1994. guide pour savoir comment mener un travail de recherche. Nest pas consacr particulire-ment aux statistiques, mais une section est consacre lanalyse des rsultats, avec une approche utilitaire des statistiques. (BU)
Extinction. Bad genes or bad luck?) Par un spcialiste de palontologie statistique, lanalyse de la part du hasard dans les extinctions. Contient une prsentation claire de quelques questions dordre statistique.